日前,從主打原創(chuàng)人工智能算法與視頻深度學(xué)習(xí)技術(shù)的千視通獲悉,其最新的行人再識(shí)別跨鏡追蹤技術(shù)(Re-ID)在國(guó)家超算中心長(zhǎng)沙中心完成了精度測(cè)試,測(cè)試結(jié)果刷新了目前已知的業(yè)內(nèi)最高紀(jì)錄。
作為一家以Re-ID視頻結(jié)構(gòu)化技術(shù)和應(yīng)用為核心的計(jì)算機(jī)視覺(jué)科技公司,千視通團(tuán)隊(duì)在Market 1501、DukeMTMC-reID、CUHK03這三個(gè)衡量Re-ID技術(shù)最通用的數(shù)據(jù)集測(cè)試中,獲得了巨大突破。這些數(shù)據(jù)集中有兩項(xiàng)核心指標(biāo)評(píng)判標(biāo)準(zhǔn):首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,縮寫(xiě)mAP,它反映檢索的人在底庫(kù)中的所有圖片排在結(jié)果隊(duì)列前面的程度)。
千視通目前在Market 1501上的首位命中率(Rank-1 Accuracy)已經(jīng)達(dá)到97.1%,超越人眼識(shí)別能力(94%),領(lǐng)先頭部廠(chǎng)家,并刷新了今年4月公布的96.6%的世界紀(jì)錄。同時(shí)在CUHK03,Duke MTMC-reID兩個(gè)數(shù)據(jù)集上也刷新了之前業(yè)內(nèi)最高紀(jì)錄,達(dá)到了行業(yè)state of the art的技術(shù)水平,特別是在CUHK03數(shù)據(jù)集上,Rank 1指標(biāo)提高了10.7%。
Market 1501:由清華大學(xué)提供 ,使用了6個(gè)攝像頭(5高清和1低清),鏡頭之間有部份重疊,當(dāng)中有 1501個(gè)人的身份,共有32668個(gè)標(biāo)物框/行人圖片。
千視通在最新的測(cè)試報(bào)告中顯示,該數(shù)據(jù)集中首位命中率高達(dá)97.1%(籃框代表正確目標(biāo),紅框代表誤報(bào)或不清晰目標(biāo))。
(千視通Market1501 部分測(cè)試結(jié)果)
Duke MTMC-reID:格式基本上跟 Market 1501一樣,共有1404個(gè)人的身份,并 36411個(gè)標(biāo)物框/行人圖片。DukeMTMC其實(shí)不止有Re-ID用的訓(xùn)練及測(cè)試素材,它本來(lái)是用于視頻之間的(真正)多攝像頭多軌跡動(dòng)態(tài)追蹤。用來(lái)訓(xùn)練或測(cè)試 Re-ID,只是它的其中一個(gè)功能。千視通在Duke MTMC-reID數(shù)據(jù)集中測(cè)試的mAP結(jié)果78.9%,刷新之前榜單第一的78.4%,而Rank1成績(jī)?yōu)?9.1%,超過(guò)之前第一名88.7%。
(千視通Duke MTMC-ReID 部分測(cè)試結(jié)果)
CUHK03: 是香港中文大學(xué)所提供的。它前身有CUHK01 和CUHK02,因?yàn)檫@兩個(gè)數(shù)據(jù)庫(kù)不夠作深度學(xué)習(xí)訓(xùn)練,所以采集了更多數(shù)據(jù)生成 CUHK03。這個(gè)數(shù)據(jù)庫(kù)有1360個(gè)人的身份,并有 13164張圖片,同樣由6個(gè)攝像頭所拍攝。千視通在該數(shù)據(jù)集中測(cè)試的mAP結(jié)果為74.8%,遠(yuǎn)遠(yuǎn)超過(guò)原先排行第一的67.4%數(shù)據(jù),而Rank1更是達(dá)到78.7%,比之前榜首的68%提升了足足10.7%。
(千視通CUHK03 部分測(cè)試結(jié)果)
以上數(shù)據(jù)由國(guó)家超級(jí)計(jì)算長(zhǎng)沙中心,以及長(zhǎng)沙市公安局刑事偵查支隊(duì)視頻偵查大隊(duì)測(cè)試驗(yàn)證。
自研技術(shù)創(chuàng)新,千視通Re-ID算法有效提高可識(shí)別率
Re-identification,簡(jiǎn)稱(chēng)Re-ID,即行人再識(shí)別,是利用計(jì)算機(jī)視覺(jué)技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。作為人臉識(shí)別技術(shù)的重要補(bǔ)充,其發(fā)展內(nèi)核便是在不同視頻中,在無(wú)法獲取清晰人臉特征信息前提下,機(jī)器通過(guò)穿著、發(fā)型、體態(tài)等信息將同一個(gè)人識(shí)別出來(lái),增強(qiáng)數(shù)據(jù)的時(shí)空連接性。可廣泛應(yīng)用于智能視頻監(jiān)控、智能安保等領(lǐng)域。
舉個(gè)例子,我們所熟悉的哈利·波特作品,在《阿茲卡班囚徒》中想象出一種叫做活點(diǎn)地圖 (Marauder’s Map)的魔法道具,展開(kāi)地圖,除了顯示基本地圖信息外,還能實(shí)時(shí)觀看某個(gè)指定人物的行動(dòng)軌跡。
回到現(xiàn)實(shí)世界,我們現(xiàn)在可以在攝像頭的部署環(huán)境中,通過(guò)上傳特定人物的照片,同時(shí)檢測(cè)多個(gè)不同位置的攝像頭數(shù)據(jù),精準(zhǔn)找出所有攝像頭抓拍到的目標(biāo)人物圖像,并生成他/她的行動(dòng)時(shí)空軌跡,達(dá)到跨鏡追蹤的目的。
由于多個(gè)攝像頭下拍攝行人的角度、光線(xiàn)等條件不同,圖像中的行人很難被判斷為同一個(gè)人。所以就要找到行人上的局部不變的部分,比如:衣服顏色,衣服紋理,手提包,背包等。同時(shí)行人兼具剛性和柔性的特性 ,外觀易受穿著、尺度、遮擋、姿態(tài)和視角等影響,行人再識(shí)別是一個(gè)既具研究?jī)r(jià)值同時(shí)又極富挑戰(zhàn)性的課題,為了提升Re-ID的可識(shí)別率,千視通做了多方面的算法優(yōu)化,致力于加速Re-ID的應(yīng)用落地。
考慮訊息全面:一般算法只考慮了全局、多粒度及水平匯集訊息,而水平匯集訊息主要用于把圖片對(duì)齊。在實(shí)際的情況下,攝像頭的角度多變,同時(shí)人行是非剛體,所以,垂直方向也理應(yīng)同時(shí)考慮。對(duì)于此種情況,千視通在網(wǎng)絡(luò)設(shè)計(jì)上開(kāi)發(fā)了自研的垂直匯集及其關(guān)聯(lián)的算法層,用以更好的適應(yīng)以上情況。
強(qiáng)化特征空間的可分辨性: 千視通的 ReID 算法,針對(duì)損失函數(shù)進(jìn)行改良,并提出了新的方案,能一方面增大類(lèi)間距離并同時(shí)最細(xì)化類(lèi)內(nèi)距離。這代表能提高所計(jì)算出的高維特征向量的唯一性,并能有效的提高可識(shí)別率。
千視通卡視聯(lián)動(dòng)技戰(zhàn)法,Re-ID+人臉識(shí)別助力高效辦案
提到計(jì)算機(jī)視覺(jué)領(lǐng)域的大規(guī)模應(yīng)用,大家首先想到的是人臉識(shí)別,其實(shí)Re-ID作為新興研究方向在最近幾年受到的關(guān)注程度是非常高的。千視通發(fā)現(xiàn),目前人臉識(shí)別技術(shù)在安防行業(yè)落地較多,的確是發(fā)展所向,但在很多實(shí)際場(chǎng)景中,人臉識(shí)別技術(shù)作用并不突出。
受限于視頻監(jiān)控探頭的安裝高度及密度,在實(shí)際運(yùn)行過(guò)程中,它們更多拍到的是行人的頭頂、后腦勺或者側(cè)臉。其次,即便拍到人臉,攝像頭拍攝的像素可能不高,尤其是遠(yuǎn)景攝像頭里面人臉截出來(lái)很可能都沒(méi)有32x32的像素。所以人臉識(shí)別在實(shí)際的重識(shí)別應(yīng)用中很可能有限,無(wú)法看清。
于是,千視通基于多年實(shí)戰(zhàn)經(jīng)驗(yàn),提出一種卡視聯(lián)動(dòng)技戰(zhàn)法,結(jié)合人臉識(shí)別和跨鏡追蹤(Re-ID)各自的特點(diǎn)及優(yōu)勢(shì),以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對(duì)監(jiān)控范圍進(jìn)行覆蓋,具有極強(qiáng)的實(shí)戰(zhàn)價(jià)值,對(duì)安防行業(yè)具有顛覆性意義。
讓AI算法落地,不斷尋找業(yè)務(wù)場(chǎng)景
技術(shù)發(fā)展永遠(yuǎn)都是一條向上的道路,對(duì)于Re-ID技術(shù)的精進(jìn)上,千視通不斷投入大量資源進(jìn)行相關(guān)技術(shù)研究、攻克。但無(wú)論是數(shù)據(jù)排名如何刷新、趕超世界水準(zhǔn),都繞不開(kāi)一個(gè)最重要的議題:讓AI算法落地。作為國(guó)內(nèi)第一家發(fā)布視頻搜索產(chǎn)品的
計(jì)算機(jī)視覺(jué)科技公司,千視通七年里一直在最前線(xiàn)深耕,在業(yè)務(wù)場(chǎng)景里發(fā)現(xiàn)行業(yè)痛點(diǎn)并不斷打磨算法和產(chǎn)品,獲得了300+客戶(hù)單位的認(rèn)可。
千視通相信,AI技術(shù)的發(fā)展要與場(chǎng)景應(yīng)用密切結(jié)合,用最好的服務(wù)去發(fā)揮AI算法的價(jià)值,推動(dòng)各行各業(yè)邁入更高效的時(shí)代去賦能。隨著場(chǎng)景愈加豐富與成熟,千視通的技術(shù)也在迅速往前超。
由一項(xiàng)技術(shù)的突破,衍生到規(guī)?;倪\(yùn)作,為一個(gè)行業(yè)帶來(lái)更極致的降本增效,人工智能,讓城市更加安全、便捷、智慧,是千視通一直秉承的偉大使命!