近日,佳都科技參股公司千視通在行人再識別跨鏡追蹤技術(shù)(Re-ID)的測試中公布了最新數(shù)據(jù),刷新了行業(yè)紀(jì)錄。
作為一家以Re-ID視頻結(jié)構(gòu)化技術(shù)和應(yīng)用為核心的計算機(jī)視覺科技公司,千視通團(tuán)隊在Market 1501、DukeMTMC-reID、CUHK03這三個衡量Re-ID技術(shù)最通用的數(shù)據(jù)集測試中,獲得了巨大突破。這些數(shù)據(jù)集中有兩項核心指標(biāo)評判標(biāo)準(zhǔn):首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,縮寫mAP,它反映檢索的人在底庫中的所有圖片排在結(jié)果隊列前面的程度)。
千視通目前在Market 1501上的首位命中率(Rank-1 Accuracy)已經(jīng)達(dá)到97.1%,超越人眼識別能力(94%),領(lǐng)先頭部廠家,并刷新了今年4月公布的96.6%的世界紀(jì)錄。同時在CUHK03,Duke MTMC-reID兩個數(shù)據(jù)集上也刷新了之前業(yè)內(nèi)最高紀(jì)錄,達(dá)到了行業(yè)state of the art的技術(shù)水平,特別是在CUHK03數(shù)據(jù)集上,Rank 1指標(biāo)提高了10.7%。
Market 1501:由清華大學(xué)提供 ,使用了6個攝像頭(5高清和1低清),鏡頭之間有部份重疊,當(dāng)中有 1501個人的身份,共有32668個標(biāo)物框/行人圖片。千視通在最新的測試報告中顯示,該數(shù)據(jù)集中首位命中率高達(dá)97.1%(籃框代表正確目標(biāo),紅框代表誤報或不清晰目標(biāo))。
(千視通Market1501 部分測試結(jié)果)
Duke MTMC-reID:格式基本上跟 Market 1501一樣,共有1404個人的身份,并 36411個標(biāo)物框/行人圖片。DukeMTMC其實不止有Re-ID用的訓(xùn)練及測試素材,它本來是用于視頻之間的(真正)多攝像頭多軌跡動態(tài)追蹤。用來訓(xùn)練或測試 Re-ID,只是它的其中一個功能。千視通在Duke MTMC-reID數(shù)據(jù)集中測試的mAP結(jié)果78.9%,刷新之前榜單第一的78.4%,而Rank1成績?yōu)?9.1%,超過之前第一名88.7%。
(千視通Duke MTMC-ReID 部分測試結(jié)果)
CUHK03: 是香港中文大學(xué)所提供的。它前身有CUHK01 和CUHK02,因為這兩個數(shù)據(jù)庫不夠作深度學(xué)習(xí)訓(xùn)練,所以采集了更多數(shù)據(jù)生成 CUHK03。這個數(shù)據(jù)庫有1360個人的身份,并有 13164張圖片,同樣由6個攝像頭所拍攝。千視通在該數(shù)據(jù)集中測試的mAP結(jié)果為74.8%,遠(yuǎn)遠(yuǎn)超過原先排行第一的67.4%數(shù)據(jù),而Rank1更是達(dá)到78.7%,比之前榜首的68%提升了足足10.7%。
(千視通CUHK03 部分測試結(jié)果)
以上數(shù)據(jù)由國家超級計算長沙中心,以及長沙市公安局刑事偵查支隊視頻偵查大隊測試驗證。
自研技術(shù)創(chuàng)新
千視通Re-ID算法有效提高可識別率
Re-identification,簡稱Re-ID,即行人再識別,是利用計算機(jī)視覺技術(shù)判斷圖像或者視頻序列中是否存在特定行人的技術(shù)。作為人臉識別技術(shù)的重要補(bǔ)充,其發(fā)展內(nèi)核便是在不同視頻中,在無法獲取清晰人臉特征信息前提下,機(jī)器通過穿著、發(fā)型、體態(tài)等信息將同一個人識別出來,增強(qiáng)數(shù)據(jù)的時空連接性。可廣泛應(yīng)用于智能視頻監(jiān)控、智能安保等領(lǐng)域。
舉個例子,我們所熟悉的哈利·波特作品,在《阿茲卡班囚徒》中想象出一種叫做活點地圖 (Marauder’s Map)的魔法道具,展開地圖,除了顯示基本地圖信息外,還能實時觀看某個指定人物的行動軌跡。
回到現(xiàn)實世界,我們現(xiàn)在可以在攝像頭的部署環(huán)境中,通過上傳特定人物的照片,同時檢測多個不同位置的攝像頭數(shù)據(jù),精準(zhǔn)找出所有攝像頭抓拍到的目標(biāo)人物圖像,并生成他/她的行動時空軌跡,達(dá)到跨鏡追蹤的目的。
由于多個攝像頭下拍攝行人的角度、光線等條件不同,圖像中的行人很難被判斷為同一個人。所以就要找到行人上的局部不變的部分,比如:衣服顏色,衣服紋理,手提包,背包等。同時行人兼具剛性和柔性的特性 ,外觀易受穿著、尺度、遮擋、姿態(tài)和視角等影響,行人再識別是一個既具研究價值同時又極富挑戰(zhàn)性的課題,為了提升Re-ID的可識別率,千視通做了多方面的算法優(yōu)化,致力于加速Re-ID的應(yīng)用落地。
-
考慮訊息全面:一般算法只考慮了全局、多粒度及水平匯集訊息,而水平匯集訊息主要用于把圖片對齊。在實際的情況下,攝像頭的角度多變,同時人行是非剛體,所以,垂直方向也理應(yīng)同時考慮。對于此種情況,千視通在網(wǎng)絡(luò)設(shè)計上開發(fā)了自研的垂直匯集及其關(guān)聯(lián)的算法層,用以更好的適應(yīng)以上情況。
-
強(qiáng)化特征空間的可分辨性:千視通的 ReID 算法,針對損失函數(shù)進(jìn)行改良,并提出了新的方案,能一方面增大類間距離并同時最細(xì)化類內(nèi)距離。這代表能提高所計算出的高維特征向量的唯一性,并能有效的提高可識別率。
千視通卡視聯(lián)動技戰(zhàn)法
Re-ID+人臉識別助力高效辦案
提到計算機(jī)視覺領(lǐng)域的大規(guī)模應(yīng)用,大家首先想到的是人臉識別,其實Re-ID作為新興研究方向在最近幾年受到的關(guān)注程度是非常高的。千視通發(fā)現(xiàn),目前人臉識別技術(shù)在安防行業(yè)落地較多,的確是發(fā)展所向,但在很多實際場景中,人臉識別技術(shù)作用并不突出。
受限于視頻監(jiān)控探頭的安裝高度及密度,在實際運(yùn)行過程中,它們更多拍到的是行人的頭頂、后腦勺或者側(cè)臉。其次,即便拍到人臉,攝像頭拍攝的像素可能不高,尤其是遠(yuǎn)景攝像頭里面人臉截出來很可能都沒有32x32的像素。所以人臉識別在實際的重識別應(yīng)用中很可能有限,無法看清。
于是,千視通基于多年實戰(zhàn)經(jīng)驗,提出一種卡視聯(lián)動技戰(zhàn)法,結(jié)合人臉識別和跨鏡追蹤(Re-ID)各自的特點及優(yōu)勢,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進(jìn)行覆蓋,具有極強(qiáng)的實戰(zhàn)價值,對安防行業(yè)具有顛覆性意義。
讓AI算法落地
不斷尋找業(yè)務(wù)場景
技術(shù)發(fā)展永遠(yuǎn)都是一條向上的道路,對于Re-ID技術(shù)的精進(jìn)上,千視通不斷投入大量資源進(jìn)行相關(guān)技術(shù)研究、攻克。但無論是數(shù)據(jù)排名如何刷新、趕超世界水準(zhǔn),都繞不開一個最重要的議題:讓AI算法落地。作為國內(nèi)第一家發(fā)布視頻搜索產(chǎn)品的人工智能計算機(jī)視覺科技公司,千視通七年里一直在最前線深耕,在業(yè)務(wù)場景里發(fā)現(xiàn)行業(yè)痛點并不斷打磨算法和產(chǎn)品,獲得了300+客戶單位的認(rèn)可。
千視通相信,AI技術(shù)的發(fā)展要與場景應(yīng)用密切結(jié)合,用最好的服務(wù)去發(fā)揮AI算法的價值,推動各行各業(yè)邁入更高效的時代去賦能。隨著場景愈加豐富與成熟,千視通的技術(shù)也在迅速往前超。
由一項技術(shù)的突破,衍生到規(guī)?;倪\(yùn)作,為一個行業(yè)帶來更極致的降本增效,人工智能,讓城市更加安全、便捷、智慧,是千視通一直秉承的偉大使命!
(來源:千視通)