近日,佳都科技參股公司千視通在行人再識別跨鏡追蹤技術(Re-ID)的測試中公布了最新數(shù)據(jù),刷新了行業(yè)紀錄。
作為一家以Re-ID視頻結構化技術和應用為核心的計算機視覺科技公司,千視通團隊在Market 1501、DukeMTMC-reID、CUHK03這三個衡量Re-ID技術最通用的數(shù)據(jù)集測試中,獲得了巨大突破。這些數(shù)據(jù)集中有兩項核心指標評判標準:首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,縮寫mAP,它反映檢索的人在底庫中的所有圖片排在結果隊列前面的程度)。
千視通目前在Market 1501上的首位命中率(Rank-1 Accuracy)已經(jīng)達到97.1%,超越人眼識別能力(94%),領先頭部廠家,并刷新了今年4月公布的96.6%的世界紀錄。同時在CUHK03,Duke MTMC-reID兩個數(shù)據(jù)集上也刷新了之前業(yè)內最高紀錄,達到了行業(yè)state of the art的技術水平,特別是在CUHK03數(shù)據(jù)集上,Rank 1指標提高了10.7%。
Market 1501:由清華大學提供 ,使用了6個攝像頭(5高清和1低清),鏡頭之間有部份重疊,當中有 1501個人的身份,共有32668個標物框/行人圖片。千視通在最新的測試報告中顯示,該數(shù)據(jù)集中首位命中率高達97.1%(籃框代表正確目標,紅框代表誤報或不清晰目標)。
(千視通Market1501 部分測試結果)
Duke MTMC-reID:格式基本上跟 Market 1501一樣,共有1404個人的身份,并 36411個標物框/行人圖片。DukeMTMC其實不止有Re-ID用的訓練及測試素材,它本來是用于視頻之間的(真正)多攝像頭多軌跡動態(tài)追蹤。用來訓練或測試 Re-ID,只是它的其中一個功能。千視通在Duke MTMC-reID數(shù)據(jù)集中測試的mAP結果78.9%,刷新之前榜單第一的78.4%,而Rank1成績?yōu)?9.1%,超過之前第一名88.7%。
(千視通Duke MTMC-ReID 部分測試結果)
CUHK03: 是香港中文大學所提供的。它前身有CUHK01 和CUHK02,因為這兩個數(shù)據(jù)庫不夠作深度學習訓練,所以采集了更多數(shù)據(jù)生成 CUHK03。這個數(shù)據(jù)庫有1360個人的身份,并有 13164張圖片,同樣由6個攝像頭所拍攝。千視通在該數(shù)據(jù)集中測試的mAP結果為74.8%,遠遠超過原先排行第一的67.4%數(shù)據(jù),而Rank1更是達到78.7%,比之前榜首的68%提升了足足10.7%。
(千視通CUHK03 部分測試結果)
以上數(shù)據(jù)由國家超級計算長沙中心,以及長沙市公安局刑事偵查支隊視頻偵查大隊測試驗證。
自研技術創(chuàng)新
千視通Re-ID算法有效提高可識別率
Re-identification,簡稱Re-ID,即行人再識別,是利用計算機視覺技術判斷圖像或者視頻序列中是否存在特定行人的技術。作為人臉識別技術的重要補充,其發(fā)展內核便是在不同視頻中,在無法獲取清晰人臉特征信息前提下,機器通過穿著、發(fā)型、體態(tài)等信息將同一個人識別出來,增強數(shù)據(jù)的時空連接性。可廣泛應用于智能視頻監(jiān)控、智能安保等領域。
舉個例子,我們所熟悉的哈利·波特作品,在《阿茲卡班囚徒》中想象出一種叫做活點地圖 (Marauder’s Map)的魔法道具,展開地圖,除了顯示基本地圖信息外,還能實時觀看某個指定人物的行動軌跡。
回到現(xiàn)實世界,我們現(xiàn)在可以在攝像頭的部署環(huán)境中,通過上傳特定人物的照片,同時檢測多個不同位置的攝像頭數(shù)據(jù),精準找出所有攝像頭抓拍到的目標人物圖像,并生成他/她的行動時空軌跡,達到跨鏡追蹤的目的。
由于多個攝像頭下拍攝行人的角度、光線等條件不同,圖像中的行人很難被判斷為同一個人。所以就要找到行人上的局部不變的部分,比如:衣服顏色,衣服紋理,手提包,背包等。同時行人兼具剛性和柔性的特性 ,外觀易受穿著、尺度、遮擋、姿態(tài)和視角等影響,行人再識別是一個既具研究價值同時又極富挑戰(zhàn)性的課題,為了提升Re-ID的可識別率,千視通做了多方面的算法優(yōu)化,致力于加速Re-ID的應用落地。
-
考慮訊息全面:一般算法只考慮了全局、多粒度及水平匯集訊息,而水平匯集訊息主要用于把圖片對齊。在實際的情況下,攝像頭的角度多變,同時人行是非剛體,所以,垂直方向也理應同時考慮。對于此種情況,千視通在網(wǎng)絡設計上開發(fā)了自研的垂直匯集及其關聯(lián)的算法層,用以更好的適應以上情況。
-
強化特征空間的可分辨性:千視通的 ReID 算法,針對損失函數(shù)進行改良,并提出了新的方案,能一方面增大類間距離并同時最細化類內距離。這代表能提高所計算出的高維特征向量的唯一性,并能有效的提高可識別率。
千視通卡視聯(lián)動技戰(zhàn)法
Re-ID+人臉識別助力高效辦案
提到計算機視覺領域的大規(guī)模應用,大家首先想到的是人臉識別,其實Re-ID作為新興研究方向在最近幾年受到的關注程度是非常高的。千視通發(fā)現(xiàn),目前人臉識別技術在安防行業(yè)落地較多,的確是發(fā)展所向,但在很多實際場景中,人臉識別技術作用并不突出。
受限于視頻監(jiān)控探頭的安裝高度及密度,在實際運行過程中,它們更多拍到的是行人的頭頂、后腦勺或者側臉。其次,即便拍到人臉,攝像頭拍攝的像素可能不高,尤其是遠景攝像頭里面人臉截出來很可能都沒有32x32的像素。所以人臉識別在實際的重識別應用中很可能有限,無法看清。
于是,千視通基于多年實戰(zhàn)經(jīng)驗,提出一種卡視聯(lián)動技戰(zhàn)法,結合人臉識別和跨鏡追蹤(Re-ID)各自的特點及優(yōu)勢,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋,具有極強的實戰(zhàn)價值,對安防行業(yè)具有顛覆性意義。
讓AI算法落地
不斷尋找業(yè)務場景
技術發(fā)展永遠都是一條向上的道路,對于Re-ID技術的精進上,千視通不斷投入大量資源進行相關技術研究、攻克。但無論是數(shù)據(jù)排名如何刷新、趕超世界水準,都繞不開一個最重要的議題:讓AI算法落地。作為國內第一家發(fā)布視頻搜索產品的人工智能計算機視覺科技公司,千視通七年里一直在最前線深耕,在業(yè)務場景里發(fā)現(xiàn)行業(yè)痛點并不斷打磨算法和產品,獲得了300+客戶單位的認可。
千視通相信,AI技術的發(fā)展要與場景應用密切結合,用最好的服務去發(fā)揮AI算法的價值,推動各行各業(yè)邁入更高效的時代去賦能。隨著場景愈加豐富與成熟,千視通的技術也在迅速往前超。
由一項技術的突破,衍生到規(guī)模化的運作,為一個行業(yè)帶來更極致的降本增效,人工智能,讓城市更加安全、便捷、智慧,是千視通一直秉承的偉大使命!
(來源:千視通)