人才濟(jì)濟(jì)的CV賽道,從來不缺黑馬,千視通便是其中一匹。
近日,主打原創(chuàng)人工智能算法與視頻深度學(xué)習(xí)技術(shù)的千視通,在Market 1501、DukeMTMC-reID、CUHK03這三個(gè)衡量Re-ID技術(shù)最通用的數(shù)據(jù)集測(cè)試中,獲得了巨大突破。 這些數(shù)據(jù)集中有兩項(xiàng)核心指標(biāo)評(píng)判標(biāo)準(zhǔn):首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,縮寫mAP,它反映檢索的人在底庫中的所有圖片排在結(jié)果隊(duì)列前面的程度)。
根據(jù)相關(guān)數(shù)據(jù)顯示,目前千視通在Market 1501上的首位命中率(Rank-1 Accuracy)已經(jīng)達(dá)到97.1%,超越人眼識(shí)別能力(94%),并刷新了今年4月公布的96.6%的行業(yè)紀(jì)錄。
同時(shí)在CUHK03,Duke MTMC-reID兩個(gè)數(shù)據(jù)集上也刷新了之前業(yè)內(nèi)最高紀(jì)錄,達(dá)到了行業(yè)state of the art的技術(shù)水平,特別是在CUHK03數(shù)據(jù)集上,Rank 1指標(biāo)提高了10.7%。
注:以上數(shù)據(jù)由國(guó)家超級(jí)計(jì)算長(zhǎng)沙中心,以及長(zhǎng)沙市公安局刑事偵查支隊(duì)視頻偵查大隊(duì)測(cè)試驗(yàn)證。
人臉識(shí)別后
千視通用ReID“擦亮”AI天眼
成立于2011年的千視通是一家視頻大數(shù)據(jù)結(jié)構(gòu)化技術(shù)提供商。短短七年時(shí)間,其已經(jīng)手握500家客戶,在香港、深圳、蘇州、長(zhǎng)沙均設(shè)有研發(fā)中心,并于上月斬獲近億元A輪融資。
與所有賽道玩家一樣,對(duì)于AI技術(shù)的深耕與落地是千視通的立業(yè)之本。
如果有人追問,在AI安防市場(chǎng)大局將定的下半場(chǎng),千視通緣何還能逆風(fēng)猛進(jìn),其CTO胡大鵬博士試圖給出答案。
當(dāng)包括AI在內(nèi)的前沿科技成為所有企業(yè)的最強(qiáng)競(jìng)爭(zhēng)力及核心生產(chǎn)力,那些癡迷于技術(shù)的工程師們便取代了此前數(shù)世紀(jì)的冒險(xiǎn)家們成為商業(yè)之神赫爾墨斯的新寵。
作為一直在學(xué)術(shù)界耕耘的前沿學(xué)者,胡大鵬博士自香港科技大學(xué)畢業(yè)后,先后任職北京微軟亞洲研究所、香港中文大學(xué)等科研機(jī)構(gòu)。
之后,他帶著在機(jī)器視覺技術(shù)產(chǎn)業(yè)轉(zhuǎn)化和應(yīng)用開發(fā)方面的豐富經(jīng)驗(yàn)落地安防圈,讓AI技術(shù)重塑已經(jīng)塵封多年未做改變的安防市場(chǎng)。
在胡大鵬博士看來,以AI技術(shù)為代表的高新科技的發(fā)展為人們提供了越來越多的可能性。 它與傳統(tǒng)安防行業(yè)的結(jié)合,不僅重新定義了產(chǎn)品的作業(yè)、體驗(yàn)方式,還不斷顛覆與重塑著整個(gè)行業(yè)的價(jià)值鏈。
用他的話說,“得益于AI的發(fā)展,新的‘安防’時(shí)代正在誕生。”
2014年前后,成百上千家 AI初創(chuàng)企業(yè)陸續(xù)帶著天賦殺入了這個(gè)稍顯禁錮的傳統(tǒng)產(chǎn)業(yè),而后又紛紛折戟收?qǐng)觥⑴诨沂谷弧?/span>
撫今追昔,當(dāng)人們還沒來得及反思悲傷,千視通已經(jīng)從新老巨頭的爭(zhēng)食中掘開一條血道,收獲大批客戶、斬獲巨額融資。
而所有的一切原因在胡大鵬博士看來可以總結(jié)為一點(diǎn):持續(xù)在自己最懂的行業(yè)中做最擅長(zhǎng)的事。 持續(xù)便是沒有理由的堅(jiān)持,最懂的行業(yè)無疑則是安防,而最擅長(zhǎng)的事便是包括ReID(跨鏡頭追蹤)在內(nèi)的AI技術(shù)。
ReID全稱為Re-identification,是近年來計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重點(diǎn)研究方向。作為人臉識(shí)別技術(shù)的重要補(bǔ)充,其發(fā)展內(nèi)核便是在不同視頻中且無法獲取清晰人臉特征信息前提下,機(jī)器通過穿著、發(fā)型、體態(tài)等信息將同一個(gè)人識(shí)別出來,增強(qiáng)數(shù)據(jù)的時(shí)空連接性。
八十字描述便準(zhǔn)確說明了該技術(shù)的發(fā)展意義,但從0到1的研究、發(fā)展、應(yīng)用過程中,ReID技術(shù)經(jīng)歷了較長(zhǎng)的蟄伏期。
不同于人臉特征信息的唯一性,ReID技術(shù)在運(yùn)行過程中遇到的難題與人臉識(shí)別技術(shù)可以說根本不在一個(gè)層級(jí)。
由于不同攝像設(shè)備之間存在差異,行人外觀易受穿著、尺度、遮擋、姿態(tài)和視角等影響,行人再識(shí)別是一個(gè)既具研究?jī)r(jià)值同時(shí)又極富挑戰(zhàn)性的課題。
在胡大鵬博士看來,“ReID是AI技術(shù)在安防行業(yè)縱橫發(fā)展中必過的一道檻,不能因?yàn)殡y所以讓其停滯不前?!?/span>
他解釋說,目前人臉識(shí)別技術(shù)在安防行業(yè)落地較多,同時(shí)也的確是發(fā)展所向,但在很多實(shí)際場(chǎng)景中,人臉識(shí)別技術(shù)作用并不突出。
受限于視頻監(jiān)控探頭的安裝高度及密度,在實(shí)際運(yùn)行過程中,它們更多拍到的是行人的頭頂、后腦勺或者側(cè)臉。其次,即便拍到人臉,攝像頭拍攝的像素可能不高,尤其是遠(yuǎn)景攝像頭里面人臉截出來很可能都沒有32x32的像素。所以人臉識(shí)別在實(shí)際的重識(shí)別應(yīng)用中很可能有限,無法看清。
相關(guān)數(shù)據(jù)統(tǒng)計(jì),目前全國(guó)運(yùn)行的視頻監(jiān)控探頭中,能夠準(zhǔn)確、清晰捕捉到人臉特征信息的視頻監(jiān)控?cái)z像頭不到10%。
而這便出現(xiàn)了一個(gè)非常棘手且尷尬的問題:視頻監(jiān)控探頭遍地都是,而大部分探頭卻看不清楚人臉,當(dāng)監(jiān)控中的人走入另外一臺(tái)攝像機(jī)的監(jiān)控范圍,機(jī)器如何辨別“誰”是 “誰”?
“ReID技術(shù)便可以很好地解決這個(gè)問題?!焙簌i博士說道。
AI通過機(jī)器學(xué)習(xí)輸出的結(jié)構(gòu)化信息,其實(shí)本質(zhì)上是建立了一個(gè)多維向量模型。這時(shí)候,機(jī)器可以給每一個(gè)模型一個(gè)編號(hào),做跨攝像頭的人形追蹤。
裝載“人形追蹤”技術(shù)的監(jiān)控?cái)z像頭可以將一個(gè)人的行為軌跡還原;之后,只要出現(xiàn)在任何一臺(tái)可以識(shí)別人臉的攝像頭中,就可以被輕易鎖定,不會(huì)出現(xiàn)“斷片”現(xiàn)象。
和單點(diǎn)監(jiān)控相比,ReID方案通過多組攝像機(jī)的軌跡還原及人員比對(duì)讓安防工作變得更為立體,方便辦案民警對(duì)目標(biāo)嫌疑人的行為軌跡、出行規(guī)律進(jìn)行分析,進(jìn)而為案情線索和實(shí)施靈活布控打擊提供依據(jù)。
胡大鵬博士判斷,“現(xiàn)階段大家都在展示視頻結(jié)構(gòu)化,其實(shí)更難的是基于跨攝像頭的人形追蹤。該技術(shù)的發(fā)展對(duì)于安防行業(yè)來說也具顛覆性作用?!?/span>
千視通卡視聯(lián)動(dòng)技戰(zhàn)法
Re-ID+人臉識(shí)別助力高效辦案
作為計(jì)算機(jī)視覺研究的熱門方向,雷鋒網(wǎng)了解到,除了千視通之外,目前包括曠視、云從等廠商已經(jīng)在ReID技術(shù)研究上發(fā)力。 但就該技術(shù)在過去一段時(shí)間的發(fā)展落地來看,不同廠商的技術(shù)比拼之間、該技術(shù)與人臉識(shí)別技術(shù)的準(zhǔn)確率之間,效果都相差甚遠(yuǎn)。
對(duì)于不同廠商的技術(shù)實(shí)力比拼,胡大鵬博士透露,千視通之所以能夠得到比較好的結(jié)果,最大的原因則是與傳統(tǒng)的全局表征或設(shè)定好的局部分割方法不同。
一、一般算法只考慮了全局、多粒度及水平匯集訊息,而水平匯集訊息主要用于把圖片對(duì)齊。在實(shí)際的情況下,攝像頭的角度多變,同時(shí)人行是非剛體,所以,垂直方向也理應(yīng)同時(shí)考慮。對(duì)于此種情況,千視通在網(wǎng)絡(luò)設(shè)計(jì)上開發(fā)了自研的垂直匯集及其關(guān)聯(lián)的算法層,用以更好的適應(yīng)以上情況。
二、針對(duì)損失函數(shù)進(jìn)行改良,千視通的 ReID 算法提出了新的方案,能一方面增大類間距離并同時(shí)最細(xì)化類內(nèi)距離。這代表能提高所計(jì)算出的高維特征向量的唯一性,并能有效的提高可識(shí)別率。
而相較人臉識(shí)別技術(shù)準(zhǔn)確率尚存差距,胡大鵬博士坦言,就ReID技術(shù)來說,其數(shù)據(jù)采集特點(diǎn)鮮明:
總結(jié)來看,互聯(lián)網(wǎng)無法提供有效數(shù)據(jù),而大規(guī)模搜集又涉及到隱私問題,由于受影響因素復(fù)雜多樣且數(shù)據(jù)集規(guī)模小,該技術(shù)數(shù)據(jù)獲取難度非常大,算法難度也較大。
也就是說,ReID技術(shù)的天然短板讓其在相同時(shí)間內(nèi)不能超過人臉識(shí)別技術(shù)。
他同時(shí)補(bǔ)充說,技術(shù)發(fā)展永遠(yuǎn)都是單向向上過程,絕無止境,在對(duì)于ReID技術(shù)的精進(jìn)上,千視通不會(huì)輕言放棄,并于香港成立了AI研究院,投入大量資源進(jìn)行相關(guān)技術(shù)研究、攻克。
此外,他還認(rèn)為,深耕安防產(chǎn)業(yè),做好單一算法的同時(shí),還需要關(guān)注其他算法以及產(chǎn)品的最終形態(tài),畢竟這才是與用戶真正接觸的部分,其也決定了產(chǎn)品的實(shí)用性及企業(yè)的業(yè)界口碑。
鑒于此,千視通基于多年實(shí)戰(zhàn)經(jīng)驗(yàn),提出一種卡視聯(lián)動(dòng)技戰(zhàn)法,結(jié)合人臉識(shí)別和跨鏡追蹤(Re-ID)各自的特點(diǎn)及優(yōu)勢(shì),以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對(duì)監(jiān)控范圍進(jìn)行覆蓋,具有極強(qiáng)的實(shí)戰(zhàn)價(jià)值,對(duì)安防行業(yè)具有顛覆性意義。
知己知彼方能百戰(zhàn)不殆
對(duì)于千視通所深耕的安防行業(yè),胡大鵬博士認(rèn)知非常深刻。
他說,過去幾十年中,安防行業(yè)的快速發(fā)展遇到了諸多阻礙。比如前端智能化不理想,目前國(guó)內(nèi)傳統(tǒng)天網(wǎng)絕大部分?jǐn)z像頭還是標(biāo)清和制高點(diǎn)的高清。它們并不能清晰地拍到公安想要的角度的圖像。
比如各個(gè)部門之間的數(shù)據(jù)難以打通。中國(guó)原有的IT部門都是建立一個(gè)一個(gè)的“煙囪”。“煙囪式”架構(gòu)也就是垂直的體系結(jié)構(gòu),每一個(gè)IT系統(tǒng)都有自己的存儲(chǔ)和IT設(shè)備,以及獨(dú)立的管理工具和數(shù)據(jù)庫,不同的系統(tǒng)不能共享資源,不能交付和訪問,形成了資源孤島和信息孤島。
再比如業(yè)務(wù)流程難以改變。用戶需要改變?cè)械淖鳂I(yè)模式,針對(duì)各個(gè)模式去調(diào)整工作機(jī)制。
與此同時(shí),他也看到了安防行業(yè)未來的一些發(fā)展機(jī)會(huì)及技術(shù)發(fā)展趨勢(shì)。
胡大鵬博士分析,以近期即將舉辦的2018北京安博會(huì)為例來說,參會(huì)各方必將圍繞智慧城市相關(guān)的大數(shù)據(jù)、云計(jì)算、loT話題展開熱烈的討論。
基于結(jié)構(gòu)化數(shù)據(jù)提取的邊緣計(jì)算作為智慧城市效率提升的重要承載,無疑將會(huì)成為大會(huì)矚目的焦點(diǎn)。
智慧城市數(shù)據(jù)處理中心需要通過邊緣計(jì)算的助力,來接受少量、精準(zhǔn)、無損的結(jié)構(gòu)化視頻數(shù)據(jù),減緩帶寬壓力,節(jié)約系統(tǒng)存儲(chǔ)和計(jì)算資源,輔助信息快速檢索、定向數(shù)據(jù)挖掘及系統(tǒng)聯(lián)動(dòng)的實(shí)現(xiàn),從而在整體上提升系統(tǒng)的實(shí)時(shí)響應(yīng)速度和分析精度。
在大量硬件廠商的支持和投入之下,目前市場(chǎng)上已經(jīng)開始出現(xiàn)了一些低成本、高算力的深度學(xué)習(xí)運(yùn)算芯片,能夠把部分算力轉(zhuǎn)移出來,甚至轉(zhuǎn)移至前端。
“端+云”方案不僅僅是將算力轉(zhuǎn)移這么簡(jiǎn)單,它能讓前/后端發(fā)揮它應(yīng)有的功能,前端感知、后端認(rèn)知,分工明確、算力協(xié)同,從而降低存儲(chǔ)成本、提升數(shù)據(jù)傳輸效率、減輕后端分析壓力,提升人工智能生態(tài)系統(tǒng)綜合服務(wù)能力。
對(duì)于未來的發(fā)展目標(biāo)及規(guī)劃,胡大鵬博士表示會(huì)堅(jiān)定“技術(shù)落地,算法先行”戰(zhàn)略。
無論市場(chǎng)上有何聲音,千視通依然會(huì)與精度“較勁”、依然會(huì)在AI安防上持續(xù)深耕,解鎖更多業(yè)務(wù)場(chǎng)景。
(來源:雷鋒網(wǎng))