人才濟濟的CV賽道,從來不缺黑馬,千視通便是其中一匹。
近日,主打原創(chuàng)人工智能算法與視頻深度學(xué)習(xí)技術(shù)的千視通,在Market 1501、DukeMTMC-reID、CUHK03這三個衡量Re-ID技術(shù)最通用的數(shù)據(jù)集測試中,獲得了巨大突破。 這些數(shù)據(jù)集中有兩項核心指標(biāo)評判標(biāo)準(zhǔn):首位命中率(Rank-1 Accuracy)以及平均精度均值(Mean Average Precision,縮寫mAP,它反映檢索的人在底庫中的所有圖片排在結(jié)果隊列前面的程度)。
根據(jù)相關(guān)數(shù)據(jù)顯示,目前千視通在Market 1501上的首位命中率(Rank-1 Accuracy)已經(jīng)達到97.1%,超越人眼識別能力(94%),并刷新了今年4月公布的96.6%的行業(yè)紀(jì)錄。
同時在CUHK03,Duke MTMC-reID兩個數(shù)據(jù)集上也刷新了之前業(yè)內(nèi)最高紀(jì)錄,達到了行業(yè)state of the art的技術(shù)水平,特別是在CUHK03數(shù)據(jù)集上,Rank 1指標(biāo)提高了10.7%。
注:以上數(shù)據(jù)由國家超級計算長沙中心,以及長沙市公安局刑事偵查支隊視頻偵查大隊測試驗證。
人臉識別后
千視通用ReID“擦亮”AI天眼
成立于2011年的千視通是一家視頻大數(shù)據(jù)結(jié)構(gòu)化技術(shù)提供商。短短七年時間,其已經(jīng)手握500家客戶,在香港、深圳、蘇州、長沙均設(shè)有研發(fā)中心,并于上月斬獲近億元A輪融資。
與所有賽道玩家一樣,對于AI技術(shù)的深耕與落地是千視通的立業(yè)之本。
如果有人追問,在AI安防市場大局將定的下半場,千視通緣何還能逆風(fēng)猛進,其CTO胡大鵬博士試圖給出答案。
當(dāng)包括AI在內(nèi)的前沿科技成為所有企業(yè)的最強競爭力及核心生產(chǎn)力,那些癡迷于技術(shù)的工程師們便取代了此前數(shù)世紀(jì)的冒險家們成為商業(yè)之神赫爾墨斯的新寵。
作為一直在學(xué)術(shù)界耕耘的前沿學(xué)者,胡大鵬博士自香港科技大學(xué)畢業(yè)后,先后任職北京微軟亞洲研究所、香港中文大學(xué)等科研機構(gòu)。
之后,他帶著在機器視覺技術(shù)產(chǎn)業(yè)轉(zhuǎn)化和應(yīng)用開發(fā)方面的豐富經(jīng)驗落地安防圈,讓AI技術(shù)重塑已經(jīng)塵封多年未做改變的安防市場。
在胡大鵬博士看來,以AI技術(shù)為代表的高新科技的發(fā)展為人們提供了越來越多的可能性。 它與傳統(tǒng)安防行業(yè)的結(jié)合,不僅重新定義了產(chǎn)品的作業(yè)、體驗方式,還不斷顛覆與重塑著整個行業(yè)的價值鏈。
用他的話說,“得益于AI的發(fā)展,新的‘安防’時代正在誕生?!?/span>
2014年前后,成百上千家 AI初創(chuàng)企業(yè)陸續(xù)帶著天賦殺入了這個稍顯禁錮的傳統(tǒng)產(chǎn)業(yè),而后又紛紛折戟收場、炮灰使然。
撫今追昔,當(dāng)人們還沒來得及反思悲傷,千視通已經(jīng)從新老巨頭的爭食中掘開一條血道,收獲大批客戶、斬獲巨額融資。
而所有的一切原因在胡大鵬博士看來可以總結(jié)為一點:持續(xù)在自己最懂的行業(yè)中做最擅長的事。 持續(xù)便是沒有理由的堅持,最懂的行業(yè)無疑則是安防,而最擅長的事便是包括ReID(跨鏡頭追蹤)在內(nèi)的AI技術(shù)。
ReID全稱為Re-identification,是近年來計算機視覺領(lǐng)域的一個重點研究方向。作為人臉識別技術(shù)的重要補充,其發(fā)展內(nèi)核便是在不同視頻中且無法獲取清晰人臉特征信息前提下,機器通過穿著、發(fā)型、體態(tài)等信息將同一個人識別出來,增強數(shù)據(jù)的時空連接性。
八十字描述便準(zhǔn)確說明了該技術(shù)的發(fā)展意義,但從0到1的研究、發(fā)展、應(yīng)用過程中,ReID技術(shù)經(jīng)歷了較長的蟄伏期。
不同于人臉特征信息的唯一性,ReID技術(shù)在運行過程中遇到的難題與人臉識別技術(shù)可以說根本不在一個層級。
由于不同攝像設(shè)備之間存在差異,行人外觀易受穿著、尺度、遮擋、姿態(tài)和視角等影響,行人再識別是一個既具研究價值同時又極富挑戰(zhàn)性的課題。
在胡大鵬博士看來,“ReID是AI技術(shù)在安防行業(yè)縱橫發(fā)展中必過的一道檻,不能因為難所以讓其停滯不前?!?/span>
他解釋說,目前人臉識別技術(shù)在安防行業(yè)落地較多,同時也的確是發(fā)展所向,但在很多實際場景中,人臉識別技術(shù)作用并不突出。
受限于視頻監(jiān)控探頭的安裝高度及密度,在實際運行過程中,它們更多拍到的是行人的頭頂、后腦勺或者側(cè)臉。其次,即便拍到人臉,攝像頭拍攝的像素可能不高,尤其是遠景攝像頭里面人臉截出來很可能都沒有32x32的像素。所以人臉識別在實際的重識別應(yīng)用中很可能有限,無法看清。
相關(guān)數(shù)據(jù)統(tǒng)計,目前全國運行的視頻監(jiān)控探頭中,能夠準(zhǔn)確、清晰捕捉到人臉特征信息的視頻監(jiān)控攝像頭不到10%。
而這便出現(xiàn)了一個非常棘手且尷尬的問題:視頻監(jiān)控探頭遍地都是,而大部分探頭卻看不清楚人臉,當(dāng)監(jiān)控中的人走入另外一臺攝像機的監(jiān)控范圍,機器如何辨別“誰”是 “誰”?
“ReID技術(shù)便可以很好地解決這個問題。”胡大鵬博士說道。
AI通過機器學(xué)習(xí)輸出的結(jié)構(gòu)化信息,其實本質(zhì)上是建立了一個多維向量模型。這時候,機器可以給每一個模型一個編號,做跨攝像頭的人形追蹤。
裝載“人形追蹤”技術(shù)的監(jiān)控攝像頭可以將一個人的行為軌跡還原;之后,只要出現(xiàn)在任何一臺可以識別人臉的攝像頭中,就可以被輕易鎖定,不會出現(xiàn)“斷片”現(xiàn)象。
和單點監(jiān)控相比,ReID方案通過多組攝像機的軌跡還原及人員比對讓安防工作變得更為立體,方便辦案民警對目標(biāo)嫌疑人的行為軌跡、出行規(guī)律進行分析,進而為案情線索和實施靈活布控打擊提供依據(jù)。
胡大鵬博士判斷,“現(xiàn)階段大家都在展示視頻結(jié)構(gòu)化,其實更難的是基于跨攝像頭的人形追蹤。該技術(shù)的發(fā)展對于安防行業(yè)來說也具顛覆性作用?!?/span>
千視通卡視聯(lián)動技戰(zhàn)法
Re-ID+人臉識別助力高效辦案
作為計算機視覺研究的熱門方向,雷鋒網(wǎng)了解到,除了千視通之外,目前包括曠視、云從等廠商已經(jīng)在ReID技術(shù)研究上發(fā)力。 但就該技術(shù)在過去一段時間的發(fā)展落地來看,不同廠商的技術(shù)比拼之間、該技術(shù)與人臉識別技術(shù)的準(zhǔn)確率之間,效果都相差甚遠。
對于不同廠商的技術(shù)實力比拼,胡大鵬博士透露,千視通之所以能夠得到比較好的結(jié)果,最大的原因則是與傳統(tǒng)的全局表征或設(shè)定好的局部分割方法不同。
一、一般算法只考慮了全局、多粒度及水平匯集訊息,而水平匯集訊息主要用于把圖片對齊。在實際的情況下,攝像頭的角度多變,同時人行是非剛體,所以,垂直方向也理應(yīng)同時考慮。對于此種情況,千視通在網(wǎng)絡(luò)設(shè)計上開發(fā)了自研的垂直匯集及其關(guān)聯(lián)的算法層,用以更好的適應(yīng)以上情況。
二、針對損失函數(shù)進行改良,千視通的 ReID 算法提出了新的方案,能一方面增大類間距離并同時最細化類內(nèi)距離。這代表能提高所計算出的高維特征向量的唯一性,并能有效的提高可識別率。
而相較人臉識別技術(shù)準(zhǔn)確率尚存差距,胡大鵬博士坦言,就ReID技術(shù)來說,其數(shù)據(jù)采集特點鮮明:
總結(jié)來看,互聯(lián)網(wǎng)無法提供有效數(shù)據(jù),而大規(guī)模搜集又涉及到隱私問題,由于受影響因素復(fù)雜多樣且數(shù)據(jù)集規(guī)模小,該技術(shù)數(shù)據(jù)獲取難度非常大,算法難度也較大。
也就是說,ReID技術(shù)的天然短板讓其在相同時間內(nèi)不能超過人臉識別技術(shù)。
他同時補充說,技術(shù)發(fā)展永遠都是單向向上過程,絕無止境,在對于ReID技術(shù)的精進上,千視通不會輕言放棄,并于香港成立了AI研究院,投入大量資源進行相關(guān)技術(shù)研究、攻克。
此外,他還認為,深耕安防產(chǎn)業(yè),做好單一算法的同時,還需要關(guān)注其他算法以及產(chǎn)品的最終形態(tài),畢竟這才是與用戶真正接觸的部分,其也決定了產(chǎn)品的實用性及企業(yè)的業(yè)界口碑。
鑒于此,千視通基于多年實戰(zhàn)經(jīng)驗,提出一種卡視聯(lián)動技戰(zhàn)法,結(jié)合人臉識別和跨鏡追蹤(Re-ID)各自的特點及優(yōu)勢,以少量的人臉卡口加大量的普通監(jiān)控探頭的部署,既可鎖定嫌疑人身份,又能重現(xiàn)嫌疑人軌跡,這種創(chuàng)新的綜合型技戰(zhàn)法可以較大概率對監(jiān)控范圍進行覆蓋,具有極強的實戰(zhàn)價值,對安防行業(yè)具有顛覆性意義。
知己知彼方能百戰(zhàn)不殆
對于千視通所深耕的安防行業(yè),胡大鵬博士認知非常深刻。
他說,過去幾十年中,安防行業(yè)的快速發(fā)展遇到了諸多阻礙。比如前端智能化不理想,目前國內(nèi)傳統(tǒng)天網(wǎng)絕大部分攝像頭還是標(biāo)清和制高點的高清。它們并不能清晰地拍到公安想要的角度的圖像。
比如各個部門之間的數(shù)據(jù)難以打通。中國原有的IT部門都是建立一個一個的“煙囪”?!盁焽枋健奔軜?gòu)也就是垂直的體系結(jié)構(gòu),每一個IT系統(tǒng)都有自己的存儲和IT設(shè)備,以及獨立的管理工具和數(shù)據(jù)庫,不同的系統(tǒng)不能共享資源,不能交付和訪問,形成了資源孤島和信息孤島。
再比如業(yè)務(wù)流程難以改變。用戶需要改變原有的作業(yè)模式,針對各個模式去調(diào)整工作機制。
與此同時,他也看到了安防行業(yè)未來的一些發(fā)展機會及技術(shù)發(fā)展趨勢。
胡大鵬博士分析,以近期即將舉辦的2018北京安博會為例來說,參會各方必將圍繞智慧城市相關(guān)的大數(shù)據(jù)、云計算、loT話題展開熱烈的討論。
基于結(jié)構(gòu)化數(shù)據(jù)提取的邊緣計算作為智慧城市效率提升的重要承載,無疑將會成為大會矚目的焦點。
智慧城市數(shù)據(jù)處理中心需要通過邊緣計算的助力,來接受少量、精準(zhǔn)、無損的結(jié)構(gòu)化視頻數(shù)據(jù),減緩帶寬壓力,節(jié)約系統(tǒng)存儲和計算資源,輔助信息快速檢索、定向數(shù)據(jù)挖掘及系統(tǒng)聯(lián)動的實現(xiàn),從而在整體上提升系統(tǒng)的實時響應(yīng)速度和分析精度。
在大量硬件廠商的支持和投入之下,目前市場上已經(jīng)開始出現(xiàn)了一些低成本、高算力的深度學(xué)習(xí)運算芯片,能夠把部分算力轉(zhuǎn)移出來,甚至轉(zhuǎn)移至前端。
“端+云”方案不僅僅是將算力轉(zhuǎn)移這么簡單,它能讓前/后端發(fā)揮它應(yīng)有的功能,前端感知、后端認知,分工明確、算力協(xié)同,從而降低存儲成本、提升數(shù)據(jù)傳輸效率、減輕后端分析壓力,提升人工智能生態(tài)系統(tǒng)綜合服務(wù)能力。
對于未來的發(fā)展目標(biāo)及規(guī)劃,胡大鵬博士表示會堅定“技術(shù)落地,算法先行”戰(zhàn)略。
無論市場上有何聲音,千視通依然會與精度“較勁”、依然會在AI安防上持續(xù)深耕,解鎖更多業(yè)務(wù)場景。
(來源:雷鋒網(wǎng))