自古以來(lái)旅游是中國(guó)文化不可缺少的一部分,發(fā)展旅游也是為了弘揚(yáng)中國(guó)的民族精神。同時(shí),國(guó)家也將發(fā)展旅游行業(yè)制定為帶領(lǐng)偏遠(yuǎn)地區(qū)致富脫貧的方案之一,所以各級(jí)政府及相關(guān)部門格外重視旅游景區(qū)的發(fā)展。
但在如今的信息爆炸的時(shí)代里,中國(guó)互聯(lián)網(wǎng)的流量每天產(chǎn)品的信息量可刻滿1.88億張光盤,其中人們一天上傳的照片數(shù)量相當(dāng)于柯達(dá)發(fā)明膠卷后拍攝的圖片總和。這意味著當(dāng)旅游景區(qū)想要做傳播的時(shí)候,出一個(gè)創(chuàng)意內(nèi)容或一條傳播信息時(shí),就像一滴水掉進(jìn)了大海,無(wú)蹤無(wú)跡,傳播何其難!
面對(duì)這一問(wèn)題,政府及有關(guān)部門首先想到的是利用大數(shù)據(jù)技術(shù)來(lái)為各地旅游景區(qū)提升收益。經(jīng)過(guò)近幾年大數(shù)據(jù)的發(fā)展及旅游行業(yè)相關(guān)政策法規(guī)的公布,各景區(qū)對(duì)大數(shù)據(jù)逐漸的由陌生到了解,逐漸認(rèn)可旅游大數(shù)據(jù),并開始使用旅游大數(shù)據(jù)幫助景區(qū)提升收益。
最近,某旅游景區(qū)找到了佳都科技參股公司睿帆科技,希望利用大數(shù)據(jù)技術(shù)解決廣告營(yíng)銷投入居高不下,ROI持續(xù)走低的現(xiàn)狀。針對(duì)這一問(wèn)題睿帆科技迅速組織相關(guān)人員開會(huì),經(jīng)過(guò)會(huì)議商討得出,解決這個(gè)需求的方法是通過(guò)技術(shù)找到景區(qū)廣告沒(méi)有覆蓋的區(qū)域,即統(tǒng)計(jì)清楚每位游客的來(lái)源地,找出游客較少的區(qū)域。
確定好技術(shù)目標(biāo)以后,第一步,將原始數(shù)據(jù)里的每個(gè)人進(jìn)行網(wǎng)格化。佳都科技CTO王雪博士表示,網(wǎng)格化是將已經(jīng)導(dǎo)入的海量原始數(shù)據(jù)中每個(gè)人的位置先從分布式數(shù)據(jù)倉(cāng)庫(kù)中調(diào)取,然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理合并每個(gè)人的停留時(shí)長(zhǎng),最后按照時(shí)間為維度放入地圖上既定的500m x 500m 的范圍,再通過(guò)分布式計(jì)算形成統(tǒng)一的以時(shí)間變化的ID編碼。
例如,某景區(qū)是5000m x 5000m的正方形區(qū)域,其就會(huì)包含100個(gè)500m x 500m的范圍。將該景區(qū)的編號(hào)設(shè)置為“A”,其中每個(gè)500m x 500m的范圍就是“A1-A100”,然后將這些景區(qū)編號(hào)按照每個(gè)人的時(shí)間維度進(jìn)行標(biāo)記。即,張三,13點(diǎn)出現(xiàn)在A1區(qū)域,15點(diǎn)出現(xiàn)在A8區(qū)域,20點(diǎn)出現(xiàn)在Z13區(qū)域等。
如果景區(qū)不是正方形區(qū)域,則會(huì)通過(guò)景區(qū)凹多邊形算法劃定景區(qū)范圍。首先,在所有景區(qū)的坐標(biāo)點(diǎn)中找出縱坐標(biāo)最大的A點(diǎn),如果有好幾個(gè)點(diǎn)的縱坐標(biāo)都是最大的,就從中選出橫坐標(biāo)最小的點(diǎn)定為頂點(diǎn),這種方法從數(shù)學(xué)上可以嚴(yán)格證明一定是最大凸多邊形的頂點(diǎn)。
其次,連接A點(diǎn)和剩下其它點(diǎn),形成一系列向量AB,從正向X軸出發(fā)順時(shí)針旋轉(zhuǎn)一個(gè)角度之后會(huì)和向量AB重合,記錄下這個(gè)最小夾角α。如果有好幾個(gè)點(diǎn)都形成相等的最小夾角,那么我們選擇線段AB長(zhǎng)度最長(zhǎng)的B點(diǎn),這個(gè)B點(diǎn)就是另一個(gè)頂點(diǎn)。以此類推,重復(fù)上面的步驟即可圈定景區(qū)的范圍。
最后,規(guī)定每個(gè)網(wǎng)格化人的中心點(diǎn)落入景區(qū)網(wǎng)格即判定該人在景區(qū)旅游。
“選擇500m x 500m的區(qū)域是因?yàn)檫@樣不僅可以達(dá)到數(shù)據(jù)收集的目的,又可以有效的保護(hù)每個(gè)人的隱私,就像我說(shuō)我在望京和我在望京SOHO完全是兩個(gè)概念。當(dāng)然在姓名年齡等信息我們也是采取編碼加密的方式,舉例張三只是幫助理解。”王雪博士表示。
第二步,對(duì)游客的篩選。在原始數(shù)據(jù)中,會(huì)包含居住人員、在附近工作人員以及過(guò)路人等。根據(jù)每個(gè)用戶的行為習(xí)慣,篩選出真正的游客。“居住人員一般只有晚上會(huì)在附近出現(xiàn),工作人員每個(gè)工作日會(huì)在白天固定時(shí)間出現(xiàn),過(guò)路人停留時(shí)間短,排除掉這些干擾的數(shù)據(jù),我們才能找到真正想要的游客數(shù)據(jù)?!蓖跹┎┦勘硎?。
第三步,對(duì)游客追蹤地的查找。找到真正的游客,只需追尋他的出發(fā)地即可找到游客的來(lái)源地。然后再將游客來(lái)源地進(jìn)行統(tǒng)計(jì),找到游客量較少的區(qū)域進(jìn)行重點(diǎn)的廣告投放。
公司擁有業(yè)內(nèi)領(lǐng)先技術(shù),可以通過(guò)技術(shù)手段將游客的居住地精準(zhǔn)到縣,這極大的為旅游景區(qū)降低了廣告營(yíng)銷的投入,幫助旅游景區(qū)提升了ROI。佳都科技致力于解決大數(shù)據(jù)技術(shù)門檻高、實(shí)施周期長(zhǎng)、技術(shù)人員缺乏等問(wèn)題,幫助客戶降低應(yīng)用大數(shù)據(jù)技術(shù)的成本和周期,提高數(shù)據(jù)資產(chǎn)轉(zhuǎn)化為客戶價(jià)值的能力。
(來(lái)源:佳都科技)