然而,隨著行業(yè)的發(fā)展,大數(shù)據(jù)采集已然不是那么順山順?biāo)氖虑椤kS之而來的還有一個(gè)日漸逼近的事實(shí):新形勢下的大數(shù)據(jù)采集,靠什么?
工欲善其事,必先利其器。采集這些TB級(jí)以上數(shù)據(jù)只是靠星羅棋布在全國各處的采集車和測繪員?或說靠的是對傳統(tǒng)紙質(zhì)版數(shù)據(jù)的矢量化梳理?顯然不是。
那么大數(shù)據(jù)時(shí)代下,從二維到三維,數(shù)據(jù)采集,靠的到底是什么?時(shí)下對于這些數(shù)據(jù)的采集,可以歸結(jié)為四種模式。而這四種模式,分為兩種屬性,一種是利用相關(guān)設(shè)備工具采取并搜集數(shù)據(jù),我們稱之為“采之有方”;另一種是無需自己具備采集設(shè)備,而是通過一些渠道或途徑來變相得到這些數(shù)據(jù)的使用權(quán),這里注重的是一種共享和互換意識(shí),如行業(yè)巨頭兼并小數(shù)據(jù)公司、直接購買數(shù)據(jù)等方式,我們稱之為“取之有道”。
其一,自主采集,方式更加多樣化,設(shè)備更加智能化。與以往相比,采集空間地理信息數(shù)據(jù),其變化主要在采集方式與采集設(shè)備方面。一方面,現(xiàn)在逐漸形成了“自主采集+眾包”、“自主采集+眾包+購買”多種自主采集方式。今天的采集方式不再只是單獨(dú)自主采集,也不再是對紙質(zhì)版數(shù)據(jù)簡單處理應(yīng)用。比如,高德憑借其強(qiáng)大的LBS解決方案能力,與各城市的交管部門進(jìn)行合作,獲取更多交通信息權(quán)威數(shù)據(jù),在自主采集大數(shù)據(jù)的同時(shí)還建立了眾包模式的交通信息上報(bào)體系。另一方面,采集設(shè)備智能化,以往采集數(shù)據(jù)基本為單向采集,更多的是將數(shù)據(jù)搜集簡單處理,而今,遙感設(shè)備拍攝獲取影像數(shù)據(jù),全方位三維地理信息采集車在采集過程中可以將所有大數(shù)據(jù)智能化處理并即時(shí)反饋。
其二,“雙拼”模式,即具備采集空間地理信息能力的企業(yè)和另外一家需要這些基于空間地理位置數(shù)據(jù)的企業(yè)合作。這種模式,嚴(yán)格來講應(yīng)該是一種共享共贏的復(fù)雜模式。舉例來講,阿里巴巴和高德地圖的合作就是這種雙拼模式,對于阿里來講,共享高德的空間地理位置數(shù)據(jù)完全就是依靠這么一個(gè)斥資入股的手段。高德地圖有著規(guī)模最大的電子地圖用戶群,且高德具備獨(dú)立采集空間地理信息的軟件資質(zhì)和硬件配套設(shè)施,阿里巴巴入股高德地圖無非就是想把O2O業(yè)務(wù)更加智能化,讓淘寶的線上產(chǎn)品準(zhǔn)確地推銷到指定地理空間所有的人群。甚或會(huì)通過定位消費(fèi)者地理位置來進(jìn)行數(shù)據(jù)分析,根據(jù)行為路徑判定消費(fèi)者需求進(jìn)而針對性投放產(chǎn)品廣告。
其三,政府主導(dǎo)實(shí)施方略,企業(yè)技術(shù)參與。這種模式目前主要應(yīng)用于公共管理監(jiān)測。這種模式下,數(shù)據(jù)的采集方略全靠一根指揮棒,而指揮棒就在政府手中,政府所需數(shù)據(jù)完全會(huì)根據(jù)公共服務(wù)需求來定向獲取,而這一過程,數(shù)據(jù)公司又擔(dān)當(dāng)一個(gè)“芯片”的角色,因?yàn)閿?shù)據(jù)獲取的整個(gè)流程都需要數(shù)據(jù)公司來設(shè)計(jì)對應(yīng)的系統(tǒng)和硬件設(shè)備。這些數(shù)據(jù)的采集旨在提升公共管理效能,而非商業(yè)化。比如,泰瑞數(shù)創(chuàng)科技公司應(yīng)北京市政府公共管理需求,協(xié)同北京地理信息部門繪制了三維地理信息系統(tǒng)——智慧北京。系統(tǒng)充分利用航空遙感影像、政務(wù)信息圖層、政務(wù)電子地圖等數(shù)據(jù)。為北京市政府構(gòu)建了一個(gè)全市域范圍的真實(shí)三維城市場景,實(shí)現(xiàn)了全市三維環(huán)境下的數(shù)據(jù)共享服務(wù)。這些直觀的三維立體可視化效果讓政府在城市綜合管理、應(yīng)急指揮、領(lǐng)導(dǎo)決策、檢測監(jiān)控等多個(gè)領(lǐng)域變得更為精準(zhǔn)高效。
其四,直接購買數(shù)據(jù)。在這種模式下,能用于交易的大數(shù)據(jù),嚴(yán)格意義上來講是經(jīng)過處理篩選后具有商業(yè)價(jià)值或社會(huì)價(jià)值的基于地理位置來提供相關(guān)服務(wù)的數(shù)據(jù),這種數(shù)據(jù)兼具海量性和多樣性,其使用價(jià)值極高。在國內(nèi),最典型的案例當(dāng)屬中國圖資市場的雙雄——四維圖新與高德地圖。蘋果公司為開展基于地理位置信息服務(wù)的相關(guān)業(yè)務(wù),直接向高德購買中國地圖的測繪數(shù)據(jù)。而諾基亞則向四維圖新購買地理位置信息數(shù)據(jù),有媒體稱諾基亞僅就電子地圖數(shù)據(jù)每年就要向四維圖新支付至少4億元費(fèi)用。除此之外,2008年,谷歌公司推出“谷歌流感趨勢”,其根據(jù)搜索引擎上與“流感”相關(guān)的字詞句出現(xiàn)的頻率進(jìn)行信息數(shù)據(jù)挖掘和分析,將這些基于不同區(qū)域、不同地理位置反饋回來的數(shù)據(jù)進(jìn)一步處理成可視化的流感圖表和分布圖,進(jìn)而對有流感蔓延趨勢的地域加強(qiáng)防護(hù),有著很強(qiáng)的社會(huì)價(jià)值。政府對于這種數(shù)據(jù)基本可以無償使用,像俄羅斯、美國、澳大利亞等國數(shù)年前已有先例可循,而國內(nèi)目前并沒有將這些基于不同空間、不同地理位置的數(shù)據(jù)作為參考依據(jù)。
宗其所有,大數(shù)據(jù)時(shí)代,數(shù)據(jù)變得快而泛,采之有方,集之有道是目前采集各類數(shù)據(jù)慣用的兩種路徑。(文|本刊編輯 李保旭)
注:本文為《3S新聞周刊》原創(chuàng)文章,如需轉(zhuǎn)載請及時(shí)通過郵件告知:news@3snews.net。
{{item.content}}