以下為立德空間信息技術(shù)股份有限公司董事長郭晟先生以“互聯(lián)網(wǎng)地圖-實用的大數(shù)據(jù)整合與服務(wù)解決方案”為主題,在大會現(xiàn)場的演講內(nèi)容(未經(jīng)本人審核):
郭晟:尊敬的各位領(lǐng)導、各位專家、各位來賓:早上好!
剛才,幾位院士、專家講的都是非常高大上的題目,我從微觀角度說一點,我的題目是“互聯(lián)網(wǎng)地圖--實際永遠的大數(shù)據(jù)整合與服務(wù)解決方案”。包括三方面內(nèi)容:一、政務(wù)大數(shù)據(jù)整合的瓶頸。二政務(wù)大數(shù)據(jù)整合的方法論。三、互聯(lián)網(wǎng)地圖提供的實用大數(shù)據(jù)整合技術(shù)路線。
一、政務(wù)大數(shù)據(jù)整合的瓶頸
目前,很多城市開展了相關(guān)的智慧城市建設(shè)工作,但是,我們的城市還不夠智慧,這幾張圖片是令人心痛的,北京的霧霾,天津的大爆炸,深圳的垃圾坍塌,上海外灘的踩踏事件和武漢的“看海”,這是“十一”黃金周到處人滿為患的景象。
為什么會出現(xiàn)這些現(xiàn)象呢?我們從技術(shù)角度分析的話,無非這樣幾個原因:第一,我們的智慧城市頂層設(shè)計,由于得不到大數(shù)據(jù)支持,所以,我們還是處于工程設(shè)計的階段,難免頭痛醫(yī)頭腳痛醫(yī)腳,所以,出現(xiàn)城市水澇、交通擁堵、氣象問題、環(huán)保問題就不足為怪了。第二,從目前的建設(shè)來說,統(tǒng)計數(shù)字表明60%以上投入到傳統(tǒng)的IT設(shè)施上,就是投入在硬件上的占60%,對于軟件的投入非常少。第三,我們沒有一個大型的智慧城市仿真系統(tǒng)來支持我們的設(shè)計、管理、運營、服務(wù)。最大的問題還是在于數(shù)據(jù)本身,我們現(xiàn)在還是有很多信息孤島,我們的決策也是碎片化的。以至于習總書記兩次站出來說“要打通信息壁壘,構(gòu)建全國信息資源共享體系。”10月6號,政治局學習會議上,習總書記強調(diào)“要以建設(shè)新型智慧城市為抓手,實現(xiàn)數(shù)據(jù)、技術(shù)和業(yè)務(wù)的融合”。智慧城市建設(shè)第一步一定要實現(xiàn)政務(wù)大數(shù)據(jù)的整合和開放,數(shù)據(jù)整合是智慧城市必須的數(shù)字基礎(chǔ)設(shè)施,是經(jīng)濟有品質(zhì)、可持續(xù)發(fā)展的發(fā)動機。
四年以前,立得空間率先在全國提出了智慧城市運行中心的概念。近幾年以來,大家基本在頂層設(shè)計里沿用了類似的概念,智慧城市需要做運營中心,運營中心實際上需要政府首先在機制上作出保障,機制的保障非常重要,我們當初提出這樣一個架構(gòu),城市的一把手、二把手一定要擔任城市的首席運營官,這是類似于企業(yè)化的定義,叫COO。由幾十個委辦局負責信息化的領(lǐng)導、副局級干部擔任聯(lián)席會議的委員,以聯(lián)席會議的方式對整個城市進行總體規(guī)劃和頂層設(shè)計,參與整個城市建設(shè)、運營過程。在這幾年的實踐過程中,我們看到很多城市并沒有支持就開始進行智慧城市的建設(shè),所以,效果非常不好,我們后來也在挑選客戶,如果有些客戶的機制不到位,你跟他談智慧城市和大數(shù)據(jù)整合,往往結(jié)果會是這個樣子,藍瘦香菇。
智慧城市頂層設(shè)計架構(gòu)圖,我們還是從微觀角度指出幾個需要突破的技術(shù)瓶頸,一是機制和制度設(shè)計方面;二是科學的標準和規(guī)范;三是政務(wù)大數(shù)據(jù)的整合;四是時空大數(shù)據(jù)平臺的建設(shè);五是云到端的運營實務(wù)體系的建設(shè)。當然,再說細一點,我們有很多技術(shù)細節(jié)問題,比如數(shù)據(jù)怎么采集、怎么整合、怎么管理、共享和發(fā)布?怎么保持持續(xù)的更新?
二、政務(wù)大數(shù)據(jù)整合的方法論
第一,簡單的目錄交換不是數(shù)據(jù)共享?,F(xiàn)在很多城市為了交差,委辦局做一個門戶網(wǎng)站,把目錄公開了,聯(lián)成一個網(wǎng)絡(luò),認為這就是大數(shù)據(jù)了,其實這是很錯誤的做法。稍有技術(shù)常識的人都知道,不同規(guī)格和時效的數(shù)據(jù)是沒辦法進行整合和交換的,更頭疼的是有些部門把自己的原始數(shù)據(jù)拿出來公開,沒有用,我看了北京、上海信息公開多網(wǎng)站,我覺得這是邁出了很可喜的一步,在當年的技術(shù)階段邁出的非??上驳囊徊?。
第二,用戶需要使用的是“熟數(shù)據(jù)”,而不是“生數(shù)據(jù)”,美國其實也是這個情況,有時候把自己認為好用的數(shù)據(jù)提煉出來,對于其他用戶來說,一個數(shù)據(jù)需要根據(jù)自己的應用場景進行定義,這就是數(shù)據(jù)整合的訣竅。
第三,不同機構(gòu)、企業(yè)之間數(shù)據(jù)需要統(tǒng)一標準后才能實現(xiàn)共享與交換。比如一類有關(guān)人的數(shù)據(jù)和公安局、民政局關(guān)于人的數(shù)據(jù),如果大家不統(tǒng)一到身份證這樣一個標準上,大家不知道怎么整合數(shù)據(jù)。
第四,不能動態(tài)更新和實時評估的數(shù)據(jù)不具備交易的價值,很多部門還是按照傳統(tǒng)IT項目來立項,申請一千萬,把城市數(shù)據(jù)整合了,但是,沒有考慮到后續(xù)的更新,更新準和機制也沒有,所以,數(shù)據(jù)迅速的變成了冰箱里邊的剩菜,慢慢的就沒有價值了,這個問題也非常嚴重,很多很超前的企業(yè)沒有考慮更新頻次的問題。不能更新,不能實施評估。
第五,未經(jīng)有效整理的政務(wù)數(shù)據(jù)商用價值差。
我們再把話題說回到大數(shù)據(jù)中心,我們的建議是這樣的:第一,抽取各個部門所需要的共性數(shù)據(jù),建立政務(wù)公共數(shù)據(jù)集。第二,總體規(guī)劃,定義各部門統(tǒng)一的目錄體系、數(shù)據(jù)標準、共享交換協(xié)議與質(zhì)量標準。什么意思?包括地理信息、人口信息等很多信息都是重復建設(shè),每個部門按照自己的標準定義,然后自己建設(shè),這些數(shù)據(jù)到了后臺不能交換,我們要抽取公共的數(shù)據(jù),只有公共的數(shù)據(jù)才是可以拿來共享的,因為公共數(shù)據(jù)集有總體規(guī)劃,需要統(tǒng)一定義各個部門的目錄資源。第三,流程方面,首先要重建流程,確保大數(shù)據(jù)中心和各個委辦局之間的分工和協(xié)作。第四,技術(shù)層面,把原來分散的IT孤島設(shè)施全部整合到云端架構(gòu)上來。第五,規(guī)范數(shù)據(jù)服務(wù),負責數(shù)據(jù)質(zhì)量和服務(wù)質(zhì)量。
具體怎么干呢?我們也有一些困惑,很多城市說我們到底是做一個大而全的系統(tǒng),還是做一個小而精的系統(tǒng)?不知道怎么辦。大而全的系統(tǒng)這么構(gòu)成的,搭建真正意義上的時空云平臺,對數(shù)據(jù)進行建模、挖掘、仿真,做運營系統(tǒng),叫智能應用,這樣一個系統(tǒng)的建立是巨大的挑戰(zhàn)。如果做一個小而精的系統(tǒng)又有什么問題呢?我們擔心做來做去是不是在這個行業(yè)或者在這個區(qū)域里做成封閉系統(tǒng),以及是不是影響不夠大的問題。所以,我們應該一起探索“互聯(lián)網(wǎng)+”的大數(shù)據(jù)整合與服務(wù)方式?;ヂ?lián)網(wǎng)有什么好處呢?大家都有自己的結(jié)論,我引用互聯(lián)網(wǎng)牛人說的牛哄哄的一句話,互聯(lián)網(wǎng)有什么好處?天下武功,唯快不破。
三、互聯(lián)網(wǎng)地圖
第一,極簡,按照用戶需求設(shè)計,不增加無用的內(nèi)容與功能。第二,追求及至體驗,貼近生活,快速響應、界面時尚、無需培訓。第三,功能強大,按需服務(wù),因為是云端架構(gòu),大部分運算全部在云端完成,大部分內(nèi)容推送也在云端,只需要在手機上操作。第四,整合大數(shù)據(jù),無論你有多少數(shù)據(jù),全部通過云端的分布式部署,可以無窮無盡的疊加內(nèi)容。第五,數(shù)據(jù)新鮮。目前為止,互聯(lián)網(wǎng)地圖可以實現(xiàn)按天、按周、按月的分析。第五,以人為本,互聯(lián)網(wǎng)大量收集用戶體驗數(shù)據(jù),根據(jù)用戶的喜好、興趣、使用習慣這些反饋來進行快速的改進,我們非常喜歡互聯(lián)網(wǎng)產(chǎn)品。第六,用戶產(chǎn)生數(shù)據(jù),UGC方式,比如6億手機用戶的數(shù)據(jù),我們既是使用者,又是數(shù)據(jù)的生產(chǎn)者和貢獻者,我們數(shù)據(jù)也傳到云端,最后形成良性循環(huán)。互聯(lián)網(wǎng)地圖讓我們做測繪的有一點郁悶,我們以前談Web技術(shù),但是,沒有在手機端形成任何影響,出局了,目前為止,互聯(lián)網(wǎng)地圖是在移動端全面占有,并且現(xiàn)在正在向商用地圖領(lǐng)域進發(fā)。
生產(chǎn)體系,通過移動測量和傳統(tǒng)的測繪方式采集數(shù)據(jù),但是,這些不夠,我們還需要通過一些情報的技術(shù)采集來自于互聯(lián)網(wǎng)、來自于傳感器的數(shù)據(jù),整合業(yè)務(wù)數(shù)據(jù),最后全部扁平化的放到云端,利用云這套生產(chǎn)線完成整個數(shù)據(jù)采集、生產(chǎn)、整合與服務(wù),所有數(shù)據(jù)整合完以后,變成可以被管理、可以被建模、可以被仿真、可以被用的數(shù)據(jù),比如可以應用到各個場景,大家對數(shù)據(jù)采集非常熟悉,通過一些高端的移動測量裝置,在街上也好,在空中也好,我們采集各種各樣高精度的地理位置數(shù)據(jù),很快的對這些數(shù)據(jù)進行處理,處理后,建立三維模型。模型可以用于很多仿真領(lǐng)域,應該談大城市的仿真,這樣才能解決李院士說的交通、環(huán)境、飲水問題。我們的路線是把大數(shù)據(jù)整合到三維平臺上,疊加社會資源,然后建立很多應用仿真,支持各個領(lǐng)域的應用,比如交通、智慧城管、大旅游等等。
總而言之,我們通過互聯(lián)網(wǎng)產(chǎn)生的情報系統(tǒng),我們可以對數(shù)據(jù)進行有效的整合,互聯(lián)網(wǎng)數(shù)據(jù)采集工作都是全自動化的,我們大概監(jiān)控了三千多家網(wǎng)站,比如政府發(fā)布的官網(wǎng),我們還監(jiān)控了一些社會化公司發(fā)布的信息,比如做電商的,比如做地圖的,比如做O2O社交的網(wǎng)站,我們實時監(jiān)控,機器可以不休息,24小時在網(wǎng)上抓取有用信息,抓取以后自動進行比對,然后下達生產(chǎn)任務(wù),把生產(chǎn)任務(wù)下達給各地分散的作業(yè)隊,告訴你哪條路我們確認不了,你去確認,確認之后,放到云端進行處理,當然,云里面有很多技術(shù),包括數(shù)據(jù)的自動采集、ETL機器,包括我國很多數(shù)據(jù)的建設(shè)是ETL,籠統(tǒng)地說,好象就是監(jiān)控,其實建庫并不是最主要的,建庫還是屬于傳統(tǒng)IT小數(shù)據(jù)的概念,監(jiān)控就是報表,就是數(shù)據(jù)庫,大的概念不是這樣的,比如6億手機用戶的信息怎么監(jiān)控?沒辦法監(jiān)控,ETL過程中一定要做機器的智能學習,這樣的數(shù)據(jù)才是真正的大數(shù)據(jù)。
我們以前的生產(chǎn)平臺都是以職工制定的工藝為基準,以后的生產(chǎn)平臺全部是基于情報驅(qū)動的,一定要利用網(wǎng)端搜索爬蟲技術(shù)來做,否則的話,你的系統(tǒng)就過時了,就被時代所拋棄了。我們會實現(xiàn)所有數(shù)據(jù)自動化采集、差分比對、自動成圖、實時監(jiān)控,形成能夠按天、按月甚至按小時的更新,我聽說谷歌有些更新可以按分鐘了,當然,這肯定是趨勢,手機上發(fā)出一個信息,第二分鐘的可能時候被更新了,這個過程不需要人干預。
我們現(xiàn)在做的系統(tǒng),比如早上起來我們發(fā)現(xiàn)交通局發(fā)布了一個信息,8點高架橋被開通了,我們可以在網(wǎng)上進行合適,何時候,我們把工作直接交給生產(chǎn)系統(tǒng),生產(chǎn)系統(tǒng)安排計劃,如果需要人工核實,我們就到現(xiàn)場核實一下,如果不需要人工核實,我們自動的排在生產(chǎn)線里。所有地圖的邏輯導航鏈條,所有屬性的配置,都是自動完成的,包括地圖在手機端的渲染全部是自動化的。信息化測繪體系下傳統(tǒng)測繪單位轉(zhuǎn)型升級利器。
談到怎么整合社會化大數(shù)據(jù),假設(shè)你的地理信息空間庫做好之后,其實本身就是時空平臺,我們大量的考慮空間的問題,根據(jù)時間的排序,這本身就是時空平臺。在這之后,后面整合人口數(shù)據(jù)、交通、醫(yī)療、教育等,這些工作變的非常簡單了,我們需要做一些關(guān)聯(lián)、配準,整個大數(shù)據(jù)在時空基準上配準。可滾動發(fā)展的大數(shù)據(jù)中心,第一,四大庫整合。第二,公共數(shù)據(jù)庫,我們說的具體一點,四大庫、交通、房屋、環(huán)保、衛(wèi)生、教育、醫(yī)療、養(yǎng)老、公共基礎(chǔ)設(shè)施、政務(wù)公開等。政務(wù)控做完以后,以互聯(lián)網(wǎng)地圖的方式對外進行服務(wù),總規(guī)和制作過程全部基于互聯(lián)網(wǎng)地圖,所以,發(fā)布變成非常簡單的事情,也就是互聯(lián)網(wǎng)公司干的事情,我們都可以干,把大數(shù)據(jù)整合、共享、開放、服務(wù)全部完成,所謂智慧城市一捉圖,云端互動系統(tǒng)就建設(shè)完成了。在佛山整合了58個委辦局的數(shù)據(jù),在國內(nèi)做的比較前沿。我們注重于滿足政府、企業(yè)高端應用服務(wù)平臺,目前為止聚焦了車聯(lián)網(wǎng)商,目前為止平臺上有兩百多萬臺車,提供7×24小時在線服務(wù),每天訪問次數(shù)超過1億多次。
傳統(tǒng)IT架構(gòu)的信息系統(tǒng)開發(fā)的弊端,一般IT項目都在10個月以上,做來做去,還是做一個煙囪,用不起來。我們想推薦的是云互聯(lián)網(wǎng)+時代信息系統(tǒng),就是從小處著手,第一步,搭云基礎(chǔ)設(shè)施,其實不用搭,公有云直接接多現(xiàn)有的運營商云里。第二步,做一個資源池,或者某一樓數(shù)據(jù),比如就是地理信息,比如就是人口數(shù)據(jù)或者法人數(shù)據(jù),重要的是利用剛才的方法對數(shù)據(jù)進行聚類,然后做管理共享,這項工作很快可以做好,然后開放式的數(shù)據(jù)機開發(fā)環(huán)境,微信剛起來時候非常簡單,語音通話和文本信息,用戶從0開始到幾萬、一百萬,最后到6億,大數(shù)據(jù)資源池,不斷通過用戶累計形成自己的大數(shù)據(jù),大數(shù)據(jù)形成之后,系統(tǒng)建立起來了,系統(tǒng)變成了平臺,平臺變成了生態(tài),這就是我們所夢想的事情。我們做信息系統(tǒng)的時候,我建議以這樣的方式來做比較靠譜,否則的話,大家都很累,做了以后,用戶的思想跟不上,做的很焦灼?,F(xiàn)在一定是“互聯(lián)網(wǎng)+”的方式。
總而言之,如果這么干下去,各行各業(yè)應該是全面開花的結(jié)果,數(shù)據(jù)的提供者,無論是政府、企業(yè),還是個人,會形成越來越大的開放數(shù)據(jù)集,在數(shù)據(jù)平臺之上,可以建立我們的時空共享平臺,在上面做交易、分析、存儲,我們開發(fā)出來數(shù)據(jù)之后,上面會有一些開發(fā)者針對用戶場景完成各種應用及服務(wù)的開發(fā),最后是數(shù)據(jù)的使用者享受了數(shù)據(jù)的價值,獲取了利益,并且他更喜歡這個系統(tǒng),形成一個循環(huán)。我強烈建議我們要借助互聯(lián)網(wǎng)企業(yè)成功的大數(shù)據(jù)模式,以滾動式發(fā)展,推動政務(wù)大數(shù)據(jù)的整合和運營體系,服務(wù)于我國新型智慧城市建設(shè)。
謝謝大家!
上午的精彩內(nèi)容分享先到這里,下午我們繼續(xù)!
{{item.content}}