以下為北京超圖軟件股份有限公司總裁宋關(guān)福先生以“大數(shù)據(jù)時代的GIS基礎(chǔ)軟件技術(shù)發(fā)展與展望”為主題的精彩演講,演講內(nèi)容為(未經(jīng)本人核實(shí)):
宋關(guān)福:尊敬的各位專家,各位領(lǐng)導(dǎo),大家下午好,剛才聽了幾位院士的講座非常精彩,同時我們也聽了華為云的技術(shù),接下來我跟大家匯報大數(shù)據(jù)的一個情況。
大數(shù)據(jù)時代的GIS技術(shù)發(fā)展,我們先來回顧一下GIS技術(shù)的發(fā)展情況,我談的是GIS基礎(chǔ)軟件,全世界第一套現(xiàn)代的GIS基礎(chǔ)軟件是1982年推出來的,這個開啟了現(xiàn)代的GIS基礎(chǔ)軟件發(fā)展之路。從1982年-1987年,從這個角度來看,自主GIS基礎(chǔ)軟件起步并不晚,只是差了幾年,但我們晚的是應(yīng)用,做起中國經(jīng)濟(jì)發(fā)展水平制約IT用。第二個晚的是產(chǎn)業(yè)化機(jī)制,有一個公司的機(jī)制在運(yùn)行。
到了90年代中期的時候,自主GIS軟件紛紛開始登場。我們看15年前的GIS軟件情況,基本上滿足的國外軟件。6年前格局得到一些改變,我們看到當(dāng)時的市場份額,差了20%,差距還是有點(diǎn)大,到1年前,去年自主品牌應(yīng)該說取得了一些突破,發(fā)布新的數(shù)據(jù),第一名已經(jīng)變成國產(chǎn)的。我們再分析一下2009年與2015年國內(nèi)市場份額的變化,美國占48%,自主品牌37%,其他占15%,到了201年的時候數(shù)據(jù)就反過來,美國占34%,其他占17%,自主品牌占49%。從這兩年比較,自主品牌應(yīng)該是大幅的增加。其中另外一個便是很多國際著名軟件消失,市場龍頭也開始有些變化,變成自主品牌。
我們在座的有很多是測繪的,感覺這些數(shù)據(jù)有些問題,因?yàn)槲覀兏杏X做測繪做國土的用國內(nèi)軟件比較多,這確實(shí)是對的。因?yàn)檫@幾行業(yè)用GIS用得最早,所以要進(jìn)行置換是相對滯后的。自主品牌GIS的優(yōu)勢領(lǐng)域,市場份額相對占優(yōu)一些。是什么原因驅(qū)動自主GIS技術(shù)的成長,第一是感謝科技部,它那個時代啟動了一個“技術(shù)比武”,這個是1996年開啟的,這極大的刺激了GIS軟件投入研發(fā),進(jìn)步非常大。
第二個因素是2001年科技部搞了一個“比武招親”。這樣兩件事情是科技領(lǐng)域揭示技術(shù)發(fā)展做出了非常重要的作用。第三個因素是國內(nèi)GIS應(yīng)用水平快速提高,我們現(xiàn)在之前的N金工程、數(shù)字城市、智慧城市等等,我們?nèi)タ纯礆W洲看美國在應(yīng)用的水平上還不如我們,這種領(lǐng)先的應(yīng)用就代表領(lǐng)先的需求,因?yàn)槲覀冃枨箝_始領(lǐng)先了,就意味著我們可能做出領(lǐng)先的產(chǎn)品。如果我們把中國用戶的問題解決掉了,全世界的也也都解決了。第四個因素,企業(yè)實(shí)力提升,研發(fā)投入上規(guī)模。第五個驅(qū)動因素是建成規(guī)模化的研發(fā)機(jī)制,以前是小作坊,我們建立一個產(chǎn)品理想機(jī)制,讓一線呼喚炮火,我們產(chǎn)品部門可以提供公司產(chǎn)品決策委員會申請立項(xiàng),有這樣的機(jī)制我們才能產(chǎn)生產(chǎn)品級創(chuàng)新,可能3個月以后就把它覆蓋掉。
同時我們還要想產(chǎn)品大規(guī)模推廣,很大的原因質(zhì)量問題,所以要有質(zhì)量保障體系,我們有一個機(jī)制叫持續(xù)機(jī)制,以前我們很多的一個軟件是需要時間幾個月,現(xiàn)在我們只要一個人提交了代碼,30分鐘就可以編輯。中國GIS發(fā)展差不多30年,從1987年開始,那時候是簡單的工具,到后面發(fā)展成重要軟件,到2000年以后產(chǎn)生一些新的技術(shù),組建GISWeb無GIS技術(shù),和新一代三維GIS、云GIS、GIS大數(shù)據(jù)技術(shù)的發(fā)展。我們第一個階段是起步,第二個階段是追趕,第三個階段是并行,所以我們必須要同時去探索新的方式,這是我們一個獨(dú)立創(chuàng)新的階段。
今天回到今天的主題,大數(shù)據(jù)是洶涌而至了,大數(shù)據(jù)的特征聽了很多,其中四個V是最重要的,一是數(shù)量大,二是種類多,三是價值密度低,四是變化快。體量大變化快就要求我們挖掘的信息非常高,價值密度低意味著這是一個情況。種類都,同樣一套挖掘工具要求高,所以大數(shù)據(jù)挖掘是非常麻煩的。挖掘大數(shù)據(jù)不是件容易的事情,但是與GIS有什么關(guān)系,因?yàn)?0%的大數(shù)據(jù)都跟位置也關(guān)系,這里面我們可能要說一些概念,空間大數(shù)據(jù)和時空大數(shù)據(jù),無論是關(guān)注時間屬性,只要帶位置,就是我們處理的對象。
比如我們航天航空遙感數(shù)據(jù),街景數(shù)據(jù),傾斜攝影原始照片,我們是否可以說GIS已經(jīng)在管理大數(shù)據(jù)了嗎?答案是否定的,因?yàn)橐陨洗髷?shù)據(jù)的共同特點(diǎn)都是在測量過程中產(chǎn)生,數(shù)據(jù)不是監(jiān)測,而是其他的專業(yè)軟件,遙感軟件、航測軟件、傾斜攝影三維建模軟件,他們在處理數(shù)據(jù)。GIS軟件使用的是處理結(jié)果,已不符合大數(shù)據(jù)定義,換句話說,對這些大數(shù)據(jù)的處理,沒GIS軟件什么事,GIS做什么?就是用專業(yè)軟件處理,GIS可視化。GIS該做的不應(yīng)該只是測繪,我們有很多非測繪活動產(chǎn)生更大空間大數(shù)據(jù),比如Vber用空間大數(shù)據(jù)分析“一夜情”,晚上10點(diǎn)至凌晨4點(diǎn)大車,4-6小時后160米內(nèi)再次大車,都極有可能是一夜情。大數(shù)據(jù)能不能干點(diǎn)正事,這是重慶基于收集信令大數(shù)據(jù)的通勤做的一個分析,這是移動連通的手機(jī)來做的一個。
越來越多的空間大數(shù)據(jù)各種來源都有,我們GIS平臺軟件不具備大數(shù)據(jù)的管理分析能力,僅僅作為大數(shù)據(jù)的結(jié)果來管理業(yè)務(wù),更姚明的是很多的大數(shù)據(jù)平臺也不直接具備空間統(tǒng)計與分析能力。所以,挖掘空間大數(shù)據(jù)不是件容易的事。如果說GIS平臺能解決一些大數(shù)據(jù)管理分析的問題,就可以讓更多的單位應(yīng)用。所以,大數(shù)據(jù)對GIS提出了的需求:空間大數(shù)據(jù)分布式存儲管理,空間大數(shù)據(jù)的高性能分析。我們對大數(shù)據(jù)的總體構(gòu)架是這樣的,一個是Hadoop相當(dāng)于數(shù)據(jù)的1.0,一個是Spark相當(dāng)于大數(shù)據(jù)的2.0,GIS運(yùn)營于Spark框架內(nèi)部還是外圍,外圍要做的是任務(wù)調(diào)度控制,分析結(jié)果可視化,像這些數(shù)據(jù)技術(shù)主要原生于lIEUK。
基于HDFS的空間數(shù)據(jù)管理,20億條的所有結(jié)構(gòu)。大數(shù)據(jù)計算,包括基礎(chǔ)計算,在大數(shù)據(jù)的基礎(chǔ)上做一些空間分析,在高級計算有聚合分析,熱點(diǎn)分析,密度分析等的。這是一個實(shí)時路況計算的框架,這個不詳細(xì)介紹。這是武漢的實(shí)時路況展示,都可以用這個來展示。我們看三維高性能動態(tài)目標(biāo)渲染引擎,我們可以在地球上實(shí)時展現(xiàn)出來,這個速度是加快了。
大數(shù)據(jù)必須需要云計算,需要極強(qiáng)的處理能力,這個簡單過一下。今天介紹一下云計算新技術(shù),容器技術(shù),傳統(tǒng)做的是虛擬化技術(shù)。性能優(yōu)勢,云計算比傳統(tǒng)的快9倍,包括數(shù)據(jù)查詢性能快了幾十倍。同時,在同一個設(shè)備上能夠裝更多的性能,節(jié)約資源。
打造大數(shù)據(jù)的GIS平臺軟件,不再是少數(shù)機(jī)構(gòu)的專利,但大數(shù)據(jù)的技術(shù)的應(yīng)用才剛剛開始,我們希望在大家的幫助下,接下來和您繼續(xù)前行。
謝謝大家!
{{item.content}}