2017年 6月13日,由泰伯網(wǎng)主辦、主題為“空間大數(shù)據(jù)的崛起”的WGDC2017,在北京國家會議中心盛大開幕。大會由空間信息產(chǎn)業(yè)創(chuàng)新創(chuàng)業(yè)服務(wù)平臺泰伯主辦,秉承不斷引領(lǐng)和促進(jìn)空間信息技術(shù)創(chuàng)新與變革的宗旨,WGDC已走過六個年頭,如今成為全球最具前瞻性的跨界創(chuàng)新風(fēng)向標(biāo)。
14日,空間大數(shù)據(jù)+人工智能峰會(極海縱橫專場)開幕。峰會上,來自GeoHey·極海的徐翔發(fā)表了以“人工智能,開解空間位置問題的新鑰匙”為題的精彩演講。以下為演講實(shí)錄(未經(jīng)本人核實(shí)):
徐翔:大家好,我在徐翔,我主要負(fù)責(zé)一些核心技術(shù)的研發(fā),其中包括今天我要和大家分享的人工智能。前面我的兩位同事和大家分享我們的云平臺在云計算和大數(shù)據(jù)上的進(jìn)展。今天我來講一講人工智能結(jié)合以上的兩種技術(shù),成為開解空間位置的新鑰匙。首先我們來看一看人工智能,其實(shí)是一個很古老的詞。人工智能的提出其實(shí)是在19世紀(jì)的50年代,在50年代末,MIK成立了一個人工智能實(shí)驗(yàn)室。對于我們絕大多數(shù)人來說,人工智能其實(shí)是一個非常遙遠(yuǎn)的一個時代的事情。但是在最近的幾年,人工智能又得到了井噴式的的關(guān)注,既然是井噴式的關(guān)注,其中會不會有泡沫呢?如果拿我們現(xiàn)在能夠接觸到的人工智能的能力和技術(shù)去和電影、文學(xué)作品里的五花八門的人工智能相比的話,我們會發(fā)現(xiàn),這就相當(dāng)于從石器時代到工業(yè)文明的跨度。為什么現(xiàn)在大家都說我們處在一個人工智能時代呢?其實(shí)需要我們回顧一下歷史,了解一下為什么上個世紀(jì)的人工智能成為了泡影,現(xiàn)在的人工智能能夠取得如此大的突破。
其實(shí)在我們追求人工智能這個偉大理想的過程中出現(xiàn)過很多流派,其中就有一種相信智能的產(chǎn)生依賴于符號處理系統(tǒng)的符號處理,以及性能的產(chǎn)生需要模擬人腦這個智能體的聯(lián)接主義。有一個很有意思的思想實(shí)驗(yàn),這個人她不懂中文,他僅僅依靠翻譯表就能表現(xiàn)的像會說中文一樣,于是有人根據(jù)這個開發(fā)了一個系統(tǒng),他是一個機(jī)器人,根據(jù)數(shù)據(jù)庫里的很多很多的規(guī)則,就表現(xiàn)的可以很接近圖靈測試。這種方式我們根據(jù)前提假設(shè)進(jìn)行邏輯推理的思考方式是不是很像呢?其實(shí)這實(shí)在稱不上是一條通往智能的道路,它也無法應(yīng)用到真正需要智能的場景中去。
人類需要的人工智能其實(shí)不僅僅是計算機(jī)能夠計算的比人類更快,而是需要它能夠像我們一樣思考,甚至能夠比我們思考的更好。這也是后一種流派,聯(lián)接主義所孜孜以求的。經(jīng)過很多年的潛心發(fā)展,后一種流派開始以很多種新的面目示人,出現(xiàn)了基于概率統(tǒng)計的智能,基于機(jī)器學(xué)習(xí)的智能,基于大數(shù)據(jù)的智能,這些才是我們現(xiàn)在所說的真正的人工智能,其實(shí)現(xiàn)在人工智能取得突破的領(lǐng)域,沒有一個不是依靠概率統(tǒng)計,機(jī)器學(xué)習(xí)以及大數(shù)據(jù)的。所以我們現(xiàn)在所處的就是這樣的一個人工智能的時代。
所以出于這樣的一個人工智能的時代,當(dāng)我們思考地理位置的時候我們是不是應(yīng)該帶著人工智能給我們帶來的技術(shù)和能力去思考?我們現(xiàn)在對數(shù)據(jù)的理解以及我們建立模型的方式,我們對分析的算法有沒有可能有更優(yōu)的解決方法?這一切需要我們對地理問題有非常深刻地認(rèn)識,然后把這些經(jīng)驗(yàn)編碼在其中才有可能。下面我介紹一下我們是如何將人工智能與地理問題相結(jié)合的。我們做的第一件事情開發(fā)了一個多源數(shù)據(jù)融合的工具,搭建了從位置數(shù)據(jù)到深度學(xué)習(xí)的橋梁。地理數(shù)據(jù)具有多維度和多尺度的特征。一個地點(diǎn)具有多種維度的特征,并且這些特征都通常不是在一個維度上的,你可以把這個維度理解為分辨率,比如說現(xiàn)在的朝陽區(qū)有它的土地利用分布,有它的人口,有它的GDP,有道路、河流,還有它的POI等等,可能土地利用是10米的分辨率,人口是50米的分辨率,燈光是30米的分辨率,當(dāng)我們遇到一個世紀(jì)的問題的時候,要解決地理問題的時候我們要選擇合適的地理尺度把多源的多尺度的數(shù)據(jù)在一個統(tǒng)一的尺度下進(jìn)行超采樣。通過這種方式我們可以把這些各種尺度的數(shù)據(jù),在任意一個尺度,比如說我們的格網(wǎng)或者交通小區(qū),或者是行政區(qū)劃進(jìn)行聚合,當(dāng)我們有了這樣一個多源數(shù)據(jù)融合工具,我們可以把各個維度上的位置信息統(tǒng)計起來,為下一步的訓(xùn)練做好統(tǒng)計。
我們做的第二件事情使用人工智能編碼廣義的空間坐標(biāo),深挖地理要素的隱含關(guān)聯(lián),傳統(tǒng)的空間坐標(biāo)包括了XYZ三個維度,其實(shí)剛剛我們也說了,一個地理上除了它的位置還有位置之上的很多信息。比如它的人口、土地利用等等。而很自然的我們可以把這些其他的信息也加到這個空間坐標(biāo)里面去,形成一個多維的廣義的空間坐標(biāo),大家注意,這不是單純的把這些指標(biāo)加進(jìn)去就完了,我們通過人工智能的做法進(jìn)行相關(guān)性去除,形成了一個更能表達(dá)這個地理特征的一個廣義的空間坐標(biāo),有了這樣的一個坐標(biāo)以后我們可以快速的根據(jù)我們的云計算法,對地理要素進(jìn)行快速的查詢和檢索。
正是基于這樣的靈感我們可以對任意一個地塊算出它的廣義的空間坐標(biāo),這個坐標(biāo)是一個兩千維的向量,我們可以找出相似的地物。下面可以舉更多的找相似地物的例子。我們做的第三件事情使用深度卷積網(wǎng)絡(luò),做地理空間域特征的自動組合,當(dāng)我們使用多源的數(shù)據(jù)融合工具得到了這個數(shù)據(jù),我們要考慮的是如何在模型里能夠最大限度的提取這些數(shù)據(jù)的關(guān)聯(lián)信息。其中的關(guān)聯(lián)信息包括兩個方面,第一個方面是地理特征之間的關(guān)聯(lián),不同的特征之間的相互關(guān)系,比如說燈光圖和經(jīng)濟(jì)發(fā)展水平也有很大的關(guān)系。
另一個關(guān)聯(lián)是地理空間的關(guān)聯(lián),這表明同一個維度,在地理空間上的一個變化情況。比如說,因?yàn)榈乩砜臻g是連續(xù)的,所以相鄰的位置會互相影響,并且這個影響的程度,會隨著距離的增大而減少。傳統(tǒng)的方法是怎么建模這兩種關(guān)聯(lián)的呢?對于第一種關(guān)聯(lián)他們可能會想很多指標(biāo),比如說剛剛說到的汲取河流水體的,對于后一種聯(lián)系,可能他們會做一個二次函數(shù)去做擬合,但是有沒有一種方法可以同時表達(dá)這兩種聯(lián)系,并且能夠找出最優(yōu)的聯(lián)系呢?我們發(fā)現(xiàn)深度卷積神經(jīng)網(wǎng)絡(luò)可以很好的做到,里面都是三維的數(shù)據(jù)體,寬和高表達(dá)同一個要素的特征在地理空間上的關(guān)聯(lián),深度表達(dá)不同的地理特征之間的不同地理特征,包括POI,土地利用,燈光圖等等。卷積神經(jīng)網(wǎng)絡(luò)的卷積操作,可以對這些特征進(jìn)行線性的組合,形成新的特征。通過卷積的操作我們可以進(jìn)行地理特征和地理空間的自由組合,生成更多更抽象的特征,這樣更能描述現(xiàn)實(shí)世界里的各個特征之間的聯(lián)系。
我們在做影像分割的時候把這些特征可視化出來看,左邊是一個假彩色合成的影像,這是我們的模型第一層提取出來的特征,第一層的特征和它的形狀還是很相關(guān)的,因?yàn)槲覀兡軌虮嬲J(rèn)出一些地物的形狀,隨著層數(shù)越深,我們現(xiàn)在人類已經(jīng)無法理解它提取的特征是什么意思,但是正是靠這些抽象的特征,卷積神經(jīng)網(wǎng)絡(luò)可以給出最后的分割的結(jié)果出來。前面講的幾點(diǎn)都是我們在技術(shù)上的思考。
最后我想從思維的角度來談一談如何把人工智能和地理問題相結(jié)合。在工業(yè)革命時代其實(shí)機(jī)械思維是占主導(dǎo)因素的思維方式。但是現(xiàn)在是大數(shù)據(jù)時代,大數(shù)據(jù)思維,它是想要讓我們從海量數(shù)據(jù)中尋找強(qiáng)相關(guān)關(guān)系,而不是一味的追求精確描述事物之間的因果關(guān)系,傳統(tǒng)的方法上,可能我們解決一個地理問題的時候先嘗試想清楚它的因果關(guān)系,然后再去建模分析,這種方法在有些情況下是可行的,但是有些情況也會遇到很大的阻礙。我們在給美國一家公司做選址的時候,他們在美國有非常完善的模型,因?yàn)槲覀儑鴥?nèi)的數(shù)據(jù)和他們的不一樣,所以沒法直接用。如果我們要照他們的方式建立模型的話就代價很大,而且時間成本也很高。所以我們完全拋棄了這種方式,轉(zhuǎn)而用大數(shù)據(jù)的思維,用機(jī)器學(xué)習(xí)的方法,從數(shù)百種特征里面去找跟他想要知道的東西最相關(guān)的特征,我們的模型也取得很好的效果。
從這個例子可以看出來,在人工智能時代如果我們嘗試用大數(shù)據(jù)思維去考慮問題的話,可能能夠解決以往的一些傳統(tǒng)方法很難解決的問題。而當(dāng)我們掌握了這種思維方式的時候其實(shí)我們就掌握了能夠開啟地理問題的一把嶄新的鑰匙。剛剛說到了我們在人工智能結(jié)合地理問題上的一些思考和一些實(shí)踐。現(xiàn)在我想分享一下我們在四個具體的方面取得的一些進(jìn)展。
第一個進(jìn)展可以提取地物,相信大家都使用導(dǎo)航軟件的經(jīng)歷,不知道大家有沒有遇到這種情況,有時候跟著導(dǎo)航軟件往前走,走著走著前面沒路了,這時候不得不往回走,浪費(fèi)時間不說,你的心情也會像道路一樣,變得不順。我想從A地到B地,我對路完全不熟悉,只能靠著導(dǎo)航走,走到半路的時候,有個老司機(jī)說兩點(diǎn)之間開了一條新路,兩點(diǎn)之間直線最短。有些道路新開了,沒有及時更新,道路的更新速度對導(dǎo)航的精度起著非常重要的作用。有沒有一種方式可以去快速的提取道路呢?其實(shí)現(xiàn)在隨著衛(wèi)星產(chǎn)業(yè)的發(fā)展,我們現(xiàn)在已經(jīng)每天獲取一次全球高精度的影像,如果我們從影像中提取道路的話不管是高速公路還是羊腸小道我們都可以從影像里面來,司機(jī)可以馬上知道,哪條路不通了,哪里開了一條新路。這四幅圖是我們從影像中提取道路的例子,目前對主干道的提取精度達(dá)到98.8%,IOU64.7%,對街區(qū)提取精度是95.7%,IOU是56.3%,IOU大家不太明白什么意思?就是我們模型訓(xùn)練好測試集對于影像提取出來的道路和實(shí)際的道路的交集,IOU描述的是我分割的位置的準(zhǔn)確度,我分割出來的道路是不是真的和實(shí)際的導(dǎo)讀剛好疊合在一起 了。因?yàn)槠鋵?shí)影像分割是比較難的問題,一般精度在90%以上,IOU在50%以上就是比較好的結(jié)果。前段時間在一個競賽平臺上發(fā)布了一個影像分割的比賽他們對于道路的分割,IOU也是在50%左右,但是他們的效果也是挺好的了。除了道路我們還關(guān)心建筑。比如城市規(guī)劃部門想知道全市總共有多少個建筑,哪些建筑是違建的,我們用兩個小時就可以提取北四環(huán)內(nèi)的所有的建筑,這是傳統(tǒng)的方法無法想象的。我們對傳統(tǒng)的建筑精度92.4%,IOU是64.8%。這是我們做的一個交互識別建筑的例子??梢詫θ我庖粋€區(qū)域的影像提取建筑,提取的精度幾乎是實(shí)時的。
前面大家看到的都是提取一種地物的例子,這里我們做了一個項(xiàng)目可以提取31類的地物,大家看這幅圖不知道能不能夠區(qū)分出里面的常綠闊葉林和針葉林,我們的模型非常精確的做到這一點(diǎn),經(jīng)過三百個線下點(diǎn)的檢驗(yàn),我們的模型已經(jīng)取得了非常令人吃驚的精度。通過這種方式來比較各個年份,各種覆被的面積覆蓋情況,我們可以精確的分享三峽大壩對于周邊環(huán)境的影響。
第二個進(jìn)展可以從海量的影像里面進(jìn)行地物的識別和搜索?,F(xiàn)在,隨著衛(wèi)星產(chǎn)業(yè)的發(fā)展,我們現(xiàn)在每年發(fā)射的衛(wèi)星越來越多,并且衛(wèi)星的分辨率越來越高。如何從這些覆蓋全球幾乎包含所有地標(biāo)地物的影像中快速的搜索我們感興趣的地物其實(shí)是具有非常重要的意義的。這是我們做的影像識別和搜索的例子,左邊的兩個圖是我們對路況內(nèi)的影像識別的得到的結(jié)果,右邊兩個圖是對路況內(nèi)的圖進(jìn)行搜索得到的結(jié)果,我們還做了交互的Demo,您點(diǎn)擊任意一個地塊,系統(tǒng)給出這個地塊可能是什么類別,在北京內(nèi)項(xiàng)所和它相似的地塊。這個模型我們用了數(shù)十萬圖片里面的地物訓(xùn)練。通過這種方式我們可以以一種全新的方式探索,去實(shí)時的的探索我們生活著的周邊的世界。
這類技術(shù)在現(xiàn)實(shí)中有很多的應(yīng)用,北京的煙囪分布在哪里,大家不知道,這是我們?nèi)ト本┧阉鳠焽韬蛢Σ毓薜贸龅慕Y(jié)果。
第三個進(jìn)展,用機(jī)器學(xué)習(xí),也就是人工智能生成大量的數(shù)據(jù),并且對我們已有的數(shù)據(jù)進(jìn)行補(bǔ)充和驗(yàn)證。這其中的數(shù)據(jù)包括了街區(qū)數(shù)據(jù),標(biāo)準(zhǔn)化的地址數(shù)據(jù),包括像房價等一些數(shù)據(jù)。分享一下街區(qū)數(shù)據(jù)是怎么生成的,街區(qū)在人文地理學(xué)的定義講的城市里由主要道路圍成的相對獨(dú)立的區(qū)域,我們在主要道路和河流對街區(qū)進(jìn)行分割的,分割的時候遇到了兩個比較棘手的問題,第一個問題是有些小城市我們的道路其實(shí)并不足所以街區(qū)沒有被分開,還有的城市有的道路過于密集了,我們提取了道路和河流以此為依據(jù),把未分開的進(jìn)行切分。為了解決第二個問題,我們對截取進(jìn)行分類,然后訓(xùn)練了一個分類的模型,把這些位置相鄰,并且類別的街區(qū)進(jìn)行合并。
這是我們提取的北京的街區(qū)的效果,從這個例子可以看出來,人工智能并不一定要解決最后的問題,它可以僅僅是生成數(shù)據(jù),供我們以后的分析做準(zhǔn)備。我們除了街區(qū)數(shù)據(jù),我們還生成了標(biāo)準(zhǔn)化的地址數(shù)據(jù),其實(shí)地址的準(zhǔn)確度在地圖的搜索還有貨物的配送是非常重要的。但是即使是非常簡單的地址也會存在縮寫,漏寫這些錯誤。我們?nèi)ビ?xùn)練地址,區(qū)分出地址不同的部分,讓地址的搜索更加匹配,更加簡單。前邊講的都是生成數(shù)據(jù)的例子,現(xiàn)在講一個我們補(bǔ)充我們數(shù)據(jù)的例子,在我們平臺上有些數(shù)據(jù)是缺失的,比如說可能房價信息是缺失的,我們會訓(xùn)練一些機(jī)器學(xué)習(xí)的模型,比如說房價我們用這個小區(qū)它的位置,它的樓房的類型,它的綠化率建立一個模型去預(yù)測房價,通過這個方式我們可以把缺失的數(shù)據(jù)進(jìn)行補(bǔ)全,當(dāng)我們有了這樣一個模型以后我們可以對所有的數(shù)據(jù)都去預(yù)測,通過我們預(yù)測的結(jié)果和實(shí)際的數(shù)據(jù)是不是偏差過大?篩選出可能錯誤的數(shù)據(jù),然后進(jìn)行驗(yàn)證。
我們的第四個進(jìn)展是使用人工智能結(jié)合以前的經(jīng)驗(yàn)知識,得到了商業(yè)分析的模型。我們主要是基于街區(qū)這個研究單元,對三大類POI,房價與人口數(shù)據(jù),刷卡消費(fèi)數(shù)據(jù),這部分我們的同事,會在接下來的案例和大家詳細(xì)介紹,我就不多說了。
最后,和大家總結(jié)一下,其實(shí)從人工智能到地理問題,給我們解決地理問題帶來的一個非常新的思路,也給我們的平臺帶來了很大的能力。更大更強(qiáng)的能力。其實(shí)我們也會遇到一些挑戰(zhàn)。比如訓(xùn)練數(shù)據(jù)不足,比如訓(xùn)練時間非常長。再比如我們的訓(xùn)練模型特別復(fù)雜,我們很難把我們現(xiàn)有的知識編碼到已有的模型里面去,這些都是我們需要解決的問題。
但是我們相信這些問題隨著我們的進(jìn)一步的努力,以及在座各位的努力,都會不再成為問題,因?yàn)槲覀兊目蛻?,現(xiàn)在對人工智能這個技術(shù)已經(jīng)感到了非常強(qiáng)烈的興趣,也非常愿意花時間和精力去做這件事情。所以我希望在座的各位和我們一起去使用人工智能,去取得更大的突破。謝謝大家!
{{item.content}}