亚洲熟妇av一区二区三区,亚洲av中文无码乱人伦在线视色,亚洲人成网站色www,亚洲欧美日韩国产综合在线一区 ,亚洲av之男人的天堂网站

分享
Scan me 分享到微信

極海徐翔:人工智能,開解空間位置問(wèn)題的新鑰匙

人類需要的人工智能其實(shí)不僅僅是計(jì)算機(jī)能夠計(jì)算的比人類更快,而是需要它能夠像我們一樣思考,甚至能夠比我們思考的更好。

  2017年 6月13日,由泰伯網(wǎng)主辦、主題為“空間大數(shù)據(jù)的崛起”的WGDC2017,在北京國(guó)家會(huì)議中心盛大開幕。大會(huì)由空間信息產(chǎn)業(yè)創(chuàng)新創(chuàng)業(yè)服務(wù)平臺(tái)泰伯主辦,秉承不斷引領(lǐng)和促進(jìn)空間信息技術(shù)創(chuàng)新與變革的宗旨,WGDC已走過(guò)六個(gè)年頭,如今成為全球最具前瞻性的跨界創(chuàng)新風(fēng)向標(biāo)。

  14日,空間大數(shù)據(jù)+人工智能峰會(huì)(極??v橫專場(chǎng))開幕。峰會(huì)上,來(lái)自GeoHey·極海的徐翔發(fā)表了以“人工智能,開解空間位置問(wèn)題的新鑰匙”為題的精彩演講。以下為演講實(shí)錄(未經(jīng)本人核實(shí)):

  徐翔:大家好,我在徐翔,我主要負(fù)責(zé)一些核心技術(shù)的研發(fā),其中包括今天我要和大家分享的人工智能。前面我的兩位同事和大家分享我們的云平臺(tái)在云計(jì)算和大數(shù)據(jù)上的進(jìn)展。今天我來(lái)講一講人工智能結(jié)合以上的兩種技術(shù),成為開解空間位置的新鑰匙。首先我們來(lái)看一看人工智能,其實(shí)是一個(gè)很古老的詞。人工智能的提出其實(shí)是在19世紀(jì)的50年代,在50年代末,MIK成立了一個(gè)人工智能實(shí)驗(yàn)室。對(duì)于我們絕大多數(shù)人來(lái)說(shuō),人工智能其實(shí)是一個(gè)非常遙遠(yuǎn)的一個(gè)時(shí)代的事情。但是在最近的幾年,人工智能又得到了井噴式的的關(guān)注,既然是井噴式的關(guān)注,其中會(huì)不會(huì)有泡沫呢?如果拿我們現(xiàn)在能夠接觸到的人工智能的能力和技術(shù)去和電影、文學(xué)作品里的五花八門的人工智能相比的話,我們會(huì)發(fā)現(xiàn),這就相當(dāng)于從石器時(shí)代到工業(yè)文明的跨度。為什么現(xiàn)在大家都說(shuō)我們處在一個(gè)人工智能時(shí)代呢?其實(shí)需要我們回顧一下歷史,了解一下為什么上個(gè)世紀(jì)的人工智能成為了泡影,現(xiàn)在的人工智能能夠取得如此大的突破。

  其實(shí)在我們追求人工智能這個(gè)偉大理想的過(guò)程中出現(xiàn)過(guò)很多流派,其中就有一種相信智能的產(chǎn)生依賴于符號(hào)處理系統(tǒng)的符號(hào)處理,以及性能的產(chǎn)生需要模擬人腦這個(gè)智能體的聯(lián)接主義。有一個(gè)很有意思的思想實(shí)驗(yàn),這個(gè)人她不懂中文,他僅僅依靠翻譯表就能表現(xiàn)的像會(huì)說(shuō)中文一樣,于是有人根據(jù)這個(gè)開發(fā)了一個(gè)系統(tǒng),他是一個(gè)機(jī)器人,根據(jù)數(shù)據(jù)庫(kù)里的很多很多的規(guī)則,就表現(xiàn)的可以很接近圖靈測(cè)試。這種方式我們根據(jù)前提假設(shè)進(jìn)行邏輯推理的思考方式是不是很像呢?其實(shí)這實(shí)在稱不上是一條通往智能的道路,它也無(wú)法應(yīng)用到真正需要智能的場(chǎng)景中去。

  人類需要的人工智能其實(shí)不僅僅是計(jì)算機(jī)能夠計(jì)算的比人類更快,而是需要它能夠像我們一樣思考,甚至能夠比我們思考的更好。這也是后一種流派,聯(lián)接主義所孜孜以求的。經(jīng)過(guò)很多年的潛心發(fā)展,后一種流派開始以很多種新的面目示人,出現(xiàn)了基于概率統(tǒng)計(jì)的智能,基于機(jī)器學(xué)習(xí)的智能,基于大數(shù)據(jù)的智能,這些才是我們現(xiàn)在所說(shuō)的真正的人工智能,其實(shí)現(xiàn)在人工智能取得突破的領(lǐng)域,沒(méi)有一個(gè)不是依靠概率統(tǒng)計(jì),機(jī)器學(xué)習(xí)以及大數(shù)據(jù)的。所以我們現(xiàn)在所處的就是這樣的一個(gè)人工智能的時(shí)代。

  所以出于這樣的一個(gè)人工智能的時(shí)代,當(dāng)我們思考地理位置的時(shí)候我們是不是應(yīng)該帶著人工智能給我們帶來(lái)的技術(shù)和能力去思考?我們現(xiàn)在對(duì)數(shù)據(jù)的理解以及我們建立模型的方式,我們對(duì)分析的算法有沒(méi)有可能有更優(yōu)的解決方法?這一切需要我們對(duì)地理問(wèn)題有非常深刻地認(rèn)識(shí),然后把這些經(jīng)驗(yàn)編碼在其中才有可能。下面我介紹一下我們是如何將人工智能與地理問(wèn)題相結(jié)合的。我們做的第一件事情開發(fā)了一個(gè)多源數(shù)據(jù)融合的工具,搭建了從位置數(shù)據(jù)到深度學(xué)習(xí)的橋梁。地理數(shù)據(jù)具有多維度和多尺度的特征。一個(gè)地點(diǎn)具有多種維度的特征,并且這些特征都通常不是在一個(gè)維度上的,你可以把這個(gè)維度理解為分辨率,比如說(shuō)現(xiàn)在的朝陽(yáng)區(qū)有它的土地利用分布,有它的人口,有它的GDP,有道路、河流,還有它的POI等等,可能土地利用是10米的分辨率,人口是50米的分辨率,燈光是30米的分辨率,當(dāng)我們遇到一個(gè)世紀(jì)的問(wèn)題的時(shí)候,要解決地理問(wèn)題的時(shí)候我們要選擇合適的地理尺度把多源的多尺度的數(shù)據(jù)在一個(gè)統(tǒng)一的尺度下進(jìn)行超采樣。通過(guò)這種方式我們可以把這些各種尺度的數(shù)據(jù),在任意一個(gè)尺度,比如說(shuō)我們的格網(wǎng)或者交通小區(qū),或者是行政區(qū)劃進(jìn)行聚合,當(dāng)我們有了這樣一個(gè)多源數(shù)據(jù)融合工具,我們可以把各個(gè)維度上的位置信息統(tǒng)計(jì)起來(lái),為下一步的訓(xùn)練做好統(tǒng)計(jì)。

  我們做的第二件事情使用人工智能編碼廣義的空間坐標(biāo),深挖地理要素的隱含關(guān)聯(lián),傳統(tǒng)的空間坐標(biāo)包括了XYZ三個(gè)維度,其實(shí)剛剛我們也說(shuō)了,一個(gè)地理上除了它的位置還有位置之上的很多信息。比如它的人口、土地利用等等。而很自然的我們可以把這些其他的信息也加到這個(gè)空間坐標(biāo)里面去,形成一個(gè)多維的廣義的空間坐標(biāo),大家注意,這不是單純的把這些指標(biāo)加進(jìn)去就完了,我們通過(guò)人工智能的做法進(jìn)行相關(guān)性去除,形成了一個(gè)更能表達(dá)這個(gè)地理特征的一個(gè)廣義的空間坐標(biāo),有了這樣的一個(gè)坐標(biāo)以后我們可以快速的根據(jù)我們的云計(jì)算法,對(duì)地理要素進(jìn)行快速的查詢和檢索。

  正是基于這樣的靈感我們可以對(duì)任意一個(gè)地塊算出它的廣義的空間坐標(biāo),這個(gè)坐標(biāo)是一個(gè)兩千維的向量,我們可以找出相似的地物。下面可以舉更多的找相似地物的例子。我們做的第三件事情使用深度卷積網(wǎng)絡(luò),做地理空間域特征的自動(dòng)組合,當(dāng)我們使用多源的數(shù)據(jù)融合工具得到了這個(gè)數(shù)據(jù),我們要考慮的是如何在模型里能夠最大限度的提取這些數(shù)據(jù)的關(guān)聯(lián)信息。其中的關(guān)聯(lián)信息包括兩個(gè)方面,第一個(gè)方面是地理特征之間的關(guān)聯(lián),不同的特征之間的相互關(guān)系,比如說(shuō)燈光圖和經(jīng)濟(jì)發(fā)展水平也有很大的關(guān)系。

  另一個(gè)關(guān)聯(lián)是地理空間的關(guān)聯(lián),這表明同一個(gè)維度,在地理空間上的一個(gè)變化情況。比如說(shuō),因?yàn)榈乩砜臻g是連續(xù)的,所以相鄰的位置會(huì)互相影響,并且這個(gè)影響的程度,會(huì)隨著距離的增大而減少。傳統(tǒng)的方法是怎么建模這兩種關(guān)聯(lián)的呢?對(duì)于第一種關(guān)聯(lián)他們可能會(huì)想很多指標(biāo),比如說(shuō)剛剛說(shuō)到的汲取河流水體的,對(duì)于后一種聯(lián)系,可能他們會(huì)做一個(gè)二次函數(shù)去做擬合,但是有沒(méi)有一種方法可以同時(shí)表達(dá)這兩種聯(lián)系,并且能夠找出最優(yōu)的聯(lián)系呢?我們發(fā)現(xiàn)深度卷積神經(jīng)網(wǎng)絡(luò)可以很好的做到,里面都是三維的數(shù)據(jù)體,寬和高表達(dá)同一個(gè)要素的特征在地理空間上的關(guān)聯(lián),深度表達(dá)不同的地理特征之間的不同地理特征,包括POI,土地利用,燈光圖等等。卷積神經(jīng)網(wǎng)絡(luò)的卷積操作,可以對(duì)這些特征進(jìn)行線性的組合,形成新的特征。通過(guò)卷積的操作我們可以進(jìn)行地理特征和地理空間的自由組合,生成更多更抽象的特征,這樣更能描述現(xiàn)實(shí)世界里的各個(gè)特征之間的聯(lián)系。

  我們?cè)谧鲇跋穹指畹臅r(shí)候把這些特征可視化出來(lái)看,左邊是一個(gè)假彩色合成的影像,這是我們的模型第一層提取出來(lái)的特征,第一層的特征和它的形狀還是很相關(guān)的,因?yàn)槲覀兡軌虮嬲J(rèn)出一些地物的形狀,隨著層數(shù)越深,我們現(xiàn)在人類已經(jīng)無(wú)法理解它提取的特征是什么意思,但是正是靠這些抽象的特征,卷積神經(jīng)網(wǎng)絡(luò)可以給出最后的分割的結(jié)果出來(lái)。前面講的幾點(diǎn)都是我們?cè)诩夹g(shù)上的思考。

  最后我想從思維的角度來(lái)談一談如何把人工智能和地理問(wèn)題相結(jié)合。在工業(yè)革命時(shí)代其實(shí)機(jī)械思維是占主導(dǎo)因素的思維方式。但是現(xiàn)在是大數(shù)據(jù)時(shí)代,大數(shù)據(jù)思維,它是想要讓我們從海量數(shù)據(jù)中尋找強(qiáng)相關(guān)關(guān)系,而不是一味的追求精確描述事物之間的因果關(guān)系,傳統(tǒng)的方法上,可能我們解決一個(gè)地理問(wèn)題的時(shí)候先嘗試想清楚它的因果關(guān)系,然后再去建模分析,這種方法在有些情況下是可行的,但是有些情況也會(huì)遇到很大的阻礙。我們?cè)诮o美國(guó)一家公司做選址的時(shí)候,他們?cè)诿绹?guó)有非常完善的模型,因?yàn)槲覀儑?guó)內(nèi)的數(shù)據(jù)和他們的不一樣,所以沒(méi)法直接用。如果我們要照他們的方式建立模型的話就代價(jià)很大,而且時(shí)間成本也很高。所以我們完全拋棄了這種方式,轉(zhuǎn)而用大數(shù)據(jù)的思維,用機(jī)器學(xué)習(xí)的方法,從數(shù)百種特征里面去找跟他想要知道的東西最相關(guān)的特征,我們的模型也取得很好的效果。

  從這個(gè)例子可以看出來(lái),在人工智能時(shí)代如果我們嘗試用大數(shù)據(jù)思維去考慮問(wèn)題的話,可能能夠解決以往的一些傳統(tǒng)方法很難解決的問(wèn)題。而當(dāng)我們掌握了這種思維方式的時(shí)候其實(shí)我們就掌握了能夠開啟地理問(wèn)題的一把嶄新的鑰匙。剛剛說(shuō)到了我們?cè)谌斯ぶ悄芙Y(jié)合地理問(wèn)題上的一些思考和一些實(shí)踐?,F(xiàn)在我想分享一下我們?cè)谒膫€(gè)具體的方面取得的一些進(jìn)展。

  第一個(gè)進(jìn)展可以提取地物,相信大家都使用導(dǎo)航軟件的經(jīng)歷,不知道大家有沒(méi)有遇到這種情況,有時(shí)候跟著導(dǎo)航軟件往前走,走著走著前面沒(méi)路了,這時(shí)候不得不往回走,浪費(fèi)時(shí)間不說(shuō),你的心情也會(huì)像道路一樣,變得不順。我想從A地到B地,我對(duì)路完全不熟悉,只能靠著導(dǎo)航走,走到半路的時(shí)候,有個(gè)老司機(jī)說(shuō)兩點(diǎn)之間開了一條新路,兩點(diǎn)之間直線最短。有些道路新開了,沒(méi)有及時(shí)更新,道路的更新速度對(duì)導(dǎo)航的精度起著非常重要的作用。有沒(méi)有一種方式可以去快速的提取道路呢?其實(shí)現(xiàn)在隨著衛(wèi)星產(chǎn)業(yè)的發(fā)展,我們現(xiàn)在已經(jīng)每天獲取一次全球高精度的影像,如果我們從影像中提取道路的話不管是高速公路還是羊腸小道我們都可以從影像里面來(lái),司機(jī)可以馬上知道,哪條路不通了,哪里開了一條新路。這四幅圖是我們從影像中提取道路的例子,目前對(duì)主干道的提取精度達(dá)到98.8%,IOU64.7%,對(duì)街區(qū)提取精度是95.7%,IOU是56.3%,IOU大家不太明白什么意思?就是我們模型訓(xùn)練好測(cè)試集對(duì)于影像提取出來(lái)的道路和實(shí)際的道路的交集,IOU描述的是我分割的位置的準(zhǔn)確度,我分割出來(lái)的道路是不是真的和實(shí)際的導(dǎo)讀剛好疊合在一起 了。因?yàn)槠鋵?shí)影像分割是比較難的問(wèn)題,一般精度在90%以上,IOU在50%以上就是比較好的結(jié)果。前段時(shí)間在一個(gè)競(jìng)賽平臺(tái)上發(fā)布了一個(gè)影像分割的比賽他們對(duì)于道路的分割,IOU也是在50%左右,但是他們的效果也是挺好的了。除了道路我們還關(guān)心建筑。比如城市規(guī)劃部門想知道全市總共有多少個(gè)建筑,哪些建筑是違建的,我們用兩個(gè)小時(shí)就可以提取北四環(huán)內(nèi)的所有的建筑,這是傳統(tǒng)的方法無(wú)法想象的。我們對(duì)傳統(tǒng)的建筑精度92.4%,IOU是64.8%。這是我們做的一個(gè)交互識(shí)別建筑的例子??梢詫?duì)任意一個(gè)區(qū)域的影像提取建筑,提取的精度幾乎是實(shí)時(shí)的。

  前面大家看到的都是提取一種地物的例子,這里我們做了一個(gè)項(xiàng)目可以提取31類的地物,大家看這幅圖不知道能不能夠區(qū)分出里面的常綠闊葉林和針葉林,我們的模型非常精確的做到這一點(diǎn),經(jīng)過(guò)三百個(gè)線下點(diǎn)的檢驗(yàn),我們的模型已經(jīng)取得了非常令人吃驚的精度。通過(guò)這種方式來(lái)比較各個(gè)年份,各種覆被的面積覆蓋情況,我們可以精確的分享三峽大壩對(duì)于周邊環(huán)境的影響。

  第二個(gè)進(jìn)展可以從海量的影像里面進(jìn)行地物的識(shí)別和搜索。現(xiàn)在,隨著衛(wèi)星產(chǎn)業(yè)的發(fā)展,我們現(xiàn)在每年發(fā)射的衛(wèi)星越來(lái)越多,并且衛(wèi)星的分辨率越來(lái)越高。如何從這些覆蓋全球幾乎包含所有地標(biāo)地物的影像中快速的搜索我們感興趣的地物其實(shí)是具有非常重要的意義的。這是我們做的影像識(shí)別和搜索的例子,左邊的兩個(gè)圖是我們對(duì)路況內(nèi)的影像識(shí)別的得到的結(jié)果,右邊兩個(gè)圖是對(duì)路況內(nèi)的圖進(jìn)行搜索得到的結(jié)果,我們還做了交互的Demo,您點(diǎn)擊任意一個(gè)地塊,系統(tǒng)給出這個(gè)地塊可能是什么類別,在北京內(nèi)項(xiàng)所和它相似的地塊。這個(gè)模型我們用了數(shù)十萬(wàn)圖片里面的地物訓(xùn)練。通過(guò)這種方式我們可以以一種全新的方式探索,去實(shí)時(shí)的的探索我們生活著的周邊的世界。

  這類技術(shù)在現(xiàn)實(shí)中有很多的應(yīng)用,北京的煙囪分布在哪里,大家不知道,這是我們?nèi)ト本┧阉鳠焽韬蛢?chǔ)藏罐得出的結(jié)果。

  第三個(gè)進(jìn)展,用機(jī)器學(xué)習(xí),也就是人工智能生成大量的數(shù)據(jù),并且對(duì)我們已有的數(shù)據(jù)進(jìn)行補(bǔ)充和驗(yàn)證。這其中的數(shù)據(jù)包括了街區(qū)數(shù)據(jù),標(biāo)準(zhǔn)化的地址數(shù)據(jù),包括像房?jī)r(jià)等一些數(shù)據(jù)。分享一下街區(qū)數(shù)據(jù)是怎么生成的,街區(qū)在人文地理學(xué)的定義講的城市里由主要道路圍成的相對(duì)獨(dú)立的區(qū)域,我們?cè)谥饕缆泛秃恿鲗?duì)街區(qū)進(jìn)行分割的,分割的時(shí)候遇到了兩個(gè)比較棘手的問(wèn)題,第一個(gè)問(wèn)題是有些小城市我們的道路其實(shí)并不足所以街區(qū)沒(méi)有被分開,還有的城市有的道路過(guò)于密集了,我們提取了道路和河流以此為依據(jù),把未分開的進(jìn)行切分。為了解決第二個(gè)問(wèn)題,我們對(duì)截取進(jìn)行分類,然后訓(xùn)練了一個(gè)分類的模型,把這些位置相鄰,并且類別的街區(qū)進(jìn)行合并。

  這是我們提取的北京的街區(qū)的效果,從這個(gè)例子可以看出來(lái),人工智能并不一定要解決最后的問(wèn)題,它可以僅僅是生成數(shù)據(jù),供我們以后的分析做準(zhǔn)備。我們除了街區(qū)數(shù)據(jù),我們還生成了標(biāo)準(zhǔn)化的地址數(shù)據(jù),其實(shí)地址的準(zhǔn)確度在地圖的搜索還有貨物的配送是非常重要的。但是即使是非常簡(jiǎn)單的地址也會(huì)存在縮寫,漏寫這些錯(cuò)誤。我們?nèi)ビ?xùn)練地址,區(qū)分出地址不同的部分,讓地址的搜索更加匹配,更加簡(jiǎn)單。前邊講的都是生成數(shù)據(jù)的例子,現(xiàn)在講一個(gè)我們補(bǔ)充我們數(shù)據(jù)的例子,在我們平臺(tái)上有些數(shù)據(jù)是缺失的,比如說(shuō)可能房?jī)r(jià)信息是缺失的,我們會(huì)訓(xùn)練一些機(jī)器學(xué)習(xí)的模型,比如說(shuō)房?jī)r(jià)我們用這個(gè)小區(qū)它的位置,它的樓房的類型,它的綠化率建立一個(gè)模型去預(yù)測(cè)房?jī)r(jià),通過(guò)這個(gè)方式我們可以把缺失的數(shù)據(jù)進(jìn)行補(bǔ)全,當(dāng)我們有了這樣一個(gè)模型以后我們可以對(duì)所有的數(shù)據(jù)都去預(yù)測(cè),通過(guò)我們預(yù)測(cè)的結(jié)果和實(shí)際的數(shù)據(jù)是不是偏差過(guò)大?篩選出可能錯(cuò)誤的數(shù)據(jù),然后進(jìn)行驗(yàn)證。

  我們的第四個(gè)進(jìn)展是使用人工智能結(jié)合以前的經(jīng)驗(yàn)知識(shí),得到了商業(yè)分析的模型。我們主要是基于街區(qū)這個(gè)研究單元,對(duì)三大類POI,房?jī)r(jià)與人口數(shù)據(jù),刷卡消費(fèi)數(shù)據(jù),這部分我們的同事,會(huì)在接下來(lái)的案例和大家詳細(xì)介紹,我就不多說(shuō)了。

  最后,和大家總結(jié)一下,其實(shí)從人工智能到地理問(wèn)題,給我們解決地理問(wèn)題帶來(lái)的一個(gè)非常新的思路,也給我們的平臺(tái)帶來(lái)了很大的能力。更大更強(qiáng)的能力。其實(shí)我們也會(huì)遇到一些挑戰(zhàn)。比如訓(xùn)練數(shù)據(jù)不足,比如訓(xùn)練時(shí)間非常長(zhǎng)。再比如我們的訓(xùn)練模型特別復(fù)雜,我們很難把我們現(xiàn)有的知識(shí)編碼到已有的模型里面去,這些都是我們需要解決的問(wèn)題。

  但是我們相信這些問(wèn)題隨著我們的進(jìn)一步的努力,以及在座各位的努力,都會(huì)不再成為問(wèn)題,因?yàn)槲覀兊目蛻?,現(xiàn)在對(duì)人工智能這個(gè)技術(shù)已經(jīng)感到了非常強(qiáng)烈的興趣,也非常愿意花時(shí)間和精力去做這件事情。所以我希望在座的各位和我們一起去使用人工智能,去取得更大的突破。謝謝大家!

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費(fèi)訂閱泰伯每周精選電郵。 立即訂閱

參與評(píng)論

【登錄后才能評(píng)論哦!點(diǎn)擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復(fù){{item.replynum}}
    {{child.username}} 回復(fù) {{child.to_username}}:{{child.content}}

更多精選文章推薦