從工程測繪到衛(wèi)星遙感,從街景車到眾包地圖,我們描繪世界的方式在不斷變革,這是生活在這個星球的人們一直以來探尋的,認(rèn)識自己賴以生存的世界的手段。
日前,一家公司發(fā)布了史上最精細(xì)人口密度地圖,這家公司的名字是Facebook——此前幾乎沒人會把這個名字和地圖聯(lián)系起來。他們讓我們意識到,人類在描繪世界的道路上正步入一個全新的領(lǐng)域,在這個領(lǐng)域中,地圖將與機(jī)器學(xué)習(xí)算法聯(lián)姻。
數(shù)據(jù)——精準(zhǔn)分析的源泉
去年,聯(lián)合國發(fā)布了于2030年在世界范圍內(nèi)根除貧困的發(fā)展議程目標(biāo)。然而數(shù)據(jù)的匱乏卻使之難以量化與這個目標(biāo)的實(shí)際距離,世界發(fā)展?fàn)顩r的真實(shí)數(shù)據(jù)對它來說變得至關(guān)重要。
事實(shí)上,直到今天,各國政府在經(jīng)濟(jì)普查中依然沿用著上個世紀(jì)的“土辦法”,即地面地毯式數(shù)據(jù)統(tǒng)計,這樣的方法效率低、迭代周期長。在這個數(shù)據(jù)驅(qū)動的世界,是否有一種手段能夠繪制出人類的發(fā)展現(xiàn)狀和軌跡?來自斯坦福大學(xué)的科研團(tuán)隊提出了一個更好的辦法,那就是綜合利用深度學(xué)習(xí)和衛(wèi)星影像進(jìn)行貧困統(tǒng)計建模。
機(jī)器學(xué)習(xí)專家斯特凡諾·俄曼(Stefano Ermon),聯(lián)合地球科學(xué)專家大衛(wèi)·羅貝爾(David Lobell ),加上斯坦福大學(xué)工程系的幾個學(xué)生,組成了這支研究團(tuán)隊,他們試圖將谷歌地球的衛(wèi)星圖像數(shù)據(jù)轉(zhuǎn)換成貧困統(tǒng)計模型。“我們希望終結(jié)極端貧困,但我們需要一個量化的方法告訴我們貧困是否在改善。”俄曼表示,對于南非、南亞等極度貧困地區(qū),放映當(dāng)?shù)刎毨顩r的真實(shí)數(shù)據(jù)往往是稀缺的。“我們拿到的關(guān)于南非的最近的數(shù)據(jù)竟然是20年前的,所以我們正對90年代早期南非發(fā)展?fàn)顩r進(jìn)行分析”俄曼說,“我們對于數(shù)據(jù)的需求真的太迫切了。”
左圖:基于10km*10km的細(xì)粒地圖網(wǎng)格數(shù)據(jù)的貧困概率預(yù)測;中圖:基于區(qū)域級別的貧困概率預(yù)測;右圖:2005年的真實(shí)普查結(jié)果對比
利用英偉達(dá)生產(chǎn)的GPU,這個團(tuán)隊訓(xùn)練了一個神經(jīng)網(wǎng)絡(luò),通過衛(wèi)星采集到的公路、農(nóng)田以及住房等影響,能夠準(zhǔn)確預(yù)測當(dāng)?shù)氐呢毨С潭取_@項技術(shù)獲得了英偉達(dá)2016全球最具影響力技術(shù)大獎提名的殊榮。
衛(wèi)星影像和機(jī)器學(xué)習(xí)模型——繪出人類社會進(jìn)步史
電力應(yīng)用以及夜間照明是現(xiàn)代社會評估經(jīng)濟(jì)實(shí)力的一項重要指標(biāo)。夜間的人造光源匱乏,被認(rèn)為是地區(qū)相對貧困的一個信號。在這個前提下,使用機(jī)器學(xué)習(xí)算法將這些衛(wèi)星數(shù)據(jù)與利用傳統(tǒng)方式收集的貧困數(shù)據(jù)結(jié)合,能夠產(chǎn)生一些有趣的關(guān)聯(lián)模型,基于衛(wèi)星影像更高效地識別貧困區(qū)域成為了可能。
傳統(tǒng)的深度學(xué)習(xí)解決方案需要一系列用于訓(xùn)練的數(shù)據(jù)集。但受限于有限的數(shù)據(jù)量,斯坦福大學(xué)的這家研究團(tuán)隊想出了遷移學(xué)習(xí)方法來完成計算模型。具體實(shí)現(xiàn)過程如下。
首先,利用谷歌地球和谷歌靜態(tài)圖像,同時獲取同一區(qū)域的晝夜間情況。傳統(tǒng)的貧困圖像模型使用夜間的燈光密度作為經(jīng)濟(jì)活躍度的指標(biāo)。而通過同時使用晝間、夜間的衛(wèi)星圖像,這個機(jī)器學(xué)習(xí)模型就可以從未標(biāo)記的數(shù)據(jù)集(例如公路、農(nóng)田以及水體等)中分辨出有用的標(biāo)示貧困的晝間特性。
“通常情況下,我們提供基于區(qū)域晝間、夜間衛(wèi)星圖像的深度學(xué)習(xí)系統(tǒng),并利用該系統(tǒng)對貧困區(qū)域做出預(yù)測,”俄曼說,“這個系統(tǒng)會通過比對兩組衛(wèi)星圖像進(jìn)行深度學(xué)習(xí),并解決這個問題。”
左圖:每一行顯示了神經(jīng)網(wǎng)絡(luò)中的5組最大活躍度圖像(分別為城區(qū),農(nóng)田以及網(wǎng)格狀區(qū)域,公路,水體和平原,以及森林);右圖:經(jīng)過過濾器篩選出的左圖的對應(yīng)影像點(diǎn)
目前,團(tuán)隊已經(jīng)擁有了自己的數(shù)據(jù)分析平臺,能夠自動通過簡易數(shù)據(jù)生成貧困地圖——“我們需要的只是圖像而已”俄曼表示。這種計算模型開啟了機(jī)器學(xué)習(xí)與衛(wèi)星圖像結(jié)合的新時代,即在空間和時間的維度上獲得史無前例的對于世界的更好理解。
斯坦福大學(xué)研究人員使用機(jī)器學(xué)習(xí)算法比較非洲夜間照明(電力與經(jīng)濟(jì)活力之間存在正向相關(guān)性)和晝間公路、城區(qū)、水體、農(nóng)田的衛(wèi)星圖像
未來:遙感影像應(yīng)用的全新模式
Facebook已經(jīng)向世人證明了機(jī)器學(xué)習(xí)在拓展遙感領(lǐng)域應(yīng)用上發(fā)揮的重要作用。訓(xùn)練計算機(jī)基于訓(xùn)練樣本劃分不同區(qū)域,在圖像處理領(lǐng)域是一項由來已久的技術(shù)。然而由于其計算成本的昂貴,直到今天也沒能在全球范圍內(nèi)形成規(guī)模。機(jī)器學(xué)習(xí)和深度學(xué)習(xí)正在使這種技術(shù)在全球普及化成為可能,將衛(wèi)星遙感的應(yīng)用推向前所未有的新高度。
學(xué)者們相信,這種基于機(jī)器學(xué)習(xí)的模式終將取代傳統(tǒng)的費(fèi)時費(fèi)力的數(shù)據(jù)普查工作。這是一次不可想象的飛躍,完全可以替代老舊的調(diào)查方式,高效、可擴(kuò)展,而且準(zhǔn)確得讓人吃驚,更漂亮的是,它能隨著時間和增長的數(shù)據(jù)自主進(jìn)化。
目前,源數(shù)據(jù)不足是阻礙研究進(jìn)行的一個重要因素。當(dāng)下,對于貧困地區(qū),衛(wèi)星只能做到點(diǎn)覆蓋。而系統(tǒng)需要更詳細(xì)、更多頻次的數(shù)據(jù)作為分析的原材料,才能更精確地通過機(jī)器學(xué)習(xí)預(yù)測貧困地區(qū)的興衰。好在這個問題很快就能得到解決,或者基本上解決。
斯坦福的學(xué)者們還在想辦法擴(kuò)展到更多的領(lǐng)域,例如利用手機(jī)的活動狀況作為基本數(shù)據(jù)進(jìn)行更為細(xì)致準(zhǔn)確的調(diào)查。隨著移動電話在貧困地區(qū)的爆發(fā)性增長,這些數(shù)據(jù)將會成為非常精準(zhǔn)的數(shù)據(jù)源。
羅貝爾說,只有嘗試,我們才能獲得答案。機(jī)器學(xué)習(xí)之美,在于機(jī)器善于在千萬個選項中找到最優(yōu)解,這是人類無法企及的。(文|3sNews Melody)
{{item.content}}