前不久,美國研究人員訓(xùn)練出一個(gè)深度學(xué)習(xí)算法,用以識(shí)別"東亞某國"地空導(dǎo)彈基地。
就在我們的頭頂之上,各種衛(wèi)星(包括間諜衛(wèi)星)像狗仔隊(duì)一樣,每天都圍著地球瘋狂拍下數(shù)十TB的照片。這個(gè)數(shù)量可以說是泛濫了。
每個(gè)情報(bào)機(jī)構(gòu)都有一批訓(xùn)練有素的分析師,負(fù)責(zé)搜尋隱藏在海量衛(wèi)星圖像中未申報(bào)的核設(shè)施或秘密軍事基地。
但面對(duì)如此海量的數(shù)據(jù),據(jù)說美國的情報(bào)機(jī)構(gòu)已經(jīng)被錯(cuò)失恐懼癥(FOMO)所籠罩。因?yàn)槿祟惙治鰡T能處理的圖像數(shù)量有限,很可能錯(cuò)失真正重要的關(guān)鍵信息。
于是,AI來了。而且來得很恐怖。
前不久,美國研究人員訓(xùn)練出一個(gè)深度學(xué)習(xí)算法,用以識(shí)別"東亞某國"地空導(dǎo)彈基地。
這些算法比人類的速度快幾百倍,高效找出分布在一塊近9萬平方公里區(qū)域內(nèi)的地空導(dǎo)彈發(fā)射場(chǎng)。這種人工神經(jīng)網(wǎng)絡(luò)基于能夠過濾和學(xué)習(xí)大量數(shù)據(jù)的人工神經(jīng)元層,達(dá)到人類圖像分析專家90%的準(zhǔn)確率。
令人震驚的是,這種方法還將發(fā)現(xiàn)潛在導(dǎo)彈基地的時(shí)間從60小時(shí)(2.5天)減少到42分鐘。
可怕之處在于,這只是公開的"民間"研究。
"用算法發(fā)現(xiàn)潛在的導(dǎo)彈基地位置,據(jù)我所知,這為人類節(jié)省了很多時(shí)間" 密蘇里大學(xué)電氣工程和計(jì)算機(jī)科學(xué)教授Curt Davis談了談他們的研究方向。
這個(gè)研究發(fā)表在10月的《應(yīng)用遙感》雜志上,展示了一種用于大量衛(wèi)星圖像分析的深度學(xué)習(xí)模型,能夠識(shí)別情報(bào)機(jī)構(gòu)和國家安全專家可能感興趣的目標(biāo)。
美國愛國者地空導(dǎo)彈系統(tǒng)運(yùn)輸起豎發(fā)射車(TEL)
挑戰(zhàn)
在衛(wèi)星圖像分析中應(yīng)用深度學(xué)習(xí)AI的挑戰(zhàn)通常很難解決。
與人臉、地點(diǎn)或者物體識(shí)別相比,衛(wèi)星圖像對(duì)深度學(xué)習(xí)算法提出了更大的挑戰(zhàn)。因?yàn)樾l(wèi)星圖像會(huì)從多個(gè)角度進(jìn)行拍攝,同一地點(diǎn)的建筑物可能在照片上是顛倒的,另外同一地點(diǎn)的不同時(shí)間里云層的變化也很不一樣。
另一個(gè)主要問題是相對(duì)缺乏大型訓(xùn)練數(shù)據(jù)集,包括用于訓(xùn)練深度學(xué)習(xí)算法的手工標(biāo)記的示例,需要用它來準(zhǔn)確識(shí)別衛(wèi)星圖像的特征。
對(duì)此,Davis團(tuán)隊(duì)將全球約2200個(gè)地點(diǎn)的公共數(shù)據(jù)與影響解決方案商DigitalGlobe衛(wèi)星圖像結(jié)合在一起,創(chuàng)建自己的訓(xùn)練數(shù)據(jù),然后通過測(cè)試四種深度學(xué)習(xí)模型找到最佳測(cè)試數(shù)據(jù)。
但研究人員手中確認(rèn)的地空導(dǎo)彈基地圖片只有90個(gè)。這樣一個(gè)小型訓(xùn)練數(shù)據(jù)集通常無法產(chǎn)生準(zhǔn)確結(jié)果。為了解決這個(gè)問題,Davis等人將原始圖像稍微改變了方向,把90多個(gè)訓(xùn)練樣本轉(zhuǎn)換成大約893000個(gè)訓(xùn)練樣本。
這項(xiàng)研究中的成績(jī)很可能得益于導(dǎo)彈發(fā)射基地占地很大,在衛(wèi)星圖像上看也有獨(dú)特的圖案。
兩類常見的原型/對(duì)稱地空導(dǎo)彈發(fā)射場(chǎng)
挑戰(zhàn)接踵而至。
衛(wèi)星圖像之間的分辨率也差異很大。這讓問題進(jìn)一步變得復(fù)雜,想要深度學(xué)習(xí)算法效果最好,通常需要給定相同大小的圖片。另外,除了可見光圖像之外,不少衛(wèi)星拍攝的還是紅外或者其他光譜波段的圖像。
在試圖分析諸如移動(dòng)導(dǎo)彈發(fā)射裝置、雷達(dá)天線、移動(dòng)雷達(dá)系統(tǒng)和軍用車輛等較小的物體時(shí),深度學(xué)習(xí)算法面臨著一個(gè)更大的挑戰(zhàn),因?yàn)榭捎玫男l(wèi)星圖像數(shù)據(jù)在提取識(shí)別特征時(shí)像素會(huì)減少。
"在我們的大腦中,CNN如何處理這樣的小尺寸物體是一個(gè)懸而未決的問題,尤其是在大型數(shù)據(jù)集的測(cè)試中,就像我們?cè)谶@次研究中所做的那樣。"Davis說。
未來
種種的不完善,讓深度學(xué)習(xí)面臨巨大障礙。即使算法能夠達(dá)到80%或90%的精度,專家仍然認(rèn)為AI不具備接管整個(gè)工作的能力。
今年7月以來,各路高手紛紛開始在全球最大的衛(wèi)星圖像公開數(shù)據(jù)集上訓(xùn)練機(jī)器學(xué)習(xí)算法。這個(gè)數(shù)據(jù)集包含100萬個(gè)帶標(biāo)簽的對(duì)象,包括不同的建筑和設(shè)施。
這個(gè)數(shù)據(jù)集的提供者,是美國情報(bào)高級(jí)研究計(jì)劃局(IARPA)。他們贊助舉辦的這次大賽,就是想找到一個(gè)更好的AI解決方案,分擔(dān)人類分析員75%的工作。
共有10個(gè)團(tuán)隊(duì)進(jìn)入到這次挑戰(zhàn)的決賽階段,整個(gè)比賽要下個(gè)月結(jié)束。
IARPA的項(xiàng)目經(jīng)理Hakjae Kim說:"美國情報(bào)機(jī)構(gòu)的手里已經(jīng)有了一些方案,但速度和方法總是有提升的余地"。
"現(xiàn)在的技術(shù)狀態(tài),只有人與機(jī)器合作才能真正找到答案",笛卡爾實(shí)驗(yàn)室CTO麥克·沃倫(Mike Warren)說。笛卡爾實(shí)驗(yàn)室已經(jīng)把深度學(xué)習(xí)用于分析商業(yè)衛(wèi)星圖像,對(duì)美國玉米和大豆的收成進(jìn)行預(yù)測(cè)。
即使不完美的AI工具也會(huì)有助于情報(bào)收集工作。
例如,國際原子能組織(IAEA)的任務(wù)是監(jiān)測(cè)所有已申報(bào)的核設(shè)施,并在近200個(gè)國家中尋找未申報(bào)的設(shè)施。
加州的米德爾伯里國際研究所研究員Melissa Hanham表示,深度學(xué)習(xí)工具可以幫助IAEA和其他獨(dú)立組織利用衛(wèi)星圖像監(jiān)測(cè)發(fā)展核勢(shì)力和大規(guī)模殺傷性武器的發(fā)展。
"我們就處于這樣一個(gè)世界,"Hanham說,"我期待自動(dòng)化將工作中乏味而多余的部分取代。"
{{item.content}}