以下為北京佳格天地科技有限公司聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁顧竹以“空間數(shù)據(jù)的深度學(xué)習(xí)與農(nóng)業(yè)應(yīng)用”為演講題目的主題演講內(nèi)容(未經(jīng)本人審核)。
顧竹:謝謝主持人,感謝泰伯網(wǎng)給我們一個(gè)機(jī)會(huì),在這里匯報(bào)一下深度學(xué)習(xí)關(guān)于農(nóng)業(yè)的想法和看法,簡單說一下我個(gè)人,我個(gè)人是做空間大數(shù)據(jù)的,之前也在國內(nèi)做了很多關(guān)于測(cè)繪方面的工作,空間大數(shù)據(jù)對(duì)我來說不陌生。后來我到了美國在美國航空航天局工作,在那邊接觸了更多的空間數(shù)據(jù),以及跟農(nóng)業(yè)的應(yīng)用,更多的用遙感數(shù)據(jù)來做智慧農(nóng)業(yè)或者是農(nóng)業(yè)方面的一些東西。剛才李教授也提到了,李教授高瞻遠(yuǎn)矚,說了整個(gè)中國智慧農(nóng)業(yè)的發(fā)展,他剛剛提到了農(nóng)業(yè)的智慧裝備,我其實(shí)一直在想一個(gè)問題,衛(wèi)星遙感算不算裝備之一?我們現(xiàn)在有非常強(qiáng)大的衛(wèi)星遙感的技術(shù),中國航天發(fā)展非???,處在遙感數(shù)據(jù)的爆炸時(shí)期,如何用遙感來做智慧農(nóng)業(yè)?從小的方面說一下我的看法。
簡單說一下我們公司,我和CEO張弓,利用衛(wèi)星遙感數(shù)據(jù)做一些全球的植被變化和農(nóng)業(yè)數(shù)據(jù)的統(tǒng)計(jì)工作,我做了很多關(guān)于深度學(xué)習(xí)的應(yīng)用,在全球的植被分類上面,王毅剛在美國環(huán)境部,張文鵬在美國研究部做研究員,做了十年的中國市場(chǎng)總監(jiān),對(duì)中國農(nóng)業(yè)的了解非常深入,我們有技術(shù)、市場(chǎng)、應(yīng)用、業(yè)務(wù),希望能把我們的技術(shù)更好的應(yīng)用到農(nóng)業(yè)上。
主題是空間大數(shù)據(jù)和智慧農(nóng)業(yè),說一說現(xiàn)在美國或者是全世界正在發(fā)生的事情,大家之前接觸過一些空間數(shù)據(jù),比如說之前用過很多資源衛(wèi)星數(shù)據(jù),空間分辨率比如說30米、250米,可能有多光譜。這些衛(wèi)星它的運(yùn)行成本非常高,發(fā)一顆衛(wèi)星便宜的50億美元,再發(fā)上去還要50億美元,基本上100億。美國用到現(xiàn)在,現(xiàn)在能用的比較好的衛(wèi)星其實(shí)也就兩三顆、三四顆,它的成本確實(shí)很高時(shí),它的衛(wèi)星有多大?將近430厘米,非常高的衛(wèi)星,這個(gè)衛(wèi)星造價(jià)很高,它的壽命必須非常長,有的衛(wèi)星已經(jīng)服役三十年。這些衛(wèi)星它們的成本很高,獲取的成本也很高,我們必須花很多的人力、物力采集這些數(shù)據(jù)。到現(xiàn)在在硅谷,現(xiàn)在可以做十厘米大的衛(wèi)星,這樣的衛(wèi)星沒有動(dòng)力系統(tǒng),或者說它的動(dòng)力系統(tǒng)非常小,它上去以后也沒有什么太陽能系統(tǒng),飄了三四個(gè)月可能就掛了,沒有人管它,也就是幾百萬美元的事。它是怎么發(fā)射的?它很輕,前兩天印度發(fā)了一個(gè)火箭,火箭帶了好幾十顆衛(wèi)星上面,比如說火箭的承載能力20噸,可能它要帶好幾顆軍用衛(wèi)星或者是國家政策的衛(wèi)星上去,這顆衛(wèi)星可能9.5公斤重。這樣的小衛(wèi)星飄的非常多,可能已經(jīng)有超過100個(gè)的小衛(wèi)星。它們可以對(duì)地進(jìn)行非常持續(xù)的觀測(cè),可以到五米的分辨率,對(duì)農(nóng)業(yè)的觀測(cè)已經(jīng)非常足夠了。
我們總結(jié)了已經(jīng)有超過十個(gè)以上的衛(wèi)星公司,在做微型或者小型衛(wèi)星的發(fā)射,為數(shù)據(jù)獲取提供了非常便利的渠道。像Skybox,這邊全都是衛(wèi)星公司,都在做小衛(wèi)星的業(yè)務(wù),這三個(gè)公司的CEO原來是在我工作的地方出來的,我們也在想為什么他們能做到這樣,或者能做得比較成功,我們?cè)谛l(wèi)星遙感這邊做了很多的模型,我昨天在論壇上也說,我們做了很多的模型,做包括工程類的報(bào)告,最后沒有把它真正的推出應(yīng)用,沒有在商業(yè)領(lǐng)域形成完整的商業(yè)解決方案,在商業(yè)領(lǐng)域沒有人買單。這挺讓人沮喪的,比如說之前做了全球的植被變化,我們做了十年的圖,放出來是非常炫的動(dòng)畫效果,但是也沒有人為這個(gè)買單。這么好的技術(shù)我們有更好的應(yīng)用,首先在農(nóng)業(yè),今天說的另外一個(gè)好玩的,就是拿衛(wèi)星影響去做全球原油儲(chǔ)量,每一個(gè)儲(chǔ)油罐頂都是浮動(dòng)的,不是固定的,因?yàn)樗亓?,如果固定在上面它?huì)壓塌的。全球70%-90%的原油是儲(chǔ)存在儲(chǔ)存罐里的,如果能夠獲取所有儲(chǔ)存罐的量,就可以知道,我們能拿到這樣的數(shù)據(jù)其實(shí)是非常重要的,很多人會(huì)為它買單。怎么做這件事,儲(chǔ)油罐這邊的陰影可以算出來,比如說我知道太陽的角度,衛(wèi)星的角度,可以算出來當(dāng)時(shí)的蓋子有多高,通過上面的陰影就可以算出來儲(chǔ)油罐的高度,儲(chǔ)油罐的面積很好算,一個(gè)圓的面積,很簡單的數(shù)字圖象處理。通過這么簡單的三角函數(shù),當(dāng)時(shí)skybox大概11億美金,谷歌就把它收購了。真正做到那一步還很難,這是遙感給我們的方向,我們能做的東西。
是不是大家都在做,有了這么多衛(wèi)星,是不是真的在做這件事?這邊列的公司現(xiàn)在已經(jīng)開始在應(yīng)用,可以獲得的最新的遙感數(shù)據(jù)、衛(wèi)星數(shù)據(jù)驅(qū)做一些有意思的數(shù)據(jù)。中國的原油儲(chǔ)量已經(jīng)有人在做了,他們已經(jīng)可以做全中國油罐的檢測(cè)了,左邊這個(gè)圖是他們的樣本,告訴他我要檢測(cè)油罐,會(huì)把全中國的油罐在一秒鐘之內(nèi)甚至更快的時(shí)間給到你,可能不那么準(zhǔn),有的也檢測(cè)錯(cuò)了,對(duì)于全國范圍這么大的尺度來說,做到95%以上的精準(zhǔn)率,外國人在幫我們做這件事。
我們能做US Retail Traffic,做零售業(yè)的統(tǒng)計(jì),每個(gè)沃爾馬有自己的攝像頭,可以知道自己每天的車流量,他們通過車流量可以算人流量、客流量,我想知道全國的包括沃爾瑪、家樂福,各種各樣的大超市,他們的車流量和客流量,可以從衛(wèi)星遙感影像上數(shù)門口的汽車,算出他們的總客流量,他們是很有興趣拿到這個(gè)數(shù)據(jù)的。包括我剛才也說到了世界原油的儲(chǔ)量統(tǒng)計(jì),水資源的儲(chǔ)量統(tǒng)計(jì),包括我們做城市的聚集度,可以通過地表建筑物的心態(tài)。包括今天的主題農(nóng)業(yè),利用衛(wèi)星數(shù)據(jù)、遙感技術(shù)的設(shè)計(jì)做農(nóng)業(yè)方面的相關(guān)事情。
這是其它的具體案例,他們通過我們的遙感數(shù)據(jù)反映PMI,對(duì)PMI的指數(shù)比我們要快,比國家統(tǒng)計(jì)局要快一點(diǎn)。他們通過遙感數(shù)據(jù)在播種季的時(shí)候,做到整個(gè)北美玉米產(chǎn)量的估計(jì),這是他們做的全美大豆產(chǎn)量的估計(jì),都是在播種季或者是播種季之前,都是可以做到的。
我在做深度學(xué)習(xí),機(jī)器學(xué)習(xí)這方面的工作,這是我本身的出身。給大家說一下我是怎么做的,包括在農(nóng)業(yè)上是怎么用的,像壽光市是中國最大的蔬菜生產(chǎn)基地,它大棚的數(shù)量和聚集程度在全國都是領(lǐng)先的,它的數(shù)據(jù)很有意思,比如說大棚是有補(bǔ)貼的,可能國家在補(bǔ)貼的時(shí)候需要這樣大棚的數(shù)量數(shù)據(jù),環(huán)保部也很關(guān)心污染,總量的統(tǒng)計(jì)可以幫助他們進(jìn)行總體的統(tǒng)計(jì)安排。衛(wèi)星看到大棚里邊,大概知道大棚的百分比,哪些大棚種的西紅柿,黃瓜,我可以估計(jì)產(chǎn)量,在衛(wèi)星影象上面,一個(gè)下午的時(shí)間把整個(gè)山東省壽光市的大棚全都數(shù)了一遍,總數(shù)大概20多萬個(gè),這個(gè)工作我相信全世界范圍之內(nèi)還沒有人做過,靠人是不可能做到這件事的,靠機(jī)器我們研發(fā)了很長時(shí)間,大棚的地表也不太一樣,這個(gè)技術(shù)公關(guān)我們完成以后,做這件事情的時(shí)候非常難,可復(fù)制性非常高。
這是我們做的用機(jī)器學(xué)習(xí)自動(dòng)的識(shí)別田塊,中國的田塊非常破碎,我這邊挑的是云南一個(gè)地區(qū),梯田的地表情況非常復(fù)雜,跟美國、歐美的不太一樣,美國一望無際全都是平地,它去做地表的遙感分析非常便利。像云貴地區(qū)梯田比較多,地表比較復(fù)雜,我們通過機(jī)器學(xué)習(xí),通過地表每一塊的紋理,包括邊界自動(dòng)的把每一塊地的邊界勾畫出來,形成這個(gè)文件,快速的把所有的地進(jìn)行統(tǒng)計(jì)的工作,這個(gè)也是我們開發(fā)的。
空間大數(shù)據(jù)我說的多一點(diǎn),這個(gè)是做的數(shù)汽車的案例,這個(gè)是美國的六旗游樂場(chǎng)(音),全美不到十個(gè),把所有的汽車數(shù)了一遍,用了好幾個(gè)衛(wèi)星的數(shù)據(jù)。首先找了幾個(gè)樣本,這邊的汽車是可以數(shù)出來的,我們可以把它算作是樣本,我們?cè)诟叻直媛酚跋裆蠑?shù)汽車,這個(gè)效果一般,漏了20%的車,右上角的基本上可以把汽車全都數(shù)上,這個(gè)算法還在調(diào)。這是我們拿到的高持續(xù)影像,每三到四天可以拿一張影像,白色的塊就是汽車,通過圖像融合的方法融合到高分辨率,可以把形態(tài)描繪出來進(jìn)行選擇。這是最后的結(jié)果,從2010年的4月份做到2017年,只要有數(shù)據(jù)我們都會(huì)做。曲線是當(dāng)天的車流量,我們本來想猜車流量跟什么有關(guān),是不是周末多一點(diǎn),或者是節(jié)假日多一點(diǎn),根本就沒有關(guān)系,我們總在想禮拜二是不是大家都忙,結(jié)果周二去的人最多,周五最少。我們把六旗游樂場(chǎng)的骨架弄出來,我們發(fā)現(xiàn)車流量和骨架還很相近。大數(shù)據(jù)并不是我們想的那個(gè)樣子,從各種各樣不同的角度考慮這個(gè)數(shù)據(jù)能帶給你一些不同的感覺,不同的想法和思路,那么對(duì)于數(shù)汽車這件事也一樣,農(nóng)業(yè)也一樣,現(xiàn)在是我們非常好的時(shí)機(jī),我們有更多的數(shù)據(jù)獲取手段,有更多的數(shù)據(jù)源,我們利用什么樣的方法,現(xiàn)在有深度學(xué)習(xí)、云計(jì)算,通過什么樣的方法運(yùn)用到整個(gè)農(nóng)業(yè)生產(chǎn)中去。佳格希望群策群力,如何在這條路上走得更遠(yuǎn),謝謝大家!
{{item.content}}