6月14日,第六屆WGDC大會(huì)在北京國(guó)家會(huì)議中心隆重開(kāi)幕。大會(huì)由空間信息產(chǎn)業(yè)創(chuàng)新創(chuàng)業(yè)服務(wù)平臺(tái)泰伯主辦,秉承不斷引領(lǐng)和促進(jìn)空間信息技術(shù)創(chuàng)新與變革的宗旨,WGDC已走過(guò)五個(gè)年頭,如今已成為全球最具前瞻性的跨界創(chuàng)新風(fēng)向標(biāo)。
在本屆大會(huì)的衛(wèi)星+大數(shù)據(jù)峰會(huì)上,商湯科技高級(jí)研究員、香港中文大學(xué)計(jì)算機(jī)視覺(jué)博士石建萍做了主題演講,以下為演講實(shí)錄。(內(nèi)容未經(jīng)本人審核):
大家好,我們?cè)谧龅氖虑橹饕侨斯ぶ悄芎蛨D像識(shí)別相關(guān)的技術(shù),遙感的圖像對(duì)于我們來(lái)說(shuō)也是一種特殊的形式,在之前有很多的積累可以運(yùn)用到這個(gè)過(guò)程。首先介紹一下人工智能在近期突破性的進(jìn)展。
據(jù)我們所知,美國(guó)的科技浪潮、科技巨大的突破會(huì)對(duì)各個(gè)行業(yè)有非常大的變革,比如說(shuō)從90年代開(kāi)始,信息互聯(lián)網(wǎng),包括人工智能的方向,催生了非常多非常厲害的科技巨頭。最近我們發(fā)現(xiàn)Google、facebook估值非常高而且非常有活力的公司,他們技術(shù)核心的壁壘是在人工智能上,人工智能也會(huì)在最近的一段時(shí)間帶來(lái)新一波產(chǎn)業(yè)的升級(jí)。
深度學(xué)習(xí)在人工智能的領(lǐng)域內(nèi)有非常大的突破,有了深度學(xué)習(xí)這樣一個(gè)技術(shù),在一些識(shí)別的領(lǐng)域,語(yǔ)音識(shí)別、AlphaGo,它背后的技術(shù)突破都是來(lái)自于深度學(xué)習(xí),深度學(xué)習(xí)相當(dāng)于提供了平臺(tái)化的解決方案,可以適應(yīng)不同的行業(yè)、不同的數(shù)據(jù)類(lèi)型上,整體的提升整個(gè)智能判別、智能理解技術(shù)的突破。包括了解到深度學(xué)習(xí)作為AI的核心技術(shù),目前已經(jīng)匯集到不同行業(yè)中,包括無(wú)人機(jī)、醫(yī)療、安防或者是遙感行業(yè)中,或多或少都看到了人工智能在其中起到的作用。
近些年來(lái)也有非常多的科技公司在這方面有非常多的努力和戰(zhàn)略布局,包括像Google、facebook都收購(gòu)了非常多深度學(xué)習(xí)方面的專(zhuān)家團(tuán)隊(duì)。我們公司依托于香港中文大學(xué)的多媒體實(shí)驗(yàn)室成立了這家公司,公司在相關(guān)的技術(shù)行業(yè)上,包括人臉識(shí)別、圖象識(shí)別和圖像理解上都做了非常多的成就。
我們團(tuán)隊(duì)是第一個(gè)用深度學(xué)習(xí)在人臉識(shí)別上,把人臉識(shí)別的精度超過(guò)了人識(shí)別的精度,包括在圖像識(shí)別的奧林匹克競(jìng)賽得了多項(xiàng)的冠軍。公司的介紹,我們以人工智能為核心的引擎,建立下一代基于深度學(xué)習(xí)AI的領(lǐng)軍企業(yè),我們也是目前國(guó)內(nèi)AI企業(yè)中規(guī)模最大,包括行業(yè)布局最多,我們整個(gè)的深度學(xué)習(xí)的核心平臺(tái),會(huì)主持非常多基于深度學(xué)習(xí)的算法,包括人臉識(shí)別、視頻監(jiān)控、圖象識(shí)別、文字識(shí)別等等。在這些核心技術(shù)之后,我們可以使非常多的行業(yè)客戶(hù)受益,像平安城市、智慧醫(yī)療、遙感、無(wú)人駕駛機(jī)器人等等不同行業(yè)都可以使用。
眾所周知,對(duì)于深度學(xué)習(xí)來(lái)說(shuō),這一波深度學(xué)習(xí)非常厲害,產(chǎn)生了非常大的價(jià)值,主要有三大核心的要素,需要有大量的數(shù)據(jù)、海量標(biāo)注的數(shù)據(jù),其次有大規(guī)模高性能計(jì)算的引擎,有非常強(qiáng)大的深度學(xué)習(xí)算法,這三個(gè)要素疊加在一起,就是我們目前深度學(xué)習(xí)能夠遠(yuǎn)遠(yuǎn)突破傳統(tǒng)的算法,達(dá)到了與傳統(tǒng)算法無(wú)法企及的核心要素。首先團(tuán)隊(duì)在這方面一直都是遙遙領(lǐng)先的,從最初深度學(xué)習(xí)被大家接受開(kāi)始,我們團(tuán)隊(duì)發(fā)表了在國(guó)際頂級(jí)的期刊上發(fā)表了深度學(xué)習(xí)相關(guān)的論文,也在非常多專(zhuān)業(yè)的數(shù)據(jù)庫(kù)和國(guó)際最高水平的競(jìng)賽中獲得了非常好的名詞,同時(shí)參加比賽的也有Google、facebook人工智能的大公司,我們也在深度學(xué)習(xí)的平臺(tái)上有非常多的積累。目前我們的超計(jì)算能力來(lái)自于超過(guò)2600塊的GPU的平臺(tái),也是國(guó)內(nèi)創(chuàng)業(yè)公司中最大規(guī)模在平臺(tái)計(jì)算能力上的積累。我們和Mellan建立了戰(zhàn)略的合作關(guān)系,我們是去年機(jī)器C大會(huì)頒布的十佳戰(zhàn)略合作伙伴之一。
在數(shù)據(jù)方面我們公司有非常大的人工標(biāo)注團(tuán)隊(duì),有超過(guò)300人的標(biāo)注員在為我們服務(wù),主要涉及的圖片理解,包括圖片、人臉、證件照、資料等等各種各樣的信息,累計(jì)的工作時(shí)間超過(guò)了80萬(wàn)個(gè)小時(shí),耗時(shí)也在一年半左右的時(shí)間。在這個(gè)過(guò)程我們子一積累了非常多標(biāo)注的數(shù)據(jù),數(shù)據(jù)就會(huì)成為將來(lái)行業(yè)的壁壘,同時(shí)也公布了其中的一部分?jǐn)?shù)據(jù)供研究和探索。
目前我們商湯科技AI的引擎已經(jīng)被廣泛應(yīng)用于非常多的行業(yè)中,超過(guò)300多家的大型客戶(hù)和合作伙伴,包括像中國(guó)移動(dòng)、其它的手機(jī)廠商、華為、小米、oppo等等,金融的廠商。
下面主要介紹目前已經(jīng)成功的案例和正在探索的遙感方向,目前最成功的一個(gè)方向應(yīng)該是在安防方向,做了非常多和地市的公安局建立的天網(wǎng)系統(tǒng),是一個(gè)人臉識(shí)別的系統(tǒng),在各個(gè)卡口或者是只能關(guān)卡,自動(dòng)和白名單或者黑名單庫(kù)里面的做比對(duì),這套系統(tǒng)已經(jīng)成功幫警察局抓住幾十名到上百名的嫌疑犯。這個(gè)事情也是我們和攝像頭廠商一起聯(lián)合打造的監(jiān)控平臺(tái),我們首先可以在一個(gè)地方定位,這邊可能有嫌疑人,之后超聲聯(lián)合機(jī)可以把分辨率提升,看到更近距離的人臉,并進(jìn)行相對(duì)應(yīng)的識(shí)別。這個(gè)系統(tǒng)是結(jié)構(gòu)化的系統(tǒng),目前能夠在監(jiān)控行業(yè)有非常多海量的視頻,真正得到其中一些信息的話(huà)是需要視頻中有非常多的警察,有非常多的人力看這個(gè)視頻才能拿到想要的信息,這個(gè)系統(tǒng)就可以實(shí)時(shí)的把當(dāng)前視頻里面的各個(gè)要素,以及要素的特征提取出來(lái),之后再去做檢索,就可以基于視頻提取出來(lái)的信息,而不需要看海量的原始視頻。
同時(shí)也在金融、互聯(lián)網(wǎng)身份驗(yàn)證方面有非常多的積累,戰(zhàn)略伙伴中國(guó)移動(dòng),幫助中國(guó)移動(dòng)的在線(xiàn)平臺(tái)實(shí)現(xiàn)它的身份驗(yàn)證,幫助了上億中國(guó)人做在線(xiàn)身份證識(shí)別,只需要拿著手機(jī)自拍一張,同時(shí)上傳身份證照片,就可以比對(duì)出是不是本人,就可以在線(xiàn)做一些其它的操作業(yè)務(wù),而不需要到銀行柜臺(tái)去做身份驗(yàn)證。
遙感方向我們也在努力挖掘下一個(gè)引爆的方向,在遙感方向,遙感數(shù)據(jù)是一種特殊的圖像數(shù)據(jù),我們?cè)趫D像領(lǐng)域多年的積累和算法,是可以幫助到遙感圖像的識(shí)別理解,遙感這個(gè)行業(yè)大部分?jǐn)?shù)據(jù)來(lái)源都是遙感影像,最終關(guān)心的是影像中的信息,而不是影像本身。利用人工智能的方法可以做快速影像要素的提取,可以幫助整個(gè)行業(yè)提升生產(chǎn)效率。
下面是我們目前做的一些案例,目前這些案例應(yīng)該都是有產(chǎn)品化的結(jié)果,這個(gè)是道路中心線(xiàn)的產(chǎn)品,是資源三號(hào)的衛(wèi)星,大概是27米,北京郊區(qū)的圖像,在GPU上可以以?xún)?yōu)于四秒的速度處理一張圖像,同時(shí)得到道路的中心線(xiàn)和角度,這個(gè)可以直接介入到后期系統(tǒng)中去。后面還有其它的案例,同一個(gè)模型無(wú)論是在北京這樣一些中心化的城區(qū),還是在西藏這樣非常邊遠(yuǎn)而且地形地貌非常不一樣的地區(qū),也可以做很好的提取,速度也非常快,基于深度學(xué)習(xí)和大數(shù)據(jù)的方案,可以比較快速和通用的積累能力,不需要在不同的位置,或者不同的地理地貌去定制化不同的方案,而是只需要去積累大量的數(shù)據(jù),之后這些數(shù)據(jù)都能夠?yàn)槲覀兯?,能夠得到有效的信息提取。這個(gè)是在高分2號(hào)的衛(wèi)星上做石家莊郊區(qū)的方案,利用道路分割的解決方案,可以快速的做道路的變化發(fā)現(xiàn)應(yīng)用。
軍事目標(biāo)識(shí)別,利用現(xiàn)在深度學(xué)習(xí)的方法也跟傳統(tǒng)的方法有非常大的提升,召回率和檢測(cè)率都在96%以上,這個(gè)是香港機(jī)場(chǎng)的圖像,可以處理非常多其它類(lèi)型的不同衛(wèi)星影像拍攝的圖片,我們也可以得到非常好的結(jié)果,同時(shí)對(duì)于其中的一些拍攝質(zhì)量不好或者非常小的飛機(jī)也可以得到很好檢測(cè)。這一塊之前積累了非常多的人臉?lè)矫娴臋z測(cè)方法,都可以在這邊用到。
這邊是一個(gè)衛(wèi)星艦船檢測(cè)的案例,在那邊的海域上有非常多好的艦船,也可以很好的識(shí)別,同時(shí)在得到這樣的檢測(cè)之后,還可以得到飛機(jī)和鍵盤(pán)關(guān)鍵點(diǎn)的結(jié)果,有了這樣關(guān)鍵點(diǎn)的結(jié)果,就可以很好的得到尺寸和它的一些型號(hào)的信息。
另外一個(gè)案例,變化檢測(cè)的案例,是遙感方面非常重要的內(nèi)容,林業(yè)方面的數(shù)據(jù),我們可以得到兩個(gè)不同的影像,在其中發(fā)現(xiàn)到了一些變化的區(qū)域,可以快速的把變化區(qū)域自動(dòng)提取出來(lái),不需要人工看大量的圖,再去一一進(jìn)行比對(duì)了。實(shí)踐中我們發(fā)現(xiàn)對(duì)于之前拿到的人工標(biāo)注的結(jié)果來(lái)看,算法的結(jié)果優(yōu)于人工標(biāo)注的結(jié)果,因?yàn)槿斯?biāo)注的結(jié)果也經(jīng)常會(huì)漏掉一些。這邊是另外一個(gè)案例,這是一些變化區(qū)域。同時(shí)我們的深度學(xué)習(xí)算法也可以去做自動(dòng)的土地利用類(lèi)型分類(lèi),這是北京的一個(gè)分類(lèi)結(jié)果,這個(gè)算法也是我們積累了非常多,有非常好的效率和精度,可以同時(shí)非常多不同的類(lèi)別,在結(jié)果上進(jìn)一步做變化發(fā)現(xiàn)。這是北京城區(qū)的一塊地,可以很清晰的提取出建筑物的輪廓和道路,還有其它的應(yīng)用,包括一些林地等等。
同時(shí)我們也可以做非常多,當(dāng)我們把想要提取的要素做重新的定義,比如說(shuō)這邊是云、雪檢測(cè)的案例,在高分1號(hào)的數(shù)據(jù)上,可以非??焖俚姆直娉?,是否有云或者是否有雪的區(qū)域,對(duì)雨雪做非常好的區(qū)分,方便我們做篩選工作,同時(shí)可以有效的發(fā)現(xiàn),讓云的檢測(cè)不會(huì)受到雪的干擾。同時(shí)我們也做了水體提取的案例,可以快速有效的發(fā)現(xiàn)所有的水體區(qū)域。
這是另外一個(gè)案例,也是在高分一號(hào)衛(wèi)星上做的,我們公司成立兩年多,也是一個(gè)新的企業(yè),我們其實(shí)已經(jīng)得到了非常多的關(guān)注,包括有非常多的政府資源,政府的領(lǐng)導(dǎo)都曾經(jīng)參觀過(guò)我們公司,對(duì)我們也表示了非常大的興趣,包括在G20和之前的展會(huì)上都有非常多的領(lǐng)導(dǎo)人光顧過(guò)我們的展臺(tái)。
人工智能這個(gè)方向也是這個(gè)世界范圍內(nèi),各個(gè)重要的政府和主流公司都非常關(guān)注的方向,大家其實(shí)都已經(jīng)認(rèn)為,中國(guó)在人工智能的浪潮中,我們積累技術(shù)研究的水平,不比國(guó)外的公司差,而且我們發(fā)表了非常多的文章,在這一塊的技術(shù)積累非常領(lǐng)先和前沿的。另外一個(gè)優(yōu)勢(shì),在中國(guó)我們有非常大量的數(shù)據(jù),這些數(shù)據(jù)源深度學(xué)習(xí),或者是未來(lái)信息來(lái)源的重要方向,人工智能在產(chǎn)生技術(shù)突破的時(shí)間中,中國(guó)公司非常有機(jī)會(huì)在這個(gè)時(shí)間點(diǎn)成為一個(gè)世界型的公司。
我們公司也是一個(gè)全球領(lǐng)先深度學(xué)習(xí)平臺(tái)的開(kāi)發(fā)者,通過(guò)我們強(qiáng)大的研發(fā)團(tuán)隊(duì)和算法、在平臺(tái)上的積累,我們希望引領(lǐng)出未來(lái)的人工智能,促成人工智能在不同行業(yè)中的變革。希望成為打造人工智能領(lǐng)軍的企業(yè),謝謝大家!
{{item.content}}