“圖靈機(jī)器人”發(fā)布,強(qiáng)調(diào)人工智能
經(jīng)過為期半年多的內(nèi)測,11月7日下午,3sNews曾經(jīng)采訪的蟲洞語音助手團(tuán)隊(duì)召開了產(chǎn)品新聞發(fā)布會(huì),宣布開放他們的最新產(chǎn)品“圖靈機(jī)器人”,從產(chǎn)品名就能看出團(tuán)隊(duì)在向身為“計(jì)算機(jī)科學(xué)之父”和“人工智能之父”的阿蘭·麥席森·圖靈致敬。
在會(huì)上,圖靈機(jī)器人創(chuàng)始人俞志晨表示,他們在開發(fā)運(yùn)營蟲洞語音助手兩年半的時(shí)間中逐漸認(rèn)為,做好語音和語義識(shí)別技術(shù)并不是一個(gè)目的,它是人機(jī)交互的一種方式,而他們最終的目標(biāo)是要把技術(shù)跟更多的軟件和硬件去做融合,在形成整合服務(wù)的基礎(chǔ)上,形成人機(jī)之間的智能交互,并構(gòu)建“人工智能”的入口。
因此圖靈機(jī)器人也不是字面上理解的“機(jī)器人”,而是要將自然語言識(shí)別技術(shù)(包括對語音和語義的識(shí)別)和更多的產(chǎn)品進(jìn)行連接的平臺(tái),其平臺(tái)中為開發(fā)者提供有快速直接的嵌入工具,而平臺(tái)核心的引擎是由團(tuán)隊(duì)基于底層打造的深度問答系統(tǒng)“DeepQA”作為支撐,俞志晨強(qiáng)調(diào)DeepQA是和目前世界上公認(rèn)的人工智能程度最高的問答系統(tǒng)IBM Watson是平行的,而團(tuán)隊(duì)也正朝著Watson的方向努力。
“圖靈機(jī)器人”發(fā)布會(huì)現(xiàn)場,創(chuàng)始人俞志晨作演講
那么,DeepQA現(xiàn)在來看到底能做些什么?聯(lián)合創(chuàng)始人韋克禮同時(shí)也是DeepQA的主要技術(shù)負(fù)責(zé)人在發(fā)言中首先表示,從自然語言識(shí)別到實(shí)現(xiàn)智能化的人機(jī)交互目前看來主要有三個(gè)方面的難點(diǎn)。
其一是中文語言需要通過“切詞”、“斷句”來識(shí)別一句話的含義。這就需要產(chǎn)品要有足夠的智慧來學(xué)習(xí)越來越復(fù)雜的語句。
其二是中文方言的多樣化??谝魡栴}一直以來都是語音識(shí)別的一大挑戰(zhàn)。
其三是在一個(gè)對話情境中人機(jī)之間對話的上下文銜接問題。做到這一點(diǎn)才能讓人覺得“我真正是在跟機(jī)器人交流”,而不是在給機(jī)器下一道命令。
而圖靈機(jī)器人DeepQA的出發(fā)點(diǎn)就是為了解決這些問題。過去以來,普遍用于構(gòu)建機(jī)器智能的方法是:針對每一項(xiàng)識(shí)別的內(nèi)容,都需要把支持某一個(gè)現(xiàn)象的所有數(shù)據(jù)提取出來建立相應(yīng)的規(guī)則和模型;這種做法相對穩(wěn)妥,但人力成本過高,也非常耗時(shí),同時(shí)更讓人感覺人工智能是用人工成本來堆疊的。
而DeepQA主張的是拋開人力成本,實(shí)現(xiàn)“自主學(xué)習(xí)”,即告訴機(jī)器一個(gè)現(xiàn)象,讓機(jī)器自己來挖掘現(xiàn)象背后的關(guān)聯(lián)數(shù)據(jù)作為“證據(jù)”,自建規(guī)則和模型,這種方法其本質(zhì)還是“語義歸類”。比如不少南方人在表達(dá)“我想喝牛奶”時(shí),因?yàn)榭谝舻年P(guān)系經(jīng)常會(huì)說成“我想喝‘劉’奶”,這時(shí)候DeepQA就得分析句子,并結(jié)合上下文語境,通過搜集數(shù)據(jù)來論證這就是“喝牛奶”的意思,從而給出一個(gè)確定的結(jié)論。
韋克禮提到,圖靈機(jī)器人的DeepQA內(nèi)核目前已經(jīng)對2000多萬條有出入的表達(dá)方式進(jìn)行糾錯(cuò)和識(shí)別,從整體上看這種自主學(xué)習(xí)能有效提升整體的語言識(shí)別能力。這也意味著,圖靈機(jī)器人幕后將更依托于強(qiáng)大的計(jì)算資源、海量的詞句來強(qiáng)化人工智能。截至發(fā)布會(huì)召開,DeepQA云端數(shù)據(jù)庫已經(jīng)儲(chǔ)備了約75億條規(guī)模的語料庫和約15億條的知識(shí)庫。
隨著圖靈機(jī)器人的開放,對于開發(fā)者來說,他們可以將DeepQA接入到自己的PC端軟件、智能硬件、App或微信服務(wù)號(hào)中,獲得內(nèi)核的各種能力。此外,DeepQA也允許開發(fā)者在圖靈機(jī)器人平臺(tái)上構(gòu)建類似私有云一樣的自有知識(shí)庫,為開發(fā)者能在所在垂直領(lǐng)域更加有針對性地編輯獨(dú)有的知識(shí)和信息庫,以更好地服務(wù)用戶。
目前,基于語音和語義識(shí)別,圖靈機(jī)器人的API開發(fā)者用戶已經(jīng)達(dá)到1.5萬,覆蓋從智能硬件到軟件的各種產(chǎn)品,累計(jì)調(diào)用請求達(dá)到67億次,另外團(tuán)隊(duì)也擁有了穩(wěn)定的大客戶群,為中國電信、海爾、HTC等品牌,在人機(jī)交互領(lǐng)域提供關(guān)鍵的支持。一方面,自然語言識(shí)別技術(shù)的入口價(jià)值逐步顯山露水,另一方面,這種趨勢也給智能化的人機(jī)交互提供了契機(jī)。
語言識(shí)別推動(dòng)人工智能進(jìn)入培育期
所以,更重要的是圖靈機(jī)器人在多領(lǐng)域的快速普及和滲透能讓DeepQA快速學(xué)習(xí)并變得更加聰明,其終極目標(biāo)一定是合眾行業(yè)領(lǐng)域之力培育出接近終極的人工智能。“機(jī)器人的本質(zhì)是取代人類重復(fù)、機(jī)械、繁瑣性的勞動(dòng),未來會(huì)有越來越多的體力和腦力勞動(dòng)將被機(jī)器人取代。”俞志晨在演講中強(qiáng)調(diào)了他的這一觀點(diǎn)。
實(shí)際上,IBM的Watson已經(jīng)做到了一些比較理想的成果。如今的Watson已經(jīng)在客戶服務(wù)領(lǐng)域、金融行業(yè)和醫(yī)療行業(yè)取得了階段性的突破,例如在醫(yī)療領(lǐng)域?qū)⒒蚪M數(shù)據(jù)、醫(yī)療數(shù)據(jù)、臨床學(xué)知識(shí)和Watson系統(tǒng)結(jié)合,來幫助醫(yī)生針對腫瘤、癌癥病患出具治療方案等。此時(shí)的Watson不僅僅是一個(gè)簡單的人機(jī)聊天平臺(tái),更依托背后的數(shù)據(jù)分析能力來實(shí)現(xiàn)更嚴(yán)肅的互動(dòng)和交流。而這一切的基礎(chǔ),還是源自對語言的理解和不斷的機(jī)器學(xué)習(xí)來媲美人類大腦。
除了圖靈機(jī)器人和IBM的Watson,市場中的其他語音和語義識(shí)別技術(shù)團(tuán)隊(duì)也正通過各自的角度切入到對人工智能的探索和培育。
像微軟的“小冰”和“小娜”,前者從情感角度出發(fā)通過鼓勵(lì)人機(jī)交流培養(yǎng)機(jī)器的“情商”,后者則通過實(shí)實(shí)在在幫助用戶處理工作和生活中的流程,讓自身更有“智商”。蘋果公司的Siri從誕生之初就是人工智能計(jì)劃的一部分,雖然還沒有開放,但基于全球市場龐大的用戶基數(shù),苦練內(nèi)功Siri也有相當(dāng)?shù)墓Φ?。相對而言,谷歌公司的Google Now依托搜索、海量數(shù)據(jù)和開放的核心戰(zhàn)略,也讓這款產(chǎn)品成為人工智能強(qiáng)有力的入口。在國內(nèi),既有像科大訊飛這樣有著約15年歷史的老牌語言識(shí)別技術(shù)提供商選擇了轉(zhuǎn)型開放來推動(dòng)服務(wù)的智能化,也有在百度大腦計(jì)劃之下,百度公司通過語言識(shí)別、圖像識(shí)別等技術(shù)來構(gòu)建機(jī)器的“思維”能力。
對人工智能的研究的歷史已經(jīng)超過了半個(gè)世紀(jì),可以明確的是,在當(dāng)前階段互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的氛圍創(chuàng)造了對人工智能更好的試驗(yàn)場。而要想真正基于自然語言識(shí)別的能力創(chuàng)造入口價(jià)值,就一定離不開廣泛用戶的參與,以及從海量數(shù)據(jù)的分析挖掘中的自主學(xué)習(xí),另外則是從縱向?qū)Υ怪鳖I(lǐng)域的做精做深到橫向的多領(lǐng)域拓展。
客觀來看,各家產(chǎn)品距離真正的“人工智能”還差得很遠(yuǎn),但對很多產(chǎn)品來說,比如像圖靈機(jī)器人今天能做到開放,并且在一個(gè)相對初級的階段里,與合作伙伴共同完成了一個(gè)個(gè)人機(jī)交互的案例,其實(shí)已經(jīng)朝著人工智能這個(gè)方向邁了一大步。而到底我們何時(shí)才能迎來人工智能從量變到質(zhì)變,最權(quán)威的專家也不會(huì)給出一個(gè)明確的答案。
這正像俞志晨在圖靈機(jī)器人發(fā)布會(huì)的個(gè)人演講中有意向媒體和觀眾傳遞的一種心情:忐忑。在決定召開發(fā)布會(huì)后,團(tuán)隊(duì)上下都感受到了轉(zhuǎn)型為平臺(tái)級技術(shù)提供者的巨大壓力,因?yàn)樽鋈斯ぶ悄艿臅r(shí)間鏈很長,其中還要和包括IT巨頭在內(nèi)的諸多競品直接較量。圖靈機(jī)器人團(tuán)隊(duì)現(xiàn)在能做的,就是盡可能從團(tuán)隊(duì)自身出發(fā),努力去完善核心引擎DeepQA的能力以及其他產(chǎn)品體驗(yàn)上的各種細(xì)節(jié),以應(yīng)對新時(shí)代下人工智能培育期所遇到的各種挑戰(zhàn)。(文|陳啟臨)
{{item.content}}