3sNews訊 為期兩天的2012地理信息開發(fā)者大會(huì)(簡(jiǎn)稱:WGDC)在北京國家會(huì)議中心舉行,本次大會(huì)以“新技術(shù)、新模式、新商業(yè)”為主題,是地理信息領(lǐng)域最具影響力的技術(shù)性盛會(huì),其宗旨是不斷引領(lǐng)和促進(jìn)地理信息技術(shù)的創(chuàng)新與變革。在第二天的“Telematics與車載智能終端”分會(huì)場(chǎng),科大訊飛平臺(tái)及嵌入式事業(yè)部車載及智能電視業(yè)務(wù)總監(jiān)劉俊峰發(fā)表了題為《自由交互 語音隨行——擢升地理信息應(yīng)用交互體驗(yàn)》的演講。
以下為文字實(shí)錄:
大家好!我們希望語音作為一個(gè)交互工具能夠?yàn)榈乩硇畔硇碌慕换シ绞?。語音和地理信息都是比較火的行業(yè)方向。我們關(guān)注的是什么地方,在什么地方、人做了什么事情。從地理信息角度來講,我們關(guān)注的是不是在合適的時(shí)間、合適的地點(diǎn),辦了合適的事情,我們關(guān)注的是什么時(shí)間、什么地點(diǎn)人辦了什么事,說了什么話。所以今天基于車聯(lián)網(wǎng)這個(gè)空間,人和人怎么有一個(gè)更好的交互體驗(yàn)?我們也希望通過我們的努力能夠?yàn)榈乩硇畔⒄麄€(gè)平臺(tái)帶來一些新的交互應(yīng)用。我們認(rèn)為在這樣的一個(gè)時(shí)代里,語音已經(jīng)真的掉我們身邊來了,各種各樣的信息設(shè)備都具備能聽會(huì)說的功能,比如手機(jī)、PAD、電視、車,語音合成能夠達(dá)到90%以上的合成正確率,語音識(shí)別也能夠達(dá)到真正的準(zhǔn)確狀態(tài)。在各種移動(dòng)終端無線網(wǎng)絡(luò)以及云計(jì)算平臺(tái)逐漸成熟的條件下,為更好、更優(yōu)秀的語音系統(tǒng)之上平臺(tái)提供了支撐的條件。從訊飛角度來看更感覺到這樣的時(shí)代到來,2012年我們發(fā)布了語音云,當(dāng)時(shí)是為了能夠像提供用電一樣提供語音服務(wù)。第二次發(fā)布會(huì)就是今年在這里,我們發(fā)布了以生活為主的新一代語音產(chǎn)品。當(dāng)場(chǎng)到場(chǎng)開發(fā)人員達(dá)到了2200人。從發(fā)布語音云到現(xiàn)在,目前已經(jīng)積累了4800萬語音用戶,每天語音服務(wù)訪問量達(dá)到290萬次,現(xiàn)在第三方應(yīng)用超過了4000個(gè)。
大家可以看到在地圖導(dǎo)航這類,以及生活服務(wù)這一類,有非常多非常好的應(yīng)用,地圖導(dǎo)航目前主流的導(dǎo)航軟件都在用訊飛的語音進(jìn)行POI搜索,這樣的客戶積累已經(jīng)超過了1200萬。在這兒也是希望能把我們兩個(gè)開放性的平臺(tái)拿出來跟大家分享。其實(shí)它不能說完全開放,是在一定范圍的開放。第一個(gè)平臺(tái)就是我們的語音開發(fā)平臺(tái)。第二個(gè)平臺(tái)是應(yīng)用,叫訊飛語點(diǎn)。訊飛在嵌入式、移動(dòng)互聯(lián)網(wǎng)和呼叫中心里都能夠提供完整的合成、識(shí)別以及搜索的技術(shù)。我們移動(dòng)互聯(lián)網(wǎng)這塊的能力以語音云為核心,呼叫中心這塊業(yè)務(wù)是我們長(zhǎng)期在IVR領(lǐng)域形成的系統(tǒng),這樣的系統(tǒng)可以支持本地POI轉(zhuǎn)型和本地語音輸入。今天我們重點(diǎn)拿移動(dòng)互聯(lián)網(wǎng)語音搜索來講,首先看各項(xiàng)核心技術(shù)在語音合成方面不斷的中英文的合成技術(shù)提高的同時(shí),我們已經(jīng)在多語種的語音里面進(jìn)行了嘗試性的進(jìn)展
語音識(shí)別方面,首先在語音云規(guī)模應(yīng)用基礎(chǔ)上,我們核心效果是持續(xù)優(yōu)化。針對(duì)抗噪、口音、個(gè)性化詞匯這樣的一些應(yīng)用難題全部突破。這是我們?cè)诙绦?、微博、?dǎo)航戶外搜索、數(shù)值、數(shù)字方面的識(shí)別表現(xiàn),基本上已經(jīng)完全滿足個(gè)性化的要求。在離線也就是我們所講的嵌入式語音識(shí)別方面我們可以能夠?qū)崿F(xiàn)在嵌入式系統(tǒng)中,在安卓、iOS這樣的狀態(tài)下實(shí)現(xiàn)以往狀態(tài)的語音識(shí)別。我們針對(duì)車載環(huán)境,在識(shí)別效果上進(jìn)行了長(zhǎng)時(shí)間的突破在準(zhǔn)確性和抗噪性上有很大的突破。
我們是基于識(shí)別和合成的算法,根據(jù)語言學(xué)和語音學(xué)的結(jié)合,能夠研發(fā)出一個(gè)自然的語音交互系統(tǒng),這樣的一套系統(tǒng)對(duì)接語音系統(tǒng),它的引擎和原來是不一樣的。我們可以就這樣的一個(gè)分發(fā)體系把一句用戶的話語分解成不同緯度的參數(shù)。比如用戶問道了一個(gè)查詢航班的信息,我們用一個(gè)輸出可以輸出一連串的語音網(wǎng)絡(luò)和關(guān)健詞,即使是短寫錯(cuò)誤,我們前面就可以把語義讀完。
我們也可以提供其他的核心技術(shù),這些核心技術(shù)有核心引擎和語音應(yīng)用。
談到第二個(gè)平臺(tái)是訊飛雨點(diǎn),我們?nèi)ツ?1月份發(fā)布了汽車語點(diǎn),今年3月份發(fā)布了電信語點(diǎn)。與此同時(shí),我們把語言通信這樣的一個(gè)用戶身份的屬性的承載物分成三個(gè)平臺(tái),在這個(gè)之上用戶可以用一個(gè)語音號(hào)碼進(jìn)行穿行。
訓(xùn)4訊飛手機(jī)語點(diǎn)目前具備20個(gè)功能,大家可以在安卓平臺(tái)上下載使用。這是我們的汽車語點(diǎn),是與汽車系統(tǒng)深度結(jié)合的車載應(yīng)用。我們的目標(biāo)是讓它在行車的環(huán)境之下,讓人能夠感覺到用便利的信息使人獲得更高的娛樂性。
汽車雨點(diǎn)系統(tǒng),無論是天氣、路況、加油站、停車場(chǎng),都可以一語到位,直接搜索。第二個(gè)是自然的語音交互界面,我們可以拋棄掉原來數(shù)字的交互式的方式,讓我們和機(jī)器用自然的語音交互。
第三個(gè)就是云加端的架構(gòu),云加端指的是如果網(wǎng)絡(luò)好的時(shí)候,用戶可以用語音引擎,如果網(wǎng)絡(luò)部好我們有本地引擎,仍然可以幫助用戶用自然的方式跟系統(tǒng)對(duì)話。這就是ONE SHOT,用戶在輸入一句話的時(shí)候,這句話里可能隱藏著很多關(guān)鍵信息,可能包括導(dǎo)航、打電話,不用人和車載進(jìn)行原始的命令詞的遞進(jìn)式,它相盒子,我們打開一個(gè)盒子里面有一個(gè)小盒子,打開最后一個(gè)小盒子才發(fā)現(xiàn)這個(gè)東西,我們把所有的東西放到一個(gè)平臺(tái)之上,用戶只要說一句話就能把他想要的東西獲取出來,我們叫ONE SHOT。這種方式也是我們從用戶體驗(yàn)角度出發(fā)拋棄掉了原來所謂的GOI和VOI的深度結(jié)合。用戶是在這個(gè)界面里產(chǎn)生內(nèi)容,我們把所有的VOI和GOI切開,用戶想說什么直接對(duì)它講,然后調(diào)出相應(yīng)的應(yīng)用應(yīng)答用戶下一步的操作。
訊飛機(jī)五語點(diǎn)宣傳效果界面目前這的系統(tǒng)已經(jīng)可以在后端的車體廠商里使用了。車載方向我們正在跟地圖廠商聯(lián)手,目前已經(jīng)有1200萬的用戶。去年7月份我們跟上汽聯(lián)合發(fā)布,重新定義了車載語音應(yīng)用很航標(biāo),今年我們會(huì)跟幾個(gè)領(lǐng)軍汽車企業(yè)合作,推出后端的車載產(chǎn)品。
第三個(gè)語點(diǎn)產(chǎn)品是電視語點(diǎn)。這個(gè)產(chǎn)品是針對(duì)電視的語言交互體驗(yàn)環(huán)境去量身打造的。是由一個(gè)語音交互系統(tǒng)和語音搖控器構(gòu)成。這是長(zhǎng)虹發(fā)布的一個(gè)帶有語音交互系統(tǒng)平臺(tái)的智能電視,這個(gè)系統(tǒng)中打造了虛擬化形象,核心功能上完全跟語點(diǎn)同步。這是海信,它采用了語音的核心技術(shù),并且配備了一個(gè)非常槍彈的搖控器。第二個(gè)是創(chuàng)維、還有康佳。
目前在電視這個(gè)行業(yè)我們已經(jīng)和國內(nèi)所有主流的廠商建立了合作關(guān)系,最后說一下科大訊飛,我們是中文語音產(chǎn)業(yè)里唯一的國家863計(jì)劃成果產(chǎn)業(yè)化基地,國家規(guī)劃布局內(nèi)重點(diǎn)軟件企業(yè)和唯一的語音上市公司。我們也是國家科技技術(shù)獎(jiǎng)和科技信息重大發(fā)明獎(jiǎng)的單位。去年9月份由國家發(fā)改委頒發(fā)語音及信息處理工程實(shí)驗(yàn)室,另外也獲得多次國內(nèi)外獎(jiǎng)項(xiàng)。對(duì)于我們來講,我們更希望可以做到的核心技術(shù)和體驗(yàn)?zāi)軌虬殡S大家在地理信息應(yīng)用開發(fā)方面及車聯(lián)網(wǎng)的應(yīng)用開發(fā)方面能夠打造更好的消費(fèi)體驗(yàn)。謝謝大家!
(以上內(nèi)容根據(jù)速記整理,未經(jīng)本人審核)
{{item.content}}