亚洲熟妇av一区二区三区,亚洲av中文无码乱人伦在线视色,亚洲人成网站色www,亚洲欧美日韩国产综合在线一区 ,亚洲av之男人的天堂网站

分享
Scan me 分享到微信

捷通華聲武衛(wèi)東:語(yǔ)音交互未來(lái)市場(chǎng)廣闊

2012地理信息開(kāi)發(fā)者大會(huì)在北京國(guó)家會(huì)議中心舉辦,北京捷通華聲語(yǔ)音技術(shù)有限公司總經(jīng)理武衛(wèi)東在接受3sNews專訪時(shí)表示,未來(lái)三年五年,語(yǔ)音交互實(shí)際上作為一種非常好的、非常便捷的,跟人的生物特征契合度非常高的交互手段,一定會(huì)有很廣闊的市場(chǎng)。

  3sNews訊 2012地理信息開(kāi)發(fā)者大會(huì)在北京國(guó)家會(huì)議中心舉辦,北京捷通華聲語(yǔ)音技術(shù)有限公司總經(jīng)理武衛(wèi)東在接受3sNews專訪時(shí)表示,未來(lái)三年五年,語(yǔ)音交互實(shí)際上作為一種非常好的、非常便捷的,跟人的生物特征契合度非常高的交互手段,一定會(huì)有很廣闊的市場(chǎng)。



北京捷通華聲語(yǔ)音技術(shù)有限公司總經(jīng)理武衛(wèi)東

  3sNews:捷通華聲的業(yè)務(wù)長(zhǎng)項(xiàng)是什么?

  武衛(wèi)東:捷通華聲創(chuàng)立了12年,其實(shí),捷通軟件在98年就已經(jīng)創(chuàng)建。我們主要進(jìn)行語(yǔ)音識(shí)別技術(shù)、手寫(xiě)識(shí)別技術(shù)的研發(fā)和應(yīng)用。

  從技術(shù)來(lái)講,在2000年,我們?cè)诔闪⒔萃ㄈA聲的時(shí)候,請(qǐng)到了中科院聲研究所的教授,這也是國(guó)內(nèi)做語(yǔ)音的泰斗級(jí)的權(quán)威,到捷通華聲作為我們首席科學(xué)家,開(kāi)始創(chuàng)建為我們語(yǔ)音識(shí)別這塊搭建整個(gè)的研發(fā)核心隊(duì)伍,所以在技術(shù)上我們是有基礎(chǔ)的。特別的是我們公司另外一個(gè)首席科學(xué)家,也是北大的顧小鳳教授,是國(guó)內(nèi)模式識(shí)別里的泰斗級(jí)的科學(xué)家,創(chuàng)建了我們手寫(xiě)識(shí)別技術(shù)。

  公司近十年的業(yè)務(wù)基本上有兩大塊。一塊是基于語(yǔ)音手寫(xiě)人機(jī)交互技術(shù)的核心業(yè)務(wù),另外在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域。

  隨著移動(dòng)互聯(lián)網(wǎng),包括云計(jì)算服務(wù)的發(fā)展,公司從原來(lái)的核心技術(shù)的授權(quán)提供商,向一些平臺(tái)級(jí)的解決方案的服務(wù)提供商轉(zhuǎn)型。所以,我們現(xiàn)在從原來(lái)的賣SDK,現(xiàn)在做平臺(tái)級(jí)的服務(wù),包括深入到一些行業(yè)。而且從原來(lái)僅僅是語(yǔ)音技術(shù)、手寫(xiě)技術(shù)這方面發(fā)展到現(xiàn)在我們基于人機(jī)智能交互技術(shù),已經(jīng)涵蓋了大概六七類這樣的人機(jī)交互技術(shù)。在云計(jì)算方面我們搭建了靈云平臺(tái),而且已經(jīng)開(kāi)始了和各個(gè)產(chǎn)業(yè)的融合性的合作。

  3sNews:蘋(píng)果手機(jī)的發(fā)布,把siri推向市場(chǎng),讓語(yǔ)音走向了大眾生活的方面,你怎樣看待這種情況?

  武衛(wèi)東:siri確確實(shí)實(shí)給大家?guī)?lái)了一些新的感覺(jué),或者是一種新的認(rèn)識(shí)。大家認(rèn)為這個(gè)技術(shù)其實(shí)很了不得,語(yǔ)音識(shí)別可以這樣。其實(shí)那是一個(gè)表象的東西,siri的背后是一套自然語(yǔ)言對(duì)話系統(tǒng)??赡躶iri把語(yǔ)音識(shí)別帶活了,但是實(shí)際上一個(gè)好的語(yǔ)音識(shí)別技術(shù)成功與否在于用戶的體驗(yàn)。

  對(duì)于語(yǔ)音交互技術(shù)的認(rèn)識(shí),我覺(jué)得現(xiàn)在目前產(chǎn)業(yè)界,尤其是在相關(guān)領(lǐng)域里面,有點(diǎn)泡沫。對(duì)語(yǔ)音交互這方面的應(yīng)用,大家要分領(lǐng)域,而不是說(shuō)一個(gè)公共的東西就能解決所有的問(wèn)題,這是做不到的。所以我認(rèn)為,蘋(píng)果推出的不是一個(gè)技術(shù)代表,因?yàn)樘O(píng)果有一個(gè)完整的無(wú)縫的產(chǎn)業(yè)鏈。它每推出一個(gè)產(chǎn)品,都一定要讓人們感覺(jué)到一些新的東西,新的一些體驗(yàn)。siri是為它封閉的產(chǎn)業(yè)鏈提供了一個(gè)新的亮點(diǎn),讓人們更多去買(mǎi)蘋(píng)果手機(jī)。但是目前來(lái)講,還沒(méi)有達(dá)到它真正對(duì)siri期待的應(yīng)用,所以對(duì)這塊的應(yīng)用,我們應(yīng)該冷靜判斷。

  另外,語(yǔ)音交互技術(shù)受環(huán)境因素影響非常大,如口音、人的說(shuō)話方式、環(huán)境、表達(dá)方式。要改變?nèi)说牧?xí)慣,讓人適應(yīng)機(jī)器,這個(gè)挺難的。讓機(jī)器真正能感知,讓技術(shù)怎樣引導(dǎo)人用它,這也是關(guān)鍵。其實(shí)國(guó)內(nèi)在這方面宣傳比較少,很多廠家在這方面探索精神或者說(shuō)實(shí)踐精神確實(shí)沒(méi)有蘋(píng)果厲害。在這方面,我們還是缺乏高端人才,尤其是在產(chǎn)品設(shè)計(jì)、體驗(yàn)設(shè)計(jì),中國(guó)現(xiàn)在確實(shí)缺乏這方面的高端人才。

  3sNews:華聲有沒(méi)有大眾市場(chǎng)的語(yǔ)音產(chǎn)品?

  武衛(wèi)東:有,小唐龍,學(xué)術(shù)名字叫做手機(jī)移動(dòng)助手或者移動(dòng)終端的智能助手,我們?yōu)槭裁床唤衧iri,就像你剛才所說(shuō)的,我要訂張機(jī)票,我得通過(guò)siri去看,但是不能購(gòu)買(mǎi)。但是我們做小唐龍的時(shí)候,里面有一個(gè)工單的思想,我們覺(jué)得比較貼切。我們必須要和提供內(nèi)容的廠商、合作伙伴進(jìn)行針對(duì)這種應(yīng)用的后臺(tái)和端的融合。至少在一些流程上面,把一些命令、流程融合到我們的小唐龍的執(zhí)行操作里面。

  3sNews:小唐龍目前的應(yīng)用情況怎樣?

  武衛(wèi)東:小唐龍是在今年的1月16號(hào)發(fā)布,3月16號(hào)正式上線?,F(xiàn)在在進(jìn)行一些功能的完善,包括一些資源的深度整合。同時(shí),我們已經(jīng)開(kāi)展了一些智能領(lǐng)域的合作,比如說(shuō)智能電視、車內(nèi)服務(wù)的客服平臺(tái)上,還有就是一些客服,比如運(yùn)營(yíng)商的一些客服上面,,簡(jiǎn)單地說(shuō)就是可以通過(guò)小唐龍問(wèn)話費(fèi)、流量、運(yùn)營(yíng)商的信息、活動(dòng),類似于客服的性質(zhì)。

  小唐龍可以說(shuō)是一個(gè)智能助手,不是門(mén)戶,但起到了一些門(mén)戶的作用。在小唐龍目前的功能里面,提供了一些信息,包括周圍的生活場(chǎng)所查詢的信息、路況的信息,甚至包括城市的出租車,打出租車從哪兒到哪要多少錢(qián)的這樣一些信息。我們跟百度、搜狗都有一些合作。這方面來(lái)講,通過(guò)它能夠提供的一些內(nèi)容,我們把這些能力開(kāi)發(fā)出來(lái),提供給用戶使用。

  除了語(yǔ)音可以交互以外,小唐龍還可以提供手寫(xiě)交互。手寫(xiě)有一個(gè)好處,不受場(chǎng)景的干擾,同時(shí)準(zhǔn)確率高。而且捷通通過(guò)十多年的發(fā)展,手寫(xiě)技術(shù)已經(jīng)發(fā)展到不像原來(lái)寫(xiě)一個(gè)字識(shí)別一個(gè)字,而是有連續(xù)的。所以在手寫(xiě)方面是小唐龍是一個(gè)特色。

  3sNews:武總給我們簡(jiǎn)單預(yù)測(cè)一下,我們?nèi)昊蛘呶迥曛笳Z(yǔ)音交互的市場(chǎng)前景嗎?

  武衛(wèi)東:我們看到語(yǔ)音交互在很多地方開(kāi)始整合,而且大家開(kāi)始講一些產(chǎn)品。但是我自己感覺(jué)作秀的成分大于實(shí)用的成分。你可以去到市場(chǎng)上調(diào)研,調(diào)研相關(guān)的一些應(yīng)用,到底這些東西是不是真正已經(jīng)實(shí)用化,大家是不是已經(jīng)天天在用它,或者是已經(jīng)非常離不開(kāi)的狀態(tài)。這個(gè)還有待商榷。我覺(jué)得,從未來(lái)三年五年,語(yǔ)音交互實(shí)際上作為一種非常好的、非常便捷的,跟人的生物特征契合度非常高的交互手段,一定會(huì)有很廣闊的市場(chǎng)。而且,人們會(huì)越來(lái)越適應(yīng)用這種方式進(jìn)行人機(jī)交互。

  基本上現(xiàn)在機(jī)器的處理能力是足夠的,很大程度是人如何能夠把這種技術(shù)和真正貼身的應(yīng)用很好地融合起來(lái)。而且剛才提到的后面很多的細(xì)分的一些模型,包括一些結(jié)構(gòu)化的設(shè)計(jì),能夠真正結(jié)合起來(lái)。因?yàn)樗倪@項(xiàng)技術(shù)背后有很多的模型,很多結(jié)構(gòu)化的東西,這些東西是需要時(shí)間,需要結(jié)合具體的領(lǐng)域里面去做的。所以說(shuō)這個(gè)技術(shù)不是說(shuō)已經(jīng)成熟到大家拿來(lái)就能用,沒(méi)有那么樂(lè)觀。但是也絕不是那么悲觀,如果大家想把這個(gè)技術(shù)做好,稍微花點(diǎn)工夫就可以把它用好。而且不能說(shuō)100%全部替代性的應(yīng)用,而是補(bǔ)充性的應(yīng)用。因?yàn)橛泻芏嗟胤綄?shí)際上是可以用的。比方說(shuō)現(xiàn)在車聯(lián)網(wǎng)里面做人工客服。語(yǔ)音合成現(xiàn)在用得很成熟。語(yǔ)音識(shí)別,其實(shí)有很多地方,比如說(shuō)遇到一些做判斷的時(shí)候,我想買(mǎi)東西,想找個(gè)什么地方,你可以很準(zhǔn)確說(shuō)的時(shí)候,是完全可以做到的。但是找不到,完全可以通過(guò)人工去干預(yù)。
 

喜歡您正在閱讀的內(nèi)容嗎?歡迎免費(fèi)訂閱泰伯每周精選電郵。 立即訂閱

參與評(píng)論

【登錄后才能評(píng)論哦!點(diǎn)擊

  • {{item.username}}

    {{item.content}}

    {{item.created_at}}
    {{item.support}}
    回復(fù){{item.replynum}}
    {{child.username}} 回復(fù) {{child.to_username}}:{{child.content}}

更多精選文章推薦