呂文龍
“‘漢堡包多少錢一個(gè)’英文怎么說?”
科大訊飛董事長劉慶峰對(duì)著手中的智能手機(jī)問,不料卻因口音緣故,被識(shí)別成“‘漢堡包多少錢一個(gè)’你這么說”。劉隨即糾正發(fā)音再試,得到滿意答復(fù):“How much is a hamburger?”
這不是蘋果的Siri,而是科大訊飛的“訊飛語點(diǎn)”。
3月22日17時(shí),科大訊飛在新一代“語音云”發(fā)布會(huì)正式推出該典型應(yīng)用。劉慶峰饒有興致地通過語音發(fā)短信、設(shè)置提醒、導(dǎo)航、查詢航班、天氣和美食,推銷起訊飛語點(diǎn)的部分功能。
但劉也有意無意像那些美國科技公司老總展示產(chǎn)品時(shí)屢屢犯錯(cuò),一時(shí)著急,他又將“你能做什么?”說成了“你在做什么?”
“我在反思自己的不足呢。”訊飛語點(diǎn)第一次回復(fù)十分謙虛。而當(dāng)劉糾正問題后,訊飛語點(diǎn)如此答道:“我懂一些歷史,會(huì)一點(diǎn)算數(shù),能說幾句英語,還會(huì)背唐詩,講笑話……”
與以往企業(yè)級(jí)產(chǎn)品不同,科大訊飛此次新一代語音云要嘗試移動(dòng)互聯(lián)網(wǎng)玩法。這是其戰(zhàn)略型業(yè)務(wù),訊飛語音云會(huì)將智能語音技術(shù)向互聯(lián)網(wǎng)開發(fā)者開放,為各類移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)者和創(chuàng)新性企業(yè)提供低門檻語音技術(shù)服務(wù)。
“我們提供開發(fā)運(yùn)營和支撐,包括優(yōu)質(zhì)語音體驗(yàn)、全程開發(fā)技術(shù)支持、全天候運(yùn)維保障、自動(dòng)化業(yè)務(wù)分析。”發(fā)布會(huì)現(xiàn)場,劉慶峰以水、電作比方,科大訊飛合作伙伴可即開即有、按需取用。
圈地運(yùn)動(dòng)先行
“科大訊飛各種突破和技術(shù)排名不是主要,更重要的是他們已把技術(shù)變成產(chǎn)品,并可預(yù)見盈利。”科大訊飛股東、聯(lián)想控股董事局主席柳傳志認(rèn)為,科大訊飛將實(shí)驗(yàn)室成果變成工廠成果推向市場,并構(gòu)建整個(gè)價(jià)值鏈,這一步最難。
目前科大訊飛主要業(yè)務(wù)包括:語音支撐軟件,在行業(yè)應(yīng)用中由于進(jìn)入早,行業(yè)專業(yè)知識(shí)積累較深,擁有一定市場領(lǐng)先優(yōu)勢(shì),如在教育領(lǐng)域給對(duì)手建立了進(jìn)入壁壘。不過,其市場競爭也在加劇。
去年12月,全球最大語音技術(shù)公司Nuance、蘋果Siri技術(shù)提供商N(yùn)uance在上海展出其中文車載語音解決方案,并與四維圖新合作開發(fā)導(dǎo)航用的語音地圖數(shù)據(jù)。意識(shí)到中國市場較北美、歐洲等市場增長最快的Nuance已加大中國投入,由幾年前幾十人隊(duì)伍擴(kuò)大到百人以上規(guī)模。
Nuance去年增長最快的是手機(jī)及大眾消費(fèi)者領(lǐng)域,而大眾消費(fèi)正是科大訊飛“語音云”所要覆蓋的,除訊飛語點(diǎn)外,此前訊飛口訊、訊飛輸入法已有良好市場反饋。
“語音智能交互在全球市場都處于起步和培養(yǎng)期,包括微軟(微博)、谷歌都普遍沒找到好盈利模式。”興業(yè)證券計(jì)算機(jī)行業(yè)高級(jí)分析師李英娟認(rèn)為,“目前用戶數(shù)增加比找到盈利模式更為現(xiàn)實(shí),而語音云涉及的互聯(lián)網(wǎng)業(yè)務(wù)對(duì)科大訊飛意義較大,因?yàn)樵撌袌銮熬皬V闊。”
科大訊飛副總裁、董秘徐景明則認(rèn)為,語音云收費(fèi)雖還在探討階段,但整體路線清晰:“語音云的收費(fèi)模式會(huì)多樣:高級(jí)用戶授權(quán)收費(fèi)模式、廣告盈利模式、垂直搜索盈利模式、增值業(yè)務(wù)模式都可行。”
據(jù)科大訊飛提供的數(shù)據(jù):目前,科大訊飛在中文語音技術(shù)市場占據(jù)70%以上份額,語音合成產(chǎn)品市場份額則高達(dá)80%以上。
此外,其語音云用戶規(guī)模已從2011年上半年100萬、2011年底1000萬到目前的3300萬。每天在線用戶數(shù)超120萬,總請(qǐng)求量超700萬次,應(yīng)用開發(fā)合作伙伴超過3100家,創(chuàng)新應(yīng)用涉及手機(jī)、車載、互聯(lián)網(wǎng)電視、智能家電等各領(lǐng)域。
誰是應(yīng)用門檻
對(duì)微軟和谷歌等在人機(jī)語音交互動(dòng)作方面的表態(tài),劉慶峰表示并不畏懼:“我們?cè)缬袦?zhǔn)備:語音合成自然度超過真人發(fā)音水平;語音識(shí)別率達(dá)到90%以上;自然語音理解,典型應(yīng)用領(lǐng)域達(dá)到實(shí)用要求。”
劉同時(shí)指出,語音應(yīng)用爆發(fā)需要的條件已逐步成熟,關(guān)鍵技術(shù)達(dá)到實(shí)用門檻。智能終端、無線網(wǎng)絡(luò)、云計(jì)算平臺(tái)等環(huán)境條件已基本完備。不過,一位不愿具名的管理軟件研究院高層人士告訴記者:“語音智能互動(dòng)的重任,還在后端云計(jì)算平臺(tái)。”
后臺(tái)技術(shù)的任務(wù),是處理用戶通過前端發(fā)出的種種請(qǐng)求,并返回給用戶最匹配結(jié)果。而用戶請(qǐng)求五花八門,處理有一定難度,涉及以谷歌為代表的網(wǎng)頁搜索技術(shù)、以Wolfram Alpha為代表的知識(shí)搜索和計(jì)算技術(shù)、以維基百科為代表的人類手工編輯知識(shí)庫技術(shù)、及以Yelp為代表的問答及推薦技術(shù)等。
柳傳志坦言,“語音學(xué)習(xí)系統(tǒng)難點(diǎn)不是掌握算法,解決偏僻詞匯要求更高。”而要解決偏僻詞匯問題,關(guān)鍵在基于語料的分析。
對(duì)智能語音技術(shù)史有所貢獻(xiàn)的創(chuàng)新工場CEO李開復(fù)(微博)曾以自己相關(guān)博士論文為例:“當(dāng)時(shí)做語音技術(shù)都基于語料庫,語料庫大效果就好。一個(gè)人能錄的語料很有限。但如果中國有一億用戶,每人一天哪怕講三秒,綜合起來是一個(gè)可觀數(shù)字。”
“從3000萬用戶、到一個(gè)億、再到三億用戶,用戶量增長會(huì)讓語音云功能更強(qiáng)大。”劉慶峰期望通過用戶增長帶來更豐富的語料,“新一代語音云平臺(tái)推出后,用戶對(duì)口音、專用詞匯進(jìn)行個(gè)性化訓(xùn)練,可進(jìn)一步提升語音作用。”
但李開復(fù)也表示:“用戶體驗(yàn)的高期望,會(huì)給語音交互技術(shù)應(yīng)用帶來很大挑戰(zhàn)。語音是人類最自然的溝通方式,一旦人們開始用語音和機(jī)器交流,就會(huì)期望機(jī)器像真人一樣。”
李同時(shí)指出,如何花費(fèi)最短時(shí)間讓開發(fā)者更快介入對(duì)科大訊飛尤為重要。此外,并非所有應(yīng)用都適合語音交互,如目前創(chuàng)新工場投資的47個(gè)項(xiàng)目中,約有五六個(gè)可能會(huì)適合語音。
“蓋茨很多年前就說,五年后語音會(huì)改變世界;可每時(shí)隔五年,他又將這話再說一遍。語音智能交互沒爆發(fā),癥結(jié)在云計(jì)算等技術(shù)沒達(dá)到水平。”李開復(fù)認(rèn)為,其后會(huì)在微博上給出手機(jī)語音識(shí)別應(yīng)用發(fā)展四點(diǎn)機(jī)會(huì)。
首先,精準(zhǔn)度上,訊飛平臺(tái)利用大量語料和服務(wù)器,可以做得不錯(cuò);其次,語義要比語音更困難,且不是標(biāo)準(zhǔn)API用上就可以解決;再次,挑選真正需要語音的應(yīng)用;最后,用戶體驗(yàn)和期望,深度結(jié)合語音語義和應(yīng)用才能做出優(yōu)質(zhì)應(yīng)用。
行業(yè)深挖想象力
“訊飛語義理解技術(shù)已在各大運(yùn)營商上有廣泛應(yīng)用。去年,科大訊飛新承建安徽移動(dòng)短信營業(yè)廳智能服務(wù)系統(tǒng)。同時(shí)基于訊飛語義理解技術(shù)研發(fā)的呼叫導(dǎo)向智能客服系統(tǒng)已在多家銀行成功應(yīng)用。”劉慶峰介紹。
語音智能交互的企業(yè)級(jí)應(yīng)用將更為深入。“更上一層樓”科大訊飛發(fā)布會(huì)上,一個(gè)女主人對(duì)手機(jī)喊出口令,手機(jī)解鎖成功;改換別人喊同樣口令,手機(jī)回應(yīng):“抱歉,您不是我的主人。”
類似場景,還有《007》電影中,邦德對(duì)著自己愛車喊“start”,車先辨別主人聲音,后再啟動(dòng)start這個(gè)命令。一位銷售在與客戶通電話,智能語音模塊自動(dòng)把溝通信息輸?shù)紺RM中備案,如何時(shí)、何地打電話,客戶什么意見、要點(diǎn)等。
推薦閱讀
知識(shí)產(chǎn)權(quán)“世界警察”的“竊密案底”
核心提示:據(jù)中國商務(wù)部統(tǒng)計(jì),2011年美國政府對(duì)中國企業(yè)發(fā)起涉嫌知識(shí)產(chǎn)權(quán)侵權(quán)的調(diào)查就有16起。 李關(guān)云 上海報(bào)道 無論是在中美戰(zhàn)略與經(jīng)濟(jì)對(duì)話會(huì)議上,還是在兩國元首的高層互訪之中,美國政商領(lǐng)袖都在不斷抱怨中國知識(shí)>>>詳細(xì)閱讀
本文標(biāo)題:科大訊飛智能語音交互 闖關(guān)移動(dòng)互聯(lián)新玩法
地址:http://www.xglongwei.com/a/kandian/20120324/43974.html