SmartPlanet 的這則文章這樣寫道:用戶對著iPhone說話后,這些語音將立即被編碼,并轉換成一個壓縮數字文件,該文件包含了用戶語音的相關信息。由于用戶手機處于開機狀態,這些語音信號將被轉入用戶所使用移動運營商的基站當中,然后再通過一系列固定電線發送至用戶的互聯網服務供應商(ISP),該ISP擁有云計算服務器。該服務器中的內置系列模塊,將通過技術手段來識別用戶剛才說過的內容。
與此同時,用戶說過的語音內容,也將在用戶手機當中被加以識別和分析。安裝在用戶手機中的語音識別器,將同云計算服務器聯系,以了解指令是否適合通過本地方式 (即在用戶手機當中)被處理。比如用戶指令可能要求手機播放一首歌曲,而其他一些指令則有可能需要手機與網絡連接,以尋求進一步幫助。如果語音識別器認為,手機內部模塊完全有能力處理用戶的指令,那么手機將會告知云計算服務器,不需要云服務器的支持。
根據用戶說話的聲調和語序,云服務器將對語音加以靜態對比,以了解用戶所說語音中包含了哪些字母。在此期間,用戶手機的語音識別器也將對用戶語音進行靜態對比。無論是在服務器端還是手機端,可能性最高的識別內容都將獲得優先處理權。
通過上述處理程序,被識別出的那部分用戶語音內容,已經包含一系列元音和輔音字母。隨后這些內容將被發送至一個語言模塊,以分析用戶語音中可能包含了哪些詞匯。在此基礎上,計算機將根據所識別詞匯的可信度級別,而創建一個用戶所說內容的列表,從而具體分析用戶語音表述中最有可能會表達何種意思。
如果上述分析和判斷結果已具有足夠的可信度,那么計算機將能理解用戶所說的內容:比如計算機得出結論,用戶是要求手機發送短信或查找聯系人列表中的某個聯系人。在經過上述一系列后臺處理后,用戶將會看到手機屏幕上出現所需的內容,而不必進行手動操作。在此過程中,如果用戶的語音含義過于模糊,計算機就會詢問用戶,以了解用戶希望查找的聯系人究竟是埃里卡·奧爾森(Erica Olssen)還是埃里卡·施密特(Erica Schmidt)。
SmartPlanet網站上的原文還談到了搜索產業的發展史,其中包括谷歌、微軟以及其他科技公司在語音識別技術領域所作出的努力。
推薦閱讀
AMD在周四宣布,公司將進行重組以提高其競爭力,降低成本結購。在重組中最重要的便是裁減10%員工,原因是PC市場表現疲弱。此次裁員預計2012年第一季度完成。 AMD表示,這項裁員措施應可幫助該公司在第四季度節省1000>>>詳細閱讀
地址:http://www.xglongwei.com/a/01/20121229/104805.html