百度AI開發者大會上除了智能駕駛,另一個重頭戲就是語音交互。在現場的演示中基于自然語言的交互平臺DuerOS,百度工程師羅興通過十七行代碼,用1分鐘的時間,讓原本只會英文的音箱馬上變得能“聽懂”中文。
語音加速人機交互方式的變革,搭建智能語音生態早已不約而同地成為諸如百度、谷歌、微軟等的AI發展戰略。Google Assistant、蘋果Siri、百度DuerOS、微軟小冰和小娜等等智能語音服務早已在各類機器設備中得到了廣泛的應用。在語音交互技術商業化探索方面,亞馬遜Echo是佼佼者。來自調研機構CIRP的數據顯示,截止2016年底,Echo總共賣出了820萬臺。
eMarketer在報告中指出,在美國語音激活揚聲器市場,亞馬遜Echo占據的份額超過70%,Alphabet的谷歌Home排在第二位,份額24%。
Echo在國外市場的火爆與中國的智能音箱市場恰好形成強烈對比,無論是阿里、京東還是聯想、小米的智能音箱銷量均未達到Echo這樣的體量。除了技術方面的原因,更多的仍然是用戶接受度尚未培養。
搶先布局
7月5日,百度AI開發者大會當天下午,天貓發布智能音箱天貓精靈。據其官方介介紹,天貓精靈使用了阿里人工智能實驗室自主研發的中文語音理解引擎——AliGenie,在自然語言理解的基礎上加入了“決策引擎”機制,能夠理解上下文語境,支持多輪對話。并且針對常用的定時、提醒、天氣、家居控制、購物等領域進行了特別優化。
從其功能演示來看,這又是一款亞馬遜Echo的追隨者。早在2015年,京東就與科大訊飛成立合資公司推出了首款智能音箱叮咚。其旗艦版被命名為A1,整體交互方式在家庭5米遠程范圍內,可以與這款音箱進行語音交互。當然這款產品同樣可以實現語音購物功能。據京東智能音響產品負責人鐘博透露,目前這款產品已經迭代多次累積用戶達到了100萬。
從銷量的對比可以發現,國內的智能音箱產品遠不如亞馬遜Echo在國外市場的歡迎程度。鐘博認為主要原因還在于消費者對智能音箱這一產品的接受度還沒有培養起來。
今年7月,叮咚TOP智能音箱上線京東商城其價格僅為399元,制定這樣價格的原因在于,降低獲得門檻讓智能音箱可以進入更多的家庭。
智能音箱所代表的是一種全新的人工智能交互方式,代表著未來人工智能在家庭應用場景中的落地。巨頭搶奪的并非是智能音箱市場,而是有關未來家庭入口的進場券。
技術優化
一個不容忽視的發展趨勢是,未來我們的生活將從工業時代完全過渡到一個全新的智能時代。人工智能會受人類的控制而更好地服務于人類,擁有更多的功能,應用到更廣泛的領域。而這里有一個重要的課題需要解決:人類怎樣才能順暢的與機器進行交流,讓機器真正能與人類實現對話。
事實上,就目前的技術而言,人類與人工智能實現如同科幻電影里的順暢交流并非易事。因為機器現在的智能語音停留在對關鍵詞的內容識別和上下文分析,而機器是沒有“語感”的,也不懂得什么語法。要將人類的語言用數學邏輯的形式解析并讓機器理解、學習這中間存在的問題就是,語言是不是能夠被數學化?語言如何能被數學化?
盡管國內智能音箱設備眾多,但有一個問題是目前它們都未能完美解決的:智能音箱未能100%對用戶提出的需求進行精準的響應。
叮咚智能音箱研發中心負責人周正友對TechWeb解釋稱,機器對于人類語言的識別會隨著深度學習的加深不斷改進,足夠大的數據量會讓機器越來越智能。智能音響的推出并不是生產出來就完了,它是處于一個不斷迭代與學習完善的過程中,這也是人工智能時代產品與工業時代產品的不同。
在理想化中的狀態中,智能音箱在家庭中的角色更多是智能語音助手。它無法取代生活中的家用電器,但它能夠讓家電更快捷的對人們的需求作出反饋。
但是基于目前的智能語音交互技術,這種理想化的狀態想要實現并非易事。鐘博表示,“在特定語式下智能音箱與家電之間是打通的,特別自然的可以隨便去理解的話,其實還都是非常大的難度。這個需要通過時間、大量的用戶數據,大量的方式不斷深化它,逐漸把中文的語音方式和音響對于這個用戶的說話的方式屬性慢慢建立起來,所以并不是一個點狀的。如果是打造一個自然,業界上還沒有攻克到這種程度,需要一定的時間。”
巨頭游戲
讓人類和機器對話是人機交互領域長久以來的夢想。語音正在成為人類和機器互動中越來越重要的手段。企業在這個領域的競爭無疑也是激烈的。目前無論是科大訊飛、云之聲還是思必馳等都瞄準了語音交互與智能硬件相結合的場景。
在周正友看來,產品的研發背后最重要的其實是交互體驗,而交互體驗的順暢與否其實是需要大數據的支持與訓練。科技巨頭們擁有這場語音爭奪戰的先天優勢——海量數據。
在百度AI開發者大會上,百度工程師羅興用 DuerOS 的智能硬件開放平臺,在短短的一分鐘之內,用十七行代碼,讓搭載了 Alexa、只會講英文的 Anker 音箱聽懂了中國話。這被許多自媒體解讀為“百度DuerOS開放平臺,讓你一分鐘擁有中國版Echo”。
但其實問題遠沒有這么簡單,周正友在與TechWeb對話中談到,欽佩百度能夠開放到如此程序,將一個具體智能音響內部結構都開放出來。但他表示,僅僅依靠這個開放平臺,中小開發者并不能打造出一個智能音響,“智能音響牽扯因素比較多,譬如說整個麥克風和搭配尺寸上的關系,幾毫秒的差別引起的變化。這需要長期的設計和生產積累經驗,并不是一個開放平臺就能解決所有問題。”
智能音箱的硬件設計需要技術與經驗的積累,另一方面,其搭載的服務則需要海量數據供其學習。在周正友看來,擁有數據的大企業在智能音箱的設計與迭代方面有著巨大的優勢。
但是在人工智能初創公司驀然認知CEO戴帥湘此前在與TechWeb對話中表示,這個市場其實并不是特別激烈,因為用戶使用語音交互的習慣并沒有完全培養起來,另外就是,這個領域其實沒有真正的巨頭。
但不可否認的是,對于語音交互的需求是很大的,一款語音交互體驗好的產品必然會得到更多服務商的親睞。目前比拼的就是誰的產品交互體驗更好。
推薦閱讀
2017年7月8日,全新炫酷黑科技產品——【閑魚流通機】登陸淘寶造物節,成為展會現場的新晉人氣網紅。據現場體驗過的網友爆料,只要隨機投入一件隨身攜帶的閑>>>詳細閱讀
地址:http://www.xglongwei.com/a/05/303798.html