語音作為人類交流最自然的方式,比文字和圖像更具天然的優勢。物聯網時代,語音交互已然成為眾多智能硬件交互方式的首選。不過,近場語音交互技術在使用場景上要求低噪聲、無混響、距離聲源很近等等,還遠不能滿足家電、車載等智能硬件對自然人機對話的渴望。解決噪音問題,追求真實環境下更自然人機交互方式,提升遠場語音識別率成了智能硬件廠商的迫切需求。

近日,捷通華聲遠場語音交互技術實現再升級,全球第一款專為智能終端遠場交互信號處理打造的靈云麥克風陣列SDK正式上線靈云平臺(aicloud.com),使麥克風陣列降噪能力更強,大大提高了遠場語音識別率,可實現真實環境下更為自然的人機交互。
靈云麥克風陣列SDK 智能硬件語音交互新時代
此次在靈云平臺正式上線的為靈云麥克風陣列V3.0產品,是捷通華聲專門針對智能家電、車載、機器人、音箱等智能終端遠場語音交互推出的語音信號處理SDK,可適配多麥克風陣列布局,目前上線的支持windows系統平臺,后續還會支持更多系統,3米識別率超過95%,5米識別率同樣超過92%,在各種復雜噪音環境中均能實現精準遠場語音識別。

在捷通華聲與清華大學的共同努力下,靈云麥克風陣列SDKV3.0的語音喚醒、聲源定向、回聲消除、語音降噪等方面功能均達到了行業領先水平。

1、 語音喚醒
通過說出喚醒詞,使設備從休眠狀態中喚醒,支持1個或者多個喚醒詞,且喚醒詞可自行設定。5米喚醒率 > 95%,誤喚醒率 < 1次/24小時。
2、回聲消除&語音打斷
消除設備自身播放的聲音,保證只獲取說話人的聲音。如在電視播放時,過濾掉電視的聲音,識別人說的換臺指令;與機器人溝通時,靈活打斷機器人的說話。

3、聲源定向
支持2/4麥克風線性布局,實現180°聲源定向,定向精度 < ±15°;支持4/6麥克風環形布局,實現360°聲源定向,定向精度 < ±10°。
4、語音降噪
增強目標說話人方向的語音,抑制說話人方向以外的聲音,消除非人聲背景音,并可動態追蹤聲源位置,實現遠場聲音采集。

裝上靈動雙耳 讓每個智能硬件更懂你
語音識別本質上必須和聲學處理融合,語音設備沒有好的耳朵顯然不行,而靈云麥克風陣列SDK則能讓智能硬件的雙耳更加靈敏,并配合已有的云+端語音識別、語義理解、語音合成、聲紋識別等語音技術,可以為客戶產品提供全鏈條的語音交互產品和服務。
目前,市場上提供的Mic陣列軟硬件結合解決方案價位普遍在200元/個左右,純軟件方案也要近50元/個,高昂的價格讓成本控制嚴格的家電、車載等智能硬件生產廠商望而卻步。
相比與此,靈云麥克風陣列通過靈活的軟硬件搭配,針對不同場景的產品,推出了各種性價比較高的組合方案,家居家電,機器人,車載產品都可以找到適合自己的麥克風陣列產品組合。
伴隨產品的不斷完善升級,靈云麥克陣列技術已經成功應用于新松、木爺等幾十家服務型機器人中,以及眾多智能車載產品中,并與眾多電視、空調等智能家電廠商建立了合作。
通過不斷推出并完善靈云麥克風陣列軟硬件產品,捷通華聲努力將語音識別從傳統的單麥克近講推動到多麥克遠講時代,從而讓每一家智能硬件企業都能以較低的成本擁有語音識別這項入口級的技術,使得社會大眾能夠體驗到更自然、更流暢、更貼心的人機交互。
推薦閱讀
4月11日,由中國電子視像行業協會主辦的“2017中國電子產品設計創新大會暨(紅鉆獎)頒獎盛典”在深圳隆重召開。本屆會議以“極致設計,創享未來”為>>>詳細閱讀
本文標題:靈云麥克風陣列SDK重磅發布 為每個智能硬件裝上靈動雙耳
地址:http://www.xglongwei.com/a/05/302627.html