過去一兩年來,人工智能的火熱有目共睹。從學界到業界,從創業者到投資人,關于AI即將爆發的論調層出不窮。與此同時,AI領域創業公司的估值也水漲船高,高估值承載的是創業者和投資人對于AI和公司發展前景的樂觀預期。但是這種高預期背后,是否有足夠強有力的邏輯作為支撐?很多已經“進入”的投資人甚至說不出個所以然來。
臨近年底,一些投資人開始為AI“降溫”,引導行業冷靜看待當前的AI技術和商業化應用。如果投資人的觀點還不足以服眾,那么在AI領域奮戰20多年的行業前輩,或許能從技術角度給我們一些更現實的啟示。
近期,愛分析對捷通華聲董事長張連毅進行了訪談,探討了他關于當前人工智能各項技術的發展水平和行業應用現狀、以及對接下來全行業發展態勢的看法。
圖:捷通華聲董事長張連毅
張連毅1989年畢業于清華大學,從1990年開始致力于將清華的OCR技術商業化。2000年,他和清華大學陳明博士與中科院聲學所研究員呂士楠共同創建捷通華聲,主要提供語音合成技術。2016年,捷通華聲正式登陸新三板。
如今,這家有著17年歷史的公司已經構建了涵蓋語音識別、語音合成、聲紋識別、語義理解、OCR、手寫識別、人臉識別、指紋識別、機器翻譯、數據挖掘等十項技術的全方位人工智能平臺,為包括金融、電信、能源、交通、教育、醫療、政府、汽車、IT互聯網等眾多行業客戶提供AI技術和解決方案。(詳見愛分析文章《AI格局3年定型,捷通華聲能否成為十項全能冠軍? | 公司調研》)
張連毅認為,包括語音、圖像識別、語義理解等在內的人工智能技術尚不完美,是全社會對AI技術接受度的提高帶動了各項技術商業化需求的猛增。然而,一些公司及行業人士對AI技術宣傳過度,其實是在誤導大眾。這種誤導,將不利于AI技術未來的發展和應用。此外他還指出,從2011年到2016年上半年是AI技術啟蒙的5年,而接下來的3-5年,則是AI產業格局的定型階段。
愛分析節選部分精彩內容,與您分享。
AI技術尚不完美,應用和商業化要看行業要求
Q:OCR屬于人工智能技術嗎?
A:以前人工智能和人機交互是分開講的,現在合起來了。我認為人工智能可以理解為兩個層次,人機交互是淺層次,讓機器像人一樣能看會聽,而讓機器具備像人一樣的思維和推理能力,是深層次。OCR屬于圖像識別領域一項比較傳統的技術,它屬于人機交互,是淺層次的人工智能。
當然,雖然它較為傳統,但也不是完全成熟,也是近幾年隨著深度學習技術的發展才取得了一些突破,對于模糊、壓線、重疊、有背景色等情況下的識別準確率有了顯著提升。另外從開發者的需求來看,各行各業對OCR技術的需求仍然非常旺盛,包括藥瓶上的文字識別、票據識別、物流行業的快遞單識別等等。所以OCR技術是人工智能領域一項行業需求正旺的傳統技術。
Q:國內有哪些做OCR技術的源頭?
A:OCR技術90年開始興起,主要源頭就是清華(以捷通華聲、文通為代表)、中科院(以漢王科技為代表)、摩托羅拉(以上海合合信息為代表),以及新加坡國立研究院,國內也有兩家代表企業。
Q:現在圖像和語音識別還需要人工校對嗎?
A:都需要。外界的一些近乎100%準確率的語音識別演示,其實是經過了專門訓練的,實際使用場景下不會有那么高的準確率。當然各行各業對語音識別效果的要求不一樣,比如醫療、法律等領域是不允許出現錯誤的,那么技術公司要么在后方設呼叫中心,進行人工校對,比如Nuance就有一個幾千人的團隊在做校對工作,要么就是加強專門的數據訓練,來降低錯誤率,在實際使用中,對于部分小錯誤,再讓用戶進行自主校對。
Q:現在行業內語音識別準確率基本在什么水平?
A:手機APP和電話信道分別是16K和8K聲道,現在手機APP的16K聲道識別率基本都在95%左右,8K電話信道識別率最高只有85%,當然之前才60-70%。
Q:聲紋識別現在有哪些難點?
A:單一聲道聲紋識別還可以,但是跨聲道的聲紋識別還不行,比如從電話信道到手機,從手機到麥克風等,就很難識別。
Q:如何看待當前的人臉識別技術和市場?
A:我理解,人臉識別的技術要求是跟行業應用掛鉤的�,F在很多創業公司都把人臉識別用在金融、安防領域。如果用在公司考勤,98%以上的識別準確率足夠了,但如果用在金融領域,比如刷臉支付,就算做到99.99%,還是會有0.01%的誤差。
所以我認為,人工智能在金融領域的應用,單一技術有難以承受的風險,技術無法保證100%正確,只有通過多項技術融合,多重驗證,才能保證萬無一失�,F在生物特征識別的準確率相比模式識別并不是很高,只有虹膜識別是最高的,所以捷通會把聲紋、人臉、指紋、證照識別一起用上。
Q:人臉識別技術目前有哪些難點?
A:人臉識別最大的難點是光線,光太強、太暗都無法保證很好的識別效果。技術再先進也還是會受到環境因素的影響。就像清華的張鈸院士一直不看好無人車,因為無人車主要靠視覺,在天黑、刮風下雨、霧霾等條件下視覺會受到很大限制。
Q:您怎么看待無人車?
A:當然現在無人車很熱,我個人認為無人車在一些特定領域,比如無人軌道,就是在某段路開,不允許有人,這是可以的。但是要在日常的大馬路上開,除了前面提到的攝像頭視覺方案會遇到的問題以外,還有人、物、景的鑒別問題。之前特斯拉出事故,至少說明在某些情況下無人車還是不能很好地識別物體和環境狀況。另外,交通事故的責任界定也是一個很大的問題。
當然行業內現在會采用一些多傳感器融合的方案來減少視覺方面的限制,但是我想說,我們為什么一定要以人的生命作為代價?無論是車里的人,還是車外的人。我們還不至于依靠技術實現便捷而用自己的生命作為賭價。
Q:行業內還有一個觀點,沒有無人駕駛,同樣還是有很高的事故發生率,無人駕駛成熟以后還是能夠在一定程度上提高安全性的,您怎么看待這種觀點?
A:技術成熟以后提高安全性是沒錯的,但是人的事故責任是比較容易界定的,而無人車的話是不容易界定的,它的風險是不可預測的,人的風險是可以預測的。當然無人車作為一種技術追求還是值得去研究和探索的,可能真的有一天會實現,但是我認為還是比較遠的,除了車上的傳感器,相關的配套基礎設施也得跟上,這個還是需要時間,目前可預見的技術確實還達不到。
AI火熱得益于行業接受度提高,未來3-5年AI格局將定型
Q:對人工智能的發展階段怎么看?
A:捷通是2011年7月轉的型,到2016年6月正好是一個完整的5年。
我認為人工智能的產業發展有兩個階段,2016年6月之前的5年是啟蒙階段。這5年里面的玩家,基本上都是以前做這個行當的企業,比如捷通華聲、云知聲、思必馳、曠視、商湯、小i機器人、海鑫科金、得意音通、中科信利,上市公司有科大訊飛、漢王科技。
進入到2016年下半年,百度、騰訊、阿里、搜狗、華為等“航母”也開進來了,人工智能真正的戰役才開始。所以這之后的5年,是產業格局逐漸成型的階段。目前大部分客戶都是抱著試一試的心態,而不是真正在使用技術,所以現在很多單一領域的需求很分散,還沒有形成剛需。接下來的兩三年內,產業格局就會逐漸形成,四年之后格局就會慢慢定下來。
到時候,人工智能一定會出類似BAT一樣的巨頭,因為時勢造英雄。
Q:是否認為當前人工智能過熱?
A:確實過熱。這個產業確實在崛起,所以不能過低估計整個產業,但是也不能過高估計它的技術。人工智能技術的發展,不是得益于大家所看到的語音識別95%、97%的識別準確率,而是得益于整個社會對人工智能的理解和包容。
原來人們對人工智能的態度是,錯一個字都不滿意,我說話你就得能聽懂。但是這些年慢慢發展下來,人們發現雖然有錯字,但是我可以包容和嘗試了,你試試語音,他試試圖像,所以現在需求蜂擁而至。正是這種包容極大地促進了人工智能技術的應用。
當然這種包容和嘗試還是更多的在商業領域。一些語音公司最開始做2C產品,實際上剛出來的時候熱幾天,之后就沒人用了。相比之下,把語音技術用在智能客服領域是一個比較正確的方向。從現階段來看,垂直領域的商業化會走得更快一些。
Q:如何看待當前一些人工智能會戰勝和取代人類的說法?
A:Alpha Go贏了之后,有人問我人工智能會不會戰勝人類,我認為這個問題要看機器戰勝人類的什么。如果說在某些方面的話,那么在計算器誕生以后,機器就已經戰勝人類了。
不管別人怎么說,我理解,人工智能是人類的伙伴,它的誕生是為了幫助人類,成為人類的助手。它不是不可能取代人類,但有一個前提,我們人類能不能先搞明白我們的生老病死是怎么回事?
人工智能是仿人,人類之所以能把撞得很破的汽車復原,是因為人精通汽車的整體構造,但是人類對自身大腦的了解少之又少,而AI的核心又恰恰是在大腦,所以要造出一個超越人類的AI起碼是建立在人類對自身有足夠了解的基礎上。
人工智能未來的發展一定是伴隨著人類對自身的理解不斷加深,等到這種理解達到一定程度,我們才能去談人工智能能否戰勝人類�,F在討論這個問題還為時過早,現在我們更應該關注的是這些技術怎么來服務行業、服務社會大眾,減輕工作負擔和壓力、提高工作效率、降低成本,同時給大眾帶來一些娛樂和便捷。
Q:如何看待讓人工智能參加高考并考上一本這個項目?
A:這其實是我最不認同的一件事情。
中國的父母有兩個心病,一個擔心家人生病,一個是擔心子女教育。中國的教育是固化的填鴨式教育,毫不夸張地說,就是摧殘兒童。真正的教育應該是啟蒙式的,引導你去發現事物的本質。而我們是灌輸式的僵化教育。
讓人工智能參加高考并不能證明什么,就算幾年以后人工智能參加高考成功了,也只能證明一件事,中國的考題式教育已經到了無以復加的地步。因為不管是答題,還是寫作文,從技術上看并不難,只要把海量的題庫拿過來,讓機器去學習、訓練就行了。這個過程并沒有創造什么,并沒有對中國的教育進行一些有益的改變。
所以我們的企業可以去探索人工智能的應用方向,比如幫助孩子寫寫字、練練普通話和英語口語,那是可以的,但是不要夸大它在教育領域的應用。企業一定要服務行業,而不能誤導行業,因為這種誤導是誤國誤民的。
Q:如何看待當前AI類公司的高估值?
A:首先需要肯定這個領域還是有一些很優秀的公司存在。
但是從技術角度講,這個領域的門檻并沒有想象中那么高。很多公司都是基于國外的開源技術在做,原創技術并不多。既然是開源的,大家都可以學,并不是說誰就有很高的門檻。比如這兩三年,國內就冒出了很多做語音的公司。
所以目前的高估值一方面是因為這個市場真的起來了,另一方面不排除有一些包裝的成分在里面。
我向來不相信獨角獸,因為人工智能包含各種各樣的技術,單靠一項技術是不可能壟斷的。這是一個風起云涌的時代,創新會一直持續下去。企業當然還是要構建核心技術,但是想依靠核心技術壟斷行業是不太可能的。
人工智能企業還是要本著開放、共享的心態來做。一家人工智能公司能否實現長遠發展,關鍵在于能否正確理解人工智能,而不在于單一技術的領先。如果不能正確理解人工智能,也許可以活著,但是能走多遠能爬多高,可能就是一個問號。
推薦閱讀
在1月16日的晚間,由新浪微博與浙江衛視聯手舉辦的2016微博之夜盛典正式舉辦,該盛典匯聚了來自影視、綜藝、音樂、體育等各路明星大咖,眾星齊聚一堂共同對2016年年度>>>詳細閱讀
本文標題:不要高估AI技術,忽悠大眾誤國誤民
地址:http://www.xglongwei.com/a/05/301940.html