CNML格式】 【 】 【打 印】 
【 第1頁 第2頁 第3頁 第4頁 】 
科大訊飛陷AI同傳造假疑雲
http://www.CRNTT.com   2018-09-22 15:48:57


 

  語音識別仍存瓶頸?

  在2017年,科大訊飛就曾表態:現階段人工智能技術發展不需要“被神化”。“目前,機器翻譯已經取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳以及高水平翻譯所講究的‘信、達、雅’還存在很大的差距。”

  對於人工耦合,江濤告訴21世紀經濟報道記者,科大訊飛的人工智能系統會結合聽和看的信息,也會針對關鍵詞進行解釋,相當於有一個助手在幫助譯者進行翻譯,降低了同傳口譯者的工作強度。而科大訊飛已經和上海外國語大學成立了研究院,探討人機協同模式。在本周的2018世界人工智能大會上,就有三個嘉賓發言採取了人工耦合的模式。

  應該說,科大訊飛在語音領域技術領先,但是仍面臨著不少瓶頸。

  首先從科大訊飛的產品技術方向來看,主要包括語音交互、機器翻譯、文本識別。其中,語音交互是科大訊飛的老本行,包括語音識別、語音合成等。另外,採用日趨成熟的自然語言理解,也為語音交互提供了更強的支撐。

  尤其是語音合成方面,科大訊飛在業界比賽中屢次奪冠。其通過機器學習提取聲音的特征,通過聲學波形合成出仿真聲音。該技術的難點之一,就是如何能夠騙過耳朵達到真人說話的效果。

  但是在技術成熟的同時,仍有難題需要攻克。比如,遇到同音字識別、環境比較嘈雜的情況以及中文和英文夾雜的時候,語音的識別率就會下降。

  劉慶峰在2018世界人工智能上表示,科大訊飛是全球唯一在語音合成中機器超過人工的公司,在安靜的環境下,演講主題確定的情況下語音準確率高,但是多人說話噪音環境下的識別率是關鍵。在他看來,通過大規模後台服務集群,語音識別正在走向實用。同時,用戶也對方言、多人說話、安全保護等方面提出了新要求。 


 【 第1頁 第2頁 第3頁 第4頁 】 


掃描二維碼訪問中評網移動版 CNML格式】 【 】 【打 印掃描二維碼訪問中評社微信  

 相關新聞: