中評社北京1月16日電/1月15日消息,據百度矽穀人工智能實驗室(SVAIL)官方1月15日消息,百度已開源關鍵人工智能(AI)軟件 Warp-CTC,公開了關鍵代碼。對研究人員來說,該軟件可用於解決繪制輸入序列到輸出序列圖譜過程中的監督問題,如語音識別問題,外界預計這將推動人工智能產業的快速發展。
據悉,Warp-CTC是百度前期為了在最新的計算機芯片上更快速運行而專門研發的一種改良版深度學習算法。百度矽穀實驗室目前已向GitHub上傳了Warp-CTCC代碼庫,鼓勵開發者試用這些代碼。百度表示,代碼將開放給所有從業者。
CTC(鏈結式時間分類算法)方法始於2006年,在瑞士AI實驗室IDSIA的論文中有所描述。CTC結合了多個不同的神經網絡設計,以處理不完美的數據集。百度即在此基礎上開發了Warp-CTC,用於提升語音識別能力。
百度稱,SVAIL工程師在打造端對端語音識別系統時開發了Warp-CTC,目的是要通過CTC來改善培訓模型的可擴展性。“我們發現,可用的CTC技術通常需要更多的內存和,或是幾十到幾百倍的減速。”
百度表示,希望此次開源能促使端到端的深度學習變得更簡單、速度更快,加快研究者的進度,進而對機器學習領域的進步做出貢獻。
部分代碼被用於開發一款深度語音識別系統Deep Speech 2。對於一些簡短的句子,該系統比大多數人類更善於正確地識別語音。該技術使百度數億用戶可以更好的訪問其服務,尤其是在移動端。在智能手機上輸入漢字較為複雜,中國很多人已經習慣用語音來發送短信或在網上搜索信息。
分析人士指出,深度學習使計算機可以執行各種“用腦”的學習型操作,如精致地轉錄語音或識別物體圖像。也就是說,一個大型模擬神經網絡中導入特定字詞的音頻或特定物體的圖像,隨著時間推移,此網絡將不斷“學習”以識別幾乎任何新的例子。
(來源:騰訊娛樂) |