介紹
此次由百度與中科院自動化所、計算所、浙江大學、哈爾濱工業大學、清華大學等共同研發的“基于大數據的互聯網機器翻譯核心技術及産業化”項目,突破了機器翻譯領域内的四大技術難題
(1)提出基于大數據的互聯網機器翻譯模型,快速響應高負荷翻譯需求;
(2)基于大數據的翻譯知識獲取,克服語言數據噪聲問題;
(3)通過深度語義分析和翻譯技術,解決語言語義歧義問題;
(4)提出樞軸語言機器翻譯技術,實現了稀缺語種的多語言翻譯。
在技術應用方面,百度機器翻譯目前在全球擁有超過5億用戶,支持的中文、英文、西班牙語、日語、韓語、法語、俄語等27個語種在全球覆蓋超過47億人口,同時支持上萬家第三方應用,服務海量用戶、惠及人們的日常生活,因此有專家指出,它是今年國家科學技術獎中覆蓋全球人數最廣、對人們工作和生活最具實用價值的項目之一。
發展
百度技術副總裁、機器翻譯項目負責人王海峰表示:“破除語言壁壘是互聯網時代的用戶剛需,能更好地把人和多語言的信息和服務連接起來。也許三五年後,看似高大上的機器翻譯會融入日常生活的方方面面,而機器翻譯産業浪潮也将達到全新高度。”



















