介绍
此次由百度与中科院自动化所、计算所、浙江大学、哈尔滨工业大学、清华大学等共同研发的“基于大数据的互联网机器翻译核心技术及产业化”项目,突破了机器翻译领域内的四大技术难题
(1)提出基于大数据的互联网机器翻译模型,快速响应高负荷翻译需求;
(2)基于大数据的翻译知识获取,克服语言数据噪声问题;
(3)通过深度语义分析和翻译技术,解决语言语义歧义问题;
(4)提出枢轴语言机器翻译技术,实现了稀缺语种的多语言翻译。
在技术应用方面,百度机器翻译目前在全球拥有超过5亿用户,支持的中文、英文、西班牙语、日语、韩语、法语、俄语等27个语种在全球覆盖超过47亿人口,同时支持上万家第三方应用,服务海量用户、惠及人们的日常生活,因此有专家指出,它是今年国家科学技术奖中覆盖全球人数最广、对人们工作和生活最具实用价值的项目之一。
发展
百度技术副总裁、机器翻译项目负责人王海峰表示:“破除语言壁垒是互联网时代的用户刚需,能更好地把人和多语言的信息和服务连接起来。也许三五年后,看似高大上的机器翻译会融入日常生活的方方面面,而机器翻译产业浪潮也将达到全新高度。”



















