登录

快速注册

以翻译为跳板,网易有道将推出语音助手及智能音箱

作者:雷锋网 时间:2018/04/01 阅读:2790
有道在外界的印象往往是“词典”与“翻译”,但在3月30日下午深圳的网易有道技术开放日上,这家公司出人意料的透露 […]

有道在外界的印象往往是“词典”与“翻译”,但在3月30日下午深圳的网易有道技术开放日上,这家公司出人意料的透露,已经在开发语音助手,今年5月会有产品发布。

这次以AI为主题的开放日上,有道介绍了神经网络翻译技术,OCR技术,以及有道智云的相关进展及解决方案。有道的AI翻译解决方案分于基于视觉交互和语音交互的解决方案两类,而语音助手就被“藏”在了语音解决方案之中。

有道词典产品技术负责人林会杰告诉雷锋网,之所以做语音助手,是发现有用户在使用有道翻译官这一产品时,会将它当作一个可以理解自己表达的助手,而非仅仅是一个翻译工具。有道翻译官APP可以识别语音并即时翻译。

比如,面对一个翻译工具,你会说一句话让其全部翻译出来,而面对一个助手,你会说“翻译一下XXXX这句话”,并且只想要部分内容被翻译出来。

根据有道工作人员的介绍,与其它同类产品一样,有道的语音助手也会有智能问答、生活查询、智能翻译、日常闲聊、多语言理解,以及自然语言指令控制等功能。不过在现场的演示中,有道的语音助手还不是一个成型的产品,只是显示了一个简单的交互界面。

展开剩余60%

林会杰表示,今年5月会发布关于语音助手的更多详细情况,并且还会推出一款硬件。他也向雷锋网确认,这款硬件会是音箱。

网易做语音音箱并不奇怪,与阿里、腾讯一样,网易云音乐与网易新闻让其并不缺少内容,更何况在今年2、3月,网易云音乐还分别与腾讯音乐及阿里音乐达成版权互相转授权合作,内容库更为丰富。但由有道来做确实挺令人意外,至少与外界对它一直以来的形象不相符。

除了语音助手外,网易也公布了其在神经网络翻译,OCR技术,有道智云方面的进展。

有道翻译在2008年上线,2017年升级为神经网络模型,并在同年升级为有道智云,向外输出翻译技术和解决方案。有道的神经网络翻译在过去一段时间的主要进展有下面几个方面:

有道智云还集成了OCR技术,其在拍照翻译这样的应用中十分重要。有道表示,目前其OCR技术已经识别超过72亿张图片,支持17种语言,并支持离线识别,其中在线识别可以达成99%的请求耗时650ms,而离线模型在20M内,平均1.2秒即可识别出结果。

另外,有道对文字的方向、角度,以及文档结果都做了诸多优化,并能做到无需指定语言即可识别,而且支持多语言混合识别。未来,有道的OCR技术还将支持公式识别,面向教育场景(比如选择题、填空题和数学推理等)进行优化,还会针对手写板提供智能批改、错题整理等服务。

将上面的两项技术打包在一起,有道提供有基于视觉交互和基于语音交互的两种翻译解决方案。视觉交互方案主要包括:

语音翻译则可以做到实时识别与翻译,并对中式英语进行了特别的优化。

有道一位工作人员告诉雷锋网,现在其已经有1000多名员工,而且是网易内部AI能力最强的团队,其AI业务的重点还是以翻译为基础,逐步扩展在教育领域的应用和解决方案。



标签:

发表回复


copyright © www.scitycase.com all rights reserve.
京ICP备16019547号-5