搜狗翻译宝Pro利器:离线语音翻译、语音、翻译

2017年底以来,翻译机成为人工智能硬件的热门品类。搜狗是最早发布人工智能翻译机的公司之一。以语音和翻译为核心技术的人工智能硬件也成为搜狗的重点投资领域。

9月19日,搜狗全新AI翻译机搜狗翻译专业版正式上线。9月25日,搜狗召开媒体沟通会。搜狗CEO王小川也来到现场与媒体就搜狗翻译专业版进行了交谈。

搜狗翻译专业工具:离线语音翻译

搜狗翻译Pro有多种颜色可选,采用铝合金机身,手感不错。搜狗翻译专业版的主页面非常简洁,主要有语音翻译、照片翻译、录音备忘录三大功能模块。点击语音翻译后,可以选择要翻译的语言。雷锋网的编辑选择了中文翻译成英文。机身侧面有两个红色和蓝色按键。按住蓝色按钮开始录制,红色按钮播放翻译结果。

搜狗翻译专业版在线翻译支持42种语言的实时互译,不仅支持中文与其他41种语言的互译微软翻译不能保存离线语言,还支持42种语言的互译;离线翻译支持中、英、日、韩4种语言。

很多人第一次接触搜狗翻译专业版产品的时候,都会觉得很惊艳,主要是语音技术和翻译技术的结合所产生的火花。如果你想把你说的中文翻译成英文,你只需要在搜狗翻译Pro上将中文设置成英文,然后记录你说的中文,搜狗翻译Pro会自动翻译成英文朗读出来。以前,使用翻译软件需要手动输入文本。在获得翻译结果后,用户也会面临无法阅读翻译结果的问题。语音识别技术和语音合成技术让 Translator 更像是一个个人便携式翻译器。您只需要自然地说话即可完成跨语言交流。

目前,手机上的在线翻译软件也实现了自然会话翻译。但搜狗翻译专业版有其独特的价值:离线翻译。离线AI翻译和离线语音技术是手机硬件难以攻克的两座堡垒。

翻译机的流行其实源于人工智能翻译技术的进步。2016年9月,谷歌推出神经网络翻译,颠覆了原有的统计翻译方式,大大提升了机器翻译的质量。2016年11月,搜狗推出神经网络翻译技术,并持续迭代技术。2017年7月,升级为Transformer-NMT机器翻译。2017年5月,搜狗参与全球顶级机器翻译评测WMT,获得全球首个汉英机器翻译。

神经网络翻译需要极高的计算能力。由于手机硬件达不到要求,主要还是靠云端的能力。一旦手机没有网络,就无法使用AI翻译。搜狗翻译专业版是为AI翻译定制的硬件,其所有硬件能力都用于支持离线AI翻译。搜狗第一代旅游翻译宝已经使用离线Transformer-NMT机器翻译。

据雷锋网报道,微软、谷歌等公司也在试验离线神经机器翻译技术,将深度学习模型压缩到手机可以管理的大小。不过,在王小川看来,手机支持的离线神经机器翻译技术与翻译机之间还有相当大的差距,手机还无法做到离线语音识别和语音合成。

除了离线AI翻译,离线语音识别和语音合成是手机硬件尚未跨过的另一个门槛。搜狗目前的语音识别准确率已经达到97%,线上和线下的语音识别模型几乎一致。语音识别是语音翻译的第一步,其重要性可想而知。只有准确的语音识别才能保证正确的后续翻译。如果识别出一个错误的单词,很可能整个句子的翻译都会出错。如此高精度的语音识别模块目前还无法在手机上实现。

雷锋网小编现场体验了搜狗翻译专业版的在线汉英翻译和离线汉英翻译,很难感受到两者在语音识别、翻译速度和准确率方面的差异。

图片[1]-搜狗翻译宝Pro利器:离线语音翻译、语音、翻译-老王博客

屏幕很重要

搜狗翻译专业版采用3.1英寸高清触摸屏。在一些人看来,翻译者不需要是屏幕。设计触摸屏和手机有什么区别?不过从体验上来看,大屏确实是必须的。

如前所述,语音识别在整个语音翻译中起着决定性的作用。用户保证翻译准确性的一个重要步骤是从屏幕上确认语音识别结果的准确性。如果语音识别结果准确,那么翻译就不会太错误。.

此外,屏幕对于照片翻译至关重要。目前只有少数翻译机具备照片翻译功能。在日常的语言翻译需求中,除了对话,图片中的内容也占有很大的比重,比如:路牌、菜单、印刷品、网络内容等。

搜狗翻译专业版的图片翻译采用了搜狗自主研发的OCR图像识别技术,可以识别出图片中包含的文字内容,然后通过断字和分句进行翻译。OCR技术可以应对光线、曲面、角度、透视、畸变等拍照条件,可以覆盖多种场景。还可以理解图片的排版,将翻译后的内容按照原图的排版和格式呈现出来,方便查看。

从出境游拓展到更多场景

2018年3月,搜狗发布了AI翻译机——旅行翻译,专注于海外旅行的语音翻译。近年来,中国出境旅游人数逐年增加。2017年出境旅游人数突破2000万人次,是一个巨大的市场。第二代AI翻译机的名字去掉了“旅行”二字,专注于更多的场景,比如商务、英语教学、体育赛事等。王小川提到它原本叫“旅行翻译宝”有进入市场的时候有明确的定位和目标群体,但我们发现除了旅行之外,这款产品还有更广泛的需求。

搜狗翻译Pro的主要功能包括语音翻译、图片翻译、离线翻译、口语练习、录音笔记等。口语练习是搜狗翻译Pro拓展的另一个垂直领域。搜狗发现翻译器的产品是针对需要语言翻译的人群,而这个群体也需要语言学习。口语练习可以通过语音识别清晰的记录用户的发音,然后对比正确的发音,指出用户的发音问题。

9月17日,搜狗与中网举行合作新闻发布会,宣布搜狗翻译专业版成为中网唯一官方翻译。网球赛事已经成为搜狗翻译专业的新领域。

可以看到,搜狗翻译专业版的功能和场景都在不断的增加。这也带来了一个问题,搜狗翻译Pro会越来越像手机吗?有什么是搜狗翻译不会做的吗?王小川表示,搜狗翻译会一直专注于语音和翻译,不会做语音和翻译以外的事情,而是会选择手机无法实现的功能。

近两年,搜狗将AI作为长期战略方向,聚焦“自然交互”和“知识计算”两大方向,打造以语言为核心的人工智能。核心产品主要集中在输入法、搜索、同声传译和翻译。王小川透露,今年年底将会有三款出人意料的AI硬件发布,其中一款将具备同声传译功能。

王小川表示微软翻译不能保存离线语言,这三款AI硬件会给人耳目一新的感觉。对此,雷锋网将继续关注并跟进报道。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论