科大讯飞输入法新版上线手写、语音识别均可“离线化”

离线模式包括完全离线的拼音、语音和手写输入。

近日,讯飞输入法新版本上线,讯飞正式推出一套离线输入法,包括完全离线的拼音、语音和手写输入,更好地保护用户数据安全。

根据《信息安全技术移动互联网应用(应用程序)收集个人信息的基本规范》,输入法应用程序为用户提供键盘、手写、语音等输入字符的服务。此类服务必须遵守知情同意和最低必要原则,明确基本服务功能无需个人信息即可使用。

其他类型的互联网应用程序也是如此。近期,国家对互联网平台非法收集用户个人信息的处罚越来越严,多家互联网企业被下架进行网络安全审查。未来,将个人数据的控制权交给用户将成为互联网应用的主流趋势。

拼音输入、手写、语音识别都可以“离线”

据悉,在新版科大讯飞输入法中,手写和拼音输入都可以“离线”,用户打字数据不会传输到互联网上。同时,该版本还将“离线”AI能力,既保证了智能体验,又解决了用户数据安全问题。

比如在离线语音输入方面,新版科大讯飞输入法升级了AI语音识别模型。在非联网环境下,没有云端数据传输,手机本地解码可以为用户提供文字转文字服务,可以满足任何场景的需求。需要语音输入。用户还可以通过设置选择启用或禁用离线语音输入。

未来,科大讯飞将广泛“本地化”更多OCR识别、智能翻译等AI功能。

值得一提的是,新版科大讯飞输入法还推出了“基础输入”模式,无需上传任何数据即可流畅输入。同时,用户可以使用皮肤、表情等功能,尽可能保证输入体验。如果想要获得更多样化的输入体验,享受更智能的服务,用户可以通过【全部设置】-【隐私设置】-【使用方法】-开启完整体验。对于“完整体验”的设计,科大讯飞也将严格把关输入法,并明确列出系统权限的使用说明。

行业领先的人工智能能力

在AI能力方面10系统没有输入法,科大讯飞输入法一直走在行业前列。

讯飞输入法AI功能包括智能语音输入、智能OCR识别、智能翻译等方面。

智能语音输入是识别用户的语音并自动输入文字。目前科大讯飞输入法语音输入可以做到1分钟400字。

为提升识别准确率,科大讯飞不断深耕语音识别领域,在通用语音识别率98%的基础上取得重大突破。

在扎实的技术支持下,科大讯飞输入法还支持粤语、川语、东北语、闽南语等23种程序的识别,以及英、日、韩、俄等多国语言输入。

科大讯飞输入法除了提升正常语音条件下的识别率外,通过结合耳语识别等技术,在软语音、噪声等复杂环境下也能保持较高的识别率。

此外,科大讯飞的语音输入还可以在PC端进行操作,支持23种方言、3种国家语言和4种外语,还支持跨屏操作:手机充当电脑麦克风,使用时手机语音输入,可以在电脑屏幕上快速打字。

图片[1]-科大讯飞输入法新版上线手写、语音识别均可“离线化”-老王博客

在手写识别方面,科大讯飞基于空间注意力机制的端到端思想,独家打造了OCR识别引擎,支持汉字2万余种、英文52种、英文10余种。阿拉伯数字和100多个特殊符号。行书、草书、生字、数字符号等均可识别并转换为电子文档。

此外,科大讯飞输入法还扩展了机器视觉技术,在传统OCR文字识别的基础上增加了照片翻译、手写宣传识别等功能,甚至可以智能校正数学运算。

翻译方面,据了解,凭借自主研发的核心翻译技术和大数据的深度挖掘,科大讯飞输入法同声传译可支持日文、韩文、西班牙文、泰文、越南文、德文、法文、俄文等国家. 主流语言与中文的即时翻译。

科技的发展也是为了服务更多的人。在这些人工智能技术的支持下,科大讯飞输入法成为国内最早适配无障碍功能的应用之一。残障人士为互联网世界铺平了“盲道”。

科大讯飞输入法在无障碍模式下做了很多适配。以安卓用户为例。如果用户进入安卓系统【设置】-【辅助功能】-【屏幕阅读器】使用TalkBack服务,科大讯飞输入法会提供语音反馈。

在语音指令下开启无障碍模式后,科大讯飞输入法的输入面板、菜单面板和表情面板可以按需朗读。即使视力受损,您也可以打字。用户可以知道输入结果是否准确,可以进行修改。

此外,在无障碍模式下,用户可以开启文字扫描功能,对图片或文字进行拍照,文字瞬间提取,识别的文字语音播报,让视障人士知晓。值得一提的是,科大讯飞输入法也是第一款通过中国盲人协会认证的输入法产品,并获得了中国盲人协会颁发的无障碍认证证书。

11年征程,“用人工智能建设更美好的世界”

科大讯飞输入法自2010年成立以来,已经走过了11个年头。

2010年10月28日,全球首款基于云计算的语音输入法——科大讯飞输入法正式发布;

同年,科大讯飞人工智能研究院将GMM-hmm-Hidden Markov模型应用于语音识别系统。通过使用WFST解码器,改进了复杂语言模型,识别率达到了70%。

2012年10系统没有输入法,科大讯飞在输入法中使用深度神经网络技术,将全球首个中文云识别DNA引入产品,语音识别率骤然提升至80%。2018年,科大讯飞再次开始使用HybridCNN算法,通过结构优化大幅提升并发通道数,语音识别准确率超过98%。

2020年,科大讯飞在产品中加入了动态自适应编解码语音识别引擎,进一步实现了多模态输入和现场个性化识别。

疫情期间,科大讯飞在10天内上线了武汉方言转国语功能。

除了方言,科大讯飞输入法继续开发“个性化语音”功能。2012年,在业界首创个性化语音识别,让用户可以将本地人名、专业词汇和独特词上传到云端的机器学习中。用户下次说出这些单词时,科大讯飞输入法就能识别出对应的单词。

如今,在5G和Alot技术的背景下,科大讯飞输入法也在不断完善,以适应人机交互和万物互联的世界。科大讯飞输入法此前推出的版本10.0,搭载了“动态自适应编解码语音识别引擎”。新增的唇形辅助输入可以提高识别嘈杂环境和近距离多人语音的效果。

该版本还对领域词识别进行了优化,在游戏、医疗、旅游、购物等不同场景下,可以更准确地匹配词汇。除了语音功能边界的扩展,科大讯飞输入法10.0版还基于“自由切换”的理念,实现了英文单词的连续手写,即中文都可以手写字符和完整的英文单词直接在输入面板上。.

这个完全离线版本的出现,表明科大讯飞输入法在开发技术的同时,也注重保护用户的数据和隐私,真正为用户考虑更多。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论