依图、阿里云重磅加入,智能语音识别方案升级近年来

近期,我们的“一站式智能语音识别解决方案”将进行升级。升级后,将在原有合作伙伴“数美科技”的基础上,新增依图和阿里云两家智能语音识别服务商。通过整合行业前3大服务商的语音识别技术优势,助力直播、语音聊天室。等互联网平台更加智能高效地识别语音中的色情、政治、广告等不良信息,实现平台网络环境的全面深度净化。

依图、阿里云加入,智能语音识别解决方案升级

近年来,随着直播、短视频、语音社交等行业的快速发展,用户创作的UGC内容已成为互联网内容生态的重要组成部分,丰富了人们的互联网生活。另一方面,随着来自用户的UGC内容越来越多,色情、政治、不良广告等违法违规内容也频频出现,成为“害群之马”,给众多平台带来风险。同时,相比图文和视频,音频审核本身在技术上难度更大,增加了平台侧的内容审核压力。

去年 8 月,Agora 推出“一站式智能语音识别解决方案”,为企业提供集实时音视频、实时录音和实时智能语音识别于一体的一站式服务,接入到语音识别服务。数美科技的“天境”智能语音审核系统,通过声纹检测、语音识别等技术,智能识别语音环境中的色情、政治、广告等违法信息,得到了众多企业的好评。

升级后的“一站式智能语音识别解决方案”新增接入阿里云和依图科技先进的智能语音识别技术,并整合行业前3大智能语音识别服务商的技术优势,为当前互联网用户提供智能语音识别服务。业界最全面、最高效的智能语音识别技术。比如数美科技的“天经”智能语音识别,基于深度学习语音识别技术,多维度智能实时审计。深挖场景需求,为直播视频流、UGC短视频、FM电台、语音广场、语音直播间等多种场景提供智能内容过滤服务。广告和其他不良信息;业界首创喘息语音识别,基于Bi-GRU和Attention模型,可准确识别包含喘息、呻吟、耳鸣、喊叫等非法音频的声音,准确率达90%以上。“声纹识别与检索比对”技术可以对声纹进行聚类关联,发现线上线下的语音广告和欺诈行为。

依图科技深耕公安领域多年。依托世界级算法团队研发的语音识别、自然语言理解和声纹算法,依图“智能语音审计”具备准确、快速、经济三大特点。精准——依托世界一流的算法能力和现有场景数据的螺旋式迭代提升,依图的召回率和准确率处于行业前列,帮助企业将风险降到最低。快速 – 实时监控并在 3 秒内返回结果。省时——同步返回高精度转录文本和非法音频片段,帮助人工审稿人提高效率,节省时间。

打通实时音视频+智能语音识别+AI,企业一站式接入

Agora“一站式智能语音识别解决方案”可以为企业提供实时音视频+实时录音+实时智能语音识别的一站式高度集成服务。三大技术解决方案的视频服务商。使用声网一站式服务,企业无需额外部署SDK、自行对接CDN厂商、无需支付流媒体费用,即可同时上线直播(实时音视频)和黄鉴(实时语音识别)功能,帮助企业大幅节省接入成本,真正实现一站式便捷接入。

在智能语音识别方面,Agora 整合了行业前 3 名智能语音识别服务商的技术优势。在实时音视频功能方面声音识别算法源代码,自建软件定义实时网络SD-RTN?为实时音视频业务提供SLA/QoS质量保证,可以为企业提供高并发、高可靠、低时延和防腐败。具有弱网络等特点的实时音视频技术。

Agora 目前在全球拥有 250 多个数据中心。在网络架构设计上,可应对10倍以上的负载,并具备千万级并发能力。SoundNet的软件定义实时网络SD-RTN™具有超低时延,可实现全球端到端时延小于400ms,中值时延76ms,行业领先。SoundNet还拥有优秀的弱网传输和抗丢包算法,可以在60%丢包的环境下保证音视频流畅,在70%的网络丢包环境下保证语音流畅。在终端性能和适配方面,声网针对实时互联网lastmile做了深度优化。目前已适配6000多台终端设备,网络覆盖全球200多个国家和地区,即使在偏远山区或网络环境较差的跨国场景。用户还可以实现流畅的交互。

此外,针对语音识别中常见的噪音、背景音等音质问题,SoundNet的一站式智能语音识别解决方案还集成了SoundNet Agora语音引擎和AI音频降噪算法,可以在去除背景音和环境音后提供. 在原有算法的基础上,有效提升不良信息识别率30%以上。

Agora“一站式智能语音识别解决方案”可以帮助企业严格有效地净化平台内容质量,降低监管风险,提升用户体验,同时为企业显着节省接入成本。据了解,未来,声网还将与更多业内知名的智能语音识别服务商合作,继续为企业提供业内最高效、最严格的内容审核机制声音识别算法源代码,推动行业健康发展。网络生态。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论