实时音视频云升级后的智能语音识别方案将新增阿里云

全球领先的实时音视频云PaaS服务商Agora近日宣布,其“一站式智能语音识别解决方案”将进行升级。新增了两家新的智能语音识别服务商依图和阿里云。通过整合行业前3大服务商的语音识别技术优势,帮助直播、语音聊天室等互联网平台更智能、高效地识别语音中的色情、色情、色情内容。政治、广告等不良信息,实现平台网络环境的全面深度净化。

近年来,随着直播、短视频、语音社交等行业的快速发展,用户创作的UGC内容已成为互联网内容生态的重要组成部分,丰富了人们的互联网生活。另一方面,随着来自用户的UGC内容越来越多,色情、政治、不良广告等违法违规内容也频频出现,成为“害群之马”,给众多平台带来风险。同时,相比图文和视频,音频审核本身在技术上难度更大,增加了平台侧的内容审核压力。

去年 8 月,Agora 推出“一站式智能语音识别解决方案”声音识别算法源代码,为企业提供集实时音视频、实时录音和实时智能语音识别于一体的一站式服务,接入到语音识别服务。数美科技的“天境”智能语音审核系统,通过声纹检测、语音识别等技术,智能识别语音环境中的色情、政治、广告等违法信息,得到了众多企业的好评。

升级后的“一站式智能语音识别解决方案”,对接阿里云和依图科技先进的智能语音识别技术,整合行业前3大智能语音识别服务商的技术优势,为当前互联网行业提供服务。最全面、最高效的智能语音识别技术。比如数美科技的“天经”智能语音识别,基于深度学习语音识别技术,多维度智能实时审计。

深挖场景需求,为视频直播、UGC短视频、FM广播、语音广场、语音直播间等多种场景提供智能内容过滤服务,通过语音识别转文字的方式,识别文字内容中的政治和广告内容。不良信息;业界首创喘息语音识别,基于Bi-GRU和AttenTIon模型,可准确识别声音中的喘息、呻吟、耳鸣、喊叫等非法音频,准确率达90%以上。“声纹识别与检索比对”技术可以对声纹进行聚类关联,发现线上线下的语音广告和欺诈行为。

依图科技深耕公安领域多年。依托世界级算法团队研发的语音识别、自然语言理解和声纹算法,依图“智能语音审计”具备准确、快速、经济三大特点。精准——依托世界一流的算法能力和现有场景数据的螺旋式迭代提升,依图的召回率和准确率处于行业前列,帮助企业将风险降到最低。快速 – 实时监控并在 3 秒内返回结果。省时——同步返回高精度转录文本和非法音频片段,帮助人工审稿人提高效率,节省时间。

Agora“一站式智能语音识别解决方案”可以为企业提供实时音视频+实时录音+实时智能语音识别的一站式高度集成服务。三大技术解决方案的视频服务商。使用声网的一站式服务,企业无需部署额外的SDK,无需对接CDN厂商,无需支付流媒体费用,即可同时上线直播(实时音视频)和色情(实时语音识别)功能,帮助企业大幅节省接入成本,真正做到一站式便捷接入。

在智能语音识别方面,Agora整合了行业TOP3智能语音识别服务商的技术优势。在实时音视频功能方面,SoundNet构建的软件定义实时网络SD-RTN为实时音视频业务提供SLA/QoS质量保证,可为企业提供高并发、高可靠性,低延迟和抗弱点。具有互联网等功能的实时音视频技术。

Agora 目前在全球拥有 250 多个数据中心。在网络架构设计上,可应对10倍以上的负载,并具备千万级并发能力。SoundNet的软件定义实时网络SD-RTN具有超低时延特性,可实现全球端到端时延小于400ms,中值时延76ms,行业领先。SoundNet还拥有优秀的弱网传输和抗丢包算法,可以在60%丢包的环境下保证音视频流畅,在70%的网络丢包环境下保证语音流畅。在终端性能和适配方面,声网针对实时互联网最后一公里做了深度优化。目前已适配6000多台终端设备,网络覆盖全球200多个国家和地区,即使在偏远山区或网络环境较差的跨国国家。用户也可以在场景中流畅交互。

此外,针对语音识别中常见的噪声、背景音等音质问题,SoundNet的一站式智能语音识别解决方案还集成了SoundNet Agora语音引擎和AI音频降噪算法,可提供基于原算法的不良信息识别率有效提高30%以上。

Agora“一站式智能语音识别解决方案”可以帮助企业严格有效地净化平台内容质量,降低监管风险,提升用户体验,同时为企业显着节省接入成本。据了解,未来声音识别算法源代码,声网还将与更多业内知名的智能语音识别服务商合作,继续为企业提供业内最高效、最严格的内容审核机制,推动行业健康发展。网络生态。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论