百度大脑语言与知识技术全布局,三大技术产品重磅发布

作为百度AI多年技术积累和商业实践的结晶,百度大脑已经发展成为全球领先的人工智能平台。 12月28日,百度创造AI开发者大会“百度大脑论坛”召开。本次论坛聚焦打造人工智能时代的驱动引擎语音数字编码技术思维导图,带来百度脑语言与技术、语音与视觉等技术产品的发布,以及飞桨在开源算法模型、工业-级模型库和企业级AI应用新升级等。

百度脑语言与知识技术布局,三大科技产品发布

百度技术委员会主席吴华在论坛上表示,经过11年的发展,百度已经形成了完整的语言和知识技术布局,包括知识图谱、语言理解与生成技术、应用系统等。随后,吴华带来了三大技术产品的发布:全球首个知识增强超模鹏程-百度文心、全球最大中文跨模态生成模型ERNIE ViLG、首个百亿参数中英文对话前置机-training 生成模型 PLATO-XL 在知识增强型大型模型、跨模态文本和图形生成以及人机对话等领域取得了领先地位。

尤其是全球首个千亿知识增强大模型鹏城——百度文信,得益于鹏城实验室的“鹏城云脑II”算力系统和飞桨深度学习平台的实力联手,解决了超大型模型训练中公认的许多技术问题,大大提高了训练效率,提升了模型效果。鹏程-百度文心在机器阅读理解、文本分类、语义相似度计算等60多项任务中取得最佳成绩,在30多项小样本和零样本任务上刷新了基准。

基于百度的语言和知识技术,百度还为各行业开通了语言和知识开放平台。不仅包括开源数据集“千言”和知识生产平台“解语”,还开发了面向应用的能力引擎平台和知识中台,以及智能文档分析平台、智能对话定制平台、智能创作平台、翻译开放平台和内容审核平台等场景定制平台。

百度语音技术重大进展,新版SMLTA2

语音和语言本来就更接近,所以语音识别模型和语义模型融合后,准确率和交互成功率会大大提高。百度语音首席架构师贾磊介绍了百度多模态语音交互的最新进展。百度提出的基于历史信息抽象的流式截断Confomer建模技术SMLTA2,解决了传统自相关技术在长句识别中的计算爆炸问题和存储爆炸问题,也很好地解决了注意力模型。焦点丢失问题。

SMLTA2通过Decoder到Encoder的每一层的attention特征选择机制引入反馈,使得最外层的识别结果信息可以直接作用于encoder内部每一层的编码过程,通过历史信息抽象充分提取有效特征信息,显着改善了 Transformer 模型从 NLP 应用到语音识别所面临的各种问题。 SMLTA2的这种新的端到端建模方法是对传统Encoder-Decoder结构的端到端建模的结构创新。

最后,贾磊还介绍了SMLTA的实际商业实现。浦发银行已在全国多个营业厅推出语音交互系统。其中,上海外滩银行分行语音交互识别率达到93.51%,语音交互由完全不可用变为基本可用。

智能视频创作,计算机视觉的最新实践

百度视觉技术部总监丁二瑞重点介绍了计算机视觉在智能视频创作方面的最新进展。现阶段,视频内容制作正在从UGC(User Generated Content)向AIGC(AI Produced Content)转变。

智能视频创作是多种技术交叉集成的领域。对于创作者来说,同时掌握视觉生成、多模态和3D图形是不现实的,但百度的智能视频制作技术兼顾了内容创意和视频功能。创作不仅实现了人脸、人体的精细处理和环境的重塑,而且在创作方式上对现有视频进行了改进,获得了新的视频,保证了视频的充分展示和分发。

图片[1]-百度大脑语言与知识技术全布局,三大技术产品重磅发布-老王博客

丁二瑞表示,目前智能视频创作领域正处于蓬勃发展的态势。技术的发展带来了生产工具的变化。一旦与其他生产要素相结合,就会带来无穷无尽的想象。

飞桨行业级平台升级,AI应用门槛更低

除了技术融合创新,在工具和平台方面,飞桨从开源算法模型、工业级模型库、企业级AI应用开发等方面进行升级,持续降低AI门槛应用程序。

百度杰出架构师毕然分享,目前百度桨正式支持的行业级开源算法模型已超过400个,涵盖计算机视觉、自然语言处理、语音和推荐等多个深度学习应用领域。这种全面的覆盖范围使开发人员能够快速找到他们需要的模型。并且这些工业级模型库支持训练和部署的全过程,开发包支持灵活的配置和调优。

毕然还详细介绍了飞桨最新推出的工业实践示例库。针对实际工业场景中的AI应用,示例库提供完整的代码实现,涵盖了工业实现的全流程,包括任务分析、算法选择、模型训练与优化、推理部署、结果可视化,让开发者快速上手和使用他们学到的东西。

百度智能云AI产品研发部总监周欣介绍了飞桨企业版AI开发双平台EasyDL和BML在帮助开发者快速提升AI开发效率和资源利用率。

目前,Paddle 企业版已成为应用最广泛、应用最广泛的 AI 开发平台。基于双平台开发模式,同时满足AI应用开发者和AI算法开发者的需求。 Paddle企业版基于Paddle推理部署工具链,为开发者测试验证了9345个模型芯片组合,可覆盖95%的适配需求,为开发者节省97%的自适应开发时间。 PaddleSlim结合全自动模型组合压缩算法,在精度损失控制在1%以内的情况下,推理性能提升3~5倍;智能边缘控制台的引入大大提高了模块和系统集成的效率,集成周期可以从几天缩短到五分钟。

百度知识图谱部、大数据部高级总监朱勇详细介绍了百度自建的工业数据智能引擎如何降低人工智能在工业领域的应用门槛。

朱勇表示,随着产业数字化进程的深入,大数据的应用趋势逐渐从商业数据向数据智能化发展。工业数据智能前景广阔,机遇与挑战并存。百度基于领先的人工智能大数据技术,打造了一整套面向工业场景的工业数据智能引擎。向下对接大数据平台,实现数据治理,向上支持各类业务场景语音数字编码技术思维导图,赋能电力、钢铁、化工、汽车制造等不同行业。百度工业数据智能引擎的核心是一系列可复用的工业模型和支持定制化模型构建的核心组件,包括数据分析、数据处理、AI算法和工业机制。

以钢铁行业为例,为了保证镀锌板良好的力学性能,需要根据钢板的原材料信息调整镀锌工艺参数。基于百度工业数据智能引擎,机械性能预测准确率达90%以上。通过工艺参数优化,产品合格率可达99%。通过应用该方案,企业客户不仅可以提高产品质量,而且与传统的基于人工经验的方法相比,可以大大减少调试时间,从而提高生产效率。

最后,朱勇强调,在大数据和人工智能加速向行业渗透的背景下,工业数据智能化的未来前景广阔。百度期待与更多开发者合作,共同助力产业智能化升级。

接下来,百度大脑将不断进化,不断推动人工智能技术的进步。通过融合创新,人工智能能力会越来越强。同时,降低人工智能应用门槛,让技术更容易落地,帮助越来越多的行业和企业利用人工智能提高效率,创造价值。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论