清华大学发布机器中文语言能力评测基准“智源指数”

12月30日,由清华大学孙茂松教授带领的团队在北京发布了机器汉语水平基准“智源指数”。CUGE宋佳 摄

中新网北京12月31日电 (宋佳)北京致远人工智能研究院自然语言处理(NLP)主要研究方向前沿技术开幕日,清华大学教授孙茂松领衔的团队发布了机器汉语水平评估基准“知识来源指数”(CUGE)。

团队代表31日对媒体表示,在人工智能大模型时代,评估基准已成为大模型发展的风向标。从扁平化到综合体系,从简化到多维,“致远指数”旨在尝试设计一种新的“试卷”,对大模型评价的综合能力进行综合评价。

具体来说,“智源指数”根据人类语言测试大纲和NLP研究现状,在“语言能力-任务-数据集”的层次框架中选择和组织数据集,涵盖7种重要语言能力、17种主流NLP任务和 19 个代表性数据集。在评分策略方面,“智源指数”提供了不同级别的模型性能评分。

为推动“致远指数”共建共享,提高易用性,团队同时发布了在线评价平台和公开排行榜pta平台c语言测试答案,并表示将“定期吸纳最新和优秀的数据集”和“构建面向用户的数据集”。以及评价结果的反馈和讨论机制,打造中国优质数据集社区”。

图片[1]-清华大学发布机器中文语言能力评测基准“智源指数”-老王博客

北京语言大学教授、国家语言文字委员会原副主任李玉明认为,这些举措将推进汉语信息处理,促进汉语在人类社会中发挥更大作用。

中国工程院院士、中国人工智能学会理事长戴琼海也表示,孙茂松教授与致远NLP学者共同建立的成果,对中文信息处理乃至人类信息处理的发展具有重要意义。中国的人工智能。

除了“知源索引”,本次开放日还开展了“自然语言处理评价中的问题与对策”、“迈向通用连续知识库”、“文本释义生成”等研究成果的定期汇报。涵盖了预训练模型、知识计算、人机对话、文本生成等十多个关键的NLP科学研究问题。

据介绍,在致远研究院的支持下,自然语言处理主要研究方向的学者团队正在积极探索自然语言处理的新格局。在落地应用方面,由清华大学李娟子教授团队构建的“多式联运北京旅游知识图谱”可以为路线规划、景区信息查询等功能提供数据支持,还可以为游客规划旅游行程。

在预训练大模型方面,为了突破预训练语言模型计算成本高、设备要求高、应用适配难等问题,清华大学刘志远副教授提出了一种全流程高效计算PLM 框架pta平台c语言测试答案,并在此框架的基础上构建了以中文为核心的超大规模预训练语言模型 CPM-2。

作为具有代表性的创新研究院,致远研究院致力于通过构建协作社区,为未来的研究构建计算和数据平台。研究所于2019年4月启动“致远学者计划”,支持学者在人工智能数学基础、人工智能认知神经基础、机器学习、自然语言处理等研究方向自由探索。这个计划也尊重年轻人才带头做主角。(完)返回搜狐看更多

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论