Alphabet媒体报道开源释出可撰写TensorFlow库TRFL强化学习(图)

新浪科技讯 10 月 19 日下午消息,据中国台湾媒体报道,Alphabet 的 AI 子公司 DeepMind 周四开源并发布了 TRFL,这是一个可以编写 TensorFlow 强化学习(RL)代理的库。

DeepMind 指出,TRFL(读作 truffle)汇集了公司内部开发代理的所有重要算法元素,例如 DQN、DDPG 和重要性加权演员学习者架构。TRFL 目前可在 GitHub 上下载。

一个典型的强化学习代理由许多交互元素组成,例如环境和一些代表价值或策略的深层网络,以及该环境的学习模型、伪奖励函数或回放系统。这些组件的交互非常巧妙易语言组件代码编辑框指示器,以至于在大型计算图中不太可能发现错误。Open AI 最近分析了强化学习代理最流行的开源实现,发现 10 个代理中有 6 个存在社区发现并得到作者确认的小缺陷。

图片[1]-Alphabet媒体报道开源释出可撰写TensorFlow库TRFL强化学习(图)-老王博客

解决上述问题和辅助研究的方法之一是开源完整的代理实现。这些代理的代码对于复制研究很有用,但存在难以修改和扩展的问题。另一种方法是提供通用的构建块,经过测试的稳定实现,也可以被许多不同的 RL 代理使用。另一个好处是将这些核心组件组合到一个库中,再加上一致的 API易语言组件代码编辑框指示器,可以更轻松地组合来自不同来源的想法。

TRFL 库包括实现传统 RL 演算和更高级技术的函数。像损失函数和其他操作都是在纯 Tensorflow 中实现的。对于基于价值和基于策略的强化学习,TRFL 也提供了相应的工具。

DeepMind 表示,由于这个库在 DeepMind 开发中被广泛使用,他们将继续维护和添加新的功能,并有望继续向开源社区发布。

这个项目势必会受到开发者的欢迎。根据最近的 GitHub 统计,Tensorflow 是该平台上的第三大开源项目,仅次于 Microsoft VS Code 和 Facebook React。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论