从魔方到2000多种不同物体,任意玩转OpenAI2019年!

编译 | 程谦

编辑 | 李水清

11月9日,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)公布了一项新成果——可以灵活控制机械手的程序框架。

长期以来,机械手操纵物体的能力不如一岁大的婴儿灵活。即使现在机械手可以做的不仅仅是拾取和放下物体,它在力的产生和复杂的手部动作方面还没有完全模仿。

目前,该领域有多家专门从事机械臂训练的AI实验室,如OpenAI的Dactyl机械臂和DeepMind的RGB-Stacking技术,都在一定程度上推动了机器人产业的发展。

麻省理工学院 CSAIL 研究人员提出的程序框架允许机械手操纵 2000 多个不同物体的方向,使用简单的“师生”训练方法在模拟环境中训练“教师”网络可编程时间控制器,然后将其应用到真实环境中-世界“学生”,解决机械手技术的复杂问题。

该论文将在 2021 年机器人学习会议 (CORL) 上发表。

一、从魔方到2000多种不同的物体,自由发挥

2019年10月15日,OpenAI在官网博客上发布了Dactyl机械手的视频。视频内容是Dactyl机械手在4分钟左右成功还原了一个三阶魔方。这是在机械手控制领域,从定向任务编程迈向更通用的 AI 技术的重要一步。

Dactyl 机械手还原魔方视频(GIF 来源为 YouTube)

2021 年 10 月 12 日,DeepMind 发布了用于机械臂强化学习训练的 RGB 堆叠技术(RGB-Stacking)。这是一个基于视觉的学习系统,可以评估多个研究对象的行为和运动,以提高机械手能力。

RGB叠加技术机械手训练过程(图片来源为VentureBeat)

麻省理工学院 CSAIL 的科学家们也一直在努力提高机器模仿人类的能力,创建一个更大的程序框架:无论机械手朝上还是朝下,都可以重置 2000 多个物体的方向。从杯子到金枪鱼罐头、奶酪盒等,甚至到生活中不常见的物体,这个程序框架都可以帮助机器人以特定的方式快速地将物体拾取并放置在正确的位置。

以前只执行一项任务或只能在垂直位置移动的机器人现在可以拥有灵巧的“手部动作”,这有助于满足物流和制造业的一些常见需求。例如,将物品装入插槽进行组装,或在更远的距离灵活操作工具。麻省理工学院 CSAIL 的团队使用具有 24 个自由度的拟人化机械手证明了这种程序框架可以在未来转移到真实的机器人系统中。

MIT CSAIL 研究团队的机械手演示动画(GIF 来源为 GitHub)

二、机器人性能从零重力提升到正常状态

麻省理工学院 CSAIL 博士生、Improbable AI Lab 研究组首席研究员陈涛表示:“在工业上,平行颚式夹持器由于其控制简单而最常用,如下图所示。但在练习它不能处理我们日常生活中看到的许多工具。即使使用这个夹子来控制钳子也很困难,因为它不具有仅移动一个手柄的灵活性。我们的程序框架将允许多指机械手灵巧地操作这些工具,它为机器人应用开辟了一个新领域。”

平行颚式夹持器(图片来源 YouTube)

机械手在操纵物体时需要控制大量的电机,手指与物体的接触状态也经常变化。因此,通过机械手来重置物体的方向一直是一个具有挑战性的技术难题。程序框架需要通过2000多个对象来学习。

当机械手朝下时,问题变得更加棘手。机械手不仅需要操纵物体,还需要克服重力,使它们不会掉落。

在操纵器指向下方时操纵对象(GIF 来源是 GitHub)

该团队找到了一种解决复杂问题的简单方法。他们使用了深度学习的无模型强化学习算法,这意味着程序框架必须从与环境的交互中找出价值函数,以及所谓的“师生”训练方法。

为此,研究人员使用来自物体和操纵器的信息训练“教师”网络可编程时间控制器,这些信息在现实世界中不可用,而只能在模拟环境中使用,例如指尖的位置或物体移动的速度。

为了确保机械手可以在模拟环境之外工作,“教师”网络所学的东西将被提炼成可以在现实世界中获得的观察结果,并提供给“学生”网络,例如相机捕获的深度图像,物体姿势和机械手的关节位置。

他们还采用了“重力课”的学习方式,机械手先在零重力环境下学习技能,然后慢慢让控制器适应正常的重力条件,以这种形式训练机械手确实提高了它的整体性能。

这似乎不是一个正常的学习过程,但一个控制器,称为机械手的“大脑”,可以使用这种训练方法重新定位大量对象,即使这些对象以前从未见过也没有知道形状。

三、机械手的成功率受限于物体的形状

“我们最初认为,在机器手操纵物体时推断形状的视觉感知算法将是主要挑战,”麻省理工学院教授、该研究论文的作者 Pulkit Agrawal 说。“相反,我们的结果表明,机器人手可以独立于形状学习稳健的形状。” 控制策略。这表明视觉感知对于操纵的重要性可能远不如我们习惯于思考的方式重要,而且更简单的感知处理策略可能就足够了。”

苹果、网球、弹珠等小型球形物体在用机械手重新定位时的成功率接近 100%。对于更复杂的物体,如勺子、螺丝刀和剪刀,成功率较低,只有 30% 左右。

Manipulator 操纵球形物体(GIF 来源是 GitHub)

由于其成功率受对象形状的影响,该团队指出,基于对象形状训练模型可以在未来进一步提高机械手性能。

结论:解决机械手复杂问题的简单方法

MIT研究团队推出的程序框架可以帮助机械手重新定位不同的物体,操纵机械手多指机械手使用各种复杂的工具,满足生产过程中的各种需求,开辟机械手应用的新领域。

据研究团队称,由于高维驱动空间和手指与物体之间接触状态的频繁变化,手持物体的重新定向一直是机器人技术中的一个具有挑战性的问题。用简单的“师生”方式训练机械手巧妙地解决了这个复杂的问题。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论