利用主动神经SLAM学习探索环境(LearningToExploreUsingSLAM)

编辑 | 董文舒

智动新闻1月18日消息,近日,来自卡内基梅隆大学、Facebook等机构的研究人员提出了一种全新的AI环境探索模型。这种新模型结合了传统环境探索模型和基于学习的环境探索模型的优点,更简单,不易出错。

该研究已发表在学术网站 arXiv 上,标题为“Learning To Explore Using Active Neural SLAM”。

论文链接:

一、ANS 模型:逼真的仿真探索环境

导航能力是智能代理的核心能力之一。导航任务有多种形式,例如引导到特定坐标的点目标任务,以及引导路径到特定场景或对象的语义导航任务。

无论任务如何,导航未知环境的核心问题是如何有效地探索尽可能多的环境。这增加了在未知环境中找到目标的机会,或者在有限的时间内有效地预先映射环境。

传统的探索模型原理是用传感器观察几何。后来,一些研究人员提出了一种基于学习的导航模型,该模型直接基于 RGB 图像推断几何。

基于学习的导航策略是通过端到端训练一个神经网络来实现的,该网络可以处理原始传感器数据并直接输出代理应该执行的动作。这种策略有 3 个优点:

1、提高了输入法选择的灵活性;

2、提高显式状态估计误差的鲁棒性;

3、通过学习掌握现实世界的结构规律,让代理更有目的地行动

从理论上讲,端到端学习策略具有上述优势,但也存在局限性。

首先,纯粹从数据中学习映射、状态评估、路径规划可能非常昂贵。因此,以前的端到端学习依赖于模仿学习和数百万个经验框架。

其次,以前关于端到端学习策略的研究缺乏真实性。例如,使用合成室内环境数据库 SUNCai遇到未知的图像结构,简化代理动作,从操作环境中去除传感器噪声。

在性能方面,端到端学习策略也往往比不需要任何学习的传统方法差。

为了解决全面端到端学习的局限性,来自卡内基梅隆大学、Facebook 和伊利诺伊大学厄巴纳-香槟分校的研究人员推出了主动神经 SLAM(Active Neural SLAM)。)模型”。

在实验设计方面,研究人员尝试使模型训练环境尽可能逼真,使用一个栖息地模拟器和两个基于真实场景的数据库(Gibson 和 Matterport),不限制代理的动作,模拟传感器噪声。

二、缩小搜索范围,兼顾搜索性能和效率

在本研究中,导航模型的任务是在固定时间内覆盖最大范围。覆盖范围定义为地图中已知要遍历的总面积。

ANS 模型包括一个学习的神经同步定位和映射(SLAM,Simultaneous localization and mapping)模块、一个全局策略和一个局部策略。它们通过地图和分析路径规划器连接。

使用分层和模块化的设计和分析规划,极大地缩小了训练时的搜索范围ai遇到未知的图像结构,同时提高了性能和样本效率。

模型图

在训练过程中,学习到的神经 SLAM 模块生成自由空间地图,并根据输入的 RGB 图像和运动传感器数据预测代理的姿势。SLAM模块的学习提高了输入法的灵活性。

全局策略利用代理的姿势来占据自由空间地图,其长期目标是学习现实世界环境布局的结构规则。全局策略可以探索现实世界环境的布局。

长期目标可以为地方政策产生短期目标。学习本地策略以直接映射代理应从 RGB 图像中采取的动作,呈现视觉反馈。

模型运行过程示意图

三、ANS模型可以探索的范围更广,性能优于baseline模型

使用 Gibson 训练集,研究人员完成了 ANS 模型的训练,运行了 1000 万帧探索任务的所有基线。结果如下表所示。

运行结果基于模型在 14 个未知场景中的 994 次运行结果进行平均。模型的覆盖率为 32.701m^2/0.948,而最佳基线为 24.863m^2/0.789。该数值表明,与基线相比,ANS 模型在穷举探索中更有效。

研究人员还比较了模型和基线在更大的训练集、更小的训练集和完整的 Gibson 训练集上的性能。

在较小的训练集中,ANS 模型可以在 500 步内探索未知环境,而基线在 1000 步后仍然只探索 85~90% 的位置环境(上图)。

在较大的训练集中,随着情节的进展,ANS 模型和基线之间的差距会扩大(左上图)。

在基线模型中,智能体往往只探索局部区域,这意味着他们无法记住长期视野的探索区域,无法进行长期规划。相比之下,ANS 采用全球战略,可以记住探索的区域,有效地规划和实现长期目标。

受到结果的鼓舞,研究人员部署了一个带有 ANS 模型的环境探索机器人。通过调整摄像头的高度和垂直视野,匹配栖息地模拟器,机器人成功探索了公寓的生活区域。

结论:ANS模型效率更高,未来可能有更多应用

ANS导航模型克服了以往端到端学习策略的不足,基于更加真实的数据库进行训练,提高了最终的探索效率。

研究人员认为,这种模型在未来可能会有更多的应用。“未来,ANS 模型可以扩展到复杂的语义任务,例如语义目标导航和回答特定问题,这将创建一个捕获对象语义属性的地图。”

此外,该模型还可以与之前的定位工作相结合,在之前创建的地图中重新定位,从而使后续导航更加高效。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论