基于生成递归神经网络和蒙特卡罗树搜索的动态环境路径规划

person 匿名

发布日期: 2021-07-17 10:23:29 浏览量: 94
评分:
star star star star star star star star star star_border
*转载请注明来自write-bug.com

Path Planning in Dynamic Environments using Generative RNNs and Monte Carlo Tree Search

摘要

在动态环境中,如人群或交通,机器人路径规划的最先进的方法依赖于为智能体手工制作的运动模型。这些模型通常不能反映真实世界场景中智能体的交互。为了克服这一局限性,本文提出了一种在蒙特卡罗树搜索(MCTS)中使用生成递归神经网络的集成路径规划框架。这种方法使用社会反应的学习模型来预测整个行动空间规划期间的人群动态。这扩展了我们最近使用生成递归神经网络来学习计划的机器人动作和人群可能的反应之间的关系的工作。结果表明,所提出的框架可以显著提高交互过程中的运动预测精度,允许更有效的路径规划。在仿真中,所提出的方法的性能与现有的在人群中避免碰撞的方法进行了比较,展示了控制附近个体未来状态的能力。还进行了初步的真实世界测试,以验证方法的有效性。

系统概述

说明了在基于树搜索的规划器中学习的社会反应模型的使用。训练后(蓝色),编码器对给定观察序列的最终隐藏状态与最新观察Xt一起用作计划器的根状态(红色)。解码器然后可以在单个步骤中用于模拟给定动作A和节点状态S的MDP的状态转换。

不同机器人视角△t预测精度的比较,和当不使用机器人输入时(△t =None)。ADE和FDE显示为所有代理(红色),并仅限于机器人附近的代理(蓝色、青色、青色)。对于ORCA和VCI,可以看到△t和精度之间的相关性,尽管不适合ARATH,除非距离有限。

算法

上传的附件
eject