在模拟,机器人移动通过探索新环境,观察,从学习的经验和绘画
技术

当穿过人群到达某个终点时,人类通常可以在太空安全不考虑太多。他们可以从他人的行为中学习,并注意到任何需要避免的障碍。机器人,另一方面,斗争的导航的概念。

新颖的运动规划模型


麻省理工学院的研究人员现在已经设计出一种方法来帮助机器人更像人类一样在环境中导航。他们新颖的运动规划模型让机器人通过探索环境来决定如何达到目标,观察其他药剂,和利用他们之前已经学会了在类似的情况下。

在最近的IEEE/RSJ智能机器人与系统国际会议(IROS)上,提出了一篇描述该模型的论文。

受欢迎的运动规划算法将创建一个可能的决策树,树枝,直到找到好的路径导航。

一个需要在房间里导航才能够到门的机器人,例如,将创建一个循序渐进的搜索树可能运动的门,然后执行最好的路径考虑各种限制。

一个缺点,然而,这些算法很少学习:机器人不能对他们如何利用信息或其他代理人行动之前在相似的环境中。

“就像下棋时,直到这些决策分支(机器人)找到一个好的导航的方法。但不像国际象棋选手,[机器人]在不了解环境和其他代理的情况下探索未来的样子,“合著者安德烈·巴布说,麻省理工学院计算机科学与人工智能实验室(CSAIL)和大脑中心的研究员,头脑,以及麻省理工学院麦戈文研究所的机器。

“他们总是在探索,很少观察”


“他们第一千次穿过同一人群和第一次一样复杂。他们总是在探索,很少观察到,而且从不使用在过去发生了什么。”“

研究人员开发了一个模型,结合规划算法的神经网络,学会识别路径可能导致最好的结果,并利用这些知识来指导机器人在环境中的运动。

在他们的论文中,”基于抽样计划的深度序列模型‘,研究人员在两个环境中展示了他们的模型的优势:通过带有陷阱和狭窄通道的充满挑战的房间航行,以及导航区域,同时避免与其他代理发生碰撞。

有希望的现实应用


一个有前途的真实世界的应用程序帮助自主车导航十字路口,他们必须迅速评估别人会做在合并之前流量。研究人员目前正在寻求这样的应用程序通过Toyota-CSAIL联合研究中心。

“当人类与世界互动,我们看到了一个我们以前接触过的物体,或者在我们以前去过的某个地方,所以我们知道如何行动,“阎令国说,CSAIL博士生,论文第一作者。

“这项工作背后的想法是添加搜索空间的一个机器学习模型,从过去的经验中知道怎样使计划更有效率。”“

鲍里斯•卡茨CSAIL的首席研究科学家和信息实验室小组负责人,也是这篇论文的合著者。

勘探开发交易


传统的运动规划探索的环境迅速扩张的决策树,最终毯子整个空间。

然后机器人看着树,想办法达到目标,比如一扇门。研究人员的模型,然而,提供“探索世界之间的权衡和利用过去的知识,“郭说。

学习过程从几个例子开始。一个使用该模型的机器人被训练了几种导航类似环境的方法。神经网络通过解释机器人周围的环境来了解这些例子的成功之处,比如墙壁的形状,其他代理人的行为,以及目标188bet亚洲体育的特点。

简而言之,模型”当你被困在一个环境中时,你看到一个门口,穿过门出去可能是个好主意,“Barbu说。

该模型将早期方法的探索行为与所学信息结合起来。底层的规划师,叫RRT *,由麻省理工学院教授Sertac Karaman和Emilio Frazzoli开发。(这是一个变体的一种广泛使用的运动规划算法被称为快速扩展随机树,或RRT。

神经网络反映每一个步骤,使概率预测


计划创建一个搜索树,而神经网络反映每一个步骤,使概率预测机器人应该去的地方。当网络预测高信心,根据所学信息,它引导机器人在一个新的路径。

如果网络没有很高的信心,它让机器人探索环境,就像一个传统的规划师。

例如,研究人员在一个被称为“陷阱”的模拟中演示了该模型,一个二维机器人必须通过一个中央狭窄的通道从一个内腔逃出,到达周围较大房间的某个位置。盲目的盟友两侧的通道可以得到机器人卡住了。

在这个模拟中,机器人被训练如何逃脱的几个例子不同的错误陷阱。当面对新的陷阱时,它承认的陷阱,188bet亚洲体育逃逸,继续在更大的房间里寻找目标。

神经网络帮助机器人找到出口的陷阱,识别死角,并给出了机器人的周围环境,这样就可以快速找到目标。

比传统的规划师绘制的路径要短得多且一致


结果本文是基于路径的机会发现一段时间后,的路径总长度达到给定的目标,以及路径的一致性。在两个模拟中,与传统的规划者相比,研究者的模型绘制出的路径要短得多,而且要一致得多。

“这个模型很有趣,因为它允许一个运动规划器适应它在环境中看到的东西,“斯蒂芬妮Tellex说布朗大学计算机科学助理教授,他没有参与这项研究。

“这可以使戏剧性的改善计划的速度通过定制规划师机器人知道什么。大多数规划者不适应环境。能够长途跋涉,对于一个传统的计划者来说,狭窄的通道是众所周知的困难,但他们可以解决它。我们需要更多的方式来填补这一缺口。”“

使用多个代理


在另一个实验中,研究人员在多个运动物体的导航环境中对模型进行了训练和测试,这是一个有用的测试自动汽车,特别是在十字路口和环形路。

在模拟中,有几个代理环绕一个障碍。一个机器人代理必须成功地浏览其他代理,避免碰撞,并达到一个目标位置,如退出迂回的。

“像环形交叉路口这样的情况很困难,因为他们需要推理别人会如何回应你的行动,然后你将如何回应他们,他们接下来会采取什么行动,等等,“Barbu说。

“你最终发现是错误的,你的第一个行动因为以后可能会导致事故。这个问题会成倍地恶化,你不得不与更多的汽车抗争。”“

结果表明,研究者的模型可以获取足够的信息对未来行为的其他代理(汽车)切断过程早期,同时在导航方面仍能做出正确的决定。这使得计划更有效。

此外,他们只需要训练模型的几个例子环形路只有几辆车。“计划机器人使考虑其他车辆要做什么,像任何人一样,“Barbu说。

最具挑战性的场景之一


穿过交叉口或环形交叉口是自动驾驶汽车面临的最具挑战性的场景之一。这项工作可能有一天会让汽车了解人类的行为以及如何适应不同环境中的驾驶者,研究人员称。这是Toyota-CSAIL联合研究中心的重点工作。

“不是每个人的行为都一样,但人们都很刻板。有些人很害羞,好斗的人。该模型很快承认,这就是为什么它可以有效地计划,“Barbu说。

最近,研究人员已经将这项工作应用到机器人的操纵器上,这些机器人在不断变化的环境中接触到物体时也面临着同样严峻的挑战。

//www.bjgzb.com/wp-content/uploads/2018/10/a-aaaab.jpg//www.bjgzb.com/wp-content/uploads/2018/10/a-aaaab-300x300.jpg戴维奥里奥登技术人工智能,麻省理工学院,机器人
当穿过人群到达某个终点时,人类通常可以在太空安全不考虑太多。他们可以从他人的行为中学习,并注意到任何需要避免的障碍。机器人,另一方面,与这种导航概念作斗争。研究人员提出的新颖的运动规划模型…