新技术结合不同来源的数据,打造更有效的多用途机器人

假设你想训练一个机器人,让它了解如何使用工具,然后可以快速学会用锤子、扳手和螺丝刀修理房子。要做到这一点,你需要大量展示工具使用的数据。

现有的机器人数据集在形式上千差万别——例如,有些包括彩色图像,而另一些则由触觉印记组成。数据也可以在不同的领域收集,例如模拟或人类演示。每个数据集可能捕获一个独特的任务和环境。

在一个机器学习模型中,很难有效地整合来自如此多来源的数据,因此许多方法只使用一种类型的数据来训练机器人。但是,以这种方式训练的机器人,由于任务特定数据量相对较少,通常无法在陌生的环境中执行新任务。

为了训练更好的多用途机器人,麻省理工学院的研究人员开发了一种技术,使用一种称为扩散模型的生成式人工智能,将跨领域、跨模式和跨任务的多种数据源结合起来。

他们训练一个单独的扩散模型来学习使用一个特定数据集完成一项任务的策略或政策。然后,他们将扩散模型学习到的策略组合成一个通用策略,使机器人能够在各种设置中执行多项任务。

在模拟和真实世界实验中,这种训练方法使机器人能够执行多种工具使用任务,并适应训练期间未见过的新任务。与基线技术相比,这种方法称为策略组合 (PoCo),可将任务性能提高 20%。

“解决机器人数据集中的异质性就像先有鸡还是先有蛋的问题。如果我们想使用大量数据来训练一般的机器人策略,那么我们首先需要可部署的机器人来获取所有这些数据。我认为利用所有可用的异构数据,类似于研究人员对 ChatGPT 所做的那样,是机器人领域迈出的重要一步,”电气工程和计算机科学 (EECS) 研究生、在arXiv预印本服务器上发布的 PoCo论文的主要作者 Lirui Wang 说道。

王的合著者包括机械工程研究生 Jialiang Zhao、EECS 研究生 Yilun Du、脑与认知科学系视觉科学 John and Dorothy Wilson 教授兼计算机科学与人工智能实验室 (CSAIL) 成员 Edward Adelson;以及资深作者、EECS、航空航天和机械工程丰田教授兼 CSAIL 成员 Russ Tedrake。

该研究将于7 月 15 日至 19 日在荷兰代尔夫特举行的机器人:科学与系统会议上发表。

通过策略组合,研究人员能够将来自多个来源的数据集组合起来,这样他们就可以教机器人有效地使用各种工具,比如锤子、螺丝刀或铲子。图片来源:麻省理工学院

合并不同的数据集

机器人策略是一种机器学习模型,它接收输入并使用它们来执行操作。将策略视为一种策略是一种思考方式。对于机械臂而言,该策略可能是一条轨迹,或一系列移动机械臂的姿势,以便机械臂拿起锤子并用它敲钉子。

本站全部资讯来源于实验室原创、合作机构投稿及网友汇集投稿,仅代表个人观点,不作为任何依据,转载联系作者并注明出处:https://www.lvsky.net/502.html

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论