具身人工智能中的数据价值

T7S126B%}5Z8}QR~IN2H4~U.png

  具身人工智能 (EAI) 将人工智能融入机器人等物理实体,使其具备感知、学习和动态与环境互动的能力。这种能力使这些机器人能够在人类社会中有效地提供商品和服务。在本文中,我们将与互联网领域的数据价值进行比较,以估计 EAI 中数据的潜在价值。此外,我们深入探讨了数据瓶颈在 EAI 开发中带来的重大挑战,并研究了旨在克服这些障碍的创新数据捕获和生成技术。

  1. 数据是一种货币化工具

  图 1:数据货币化——互联网与具身人工智能 图片

  来源:Shaoshan Liu

  数据是互联网和机器人领域实现盈利的重要工具。本文,我们以互联网行业作为历史基准,探讨数据在 EAI 中的战略价值。

  在互联网领域,公司主要利用用户数据进行定向广告和个性化内容。这种有针对性的方法不仅可以增加销售额,还可以提高用户参与度,从而提高订阅费或增加使用量。同时,在 EAI 领域,数据对于训练增强和优化机器人功能的深度学习模型至关重要。

  从经济角度来看,用户数据对互联网公司来说具有重大价值,估计每位用户 600 美元[3],考虑到大规模商业化后每台机器人的预计成本为 35,000 美元[4],我们保守估计机器人公司愿意将每台机器人成本的 3% 左右投入到数据收集和生成中。这项投资旨在开发先进的 EAI 功能,预计 EAI 数据的市场价值将超过 10 万亿美元,是互联网行业的三倍。

  该分析凸显了 EAI 的巨大潜在数据,目前 EAI 的数据收集和生成行业仍处于起步阶段。

  2. 具身人工智能的数据瓶颈

  尽管 EAI 数据行业前景光明,但目前 EAI 系统的可扩展性受到严重数据瓶颈的严重阻碍。与互联网数据不同,互联网数据主要由用户生成的输入组成,这些输入相对容易收集和汇总,而 EAI 数据涉及机器人与其动态环境之间的复杂交互。这一根本区别意味着,虽然可以从数字平台上的用户活动中挖掘互联网数据,但 EAI 数据必须捕捉各种各样且通常不可预测的环境中的各种物理交互。

  例如,虽然易于获取的聊天数据允许使用 570 GB 的文本[5]训练 ChatGPT 4 ,并展示出在聊天任务中的出色能力,但由于 EAI 模型具有多模态特性,因此训练它需要更多的机器人数据。这些机器人数据涵盖各种感官输入和交互类型,不仅极具挑战性,而且收集成本高昂。

  训练 EAI 的第一个挑战是获取大量、高质量和多样化的数据集。例如,自主导航机器人需要处理大量环境数据以增强其路径规划和避障能力。此外,数据的精度直接影响机器人的性能;从事高精度任务的工业机器人需要极其准确的数据,其中微小的错误可能会导致生产质量出现重大问题。此外,机器人适应和泛化不同环境的能力取决于其处理的数据的多样性。例如,家庭服务机器人必须适应各种家庭环境和任务,这需要它们从广泛的家庭环境数据中学习以提高其泛化技能。

  训练EAI的第二个挑战是“数据孤岛”。获取如此全面的数据充满挑战,包括高成本、长时间要求和潜在的安全风险。大多数EAI机器人组织都局限于在特定受控环境中收集数据。实体之间缺乏数据共享加剧了这种情况,导致重复工作和资源浪费,并产生“数据孤岛”。这些孤岛严重阻碍了EAI的进展。

  3. 数据捕获和生成

  图 2:数据采集和生成 图片

  来源:Shaoshan Liu

  为了解决 EAI 开发中的数据可用性瓶颈,强大的数据捕获和生成管道至关重要。图 2 说明了此类管道的架构。

  该流程的第一部分涉及捕获真实世界数据。这包括收集人类与物理环境交互的数据以进行模仿学习,如 Mobile-Aloha [6]等研究项目所示,它捕获复杂的交互任务,以及 PneuAct [7],它专注于捕获与人类手部动作相关的数据。此外,该流程还涉及从多模态机器人传感器收集数据,以捕获机器人对其物理环境的感知。

  其次,鉴于获取大量高质量、多样化的 EAI 数据成本过高,基于数字孪生的仿真已被证明是一种有效的解决方案[8]。它显著降低了数据收集成本,提高了开发效率。例如,为自动驾驶汽车捕获一小时的多模态机器人数据的成本为 180 美元,而模拟相同数据的成本仅为 2.20 美元,成本降低了近 100 倍[9]。此外,Sim2Real 技术的进步促进了技能和知识从模拟环境转移到现实世界应用程序[10]。该技术在虚拟空间中训练机器人和人工智能系统,使它们能够安全有效地学习任务,而不受现实世界的物理风险和限制。因此,现实世界数据和合成数据的结合是克服 EAI 中数据可用性挑战的战略方法。

  最后,收集和生成的数据都必须经过时间和空间对齐,这一点至关重要。这可确保来自各种传感器的数据既准确又同步,从而提供对机器人环境和动作的统一而详细的理解[11]。只有经过这些过程,数据才能有效地用于训练 EAI 系统。

  4。结论

  本文探讨了数据在 EAI 中的作用,并估计 EAI 中数据收集和生成的市场可能超过 10 万亿美元,可能是互联网数据市场价值的三倍。与直接收集互联网数据不同,收集 EAI 数据涉及动态环境中的复杂交互,因此是一项昂贵且具有挑战性的工作。为了应对这些挑战,我们引入了利用 Sim2Real 技术的数据捕获和生成管道,将现实世界的数据收集与基于数字孪生的模拟相结合,以降低成本并提高开发效率。目前,应用 Sim2Real 技术的主要障碍是“现实差距”——模拟环境与现实世界之间的差异,包括物理、照明和意外交互的差异。克服这一差距需要创新技术,例如域随机化(将各种场景纳入模拟)和域自适应(调整 AI 的响应以更好地适应现实世界条件)。这些策略对于有效弥合模拟训练与现实世界应用之间的差距至关重要。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论