摘要:具身 AI 通常将传感器与机器学习相结合,以响应真实世界的数据。示例包括自主无人机、自动驾驶汽车和工厂自动化。机器人真空吸尘器和割草机使用简化形式的具体 AI。
具身 AI 使机器人和自主无人机能够与现实世界交互,但它是如何工作的呢?
(图片来源:Yuichiro Chino/Getty Images)
人工智能 (AI) 有多种形式,从模式识别系统到生成式 AI。但是,还有另一种类型的 AI 几乎可以立即响应真实数据:具身 AI。
但这项技术到底是什么,它是如何工作的?
具身 AI 通常将传感器与机器学习相结合,以响应真实世界的数据。示例包括自主无人机、自动驾驶汽车和工厂自动化。机器人真空吸尘器和割草机使用简化形式的具体 AI。
这些自主系统使用 AI 来学习导航物理世界中的障碍。大多数具身 AI 使用算法编码的地图,该地图在许多方面类似于伦敦出租车司机使用的伦敦迷宫般的道路和地标网络的心理地图。事实上,关于伦敦出租车司机如何确定路线的研究已被用于为此类嵌入式系统的开发提供信息。
其中一些系统还结合了在成群的昆虫、成群的鸟类或成群的动物中发现的具身的群体智能类型。这些群体在潜意识中同步他们的动作。模仿这种行为是开发由具体 AI 控制的无人机或仓库车辆网络的有用策略。
具身人工智能的开发始于 1950 年代,由英国 Burden 神经学研究所的 William Grey Walter 创造的控制论。但具身 AI 需要几十年的时间才能独树一帜。认知和生成式 AI 从大型语言模型中学习,而具身 AI 则从其在物理世界中的经验中学习,就像人类对所见所闻做出反应一样。
然而,具身 AI 的感官输入与人类的感官完全不同。具身 AI 可以检测 X 射线、紫外线和红外光、磁场或 GPS 数据。然后,计算机视觉算法可以使用这些传感数据来识别物体并对其做出响应。
具身 AI 的核心元素是其世界模型,该模型专为其操作环境而设计。这个世界模型类似于我们自己对周围环境的理解。
世界模型由不同的学习方法支持。一个例子是强化学习,它使用基于策略的方法来确定路线——例如,使用“遇到 Y 时总是做 X”等规则。
另一种是主动推理,它以人脑的运作方式为模型。这些模型不断从环境中获取数据,并根据此实时流更新世界模型 - 类似于我们根据所见所闻做出反应的方式。相比之下,其他一些 AI 模型不会实时进化。
主动推理从对环境的基本理解开始,但它可能会迅速发展。因此,任何依赖主动推理的自动驾驶汽车都需要经过广泛的培训才能安全地部署在道路上。
Embodied AI 还可以通过读取客户的情绪状态并相应地调整其响应,帮助聊天机器人提供更好的客户体验。
尽管具身 AI 系统仍处于早期阶段,但研究正在迅速发展。生成式 AI 的改进自然会为具身 AI 的开发提供信息。Embodied AI 还将受益于其用于确定周围环境的传感器的准确性和可用性的改进。
来源:小小兔Ra