摘要:Google DeepMind 机器人技术主管 Carolina Parada 简要介绍了他们最新机器人模型的惊人功能。她的叙述强调了这些机器人学习和适应新情况的意想不到的方式。一个具体的例子特别值得注意,甚至让开发该系统的工程师都感到敬畏。
LLM 在通过计算机界面使用时令人印象深刻,但事实证明,当与人形机器人结合使用时,它们会更加令人印象深刻。
Google DeepMind 机器人技术主管 Carolina Parada 简要介绍了他们最新机器人模型的惊人功能。她的叙述强调了这些机器人学习和适应新情况的意想不到的方式。一个具体的例子特别值得注意,甚至让开发该系统的工程师都感到敬畏。
Parada 说,该机器人能够玩 naughts 和 crosss 等游戏,以及平铺字谜。但它也有一些意想不到的功能。“我认为这些模型最令人兴奋的是,在很多情况下,我们自己的研究人员都对它所做的事情感到兴奋和印象深刻。这主要是因为我们测试它的方式是将机器人置于以前从未见过的情况面前,所以即使我们也不知道机器人是否能够正确地完成它,而且在很多情况下它确实做到了,”她说。
“所以一个非常酷的例子,当我们播放机器人实际上正在进行扣篮的视频时,我们所有人都惊叹不已。”
Parada 详细阐述了围绕 slam dunk 的情况:“那个案例很酷的地方在于,那天我们只是让创意团队来拍摄机器人,我们让他们带玩具。我们没有说别的。他们说,'就带玩具来和机器人一起玩,还有机器人以前没见过的东西。
“他们不知道机器人是用什么训练的,”她强调说。“所以他们实际上带来了这个小篮球架,这是一个带有小球的可爱小玩具,他们把它放在机器人前面。同样,机器人从未见过任何与篮球有关的东西。它肯定从未见过这个玩具,他们让它对球进行猛烈扣篮,我们都说,'我不知道它是否会奏效。
结果令人震惊。“实际上,它甚至只花了不到四分之一秒,它就决定把球放进篮球架里,我们都说,'太神奇了!'它基本上就是借鉴了 Gemini 对篮球和扣篮的理解。这是一个我们从未想过教它去做的概念。从本质上讲,它做了正确的动作,所以这是一个非常酷的例子。
这个轶事凸显了 AI 能力的重大飞跃。该机器人没有接受过篮球或扣篮方面的专门训练,就能够从其现有的知识库中推断并执行复杂的动作。这表明理解和解决问题的水平超越了死记硬背,暗示了真正的认知能力。
虽然近年来通过计算机使用 LLM 已成为主流——ChatGPT 现在是世界上访问量第五大的网站——但这些模型与机器人的集成却不太为人所知。这些模型已经具有高水平的智能,并且对世界如何运作的理解。当集成到可以在世界中导航的人形外形时,他们可以不断得出令人惊讶的结果,即他们如何能够模仿以前只属于人类领域的活动。
共享
来源:人工智能学家