摘要:必要的泡沫。当下的具身智能赛道正陷入某种奇观。一边是朱啸虎这样的投资人高调逃离泡沫,一边是这个在去年年末就被很多投资人预判为“下注窗口期已结束”的方向,屡屡被高额融资激活。
如果机器人真的实现manipulation 这就是AGI 提问8:智元已经有CTO稚晖君,包括智元机器人研究院执行院长姚卯青也是技术背景。你们之间存在汇报关系吗,会如何分工? 罗剑岚: 我们内部是一个比较扁平、高度协作的团队。稚晖君在系统工程方面有一些深厚的积累,姚院长在战略方向上会把控全局,我会更多的负责一些算法路线的推动,还有一些外部技术生态的融合。 我们之间是平行互补关系,更强调的是共识驱动,项目导向。 提问9:这次,智元选择和PI(Physical Intelligence)合作,是基于什么背景? 罗剑岚: 首先是智元与PI在理念上有很多契合,都强调真实数据的重要性,都从实际出发推动具身智能落地,这个是合作的大背景。 此外,它是由具身智能领域的先驱Sergey Levine和Chelsea Finn等教授创立的,是目前国际上做具身智能最好的公司之一。 提问10:在具身智能创业公司里,智元也一直在用一种生态打法做公司,很像在用大公司方法运作创业公司,这是有意为之的吗? 罗剑岚: 我们觉得具身智能的复杂性,远超单一公司所能承担的。所以我们强调开放协同。一方面帮助一些外部公司实现他们的一些迭代,另一方面,也把他们的能力引入到我们的生态体系内。 提问11:为什么在具身领域,还没有出现类似OpenAI这种引领型的明星公司? 罗剑岚: 因为这个行业还没有收敛到非常确定性的一些技术方案,所以还不存在哪家遥遥领先,具有很强的话语权。 提问12:现在大家看到很多关于机器人的demo视频,很酷炫,但终究还都是人类在遥控,怎样才能实现自主决策? 罗剑岚: 自主决策和遥控的差别,就类似你以为是和ChatGPT对话,但其实是背后还有另一个人在另一台电脑上打字,完完全全是两回事。 本质是机器人对不确定性的分析和建模,然后换成可执行的动作链。对机器人来说,位置变了一下,颜色变了一下,就跟它记到的东西不一样了。这套感知、预测、生成机制的泛化能力,是最关键的技术。 提问13:最近具身智能厂商都愿意拿来秀肌肉的技能展示,很多都集中在执行长周期、复杂任务,每家技能点也不太一样。你是怎么定义长周期和复杂任务的? 罗剑岚: 长周期是一个比较主观的词,我们可能更关注的是一个任务,先后存在的一些比较复杂的依赖关系,和它的泛化能力,而不是某种绝对条件下,一分钟是长周期,小于一分钟是短周期。 至于复杂任务,至少在manipulation(操控)上,宇树可能更多是一些local motion(局部运动)这些东西。而manipulation上有一些没有解决的问题。比如机器手和外界有接触后,会产生非常复杂的物理现象、物理模型。然后是在多模态、高维度的视觉输入下,怎么完成一些比较灵巧的任务,同时达到非常高的成功率。 这个是manipulation50年以来的,最关键的challenge,我们现在会尝试做一些这类的工作。 提问14:manipulation,机器人操控问题,也是当下关注非常高的部分。 罗剑岚: 如果机器人真的实现了manipulation,就是 AGI。是比LLM更高级的智能 。如果人类文明是零到十,LLM 最多算三,而如果把manipulation实现了,最少得有七到八吧。 现在是具身智能入局
最佳时间点
提问15:实现机器人AGI这件事中,什么是你最感兴趣的? 罗剑岚: 怎么让这个系统有更强的自主学习能力、泛化能力。2016年,谷歌发出第一篇深度机器人学习的paper后,用这些基于learning的机器人,真正被部署到现实世界的,一台都没有,但当下会不一样。 我们在智元新成立的具身智能研究中心,不是单纯的科研机构,也不是单纯的工程化落地机构。它是一个中间态的,希望它能打通从基础科学到技术落地的链路。 提问16:受大模型的影响,在具身智能领域,强化学习也开始成为潮流。 罗剑岚: 现在大家都在开始看这个方向,因为我们有了 DeepSeek R1,有了GPTo1。有50年历史的机器人领域,虽然很多教授做了先驱性的工作,解决了一系列这些控制的稳定性等,但过去十年,我有个观察,就是这个领域的进步总是来自于别的领域,比如CV或者 NLP。 现在有几波人在做具身智能, 一些是做CV的,一些是基于learning的,还有一些做核心机器人,大家视角都会不一样。 提问17:现在陆续很多大厂、产业方,包括消费电子公司也都在入局具身智能,你觉得像智元这样的创业公司有何独特优势? 罗剑岚: 很多人下场,其实是一个积极信号,说明关注越来越多。作为下一代的智能终端,机器人天然就是消费电子公司的关注点,他们在用户体验、产品化,成本控制、供应链整合都有非常强的积累。 像智元这种团队,优势更多在于对行业底层逻辑的理解。他们可能会更垂直,更精致,我们可能会更擅长智能,最终两个方向也会聚合。 提问18:你觉得具身智能当下处于何种周期,还是入局的好时机点吗? 罗剑岚: 从2016年看,我觉得具身已走过大概十年的探索期,刚开始它叫机器人学习。 我觉得现在是一个非常exciting的时间。几年时间内,我们会在一些特定场景里看到一些成功。 其实,现在全世界,有500万台机器人被部署在真实世界里,但它们都是盲的机器人,操作靠绝对的定位,做的是重复性的编程和工作。而随着智能的提升,我们已经进入机器人的应用窗口期了。 虽然那些理想型的,全能机器人可能十年甚至更久才能到来,但在特定场景下具备使用价值,且有持续学习能力的机器人会提前到来。 所以现在是入局,还有突破的最佳时间点。来源:小夭看天下