摘要:以实现基本的双足行走功能为主要目标。以日本早稻田大学为代表,开发了一系列机器人,如WAP、WL、WABIAN 和 WABOT等。这一阶段的主要特点是基本实现双足行走功能和控制能力,初步具备了拟人化的结构,但整体上运动能力较弱。
1、发展历程:发轫于传统运控 迈向具身智能新时代
海外人形机器人发展历程已经历了萌芽探索、集成发展、高动态发展、智能化发展四个阶段:
萌芽探索阶段(20 世纪 60 年代末至 90 年代)
以实现基本的双足行走功能为主要目标。以日本早稻田大学为代表,开发了一系列机器人,如 WAP、WL、WABIAN 和 WABOT 等。这一阶段的主要特点是基本实现双足行走功能和控制能力,初步具备了拟人化的结构,但整体上运动能力较弱。
集成发展阶段(21 世纪初至 2010 年)
以感知和智能控制整合为主要特点,本田公司的 ASIMO 系列人形机器人代表了这一阶段的重大进展,通过感知和智能控制技术的整合,机器人具备了初步的感知系统,能够感知周围环境的基本信息,并根据感知输入做出简单判断并调整动作。ASIMO 200 是其中的代表作,不仅外观类人,还能预测未来动作并主动调整重心,实现转弯时的流畅行走。
高动态发展阶段(2010 年至 2022 年)
控制理论和技术的进步提升了机器人的认知能力,使其能够独立、稳定地执行复杂动作,且此阶段人形机器人已经具备了较强的运动能力。如本田的升级版ASIMO 机器人采用电驱动的技术路线,并通过整合视觉和触觉物体识别技术,能够精确完成抓取物体和倒液体等精细任务。波士顿动力的 ATLAS 机器人采用液压驱动的技术路线,能够在具有挑战性的场景中保持平衡并实现高动态运动。
智能化发展阶段(2022 年至今)
2023 年,大型语言模型的快速进步加速了具身智能的出现。在人工智能技术的赋能下,机器人具有了更加智能化的感知、交互和决策能力。同时,电驱动成为“肢体”主流技术路线,实现了更加精准的行走和操作,并提高了研发迭代速度。如特斯拉 Optimus 机器人,基于人工智能技术和自研的 FSD 芯片,通过端到端的神经网络模型实现任务级和动作级的决策,以及复杂环境中物体、人脸和手势等的识别。同时,通过其全身压力计算和实时反馈机制,使机器人的四肢运动更加灵敏,能够实现流畅和自然的动作。
2、技术路线:仿生与功能方向并行 技术探索多元化
海外人形机器人的主要研究方向可分为仿生模拟、功能学习两大类,其中日本以形态模拟见长,为人形机器人行业开创者;美国以功能学习见长,引领人形机器人产业化落地:
日本:对人形机器人的研究主要侧重于仿生模拟,重点开发复杂且逼真的仿生机器人,主要面向家庭和服务应用。
早稻田大学 1976 年开创性地推出了 WABOT 系列机器人,首次成功实现了双足行走技术,并通过与东京大学和国家先进工业科学技术研究所(AIST)合作,在双足运动、控制算法和人机交互领域持续保持领先地位;本田著名的 ASIMO 机器人源自 P2 人形步行机器人,尺寸更小,同时进一步提升了行走和工作能力。2011 年的 ASIMO 改进版展示了在崎岖地面行走、语音识别、避开静态和动态障碍物以及多指协调能力;索尼开发了娱乐性人形机器人 SDR 和 QRIO(2003 年推出),能够唱歌、跳舞、踢球并进行人机交互。
美国:人形机器人研究主要侧重于理解人脑的机制和功能学习,在复杂环境中机器人操作方面取得重大进展,为潜在的实际应用奠定了坚实基础。Willow Garage 的双臂服务机器人 PR2 展示了执行复杂操作的能力,如叠衣服、叠毛巾、开门和自主寻找充电插座;
美国国家航空航天局(NASA)开发了人形双臂机器人 Robonaut 2,在国际空间站上替代宇航员执行危险太空环境中的重复性任务;开发了各种动态且高度移动的机器人;
波士顿动力的 Atlas 机器人具备类似人类的感知、判断和决策技能,展示了穿越传送带、避开障碍物和维持平衡等动态能力;
特斯拉 Optimus 展示了类似人类的灵巧性、平稳行走、弯腰、向观众挥手以及表演简单舞蹈动作的能力。
海外人形机器人代表性产品一览
资料来源:《Advancements in Humanoid Robots: A Comprehensive Review and Future Prospects》Yuchuang Tong 等,民生证券研究院
其他国家:法国、德国、意大利等国在人形机器人领域也展开了多元化创新探索,Pepper、Ameca 等是行业明星产品。
法国 Aldebaran Robotics 开发了各种人形机器人,包括 ROMEO、Pepper和 NAO。NAO 机器人广泛应用于学术领域,享誉全球。ROMEO 主要为个人护理设计,能够观察周围环境并与人类交谈。Pepper 机器人旨在与人类互动,特别是通过人脸表情和声音识别情感并相应调整对话模式。
德国航空航天中心(DLR)开发了 TORO 人形机器人,强调机器人手臂的协调控制和步态控制,以实现安全的人机交互。
意大利理工学院开发的 iCub 人形机器人在人类认知和人工智能研究中发挥重要作用,旨在加深我们对人类认知过程的理解。
西班牙 PAL Robotics 推出了 REEM-C 人形机器人,具备行走、视觉识别和人机交互能力。
英国 Engineered Arts 创造了一个以逼真表情和先进交互能力著称的人形机器人 Ameca,被誉为最像人类的机器人之一。
韩国科学技术院(KAIST)开发的 KHR 系列人形机器人获得了高度认可。HUBO KHR-3 机器人能以直膝步态以 1.4 公里/小时的速度行走,并能以 3.6 公里/小时的速度奔跑。
3、竞争格局:科技巨头持续入局 美国初创公司领跑
海外科技巨头正通过多元化策略加速人形机器人领域布局,内部研发+战略投资+合作赋能三线并行:
全栈布局:谷歌于 2025 年 2 月投资 Apptronik,旗下 Deepmind 于 2024年 12 月与 Apptronik 达成战略合作;微软于 2024 年 2 月投资 Figure AI,2024年 5 月与 Sanctuary AI 达成战略合作,2025 年 2 月发布 Magma 多模态基础模型;英伟达 2024 年 2 月发布人形机器人基础模型 GR00T、投资 Figure AI,2025年 2 月与富士康达成合作;
内生发展:报道称,苹果 2025 年 2 月开始人形机器人领域探索;Meta于 2025 年 2 月,在 Reality Labs 硬件部门下组建人形机器人专项研发团队;特斯拉自研 Optimus 通用人形机器人,目标为内部应用与商业化销售;
外延拓展:亚马逊于 2022 年 4 月投资 Agility、2024 年 7 月投资 SkildAI,并于 2023 年 10 月开始在仓库中应用 Agility 的 Digit 人形机器人;英特尔2023 年 7 月投资 Figure AI;Open AI 于 2023 年 1 月通过 OpenAI StartupFund 投资 1X Technologies,并成为其合作伙伴,2025 年 3 月开始发力人形机器人自研;三星 2023 年 1 月收购 Rainbow Robotics 的少数股权,2024 年 1 月通过三星 NEXT 投资 1X Technologies。
当前海外科技巨头布局方式呈现两大特征:头部企业侧重技术融合与场景落地,通过资本纽带绑定创新主体;多数玩家避免单一路径依赖,以内外兼修方式降低试错风险。行业仍处资源整合与技术验证阶段,生态协同效应将加速商业化拐点到来。
美国凭借 AI 领域强大积累,领跑人形机器人赛道。2020 年以前,以 ASIMO为代表的日本人形机器人虽然也能做出端茶倒水动作,但使用的是传统运控算法,只能执行程序设定好的特定动作。而在 AI 时代,人形机器人的动作执行更多基于AI 大模型和强化学习,能够一定程度上实现场景泛化和自主决策。美国开始凭借AI 领域强大技术积累,强势领跑人形机器人赛道。截至目前,美国有 13 家人形机器人初创公司,与中国持平;过去 10 年中,美国人形机器人初创公司总融资额达13.7 亿美元,远程其他国家。
4、发展趋势:大模型深度赋能应用落地持续加速
具身大模型作为人形机器人智能化的核心引擎,正持续赋能海外主机厂突破感知-决策-执行闭环的技术瓶颈。
Figure AI 自研的视觉-语言-动作(VLA)模型Helix 已实现跨场景任务泛化,支持机器人在物流分拣中完成从零样本学习到动态包裹处理的升级;1X Technologies 依托 OpenAI 投资强化具身学习架构,通过VR 远程操作积累真实动作数据训练 Neo 机器人,结合世界模型仿真优化家庭场景的咖啡制作、洗衣等长周期任务泛化能力;Physical Intelligence 推出的分层交互系统 Hi Robot 创新性整合高层推理 VLM 与底层执行 VLA 模型,在开放式指令跟随准确率上超越 GPT-4o 达 40%,为 Agility Robotics 等合作伙伴提供动态纠错与复杂任务分解能力。
技术路径上,分层架构因模块化与可解释性优势暂居主流,但端到端模型随数据积累(如谷歌 RT-2)正推动执行效率质变,2025 年成为人形机器人智能化跃迁的关键拐点。
海外人形机器人应用端落地加速,核心场景包括工业制造、物流分拣、家庭服务等场景:
工业制造:以标准化工业场景为切入点,解决劳动力短缺与高危工种替代需求。Figure AI 与宝马达成深度合作,其人形机器人 Figure 02 在汽车生产线承担装配、物料搬运等任务,通过自研 Helix 模型实现任务快速迁移(新场景部署周期从 12 个月压缩至 30 天),目标未来四年交付 10 万台;Agility Robotics 建成全球首座人形机器人量产工厂“RoboFab”,年产 1 万台 Digit 机器人,已与德国舍弗勒集团合作部署全球工厂物流网络,优化仓储周转效率。
Figure 02 在宝马汽车产线工作
资料来源:宝马官网,民生证券研究院
Digit 在亚马逊工厂工作
资料来源:亚马逊官网,民生证券研究院
物流分拣:依赖环境适应性与末端操作泛化能力,以柔性操作突破场景瓶颈。Figure AI 旗下 Figure 02 机器人在物流中心实现包裹分拣从“零样本”到落地应用的重大突破。通过 Helix 模型(视觉-语言-动作 VLA 架构)支持立体视觉感知与跨机器人策略迁移,可处理扁平包裹、条码识别及漏拣校正;亚马逊推进人形机器人“最后一公里”配送测试,采用定制化方案解决窄通道通行与避障问题
家庭服务:以人性化设计打开 C 端市场,依赖安全性与情感化交互。1XTechnologies 旗下 Neo Gamma 机器人专为家庭场景设计,采用针织尼龙外壳与 3D 打印鞋降低物理伤害风险,噪音控制至冰箱级(
5、小结
发轫于传统运控,迈向具身智能新时代。海外人形机器人产业已历经四个清晰的发展阶段:萌芽探索以日本早稻田大学 WABOT 系列为代表,核心目标是实现基础双足行走功能;集成发展标志性事件是本田 ASIMO 的推出,其整合了初步感知系统,实现了环境交互与动作预测;高动态发展期(2010-2022 年)得益于控制理论的进步,机器人的运动能力显著提升,本田升级版 ASIMO 与波士顿动力Atla 分别在电驱与液压路线上实现了复杂环境下的精细操作与高动态平衡;智能化发展阶段则深度融合大型语言模型,赋予机器人智能化感知、交互与决策能力。
仿生与功能方向并行,技术探索多元化。全球人形机器人技术路线呈现出多元化探索格局,核心分野在于“仿生模拟”与“功能学习”两大方向。日本作为行业开创者,长期侧重于形态仿生与服务应用,致力于开发复杂逼真的仿生机器人,早稻田大学、东京大学与 AIST 持续引领双足运动及控制算法研究。美国则引领功能学习路线,聚焦理解人脑机制与复杂环境操作产业化,在机器人操作领域取得重大进展。欧洲及其他国家则在人机交互、认知研究、情感识别等领域展开了丰富的创新实践,共同构成了全球人形机器人技术生态的多样性。
科技巨头持续入局,美国初创公司领跑。当前海外科技巨头正通过多元化策略加速布局人形机器人领域,主要形成全栈布局、内生发展及外延拓展三条路径。谷歌采取全栈策略,微软与英伟达亦积极卡位。苹果、Meta 与特斯拉则侧重内生发展。亚马逊、英特尔、OpenAI、三星则主要通过外延投资拓展生态。头部企业普遍注重 AI 技术融合与场景落地,通过资本纽带绑定创新主体,多数玩家避免单一路径依赖以降低试错风险,行业整体仍处资源整合与技术验证阶段,生态协同效应将加速商业化拐点到来。凭借在 AI 领域的深厚积累,美国在人形机器人赛道强势领跑,其初创公司数量与中国持平,但过去十年融资总额远超其他国家。
大模型深度赋能,应用落地持续加速。具身大模型作为人形机器人智能化的核心引擎,正持续赋能海外企业突破感知-决策-执行闭环的技术瓶颈。Figure AI 自研的 VLA 模型 Helix 已实现跨场景任务泛化,显著提升物流分拣效率并支持零样本学习到动态包裹处理的升级。1X Technologies 依托 OpenAI 强化具身学习架构,结合世界模型优化家庭场景的长周期任务泛化能力。Physical Intelligence 的分层交互系统 Hi Robot 创新整合高层推理 VLM 与底层执行 VLA 模型,在开放式指令跟随准确率上实现突破。技术路径上,分层架构因模块化与可解释性优势暂居主流,但端到端模型随数据积累正推动执行效率质变,2025 年被视为人形机器人智能化跃迁的关键拐点。应用端落地呈现加速态势,核心场景聚焦工业制造、物流分拣等。
来源:思瀚研究院