摘要:9月25日,Google DeepMind的演示视频在科技圈炸了锅:Apptronik的Apollo人形机器人正按颜色分拣衣物,当测试员突然旋转收纳篮,它的视觉传感器仅停顿0.3秒就调整动作,继续精准投放;另一边,Franka双臂机器人听完“按颜色分香蕉到不同
9月25日,Google DeepMind的演示视频在科技圈炸了锅:Apptronik的Apollo人形机器人正按颜色分拣衣物,当测试员突然旋转收纳篮,它的视觉传感器仅停顿0.3秒就调整动作,继续精准投放;另一边,Franka双臂机器人听完“按颜色分香蕉到不同盘子”的语音指令,直接完成识别、抓取、分类的全流程操作,没有丝毫卡顿。
这不是简单的程序执行,而是Gemini Robotics 1.5系列模型赋予的“自主决策能力”。当全球还在惊叹AI突破时,中国赛场早已不遑多让:蚂蚁机器人R1实现量产落地,中联重科的人形机器人已在工厂干活,北京人形的“天工”能以12公里/小时奔跑。一场AI赋能人形机器人的全球竞速赛,正进入白热化阶段。
一、谷歌的“双脑”革命:机器人终于有了“思考中枢”
在Gemini Robotics 1.5出现前,人形机器人更像“精密木偶”——需提前编写数千行代码,才能完成简单分拣,环境稍有变化就会“死机”。而谷歌这次推出的“双模型组合”,直接重构了机器人的决策逻辑。
Gemini Robotics 1.5是机器人的“执行大脑”,能把视觉捕捉的色彩、形状信息和语音指令,实时转化为毫米级的动作指令。比如在“香蕉测试”中,它能同时识别香蕉、苹果等多种水果的轮廓,区分黄色、绿色等色差,再驱动机械臂调整抓取力度,成功率较上一代提升83%。
负责“战略规划”的Gemini Robotics-ER 1.5更关键。它能联网查询当地规则,为垃圾分类等任务生成最优步骤。在旧金山的测试中,机器人遇到未知塑料瓶,先在线检索当地回收标准,确定“清洗后投放到蓝色可回收桶”,整个决策过程仅用2秒。这种“世界推理能力”,让机器人首次具备了适应不同地区规则的通用性。
安全性是谷歌的另一张王牌。更新后的ASIMOV基准测试覆盖1000+风险场景,从避免夹伤人类到应对突发断电,Gemini Robotics-ER 1.5取得了97.2%的通过率,这也是目前该领域的最高成绩。“我们要的不是会干活的机器人,而是能安全共存的伙伴。”DeepMind高级研究员Jie Tan在发布会强调。
更值得关注的是“跨机迁移学习”能力。谷歌团队发现,模型在Franka机器人上学到的分拣技能,能直接迁移到ALOHA 2机器人上,无需重新训练,这让机器人开发成本降低了60%。这种“举一反三”的能力,被业内视为迈向通用机器人的关键一步。
二、中国军团“多点开花”:从赛场领先到量产落地
当谷歌在实验室展示突破时,中国的人形机器人早已走进现实场景。9月22日的互联网岳麓大会上,中联重科的五款人形机器人上演了一场“实景秀”:双足机器人在展厅平稳行走、挥手问好,轮式机器人接到订单后精准取货、粘贴二维码,甚至能通过VR远程操控夹取娃娃。
这背后是“云谷具身智能大模型”的支撑。与谷歌的双模型思路不同,中联重科走了“全流程平台化”路线,将数据采集、模型训练、仿真评测等模块整合,解决了行业“数据获取难、开发门槛高”的痛点。其打造的上百工位训练场,正持续采集真实工业数据,让机器人在机加、上料等场景快速迭代——目前这些机器人的操作精度已达0.1毫米,满足精密装配需求。
更令人惊喜的是商业化速度。蚂蚁集团9月10日在上海外滩大会宣布,旗下人形机器人R1已实现量产并启动商业化推广,成为国内首个量产的消费级人形机器人。而北京人形机器人创新中心的“天工”机器人,早已在运动领域展现实力:作为全球首个能拟人奔跑的全尺寸纯电驱机器人,它的最高速度达12公里/小时,能轻松应对斜坡、碎石等复杂地形,还与李宁成立联合实验室,探索运动场景的规模化应用。
核心技术自主可控是中国军团的底气。中联重科的机器人从行星关节模组到控制器全是自研,北京人形攻克了高扭矩关节驱动技术,蚂蚁R1的视觉算法准确率达99.5%。这种“软硬件协同”的发展模式,让中国在关键零部件国产化率上远超依赖进口的部分国家。
三、全球竞速赛:中美路线差异背后的终极目标
当前全球人形机器人赛道形成了三大阵营:谷歌代表的“AI优先派”、特斯拉为核心的“硬件极致派”,以及中国的“场景落地派”。特斯拉Optimus Gen3的手部自由度已达22个,指尖触觉精度0.08毫米,能完成握鸡蛋、叠衣服等精细动作,但在自主决策上仍依赖预设程序;谷歌则用AI弥补硬件差距,通过“双脑”系统实现复杂环境适应,但尚未大规模落地;中国则走出了“场景定义技术”的特色路线。
这种差异源于目标不同。谷歌希望先突破通用智能,再适配场景,其公开的路线图显示,2030年前要让机器人进入医疗、废物管理等领域,但目前仍停留在实验室演示阶段。中国企业则从工业、物流等明确场景切入,中联重科的机器人已在工厂试点,蚂蚁R1瞄准消费市场,用商业化反哺技术迭代。
在技术指标上,中美各有胜负。谷歌的模型在ASIMOV安全测试中领先,中国的机器人则在运动性能和量产能力上占优——北京“天工”的奔跑速度远超谷歌合作机器人的5公里/小时,中联重科的量产成本仅为国外同类产品的60%。而在AI推理速度上,谷歌凭借Gemini的算力优势稍胜一筹,但中国企业通过边缘计算优化,已将端侧响应延迟压缩至50毫秒以内,满足实时操作需求。
全球资本都在押注这场竞赛。截至2025年9月,全球人形机器人领域融资超120亿美元,谷歌、微软等科技巨头纷纷加码。中国更是将具身智能机器人列为国家战略级产业,政策红利持续释放,中联重科、蚂蚁等企业的研发投入年均增长超40%。
四、黎明前的挑战:离“家用机器人”还有多远?
尽管进展迅猛,但人形机器人真正走进日常生活仍需跨越三重门槛。首先是算力成本,谷歌的Gemini Robotics 1.5单次推理需占用128GB显存,普通边缘设备难以承载,中国企业通过模型轻量化虽有突破,但复杂任务仍需云端支持。
其次是材料损耗问题。机器人关节在高频运动中易磨损,中联重科的实验数据显示,目前的合金关节在工业场景下寿命约5000小时,要满足家用“十年不坏”的需求,材料强度还需提升3倍以上。
最后是伦理安全的平衡。谷歌的ASIMOV基准虽覆盖风险场景,但现实中的突发情况远超测试范围——比如机器人遇到儿童触碰危险部件时,如何在“停止工作”和“保护人类”间快速决策。中国已开始布局相关标准,2025年7月发布的《人形机器人安全指南》,明确要求商用机器人必须具备紧急制动、身份识别等功能。
不过行业已看到曙光。谷歌预测,到2030年,AI驱动的机器人将使制造业效率提升40%,医疗护理成本降低30%;中国电子学会的报告更乐观,认为2027年前后,家用服务机器人的价格将降至万元以内,进入普通家庭。
从谷歌实验室的演示视频,到中国工厂里忙碌的机器人身影,人形机器人正从科幻走向现实。谷歌用AI赋予机器人“思考力”,中国用场景打磨机器人的“行动力”,两条路线虽不同,却都在加速终极目标的实现。
或许用不了多久,当你下班回家,机器人已按当地垃圾分类规则处理好垃圾,还根据你的口味准备好水果——这一天的到来,离不开谷歌的技术突破,更少不了中国企业的落地深耕。这场全球竞速赛没有输家,最终受益的,将是整个人类社会。
来源:小黄科技观