摘要:智元机器人官宣,正式发布首个通用具身基座模型——智元启元大模型Genie Operator-1,(GO-1),并称它开创性地提出了Vision-Language-Latent-Action (ViLLA) 架构。
上周五(3月7日)晚,华为离职“天才少年”——稚晖君(彭志辉)官宣消息刷屏。
稚晖君(智元机器人联合创始人兼CTO)在社交平台发文:“预告一下,下周有好东西发布”。
3月10日上午,“好东西” 如约而至!
智元机器人官宣,正式发布首个通用具身基座模型——智元启元大模型Genie Operator-1,(GO-1),并称它开创性地提出了Vision-Language-Latent-Action (ViLLA) 架构。
据介绍,ViLLA 架构由VLM(多模态大模型) + MoE(混合专家)组成。GO-1大模型可以借助人类视频和多种机器人数据学习,且可泛化应用到各类的环境和物品中。同时,它还支持部署到不同的机器人中,且能在不同机器人形态之间迁移,并能在实际的使用中持续不断进化学习。
即具备人类视频学习、小样本快速泛化、“一脑多形”的跨本体应用、持续进化4个特点。
据悉,在发布的同时,智元同样也将技术博客、论文完全公开,相当于是一种开源。在媒体的访谈中智元合伙人,具身业务部总裁,研究院执行院长姚卯青表示:Q1 内智元机器人还会面向核心用户,开源GO-1模型。(论文链接:https://agibot-world.com/blog/agibot_go1.pdf?continueFlag=fbaa96fc61163f99000b7a72506c9029)
为了探索可扩展的机器人数据如何解决现实世界中通用机器人操作的挑战。在2024年底,智元机器人推出了百万真机数据集开源项目AgiBot World。AgiBot World,是一个大型平台,包含 5个部署场景中 217 个任务的100多万条轨迹,与现有数据集相比,数据规模实现了数量级的增长。
尽管AgiBot World 数据集已经是全球最大的机器人真机示教数据集,但仍远少于互联网规模的数据集。在此基础上,智元推出了如今的Genie Operator-1(GO-1)大模型。
该架构由VLM(多模态大模型) + MoE(混合专家)组成。VLM借助海量互联网图文数据,获得了通用场景感知与语言理解能力;MoE中的Latent Planner(隐式规划器),借助大量跨本体和人类操作视频数据获得通用的动作理解能力。MoE中的Action Expert(动作专家),借助百万真机数据获得精细的动作执行能力。
三者协同工作,实现了可以利用人类视频学习等成就,降低了具身智能门槛。
根据智元介绍,通过ViLLA 架构,相比已有的最优模型,GO-1成功率大幅领先,平均成功率提高了32%(46%->78%)。其中 “Pour Water”(倒水)、“Table Bussing”(清理桌面) 和 “Restock Beverage”(补充饮料)任务表现尤为突出。
稚晖君原名彭志辉,1993年出生于江西吉安。2018年研究生毕业于电子科技大学信通学院。毕业后就职于OPPO研究院AI实验室担任算法工程师;2020年以“华为天才少年”计划加盟华为上海AI研究所,年薪百万。
稚晖君也是知名科技up主,B站“2021年度百大UP主”。
2020年3月,他发明了一台可以处理图像、也可以当语音助手和服务器,外观却只有硬币大小的迷你小电脑,该视频在B站风靡一时。据悉,从电路设计、结构设计,到PCB手工焊接、软件和算法开发全部是由他一人完成。
2021年,彭志辉又发明了“无人驾驶自行车”,踢开脚撑,不用人扶,可以金鸡独立,稳如泰山,还可主动规划行程。有网友分析,完成这样一辆自行车需要涉及20多个专业的知识:3D建模、电路设计、手工焊接、软件编程、AI算法、边缘计算、RPC通信、电机控制、传感器数据处理、运动学动力学建模仿真等等。而彭志辉完成这一辆自行车的设计和制作。
在B站,他陆续发布了自制钢铁侠的迷你机械臂、可以打游戏的充电宝、带电子墨水屏幕的智能门禁卡等视频。
2020年底,彭志辉正式与华为接洽,开始了前后七轮的面试。最终彭志辉以“华为天才少年计划”最高档年薪201万元,加入华为团队,从事昇腾AI芯片和AI算法相关研究工作。
天才少年,是由华为创始人任正非于2019年发起的一项招聘计划,旨在吸引全球顶尖人才。华为“天才少年”的招聘标准非常严格,一般需要经历7轮左右流程:简历筛选、笔试、初面、主管面试、若干部长面试、总裁面试、HR面试。“天才少年”共有三档,最高年薪达201万。
2021年,彭志辉还被任正非在演讲中表扬:“对于2012实验室(华为偏理论研究的实验室),公司从未给过你们过多约束。比如,有人研究自行车的自动驾驶,公司没有约束过他。我们要生产自行车吗?没有啊。这是他掌握的一把“手术刀”,或许以后会发挥什么作用,产生什么巨大的商业价值。”
2022年,有消息称稚晖君离开了华为。2022年12月27日,稚晖君在微博发文回应,已离开华为。对于接下来的计划,其表示,“接下来我会开启一段新的事业,去做更有挑战的事情。“
2023年2月,稚晖君联合创立智元机器人。3月,智元机器人完成天使轮融资。到12月,智元机器人已经完成A+++轮融资,金额超过6亿元,获得了包括比亚迪(A++轮)、BV百度风投(A+轮)、三花控股(A+++)、高瓴创投(天使轮、A轮)等知名机构投资。根据天眼查,目前智元机器人已经完成7轮融资。
同年8月,智元机器人公开首款具身智能机器人“远征A1”智能机器人。2024年1月,“北大-智元机器人联合实验室”正式成立。8月,智元机器人发布“远征”与“灵犀”两大系列共五款商用人形机器人新品,并在交互服务、柔性智造、特种作业、科研教育及数据采集等场景,五款机器人开启商用量产。
同月还智元机器人与上海临港经济发展(集团)有限公司签署了战略合作协议,加速商业化落地。
10月24日,智元机器人将灵犀X1向全球开源。12月16日,智元机器人发布视频宣布,正式开启通用机器人量产。
2025年1月6日,智元机器人宣布量产的第1000台通用具身机器人正式下线,其中包括731台双足人形机器人(远征A2/灵犀X1)和269台轮式通用机器人(远征A2-D/A2-W)。
例如,智元远征 A2 采用人因工程学原理,适合营销客服、展厅讲解、商超导览、前台接待,业务咨询等工作。
如今,智元机器人成立才不过两年,已实现规模化量产。
随着GO-1大模型发布,也将加速具身智能的普及,机器人将从依赖特定任务的工具,向着具备通用智能的自主体发展,在商业、工业、家庭等多领域发挥更大的作用。
在GO-1大模型发布后,3月10日上午11时,稚晖君预告:“明天还有惊喜,上大号发”。
来源:卓乎科技