摘要:智元发布首个通用具身基座大模型GO-1,GO-1开创性提出Vision-Language-Latent-Action(ViLLA)架构。其MoE中的LatentPlanner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Act
事件性驱动:
智元发布首个通用具身基座大模型GO-1,GO-1开创性提出Vision-Language-Latent-Action(ViLLA)架构。其MoE中的LatentPlanner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力。
来源:全产业链研究