摘要:她与大家分享的主题是:Moto - “潜在运动语言”赋能机器人视频动作学习,届时她将解释一种以潜在运动标记(Latent Motion Token)作为“桥梁语言”的创新方法——Moto-GPT。相关工作已入选ICCV 2025 Oral。
本期为TechBeat人工智能社区第715期线上Talk。
北京时间9月11日(周四) 20:00,香港大学博士生陈奕的Talk将准时在TechBeat人工智能社区开播!
她与大家分享的主题是: Moto - “潜在运动语言”赋能机器人视频动作学习,届时她将解释一种以潜在运动标记(Latent Motion Token)作为“桥梁语言”的创新方法——Moto-GPT。相关工作已入选ICCV 2025 Oral。
Talk·信息
▼
主题:Moto - “潜在运动语言”赋能机器人视频动作学习
嘉宾:香港大学 · 博士生 - 陈奕
时间:北京时间 9月11日(周四) 20:00
地点:TechBeat人工智能社区
Talk·介绍▼
如何让机器人像人类一样,通过观察视频自主学习复杂的操作技能?本次分享将介绍我们入选ICCV 2025 Oral的最新工作 — Moto。
我们提出了一种以潜在运动标记 (Latent Motion Token) 作为“桥梁语言”的创新方法,将视频内容编码为紧凑的序列表示,并基于此构建生成式预训练模型Moto-GPT。该方法能够从大规模无标注视频中自动提取与动作密切相关的运动知识,并通过我们设计的协同微调策略,将学习到的运动先验高效迁移至真实机器人控制任务中。
实验表明,经过微调的Moto-GPT能有效提升下游机器人操作任务的性能,验证了从视频数据中迁移学习视觉操作知识的可行性与有效性。
Talk大纲
1. 背景与动机:机器人学习的瓶颈与人类启示
2. 方法亮点:从视频到机器人动作的三阶段训练框架
- 视频运动语义编码
- 运动轨迹生成式预训练
- 协同微调策略
3. 实验验证与性能表现
- 潜在运动语言的可解释性
- 预训练效果验证
- 实际任务表现
4. 总结与展望:潜在运动语言的应用前景
Talk·预习资料
▼
论文链接:
项目主页:
Talk·提问交流
▼
在Talk界面下的 【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
Talk·嘉宾介绍
▼
陈奕
香港大学 · 博士生
陈奕,香港大学IDS,HKU-MMLAB二年级博士生,主要研究方向为多模态大模型和具身智能。她曾在ICCV, ACL, EMNLP, SIGIR等人工智能领域的著名国际会议发表多篇学术论文。
个人主页:
https://www.techbeat.net/grzytrkj?id=45528
-The End-
如果你也想成为讲者
▼
自荐 / 推荐
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
▼TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>
来源:小何论科技