Talk预告|加州大学洛杉矶分校周诗杰:迈向4D空间智能 - 当动态3D场景表示遇见视觉语言大模型

B站影视 港台电影 2025-03-25 14:32 1

摘要:他与大家分享的主题是:“迈向4D空间智能 - 当动态3D场景表示遇见视觉语言大模型”,届时他将探索:从 3D 场景表征的底层逻辑到动态 4D 重建的前沿突破,并聚焦多模态认知架构,剖析现有智能体在时空认知能力上与人类的差距。

本期为TechBeat人工智能社区671线上Talk。

北京时间3 月26日(周三)20:00,加州大学洛杉矶分校博士生周诗杰的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “迈向4D空间智能 - 当动态3D场景表示遇见视觉语言大模型”,届时他将探索:从 3D 场景表征的底层逻辑到动态 4D 重建的前沿突破,并聚焦多模态认知架构,剖析现有智能体在时空认知能力上与人类的差距。

Talk·信息

主题:迈向4D空间智能 - 当动态3D场景表示遇见视觉语言大模型

嘉宾:加州大学洛杉矶分校 · 博士生 - 周诗杰

时间:北京时间 3月26日(周三)20:00

地点:TechBeat人工智能社区

一键预约TALK!

Talk·介绍

如何让AI真正理解我们所处的世界?物理世界的本质是三维空间与时间流变的统一场域——我们称之为4D时空场。当前AGI大模型与智能体的终极使命,正是要在这动态的时空连续体中实现与人类的无缝协作。构建具备4D时空认知能力的智能系统,已成为解锁下一代AI潜能的关键密钥。

本次Talk我们将探索:首先解构3D场景表征的底层逻辑,沿着"静态3D重建→动态4D重建"的技术脉络,揭示时空连续体特征场建模的前沿突破;进而聚焦多模态认知架构,从语义拓扑构建到视觉语言大模型的推理跃迁,剖析现有智能体的时空认知能力距离人类到底还差多远。

Talk大纲

0. 3D场景表示入门与基础

参考:3DGS时代的三维场景表示与生成

https://techbeat.net/talk-info?id=877

1. 构建3D静态语义世界 (Feature 3DGS - CVPR 2024 Highlight)

2. 从3D场景表示到4D智能体(Feature4X - CVPR 2025)

3. 我们距离真正具备4D时空意识的智能体还有多远 (VLM4D - Technical Report)

Talk·预习资料

论文链接:

项目主页:

项目主页:

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

周诗杰

加州大学洛杉矶分校 · 博士生

周诗杰,加州大学洛杉矶分校(UCLA)博士生,研究方向为3D计算机视觉与空间智能。他在CVPR,ECCV,NeurIPS,ICLR等计算机视觉与人工智能顶会发表过多篇论文,其中2篇荣获CVPR 2024 Highlight和ICLR 2025 Spotlight,同时他也是SIGGRAPH,CVPR等顶会审稿人。他曾在Google担任学生研究员,并将于2025年加入Apple担任研究实习生,致力于空间智能研发。曾获UCLA视觉与图形学傅立叶学者奖,加州大学研究生院长学者奖,哥伦比亚大学硕士荣誉学生奖,电子科技大学优秀本科毕业生奖等。

个人主页:

https://www.techbeat.net/grzytrkj?id=39927

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

来源:小朵说科学

相关推荐