cvpr2025

动态场景,开放文本查询!清华哈佛联合建模4D语言场|CVPR2025

4D LangSplat通过结合多模态大语言模型和动态三维高斯泼溅技术,成功构建了动态语义场,能够高效且精准地完成动态场景下的开放文本查询任务。该方法利用多模态大模型生成物体级的语言描述,并通过状态变化网络实现语义特征的平滑建模,显著提升了动态语义场的建模能力

哈佛 建模 语义场 cvpr2025 建模4d 2025-04-02 17:27  1

CVPR2025|EmoEdit:情感可编辑?深大VCC带你见证魔法!

EmoEdit 由深圳大学可视计算研究中心黄惠教授课题组完成,第一作者为杨景媛助理教授。深圳大学可视计算研究中心(VCC)以计算机图形学、计算机视觉、人机交互、机器学习、具身智能、可视化和可视分析为学科基础,致力前沿探索与跨学科创新。中心主任黄惠为深圳大学讲席

深大 vcc cvpr2025 emoedit adapte 2025-03-30 22:03  2