人大联合值得买科技在CVPR 2025提全新「图像到有声视频」生成框架 本文介绍工作由中国人民大学高瓴人工智能学院宋睿华团队、李崇轩、许洪腾与值得买科技 AI 团队共同完成。第一作者王希华是人大高瓴博士生(导师:宋睿华),他的研究兴趣主要在多模态生成,之前提出利用音频布局(audio layout)为视频生成同步声音的TiVA模型 视频 图像 人大 cvpr 宋睿 2025-05-29 11:51 3