Talk预告 | 香港科技大学何晶:LOTUS - 如何更好的利用生成模型的先验知识实现快速且准确的密集预测

B站影视 韩国电影 2025-05-21 10:30 1

摘要:她与大家分享的主题是:“LOTUS - 如何更好的利用生成模型的先验知识实现快速且准确的密集预测”,届时她将对用于图像生成的扩散模型进行系统性的分析,并提出LOTUS,通过改进扩散模型的参数化方式和引入单步范式与细节保留机制,在非常少的训练数据下实现高效、精细

本期为TechBeat人工智能社区686线上Talk。

北京时间5 月22日(周四)20:00,香港科技大学(广州)博士生何晶的Talk将准时在TechBeat人工智能社区开播!

她与大家分享的主题是: “LOTUS - 如何更好的利用生成模型的先验知识实现快速且准确的密集预测”,届时她将对用于图像生成的扩散模型进行系统性的分析,并提出LOTUS,通过改进扩散模型的参数化方式和引入单步范式与细节保留机制,在非常少的训练数据下实现高效、精细的Zero-shot密集预测。

Talk·信息

主题:LOTUS - 如何更好的利用生成模型的先验知识实现快速且准确的密集预测

嘉宾:香港科技大学(广州) · 博士生 - 何晶

时间:北京时间 5月22日(周四)20:00

地点:TechBeat人工智能社区

一键预约TALK!

Talk·介绍

当前的密集预测任务(如单目深度估计和法线估计)在许多视觉应用中至关重要,但其性能往往受限于数据量和模型泛化能力。近年来,预训练文本-图像扩散模型展现出强大的视觉先验能力,有望在Zero-shot密集预测中实现突破。然而,大多数现有方法直接迁移图像生成的扩散架构,忽略了密集预测任务的特点,导致效率低下、预测不稳定等问题。本文对原本用于图像生成的扩散模型进行了系统性的分析,并提出LOTUS,通过改进扩散模型的参数化方式和引入单步范式与细节保留机制,在非常少的训练数据下实现了高效、精细的Zero-shot密集预测。

Talk大纲

1. 简要介绍

2. 相关工作 & 动机

3. 方法(对扩散模型进行三方面的分析)

4. 实验

Talk·预习资料

论文链接:

论文链接:

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

何晶

香港科技大学(广州) · 博士生

香港科技大学(广州)博士二年级学生,主要研究方向为视觉生成模型,图像生成和3D视觉。目前已经在ECCV、ICLR、CVPR和AAAI等顶级会议上发表多篇论文。

个人主页:

https://www.techbeat.net/grzytrkj?id=42603

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

预约本期Talk

来源:科学观察员

相关推荐