机器之心报道机器之心编辑部扩散模型和流匹配实际上是同一个概念的两种不同表达方式吗?从表面上看,这两种方法似乎各有侧重:扩散模型专注于通过迭代的方式逐步去除噪声,将数据还原成清晰的样本。而流匹配则侧重于构建可逆变换系统,目标是学习如何将简单的基础分布精确地映射到真实数据分布。因为流匹配的公式很简单,并且生成样本的路径很直接,最近越来越受研究者们的欢迎,于是很多人都在问:「到底是扩散模型好呢?还是流匹配好?」现在,这个困扰已得到解答。Google DeepMind 的研究团队发现,原来扩散模型和流匹配就像一枚硬币的两面,本质上是等价的 (尤其是在流匹配采用高斯分布作为基础分布时),只是不同的模型设定会导致不同的网络输出和采样方案。这无疑是个好消息,意味着这两种框架下的方法可以灵活搭配,发挥组合技了。比如在训练完一个流匹配模型后,不必再局限于传统的确定性采样方法,完全可以引入随机采样策略。从流匹配到扩散:总之,除了训练考虑和采样器选择之外,扩散和高斯流匹配没有根本区别。结语读到这里,想必你已经理解了扩散模型和高斯流匹配的等价性。不过,文中重点介绍的是流匹配为该领域带来的两个新模型规范:网络输出:流匹配提出了一种网络输出的向量场参数化方案,并且其不同于扩散文献中使用的方案。当使用高阶采样器时,网络输出可能会有所不同。它也可能影响训练动态。采样噪声调度:流匹配利用了简单的采样噪声调度 α_t = 1-t 和 σ_t = t,并且更新规则与 DDIM 相同。该团队最后表示:「如果能通过实证方式研究这两个模型规范在不同的真实应用中的重要性,那一定会很有趣。我们将此留给了未来的工作。」参考文献Flow matching for generative modelingLipman, Y., Chen, R.T., Ben-Hamu, H., Nickel, M. and Le, M., 2022. arXiv preprint arXiv:2210.02747.Flow straight and fast: Learning to generate and transfer data with rectified flowLiu, X., Gong, C. and Liu, Q., 2022. arXiv preprint arXiv:2209.03003.Building normalizing flows with stochastic interpolantsAlbergo, M.S. and Vanden-Eijnden, E., 2022. arXiv preprint arXiv:2209.15571.Stochastic interpolants: A unifying framework for flows and diffusionsAlbergo, M.S., Boffi, N.M. and Vanden-Eijnden, E., 2023. arXiv preprint arXiv:2303.08797.Denoising diffusion implicit modelsSong, J., Meng, C. and Ermon, S., 2020. arXiv preprint arXiv:2010.02502.Score-based generative modeling through stochastic differential equationsSong, Y., Sohl-Dickstein, J., Kingma, D.P., Kumar, A., Ermon, S. and Poole, B., 2020. arXiv preprint arXiv:2011.13456.Understanding diffusion objectives as the elbo with simple data augmentationKingma, D. and Gao, R., 2024. Advances in Neural Information Processing Systems, Vol 36.Diffusion is spectral autoregression [HTML]Dieleman, S., 2024.Scaling rectified flow transformers for high-resolution image synthesisEsser, P., Kulal, S., Blattmann, A., Entezari, R., Muller, J., Saini, H., Levi, Y., Lorenz, D., Sauer, A., Boesel, F. and others,, 2024. Forty-first International Conference on Machine Learning.Elucidating the design space of diffusion-based generative modelsKarras, T., Aittala, M., Aila, T. and Laine, S., 2022. Advances in neural information processing systems, Vol 35, pp. 26565—26577.Knowledge distillation in iterative generative models for improved sampling speed [PDF]Luhman, E. and Luhman, T., 2021. arXiv preprint arXiv:2101.02388.Denoising diffusion probabilistic modelsHo, J., Jain, A. and Abbeel, P., 2020. Advances in neural information processing systems, Vol 33, pp. 6840—6851.Progressive Distillation for Fast Sampling of Diffusion ModelsSalimans, T. and Ho, J., 2022. International Conference on Learning Representations.Dpm-solver++: Fast solver for guided sampling of diffusion probabilistic modelsLu, C., Zhou, Y., Bao, F., Chen, J., Li, C. and Zhu, J., 2022. arXiv preprint arXiv:2211.01095.© THE END转载请联系本公众号获得授权投稿或寻求报道:liyazhou@jiqizhixin.com摘要:从流匹配到扩散:总之,除了训练考虑和采样器选择之外,扩散和高斯流匹配没有根本区别。结语读到这里,想必你已经理解了扩散模型和高斯流匹配的等价性。不过,文中重点介绍的是流匹配为该领域带来的两个新模型规范:网络输出:流匹配提出了一种网络输出的向量场参数化方案,并且其
来源:小隐看科技
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!