机器学习与贝叶斯计算的未来

B站影视 日本电影 2025-03-19 02:44 1

摘要:贝叶斯模型是研究复杂数据的强大工具,允许分析者编码丰富的层次依赖关系并利用先验信息。最重要的是,它们通过后验分布实现了对不确定性的完整刻画。实际的后验计算通常通过马尔可夫链蒙特卡洛(MCMC)方法进行,但对于具有大量观测的高维模型,这种方法在计算上可能不可行。

Machine Learning and the Future of Bayesian Computation

机器学习与贝叶斯计算的未来

摘要:

贝叶斯模型是研究复杂数据的强大工具,允许分析者编码丰富的层次依赖关系并利用先验信息。最重要的是,它们通过后验分布实现了对不确定性的完整刻画。实际的后验计算通常通过马尔可夫链蒙特卡洛(MCMC)方法进行,但对于具有大量观测的高维模型,这种方法在计算上可能不可行。在本文中,我们讨论了如何利用机器学习中的思想来改进后验计算。我们通过关于正则化流(normalizing flows)、贝叶斯核心集(Bayesian coresets)、分布式贝叶斯推断和变分推断的案例探讨了具体的发展方向。

关键词:核心集、联邦学习、机器学习、正则化流、后验计算、变分贝叶斯。

1. 引言

在科学、工业和政策领域,人们对复杂现实世界过程的推断和预测表现出极大的兴趣。贝叶斯模型之所以具有吸引力,是因为它们允许指定丰富的生成模型,这些模型涵盖了数据中的层次结构,能够通过先验自然地纳入专家和/或先前研究的信息,并通过后验分布和预测分布对学习/推断/预测中的不确定性进行完整刻画。将贝叶斯统计应用于复杂现实世界数据的主要障碍是后验计算。在实践中,后验计算——评估后验概率/期望、参数的可信区间、特征的后验包含概率、后验预测区间等——通常基于使用马尔可夫链蒙特卡洛(MCMC)的后验样本。标准的MCMC方法在后验具有复杂几何结构(例如多个相距较远的模式或几何/流形约束)时常常无法收敛。即使从简单的后验中采样,当数据有数千万甚至数亿个观测值时也可能具有挑战性。本文专注于贝叶斯计算的未来,重点研究具有潜在数百万数据点的高维、几何结构复杂的后验推断。

机器学习的近期爆炸性成功对我们设想贝叶斯计算的未来至关重要。为了使我们的设想具体化,我们准备了四个案例,涵盖不相交的前沿计算技术,所有这些技术都涉及机器学习的思想。第一个案例描述了正则化流作为适应复杂目标的自适应MCMC的新工具;第二个案例描述了贝叶斯核心集作为一种在采样前进行数据压缩的方法;第三个案例描述了针对超大数据集的分布式贝叶斯推断;第四个案例描述了现代变分推断,用于前面技术失效的场景。所有部分都重点探讨了未来研究的有前景的方向。

2. 使用深度生成模型进行采样

Metropolis Hastings(MH)算法(通常嵌入在Gibbs采样中)是采样后验分布最受欢迎的工具。良好的混合性能在很大程度上取决于MH提议分布与目标分布的相似程度。随着目标分布的维度增加以及几何结构变得更加复杂,所需的提议分布也必须更加灵活,而这使得调参变得困难。因此,通常的做法是选择更简单的提议分布,例如多变量高斯分布,它们能够提供对目标的良好局部近似。然后,通过自适应学习后验协方差[53,139,153]或离散化由目标驱动的动力学[106,86]来调整参数,以鼓励高效的探索。局部方法的一个主要局限性是它们在实践中难以跨越低概率区域,从而导致多峰分布的收敛速度较慢。为了克服这一问题,人们提出了许多解决方案,范围从略微修改局部核以鼓励跨越低概率区域[73,114,85],到构建全新的核,这些核是局部和全局成分的混合[7,2,129]。尽管取得了这些进展,但目前仍没有一种通用方法能够高效地采样复杂的高维分布。

我们相信深度学习将在开发更好的通用解决方案中发挥重要作用。深度生成模型在估计和近似采样复杂的高维分布方面取得了显著成功,并在图像/音频/视频合成、计算机图形学、物理/工程模拟、药物发现等领域实现了最先进的性能[56,70]。在本节中,我们讨论了如何使用深度生成模型来设计更好的MH提议分布,既可以通过增强现有核,也可以通过构建全新的分布。大多数深度生成模型使用神经网络(NN)将一个简单的基分布转换为与预指定的经验分布紧密匹配的形式。通过MH进行后验计算的设置引入了两个实际问题。首先,在采样之前无法获得目标分布的样本,这使得训练NN的过程变得复杂。其次,MH的每次迭代都需要计算接受概率,因此需要评估提议分布的密度。如果提议分布是一个简单的分布通过NN转换而来,那么这就需要逆向求解NN,这通常是不可能的,并且需要计算雅可比行列式,这在高维情况下可能在数值上难以处理。

在本节中,我们讨论了如何通过自适应调整正则化流(NF)提议来解决这些挑战。第2.1节介绍正则化流;第2.2节和第2.3节涵盖了其在MH中的应用及其直接的推广;第2.4节讨论了令人兴奋的未来研究方向。

2.1 正则化流简介

来源:人工智能学家

相关推荐