脑机启侦|算法揭示了我们大脑中的一个小区域如何在动机中发挥关键作用(06.07)

B站影视 欧美电影 2025-06-07 00:03 2

摘要:大脑中一个被称为腹侧被盖区(VTA)的小区域在我们处理奖励的过程中起着关键作用。它产生多巴胺,这是一种神经调节剂,有助于根据情境线索预测未来的奖励。日内瓦大学(UNIGE)、哈佛大学和麦吉尔大学的团队发现,VTA的功能更进一步:它不仅编码预期的奖励,还编码预期

大脑中一个被称为腹侧被盖区(VTA)的小区域在我们处理奖励的过程中起着关键作用。它产生多巴胺,这是一种神经调节剂,有助于根据情境线索预测未来的奖励。日内瓦大学(UNIGE)、哈佛大学和麦吉尔大学的团队发现,VTA的功能更进一步:它不仅编码预期的奖励,还编码预期奖励的精确时刻。

这一发现得益于机器学习算法,凸显了人工智能与神经科学相结合的价值。这项研究发表在《自然》杂志上。


01

VTA编码预期奖励的精确时刻

腹侧被盖区(VTA)在动机和大脑的奖赏回路中起着关键作用。作为多巴胺的主要来源,这小群神经元将这种神经调节剂传递到大脑的其他区域,从而触发对积极刺激做出反应的行为。

“最初,人们认为中脑腹侧被盖区仅仅是大脑的奖励中心。但在20世纪90年代,科学家发现它并不编码奖励本身,而是编码对奖励的预测,”日内瓦大学医学院基础神经科学系正教授亚历山大·普盖特(Alexandre Pouget)解释道。

动物实验表明,例如,当奖励持续跟随光信号出现时,腹侧被盖区最终释放多巴胺,并非在奖励出现时,而是在信号出现时。因此,这种反应编码的是与信号相关的奖励预测,而非奖励本身。

多巴胺能神经元表现出多种折扣因子,可以解码奖励延迟。


02

更复杂的功能


多巴胺能神经元之间折扣因子的多样性解释了不同的斜坡活动。

这种“强化学习”只需极少的监督,是人类学习的核心。它也是许多通过训练提升性能的人工智能算法背后的原理,例如第一个击败围棋世界冠军的算法——AlphaGo。

在最近的研究中,Pouget 团队与哈佛大学的 Naoshige Uchida 和麦吉尔大学的 Paul Masset 合作,证明了 VTA 的编码比之前认为的更加复杂。“VTA 不是预测未来奖励的加权和,而是预测它们的时间演变。换句话说,每项奖励都是单独表示的,并带有预期的精确时刻,”领导这项研究的日内瓦大学 (UNIGE) 研究员解释道。

“虽然我们知道中脑腹侧被盖区 (VTA) 神经元优先考虑近期的奖励,而不是远期的奖励,这正体现了双鸟在林不如一鸟在手的原则,但我们发现不同的神经元会以不同的时间尺度进行此类操作,一些神经元关注几秒钟内可能出现的奖励,另一些则关注一分钟内预期出现的奖励,还有一些则关注更远的奖励。

“正是这种多样性使得奖励时间的编码成为可能。这种更精细的表征赋予了学习系统极大的灵活性,使其能够根据个体的目标和优先级进行调整,以最大化即时或延迟的奖励。”


03

人工智能与神经科学:一条双向通道

这些发现源于神经科学与人工智能之间富有成效的对话。Pouget 开发了一种纯数学算法,其中融入了奖励处理的时间。与此同时,哈佛大学的研究人员收集了大量关于动物体验奖励时中脑腹侧被盖区(VTA)活动的神经生理学数据。“然后,他们将我们的算法应用于他们的数据,发现结果与他们的经验发现完全吻合。”

虽然大脑启发了人工智能和机器学习技术,但这些结果表明算法也可以作为揭示我们的神经生理机制的有力工具。该项研究揭示的大脑“时间预测”机制也为脑机接口应用提供更精细的奖励编码模型,为构建“时域强化学习”系统,提升用户行为调控能力奠定了理论基础。

新闻来源:Medical Press

论文参考:DOI: 10.1038/s41586-025-08929-9

来源:启真脑机智能基地

相关推荐