摘要:大脑活动在控制行为时会产生无意识的伴随动作,这些动作是否能揭示潜在的认知状态?葡萄牙尚帕里莫基金会的Fanny Cazettes和Zachary F. Mainen等人研究发现,小鼠的面部表情能够同时编码多个决策变量,甚至包括当前未被使用的变量,并揭示了这些表
脑科学动态
通过看小鼠“面相”,揭示其认知功能
从行为建模到意识理论:主动推理框架中隐含的最小意识理论
压力通过杀死1%的特定神经元来减少大脑供血
听力损失重塑婴儿大脑网络,早期语言干预刻不容缓
痴呆症早期预警新线索:言语中的停顿成关键指标
越累学得越快?新研究发现大脑在疲劳时更具可塑性
胜则奖赏,败则失控:神经影像学揭示球迷大脑的极端反应
AI行业动态
扎克伯格夫妇千亿豪赌AI+生物学,誓言在本世纪末根治所有疾病
AI制药独角兽Iambic再获超1亿美元融资
AI驱动生物科技革命:20年护肤品研发周期缩短至10个月
图灵奖得主Yann LeCun告别Meta,传将创立新公司
AI驱动科学
拓扑感知深度学习模型增强了基于脑电图的运动想象解码能力
AI大脑新图谱:记忆与推理功能分离,可精准“编辑”记忆
“读心”的秘密:大语言模型如何通过极稀疏参数编码心智理论
AI假脸防不胜防?研究发现五分钟训练即可擦亮双眼
微小的数字摩擦可以减缓虚假信息的传播
脑科学动态
通过看小鼠“面相”,揭示其认知功能
大脑活动在控制行为时会产生无意识的伴随动作,这些动作是否能揭示潜在的认知状态?葡萄牙尚帕里莫基金会的Fanny Cazettes和Zachary F. Mainen等人研究发现,小鼠的面部表情能够同时编码多个决策变量,甚至包括当前未被使用的变量,并揭示了这些表情部分起源于次级运动皮层的神经活动。
研究团队设计了一个概率性觅食任务,让小鼠在舔舐糖水时,需要根据不同策略(例如计算连续失败次数或累计奖励)来决定是否切换位置。通过高分辨率视频和奇异值分解分析,研究人员发现小鼠的面部表情而非身体动作,能够同时且精确地编码多个决策变量,即使某些变量在当前决策中并未被采纳。这些面部模式在不同小鼠间具有惊人的一致性,如同刻板的“表情包”。为探究其神经起源,团队同步记录了多个脑区的神经活动。结果显示,次级运动皮层(M2)对决策变量的编码在时间上略早于面部表情的出现,而面部表情的出现又早于眶额皮层等其他脑区。这一发现表明,M2的神经活动是这些认知性面部表情的驱动源头之一,证明了通过非侵入性的面部监测,可以揭示大脑中原本潜在的认知计算过程。研究发表在 Nature Neuroscience 上。
#认知科学 #神经机制与脑功能解析 #决策 #面部表情
阅读更多:
Cazettes, Fanny, et al. “Facial Expressions in Mice Reveal Latent Cognitive Variables and Their Neural Correlates.” Nature Neuroscience, vol. 28, no. 11, Nov. 2025, pp. 2310–18. www.nature.com, https://doi.org/10.1038/s41593-025-02071-5
从行为建模到意识理论:主动推理框架中隐含的最小意识理论
意识研究领域长期存在理论碎片化问题,不同理论难以相互比较和验证。Christopher J. Whyte, Karl J. Friston, Anil K. Seth 等研究人员另辟蹊径,提出不应从意识的某个特定方面出发,而应从一个普适性的行为建模框架——主动推理中,自下而上地构建一个最小且可检验的意识理论。
该理论的核心基于主动推理框架,它将大脑视为一个预测机器,其根本目标是最小化“意外”,即预测与感官输入之间的误差。研究者指出,这一过程通过最小化一个称为变分自由能的目标函数来实现。在感知层面,大脑需要在最大化预测准确性与最小化模型复杂性之间取得平衡,以形成对外部世界的稳定认知。在行动层面,大脑通过最小化预期自由能来规划未来,这要求智能体在追求偏好目标(降低风险)、减少对世界状态的不确定性(降低模糊性)以及探索新信息(最大化新颖性)之间进行权衡。研究团队认为,这个统一的数学框架本身就隐含了一套关于意识的理论承诺。通过将主动推理模型应用于意识科学的各种现象——从基本的知觉意识到复杂的自我意识——可以发现它们背后共通的计算原理。这种方法有望超越现有理论的局限,为意识研究提供一种统一的数学语言和可检验的理论基础。研究发表在 Physics of Life Reviews 上。
#意识与脑机接口 #计算模型与人工智能模拟 #主动推理 #自由能原理
阅读更多:
Whyte, Christopher J., et al. “On the Minimal Theory of Consciousness Implicit in Active Inference.” Physics of Life Reviews, Nov. 2025. ScienceDirect, https://doi.org/10.1016/j.plrev.2025.11.002
压力通过杀死1%的特定神经元来减少大脑供血
压力如何具体损害大脑并可能增加神经退行性疾病风险?宾夕法尼亚州立大学的 Kevin Turner, Patrick J. Drew 等研究人员聚焦于一类对压力极其敏感的罕见神经元,发现其对于维持正常的脑血流和神经活动至关重要,其缺失可能是连接压力与脑功能下降的关键环节。
▷ 研究团队的目标神经元类型是 1 型 nNOS(上图中黄色部分),与其他脑神经元相比,这种神经元较为罕见。通过注射法,研究团队能够系统性地清除脑中的这类神经元,从而深入了解它们所发挥的作用。Credit: Patrick Drew / Penn State
研究团队开创了一种新方法,通过向小鼠的体感皮层(somatosensory cortex,处理触觉等感觉输入的区域)精准注射一种名为皂苷(saporin)的毒性蛋白,特异性地清除了数量稀少(占大脑神经元不足1%)的I型nNOS神经元(type-one nNOS neurons)。随后,他们利用高分辨率成像和电极监测发现,缺少了这些神经元的小鼠,其脑血管规律性的扩张和收缩,即自发振荡(spontaneous oscillation),幅度显著减小,导致整体脑血流量下降。同时,大脑的电活动也普遍减弱。有趣的是,这些负面影响在睡眠期间比清醒时更为严重,暗示了这类神经元对大脑在睡眠中的恢复和支持功能可能尤为重要。此外,大脑两个半球之间的神经信号协调性也随之降低。这项研究表明,这一小群对压力脆弱的神经元在协调全脑范围的血流和神经活动中扮演着“指挥官”的角色,它们的丧失可能是慢性压力导致大脑健康恶化的一个此前未被探明的重要原因。研究发表在 eLife 上。
#疾病与健康 #神经机制与脑功能解析 #压力 #阿尔茨海默病 #脑血流
阅读更多:
Turner, Kevin, et al. “Type-I nNOS Neurons Orchestrate Cortical Neural Activity and Vasomotion.” eLife, edited by Mark T Nelson and Laura L Colgin, vol. 14, Nov. 2025, p. RP105649. eLife, https://doi.org/10.7554/eLife.105649
听力损失重塑婴儿大脑网络,早期语言干预刻不容缓
生命早期听觉输入对大脑发育至关重要,但听力损失如何影响婴儿大脑功能网络的建立尚不明确。加州大学默塞德分校的Heather Bortfeld和北京师范大学的Haijing Niu等人通过研究揭示,患有先天性听力损失的婴儿未能形成正常的语言优势半球(左脑)功能特化,这凸显了早期干预的紧迫性。
▷ 典型发育 (TD) 和先天性感觉神经性听力损失 (SNHL) 婴儿半球网络发育差异。( A ) 全局效率人工智能 ( E glob ) 的发育比较。( B ) 局部效率人工智能 ( E loc ) 的发育比较。Credit: Science Advances (2025).
研究团队利用功能性近红外光谱对112名3至9个月大的婴儿进行了研究,其中包括52名患有先天性感觉神经性听力损失(SNHL)的婴儿。研究发现,虽然所有婴儿的大脑网络都具备高效的“小世界”结构,但其发育轨迹出现了显著差异。正常发育的婴儿随着年龄增长,其大脑左半球的网络效率会逐渐增强,形成处理语言等高级认知功能所必需的大脑不对称模式。然而,患有听力损失的婴儿并未表现出这种关键的左侧化发展趋势。这种发育差异的程度与听力损失的严重性直接相关,听力受损越严重,大脑左半球功能特化的缺失就越明显。这一发现将听力损失重新定义为一个大脑发育问题,而不仅仅是耳朵的问题,并强调了早期干预的必要性,即通过助听器、人工耳蜗或手语等方式,在婴儿大脑可塑性最强的时期提供丰富的语言环境,以促进关键神经通路的正常建立。研究发表在 Science Advances 上。
#疾病与健康 #神经机制与脑功能解析 #听力损失 #大脑可塑性
阅读更多:
Liu, Guangfang, et al. “Developmental Alterations in Brain Network Asymmetry in 3- to 9-Month Infants with Congenital Sensorineural Hearing Loss.” Science Advances, vol. 11, no. 42, Oct. 2025, p. eadx1327. science.org (Atypon), https://doi.org/10.1126/sciadv.adx1327
痴呆症早期预警新线索:言语中的停顿成关键指标
我们日常说话的方式能否揭示大脑健康状况?为解决传统认知测试的局限性,来自贝克雷斯特研究所、多伦多大学和约克大学的 Hsi T. Wei, Jed A. Meltzer 等研究人员利用人工智能分析自然言语,发现说话时的停顿、填充词(如“呃”、“嗯”)等不流畅特征,是衡量执行功能(支持记忆、计划等高级思维能力)的敏感指标。
研究团队通过两项实验,共招募了241名年龄从18岁到90岁的健康成年人。参与者被要求口头描述复杂的图片,同时完成标准的执行功能测试。研究人员利用人工智能技术对录音进行分析,从中提取了数百个细微的言语特征。结果明确显示,言语的不流畅性,特别是反映找词困难的停顿和填充词,与执行功能测试的表现密切相关。这一关联不仅存在于老年人中,而且贯穿整个成年期,并且在控制了年龄、性别和教育程度等因素后依然显著。这表明,说话时的“卡顿”并非简单的语言习惯,而可能反映了大脑处理信息的速度和效率。这项研究证实了自然言语分析作为一种便捷、无创且可重复的认知评估工具的巨大潜力,未来有望用于大规模筛查,帮助早期识别认知下降速度超常的痴呆症高风险人群。研究发表在 Journal of Speech, Language, and Hearing Research 上。
#疾病与健康 #预测模型构建 #认知科学 #早期诊断
阅读更多:
Wei, Hsi T., et al. “Natural Speech Analysis Can Reveal Individual Differences in Executive Function Across the Adult Lifespan.” Journal of Speech, Language, and Hearing Research. pubs.asha.org (Atypon), https://doi.org/10.1044/2025_JSLHR-24-00268. Accessed 12 Nov. 2025
越累学得越快?新研究发现大脑在疲劳时更具可塑性
大脑对外界的反应并非恒定,其功能状态受昼夜节律的深刻影响,但其神经机制尚不清晰。日本东北大学的Yuki Donen, Yoko Ikoma, 和 Ko Matsui研究团队通过对大鼠的研究,揭示了大脑皮层的兴奋性和学习能力在一天内会发生节律性变化,并发现神经递质腺苷是关键的调控分子,其研究成果为优化学习和康复治疗提供了新的视角。
▷ 记录皮层神经信号的昼夜节律。(A) 在 Thy1-ChR2 大鼠中,通过光遗传学方法激活皮层神经元,并在视觉皮层记录局部场电位 (LFP)。(B) 日落时第三负 LFP 相位的斜率大于日出时,表明傍晚的反应更强。(C) 三天平均信号显示出与光暗周期同步的约 24 小时正弦模式。Credit: Yuki Donen, Yoko Ikoma, Ko Matsui
研究人员利用光遗传学技术,在不同时间点精确激活夜行性大鼠视觉皮层中的神经元,并记录其电活动。结果显示,神经元的兴奋性存在明显的昼夜节律:在日落时(大鼠刚睡醒,准备开始活动)神经反应最强,而在日出时(活动一夜后,准备休息)反应则显著减弱。进一步的机制研究发现,这种变化由腺苷(adenosine,一种在清醒期间积累并导致困倦的分子)调控。当研究者在日出时阻断腺苷受体的作用,神经元的反应强度便恢复到了日落时的高水平。更令人意外的是,研究发现大脑的可塑性也遵循昼夜节律。长期增强作用(long-term potentiation, LTP,被认为是学习和记忆的细胞基础)在日出时更容易被诱导,此时大鼠最为疲劳,睡眠压力最大;而在日落时则无法诱导。这表明大脑在疲劳状态下反而更具“元可塑性”(metaplasticity,指可塑性本身的可塑性),更容易发生持久的改变。这一发现暗示大脑存在进行学习和适应的“黄金窗口”,或有助于未来优化康复训练和刺激疗法的时间安排。研究发表在 Neuroscience Research 上。
#神经科学 #神经机制与脑功能解析 #昼夜节律 #神经可塑性
阅读更多:
Donen, Yuki, et al. “Diurnal Modulation of Optogenetically Evoked Neural Signals.” Neuroscience Research, vol. 221, Dec. 2025, p. 104981. ScienceDirect, https://doi.org/10.1016/j.neures.2025.104981
胜则奖赏,败则失控:神经影像学揭示球迷大脑的极端反应
为何球迷在观看比赛时会表现出极端的情绪和行为?为探究竞争环境中社会认同的神经机制,来自智利圣地亚哥阿莱马纳诊所和圣塞巴斯蒂安大学的 Francisco Zamorano 及其团队,利用神经影像学技术揭示了足球迷在观看宿敌对决时大脑活动的剧烈变化,发现了一种“奖励增强,控制减弱”的神经模式。
▷ 重大失败的负面影响示意图。在重大失败期间,显著性网络会被抑制。色条代表 Z 值(暖色表示较高的正 Z 值,冷色表示负值/相对抑制)。A = 前侧,L = 左侧,S = 上方。Credit: Radiological Society of North America (RSNA)
研究团队采用功能性磁共振成像,对60名健康男性足球迷进行了扫描。参与者在扫描期间观看了包含其主队、宿敌及中立球队的比赛进球片段。研究结果显示,当球迷目睹自己的主队战胜宿敌时,大脑中与奖赏和愉悦感相关的区域,如腹侧纹状体(ventral striatum),被显著激活,这强化了他们的群体归属感和社会认同。相反,当球队被宿敌击败时,负责认知控制和决策的关键脑区——背侧前扣带回皮层(dorsal anterior cingulate cortex, dACC)的活动却出现矛盾性的抑制。这种控制能力的下降,可能正是导致球迷在遭遇重大失败时表现出非理性甚至攻击性行为的神经基础。研究者指出,这种神经反应模式在生命早期就已形成,并可能延伸到体育之外的政治狂热等领域。研究发表在 Radiology 上。
#认知科学 #神经机制与脑功能解析 #社会认同 #情绪调节
阅读更多:
Zamorano, Francisco, et al. “Brain Mechanisms across the Spectrum of Engagement in Football Fans: A Functional Neuroimaging Study.” Radiology, vol. 317, no. 2, Nov. 2025, p. e242595. pubs.rsna.org (Atypon), https://doi.org/10.1148/radiol.242595
AI 行业动态
扎克伯格夫妇千亿豪赌AI+生物学,誓言在本世纪末根治所有疾病
随着 Meta 股价飙升,Mark Zuckerberg 和 Priscilla Chan 夫妇旗下的慈善机构 CZI (Chan Zuckerberg Initiative,陈-扎克伯格倡议) 承诺投入的资金已从最初的 450 亿美元增长至超过 2000 亿美元。CZI 正在进行战略重心调整,几乎停止了所有非科学领域的资助,并将原定目标“在本世纪末治愈、预防或管理所有疾病”升级为更具雄心的“在本世纪末治愈、预防所有疾病”。为实现这一目标,CZI 宣布在接下来的十年将对基础科学研究的投入增加一倍以上,达到至少 100 亿美元,年度投入规模已与霍华德·休斯医学研究所(HHMI)等老牌生物医学慈善巨头相当。研究人员指出,此次投入的重点在于加大对 AI 与生物学结合领域的押注,旨在利用尖端人工智能技术大幅加速新疗法的探索,推动医学前沿发展。
CZI 对 AI 的加码主要体现在两个方面:人才引进和核心项目构建。CZI 旗下的非盈利机构科研机构 Biohub(CZI 整合旗下的三个实验室和成像中心重新设立的科研机构)已收购了 EvolutionaryScale 公司,并任命该公司创始人、麻省理工学院/哈佛大学博德研究所(Broad Institute of MIT and Harvard)的计算机科学家 Alex Rives 为科学主管。Alex Rives 曾在 Meta 基础人工智能研究实验室领导开发了蛋白质语言模型,其团队后创立 EvolutionaryScale 并推出了 ESM-3(EvolutionaryScale Model 3,第一个同时对蛋白质的序列、结构和功能进行推理的生成式人工智能模型)。重组后的 Biohub 将由 Alex Rives 领导,致力于构建一个通用的虚拟细胞模型。此外,CZI 在一份预印本论文中阐述了一项重大 AI 计划,目标是构建人类免疫系统虚拟模型,推动免疫学从描述性科学向能够动态模拟和干预的预测性工程化科学转变。研究人员将其称为“第三次免疫学革命”,核心是“预测免疫学循环”(Predictive Immunology Loop),旨在通过融合大规模因果实验数据与生成式 AI 模型,最终构建出具有如物理学“标准模型”般解释力的“虚拟免疫系统”。
#CZI #AI +Biology #虚拟免疫系统 #AlexRives #预测免疫学
阅读更多:
AI制药独角兽Iambic再获超1亿美元融资,携手Jazz攻克HER2难治性癌症
AI 制药公司 Iambic Therapeutics 近期宣布完成一轮超额认购融资,金额超过 1 亿美元。此次融资阵容强大,包括红杉、雷杰纳荣投资(Regeneron Ventures)和卡塔尔投资局等知名机构的新老投资者共同支持,显示出资本市场对其技术平台的高度认可。这笔新资金将主要用于加速其由 AI 驱动的治疗管线(Pipeline,即正在研发中的药物项目)进入临床阶段,重点是 KIF18A 和 CDK2/4 项目,并寻求更多的商业合作。Iambic 联合创始人兼首席执行官 Tom Miller 博士强调,此次融资是对团队卓越工作的肯定,并期待继续推动临床进展。
该公司的核心竞争力在于其 AI 药物发现平台,该平台能够利用蛋白质结构预测模型 NeuralPLexer 快速预测药物分子与靶点蛋白质的结合方式,并智能设计出更优、更安全的候选药物分子,从而大幅缩短临床前研究时间。该平台首个成功范例是主打候选药物 IAM1363,这款能穿透血脑屏障的 HER2 小分子酪氨酸激酶抑制剂(Tyrosine Kinase Inhibitor, TKI,一类阻断特定信号通路的小分子抗癌药)近期在欧洲肿瘤内科学会(ESMO)年会上公布了早期临床数据,显示出在对现有疗法耐药的多种癌症中具有抗肿瘤活性。基于这一亮眼表现,Iambic 上个月与制药巨头 Jazz Therapeutics 达成合作,共同研究 IAM1363 与其 HER2 靶向双特异性抗体 Ziihera 的联合疗法,旨在挑战难治性 HER2 阳性乳腺癌。这标志着 Iambic 正加速从技术平台公司转型为拥有多条临床管线、具备强大商业化潜力的生物制药公司,预示着 AI 制药正逐步进入收获期。
#AI制药 #IambicTherapeutics #IAM1363 #联合疗法 #NeuralPLexer
阅读更多:
AI驱动生物科技革命:Debut Biotech将20年护肤品研发周期缩短至10个月
Debut Biotech 是一家专注于利用先进生物技术和人工智能加速皮肤健康领域新成分发现的公司。有别于传统生物科技公司仅注重技术横向发展,Debut 致力于将前沿研究成果快速商业化并推向市场,目前已与 Image Skincare 等品牌合作,其最新成果将于明年上市。公司开发了医药级、基于基因组学的 AI 技术平台 BeautyORB™,显著加速了新成分的研发流程。研究人员指出,借助 AI 的强大能力,他们能够以前所未有的速度和效率筛选超过 500 亿种潜在成分。这一突破性技术将原本需要 20 年才能通过传统方法完成的分子筛选和发现工作,压缩至短短 10 个月左右的计算即可实现,成功发现了新的分子途径,并创造出高性能的护肤配方。
BeautyORB™ 平台的核心在于其 AI/ML模型,这些模型从专有的大规模功能基因组学数据中学习,能够预测新分子对基因表达特征的影响,从而创建出具有靶向功效的成分。该平台依赖于高通量 RNA 测序平台,能够在自动化、受控的生物相关细胞培养模型中,测试小分子对多达 30,000 个人类基因的响应。此外,BeautyORB™ 还集成了定量结构活性关系(QSAR,Quantitative Structure-Activity Relationship,一种仅基于分子结构预测其生物活性的模型)模型,使得平台能够快速从数十亿个可合成的小分子集合中发现生物活性物质。在制造环节,Debut 科学家利用工程化微生物菌株(如酵母或细菌)和优化酶,通过迭代的设计-构建-测试-学习(DBTL,Design-Build-Test-Learn)循环,在无细胞反应中高效生产高性能分子,降低了下一代成分的生产成本,标志着 AI 与生物技术正从传统的制药实验室走向更贴近大众生活的消费领域。
#BeautyORB #AIforScience #生物合成 #护肤品研发 #基因组学
阅读更多:
图灵奖得主Yann LeCun告别Meta,传将创立新公司
据《金融时报》援引知情人士报道,Meta 首席人工智能研究人员Yann LeCun 计划离开公司,并正就筹集资金进行早期洽谈,以创办自己的初创公司。这一消息紧随 PyTorch 之父 Soumith Chintala 宣布离职数天后传来,虽然突然但并不令人意外。LeCun 的离开反映了 Meta 内部在 AI 战略上的巨大动荡和新旧冲突。自今年 6 月 Mark Zuckerberg斥资收购 Scale AI 并任命 Alexandr Wang领导超级智能实验室以来,Meta 内部进行了大刀阔斧的调整和裁员,十月底裁减了大约 600 个职位,波及到 FAIR(Facebook AI Research,脸书人工智能研究院)等多个团队。这种内部矛盾和对学术自由的限制,使得这位坚持开放研究模式的图灵奖得主感到尴尬,并最终选择了离开。
Yann LeCun 在 Meta 的历史始于 2013 年,当时 Mark Zuckerberg 亲自邀请他加入,并同意了 LeCun 坚持的条件:FAIR 必须采用开放的研究模式,像学术界一样公开发表论文,这对于吸引和留住顶尖人才至关重要。此后,FAIR 为 Meta 提供了核心技术和开源工具(如 PyTorch),并在大模型竞争初期,凭借其 Llama 系列模型确立了 Meta 在开放人工智能生态中的独特地位。然而,在如今竞争日益残酷的环境下,随着 Meta 对 FAIR 实验室施加锁紧论文发表的新政策,以及内部组织文化的混乱,FAIR 早期所代表的“理想主义”正在退潮。研究人员认为,正是这种学术自由受限的环境,加速了 LeCun 的辞职意愿。目前,LeCun 尚未正式离职,但他即将开启的创业新征程,无疑将为人工智能领域带来新的期待。
#YannLeCun #Meta #FAIR #人工智能创业 #开源战略
阅读更多:
AI 驱动科学
拓扑感知深度学习模型增强了基于脑电图的运动想象解码能力
解码大脑中的运动想象(MI)信号是脑机接口技术的关键,但信号的低信噪比和复杂性使其极具挑战。为解决此问题,日本千叶大学的 Chaowen Shen 和 Akio Namiki 提出了一种创新的拓扑感知多尺度特征融合(TA-MFF)网络,通过深度整合脑电信号的多维度信息,显著提升了解码的准确性和鲁棒性。
传统深度学习模型在处理运动想象脑电图(MI-EEG)信号时,常忽略频谱与拓扑特征间的深层依赖。为此,研究团队构建了拓扑感知多尺度特征融合网络(TA-MFF network),该网络包含一个时空网络(ST-Net)和一个频谱网络(S-Net)。其核心创新在于三个新模块的协同工作:首先,频谱拓扑数据分析处理(S-TDA-P)模块利用持久同调(persistent homology,一种分析数据拓扑结构的数学工具)来捕捉电极之间稳定、深层的空间关系。同时,跨频谱递归注意力(ISRA)模块对不同频段间的相关性进行建模,自适应地增强关键频谱特征。最后,创新的频谱拓扑与时空特征融合(SS-FF)单元采用两步式策略,先融合拓扑与频谱信息,再将其与时空特征整合,从而有效捕捉跨域依赖。在BCIC-IV-2a等三个公开数据集上的测试表明,该模型的分类准确率分别达到85.87%、90.2%和80.5%,全面超越了现有先进方法,为开发更精确、鲁棒的脑机接口应用奠定了基础。研究发表在 Knowledge-Based Systems 上。
#意识与脑机接口 #大脑信号解析 #脑机接口 #深度学习
阅读更多:
Shen, Chaowen, and Akio Namiki. “A Topology-Aware Multiscale Feature Fusion Network for EEG-Based Motor Imagery Decoding.” Knowledge-Based Systems, vol. 330, Nov. 2025, p. 114540. ScienceDirect, https://doi.org/10.1016/j.knosys.2025.114540
AI大脑新图谱:记忆与推理功能分离,可精准“编辑”记忆
大型AI模型如何区分记忆与推理?长期以来,这两种核心功能的内部机制尚不明确。为了绘制AI的“大脑”图谱,初创公司Goodfire.ai的研究人员Jack Merullo、Srihita Vatsavaya等人进行了一项研究,他们成功证明AI的记忆和推理能力位于其内部架构的不同部分,并开发出一种可以精准“编辑”模型记忆的方法。
▷ 我们的方法概述。我们从训练数据样本中收集激活值和梯度(a),这使我们能够使用 K-FAC 近似权重矩阵的损失曲率(b)。我们将这些权重矩阵分解为分量(每个分量的大小与矩阵相同),并按曲率从高到低排序。在语言模型中,我们展示了来自不同任务的数据与分量谱的不同部分之间的交互方式不同(c)。Credit: arXiv (2025).
研究团队使用一种名为K-FAC(克罗内克因子近似曲率)的数学技术,分析了Transformer模型的内部权重。他们发现,模型权重可以根据损失曲率(loss curvature)分解为不同部分:负责机械记忆(rote memorization)的部分呈现出较低的曲率,而负责通用推理的部分则具有较高的曲率。基于此,研究人员进行了一项“剪枝”实验,即选择性地关闭与记忆相关的低曲率组件。结果显示,模型的通用逻辑推理能力几乎不受影响,但其算术运算和回忆孤立事实等依赖记忆的能力却大幅下降。这一发现证实了记忆与推理在模型内部是物理分离的,为精准移除AI中的有害记忆(如隐私数据或偏见内容)提供了可能,而不会损害其核心智能。
#大模型技术 #记忆机制 #AI安全 #神经网络
阅读更多:
Merullo, Jack, et al. “From Memorization to Reasoning in the Spectrum of Loss Curvature.” arXiv:2510.24256, arXiv, 3 Nov. 2025. arXiv.org, https://doi.org/10.48550/arXiv.2510.24256
“读心”的秘密:大语言模型如何通过极稀疏参数编码心智理论
大型语言模型如何像人类一样理解他人想法?针对这一问题,史蒂文斯理工学院的Zhaozhuo Xu、Denghui Zhang及其合作者们,从模型的内部机制出发,揭示了LLM实现“心智理论”能力的关键。他们发现,这种复杂的社会推理能力并非依赖整个庞大的神经网络,而是由一个极度稀疏的参数子集所编码。
▷ 这是一个心智理论(ToM)任务。在问题 (a) 中,逻辑学习模型(LLM)应在空格处填写“爆米花”。在问题 (b) 中,空格处应填写“巧克力”。Credit: npj Artificial Intelligence (2025).
研究团队首先提出了一种新颖的方法,用于精确定位LLM中对心智理论(Theory of Mind,简称ToM,即推断他人心理状态的能力)敏感的参数。令人惊讶的是,即使只扰动这些参数中不到0.001%的部分,模型的ToM性能就会急剧下降。这表明LLM的社会推理能力集中在这些极少数的关键连接上,这与人脑处理类似任务时的高效节能模式有相似之处。进一步的机制分析发现,这些“ToM敏感参数”与模型的位置编码模块,特别是旋转位置嵌入(Rotary Position Embedding,一种追踪词语位置和关系的技术)紧密相连。当这些参数被扰动时,模型处理上下文信息的核心频率激活会遭到破坏,进而影响其注意力机制,改变了模型内部对信息的关注方式,最终损害了其形成连贯语义表征和进行社会推理的能力。这项研究为理解AI的“思维”过程提供了新视角,也为开发更高效、更可解释的AI系统指明了方向。研究发表在 npj Artificial Intelligence 上。
#大模型技术 #计算模型与人工智能模拟 #心智理论 #模型可解释性
阅读更多:
Wu, Yuheng, et al. “How Large Language Models Encode Theory-of-Mind: A Study on Sparse Parameter Patterns.” Npj Artificial Intelligence, vol. 1, no. 1, Aug. 2025, p. 20. www.nature.com, https://doi.org/10.1038/s44387-025-00031-9
AI假脸防不胜防?研究发现五分钟训练即可擦亮双眼
随着人工智能生成的面孔日益逼真并带来安全隐患,人类的识别能力面临严峻挑战。为解决此问题,来自雷丁大学、格林威治大学、利兹大学和林肯大学的 Katie L. H. Gray 等人进行研究,发现仅需五分钟的针对性训练,即可显著提升普通人乃至“超级识别者”(super-recognizers)辨别AI假脸的准确率。
▷ 参与者被要求辨别真人面孔和合成面孔。上面两行是人工智能生成的面孔,下面两行是真实面孔。Credit: Dr. Katie Gray
研究团队招募了664名参与者,并使用先进AI软件StyleGAN3生成的面孔进行测试。结果显示,在未经训练时,所有人都难以分辨真假,即便是人脸识别能力超群的超级识别者,其正确识别假脸的准确率也仅为41%,而普通参与者更是只有31%,均低于随机猜测水平(50%)。然而,在接受了一项仅五分钟的简短训练后(该训练重点指出了常见的计算机渲染错误,如不寻常的发型或牙齿数量),参与者的表现得到显著改善。超级识别者的准确率跃升至64%,普通参与者的准确率也达到了51%。有趣的是,训练对两组人的提升效果幅度相当,这暗示超级识别者可能并非简单地更擅长发现渲染瑕疵,而是利用了其他更深层次的视觉线索来完成识别。研究发表在 Royal Society Open Science 上。
#认知科学 #其他 #AI假脸 #人脸识别 #网络安全
阅读更多:
Gray, Katie L. H., et al. “Training Human Super-Recognizers’ Detection and Discrimination of AI-Generated Faces.” Royal Society Open Science, vol. 12, no. 11, Nov. 2025, p. 250921. royalsocietypublishing.org (Atypon), https://doi.org/10.1098/rsos.250921
微小的数字摩擦可以减缓虚假信息的传播
社交媒体平台使得高参与度但低质量内容以前所未有的速度泛滥,对社会信任构成威胁。为探索遏制虚假信息传播的有效策略,哥本哈根大学的博士生 Laura Jahn、Professor Vincent F. Hendricks, 以及 Rasmus K. Rendsvig, Alessandro Flammini, Filippo Menczer 等研究人员提出,通过行为设计引入“数字摩擦”来改善网络信息质量。
研究团队利用基于代理模型(Agent-Based Model, ABM)进行了概念验证模拟,该模型旨在模拟信息在社交媒体(如 X、Bluesky、Mastodon)上的共享行为。研究的核心策略是引入数字摩擦,即在用户分享内容时设置一个轻微的阻碍,例如弹出一条提示信息,要求用户在点击分享前稍作停顿反思。模拟结果显示,单独的数字摩擦虽然能够减少帖子的分享数量,但并不能提高被分享内容的平均质量。为了解决这一局限,研究团队在摩擦环节中加入了“质量识别学习”(quality-recognition learning)组件,例如一个询问用户关于平台社区规范的简短测试。模型结果表明,当少量的数字摩擦与学习元素相结合时,分享帖子的平均质量显著提高。研究人员总结道,这种结合学习的摩擦干预措施,是一种有效且对用户干扰最小(minimally invasive)的方式,可以启发科技巨头们在打击虚假信息方面进行创新思考。研究发表在 npj Complexity 上。
#认知科学 #预测模型构建 #跨学科整合 #社交媒体 #虚假信息
阅读更多:
Jahn, Laura, et al. “A Perspective on Friction Interventions to Curb the Spread of Misinformation.” Npj Complexity, vol. 2, no. 1, Nov. 2025, p. 31. www.nature.com, https://doi.org/10.1038/s44260-025-00051-1
来源:博识雅士
