机器学习加速原子力显微镜对细胞力学的分析

B站影视 欧美电影 2025-09-27 18:20 1

摘要:细胞不仅仅是生化机器,它们也是物理结构,受力塑造和影响。当细胞分裂、移动或对压力作出反应时,其机械特性会发生变化。这些变化,无论细微还是显著,都可能蕴含着重要的生物学意义。癌细胞在发展为恶性肿瘤的过程中通常会变得更软。干细胞在其特化过程中往往会变得更硬。神经元

新模型可在几分钟内从 AFM 数据中提取刚度和流动性,从而能够以单细胞分辨率快速、准确地对活细胞进行机械表征。

细胞不仅仅是生化机器,它们也是物理结构,受力塑造和影响。当细胞分裂、移动或对压力作出反应时,其机械特性会发生变化。这些变化,无论细微还是显著,都可能蕴含着重要的生物学意义。癌细胞在发展为恶性肿瘤的过程中通常会变得更软。干细胞在其特化过程中往往会变得更硬。神经元在生长和连接过程中会改变其硬度。细胞的机械行为并非枝节问题,它通常是身份、功能和健康状况的标志。

为了在纳米尺度 上研究这些特性,研究人员通常依赖原子力显微镜。该技术使用超锋利的探针压入活细胞表面,同时测量其变形程度。根据这些数据,科学家可以推断细胞的硬度或流体状程度。这些测量结果揭示了细胞如何抵抗或屈服于机械应力,即所谓的粘弹性。

然而,一个长期存在的问题限制了这一工具的实用性。每次测量都会产生一条曲线,必须通过一组力学方程进行解释。要从这些曲线中提取有意义的信息,需要将它们拟合到数学模型中。这个过程缓慢、难以自动化,而且对实验噪声敏感。即使是一次高分辨率扫描也可能需要几个小时才能完成。

探针设计和扫描速度的技术改进有助于缩短采集时间,但真正的瓶颈仍然在于数据处理。一些研究团队探索利用机器学习根据细胞的物理特征对其进行分类,或增强所得图像的对比度。这些方法提高了效率,但未能解决核心问题。将原始测量曲线转化为物理特性的基本步骤仍然依赖于传统的拟合方法,这些方法不可扩展且通常不可靠。

这是发表在《先进智能系统》 (Advanced Intelligent Systems)上的一篇新论文(题为《基于监督机器学习的活细胞高通量纳米流变学》)所探讨的挑战。Jaime R. Tejedor 和 Ricardo Garcia 描述了一种监督机器学习方法,用快速准确的预测取代了模型拟合。他们的方法直接处理力测量数据,提取活细胞的关键力学参数所需的时间仅为以往所需时间的一小部分。由此,它为在单细胞水平上进行高通量力学表征提供了一条切实可行的途径,对基础生物学和应用生物医学研究都具有重要意义。

他们的方法绕过了传统的力-距离曲线与力学模型的拟合。相反,它使用一个完全基于合成数据训练的监督机器学习回归器来提取两个关键参数:模量(量化刚度)和流动性系数(反映细胞行为更接近粘性流体而非固体的程度)。用直接预测代替模型拟合降低了计算复杂度并提高了鲁棒性。此外,它还消除了手动参数选择的需要,而手动参数选择通常会给分析工作流程带来主观性和多变性。

该模型学习解读原子力显微镜曲线中编码的压痕历史。这一点至关重要,因为粘弹性行为具有时间依赖性:细胞对力的机械响应不仅取决于其变形程度,还取决于变形速度和持续时间。作者通过将压痕视为连续函数而非一系列离散值来解决这个问题。他们使用泛函数据分析来表示压痕轮廓,并对完整的变形过程进行编码。这使得模型能够同时考虑压痕事件的形状和时间。

回归器架构由两个神经网络组成。第一个神经网络根据力-距离曲线和相关实验参数预测流动系数。其输出被传递到第二个神经网络,用于预测模量。这种嵌套结构将这两个相互关联的属性之间的推断分离,并减少了它们之间的干扰。两个神经网络均使用无量纲量,以确保其在不同仪器和测量条件下的普遍适用性。

该模型基于10万条合成力-距离曲线进行训练,这些曲线由一个结合了单幂律流变学和底部效应校正的接触力学模型生成。这些曲线模拟了各种条件,包括涵盖哺乳动物细胞所有预期机械响应范围的极端情况。

首先在合成测试集上评估模型性能。模量和流动系数的预测值与用于生成测试数据的真实值非常接近。在整个输入条件下,相对误差保持在 1% 以下。随后,该模型被用于分析两种具有不同生物学和力学特征的哺乳动物细胞类型的实验数据集:HeLa 细胞和 NIH 3T3 成纤维细胞。

源自宫颈癌组织的HeLa细胞通常更硬,不易变形。而构成结缔组织结构框架的成纤维细胞则更软,更像流体。

两种细胞类型的力-距离曲线均独立于先前实验获得,且未根据模型进行调整。回归量重现了模量与压痕速度之间的已知关系。对于HeLa细胞和成纤维细胞,较高的压痕速度会导致表观刚度降低和流动性增加。这些趋势与粘弹性材料的预期相符。预测结果也与传统的拟合结果一致。对于HeLa细胞,模量预测的平均误差为2.8%,流动性系数的平均误差为1.2%。对于成纤维细胞,这两个参数的预测误差均低于4%。相同的训练模型未经修改就应用于两个数据集,表明该模型在不同生物学样本中具有良好的泛化能力。

该模型还捕捉到了刚度和流动性之间的反比关系。随着细胞变得更软,它们表现出更像流体的行为。这种模式在之前的研究中也观察到过,尽管其生物学基础仍不确定。回归量在整个数据集中重现了这一趋势,进一步验证了其与已知力学行为的一致性。在此,作者提醒道,虽然这种趋势稳健,但其潜在机制仍未得到解决——这凸显了细胞力学中的一个悬而未决的问题。

为了评估其实际效用,作者将该回归器应用于从活体HeLa细胞获取的高分辨率力-体积数据集。该数据集包含262,000条独立的力-距离曲线。该模型在39分50秒内处理了全部数据集。相比之下,传统的模型拟合需要近9个小时才能完成相同的任务。其中大部分时间都花在了模量提取上。

相比之下,机器学习方法将参数推理时间缩短了50倍。实际上,这意味着曾经需要近一整天工作时间才能完成的工作,现在可以在一个午休时间内完成。这改变了AFM数据的实际应用规模。

由此生成的力学图谱保留了空间分辨率和对比度。它们揭示了纳米级的特征,例如细胞质和细胞核中硬度的变化,以及与肌动蛋白丝网络相关的精细结构细节。这些特征与通过标准模型拟合识别的特征一致。能够在不到一小时内生成此类图谱且不损失精度,对于需要海量数据集或时间敏感分析的研究具有直接意义。这种转变使得在单个项目中研究数千个细胞成为可能,为快速药物筛选或高通量临床诊断等应用打开了大门。

该回归器的设计使其应用范围广泛。它无需实验数据进行训练,完全依赖于理论生成的曲线。这消除了对特定仪器、细胞类型或成像条件的依赖。所有参与训练和预测的变量均已无量纲化,无需重新训练即可实现泛化。该架构还能避免由不规则压痕轮廓(例如由扫描仪非线性或信号噪声引起的误差)引入的误差。函数数据分析使模型能够以同等的可靠性处理理想和非理想压痕信号。

该方法提供了一种在不牺牲精度的情况下扩展基于原子力显微镜(AFM)的纳米力学测量的方法。它可以快速且可重复地提取数千个单细胞的力学特性。这可以支持癌症诊断、干细胞分化、组织工程和药物反应等领域的研究,在这些领域中,力学标记物越来越多地用于评估细胞状态和功能。通过消除计算瓶颈,该方法还使高通量筛选成为可能,而这些应用此前受限于分析时间。

这项研究表明,基于物理信息的机器学习可以取代缓慢且易出错的分析方法,且不会影响准确性。该架构体现了理论建模与算法设计之间的微妙平衡。它保留了可解释性,能够处理噪声数据,并在不同的生物环境下保持可靠的性能。

虽然该方法是为原子力显微镜 (AFM) 纳米压痕技术开发的,但其基本原理可以扩展到其他依赖曲线解释的基于力的显微镜技术。对于旨在大规模理解细胞力学的研究人员来说,该回归器提供了一种实用且经过验证的解决方案。

来源:伪科学家

相关推荐