华南理工大学林志伟教授课题组ACS Nano:精准预测DNA序列用于目标手性碳纳米管分离及性能调控

B站影视 2025-01-10 07:43 2

摘要:单壁碳纳米管(SWCNTs)因其优异的电学、光学和力学性能,已广泛应用于电子器件、光学仪器、疾病检测、能量储存等多个领域。SWCNTs的结构由手性向量(n, m)定义,每一个向量坐标(n, m)都赋予碳纳米管不同的结构特点与功能特性。根据不同的应用需求,往往需

单壁碳纳米管(SWCNTs)因其优异的电学、光学和力学性能,已广泛应用于电子器件、光学仪器、疾病检测、能量储存等多个领域。SWCNTs的结构由手性向量(n, m)定义,每一个向量坐标(n, m)都赋予碳纳米管不同的结构特点与功能特性。根据不同的应用需求,往往需要选择具有特定手性(n, m)的SWCNTs,以实现最佳性能表现。因此,发展高效的单手性SWCNTs分离方法,对于推动基础研究和实际应用具有重要意义。

DNA在分离单手性SWCNTs方面有独特的优势。筛选有效的DNA序列(也称作可识别序列,resolving sequences)是实现单手性SWCNTs分离的前提条件。近些年发展的“机器学习+实验迭代”方法大大提高了筛选可识别序列的成功率。然而,预测用于分离特定手性SWCNTs的DNA序列仍是一项艰巨挑战。针对该挑战,最近华南理工大学前沿软物质学院林志伟课题组与张睿课题组展开合作,发展了一种结合分子三维表示方法和预训练模型的深度学习策略,实现了对于分离目标手性SWCNTs的DNA序列的精准预测(图1)。该研究成果,近期发表在国际知名期刊《ACS Nano》上。博士生周轩为本文的第一作者,王蓬勃为共同第一作者,林志伟教授与张睿教授为共同通讯作者。

图1.机器学习和实验相结合,高效筛选DNA用于分离目标手性SWCNTs。

首先,作者利用双水相法(ATPE)系统测试了216条G/C组合 DNA序列分离SWCNTs的能力,得到了116条识别序列以及17种单手性SWCNTs(图2),这为建立机器学习(ML)模型提供了重要的数据基础。

图2.17种高纯度单手性SWCNTs的光谱表征。

随后,作者基于三维分子表示学习框架构建了一种新的深度学习模型。此模型通过Open Babel将DNA序列转换为三维螺旋构象,并根据每个原子的种类及空间位置构建了每条序列对应的特征矩阵(图3)。此矩阵有效地提取了DNA分子的原子级三维结构信息,如原子类型、原子位置和原子间距离等。特征矩阵信息被Uni-Mol(一种通用三维分子表示学习框架)进一步提取、分析,并导入神经网络。模型训练完成后再对所有未经实验测试的序列进行预测打分。该模型各项性能指标优异,成功预测了DNA序列用于分离半导体型(6,5)、金属型(6,6)、准金属型(7,4),三种目标手性SWCNTs,其准确率高达87.5%、90%、70%(图4)。

图3. 深度学习模型工作流程示意图

图4.深度学习模型预测识别序列的性能分析。

最后,为了更深入地研究DNA序列对DNA-SWCNTs复合物性能的影响,作者对10种不同DNA-(6,5)复合物的光学性质进行了研究(图5)。结果表明这些DNA-(6,5)复合物的E 11吸收峰位移、荧光强度、以及对表面活性剂的响应性均展现出显著的差异。作者提出不同的识别序列通过形成不同的螺旋包裹结构来调节 DNA-SWCNTs复合物的性能。预期这些具有不同螺旋结构的DNA-(6,5)复合物对于开发高性能的生物传感器具有重要意义。

图5.序列依赖性的DNA-(6,5)复合物性能调控。

总结:针对筛选用于分离碳纳米管的DNA序列存在效率低、准确率低的问题,本文发展了一种基于深度学习模型的DNA序列筛选方法,实现了对于分离目标手性碳纳米管的DNA序列的精准预测。该模型对(6,5)、(6,6)和(7,4)识别序列的预测准确率分别达到87.5%、90%和70%。在此基础上,通过模型预测和实验探索获得了大量(6,5)的识别序列,从而实现对于DNA-(6,5)复合物性能的系统调控,并进一步揭示其潜在机制。

本工作得到了国家重点研发项目(2023YFA0915200)、国家自然科学基金(52273265、21973033)、广东省基础与应用基础研究项目(2024A1515012437、2024B1515040023)、广州市GJYC项目(2024D03J0002)、广州市科学研究计划项目(2018ZD13)、中央高校基本科研业务费、小米基金会等多个项目和基金的支持。

原文链接:

来源:科学课代表

相关推荐