摘要:2024年诺贝尔物理奖和化学奖均颁发给与“AI for Science”相关领域,这一重大成就无疑为该领域的发展提供了强劲的动力。在这一科学研究的新范式——“AI for Science”时代,基于数据驱动的机器学习力场(ML-FFs)成功解决了第一性原理电子
2024年诺贝尔物理奖和化学奖均颁发给与“AI for Science”相关领域,这一重大成就无疑为该领域的发展提供了强劲的动力。在这一科学研究的新范式——“AI for Science”时代,基于数据驱动的机器学习力场(ML-FFs)成功解决了第一性原理电子结构方法与传统经验力场在准确性和效率之间的矛盾。近年来,该领域取得了飞速进展,相关研究成果频繁发表于《Nature》、《Science》、以及《Cell》等国际顶尖学术期刊。
随着计算能力的快速提升,使用ML-FFs进行第一性原理级别精度的大规模分子模拟已逐步成为现实。此外,机器学习方法让我们重新审视了许多曾经熟知的现象,例如小分子的非对称电子效应等,研究人员通过这种方式能更好地理解实验数据。这表明,机器学习力场极有可能成为现代计算化学和分子模拟领域的重要组成部分。然而,作为一个新兴的跨学科领域,机器学习力场涉及量子化学、分子模拟、以及机器学习等多个学科。由于该领域的知识广泛且门槛较高,且学习平台和相关资料相对匮乏,专业培训显得尤为迫切。
学习目标本次课程内容全面,旨在帮助学员快速掌握量化软件的使用、深入理解机器学习原理、熟练运用LAMMPS模拟软件,并精通机器学习力场模型。课程将带领学员详细了解生态最完善的DeePMD系列软件的使用方法,并深入探讨机器学习力场领域的高数据效率等变模型(如NequIP、MACE、Allegro)。此外,还将介绍机器学习力场领域的开源大模型(MACE-OFF23、MACE-MP0、DPA等)的使用与微调技巧。
深入探讨“AI for Science”时代下,机器学习力场(ML-FFs)在分子动力学模拟中的应用。课程内容涵盖从基础理论到高级应用的全面知识,包括机器学习、深度学习、分子动力学模拟、量子化学计算等。通过理论与实践相结合的方式,学员将掌握如何使用先进的机器学习力场模型进行高精度分子模拟,并了解该领域的最新进展和未来趋势。
讲师简介机器学习分子动力学主讲老师来自哈尔滨工业大学,拥有五年的讲学经验,主要擅长机器学习和分子动力学训练力场,对vasp,gromacs ,cp2k, qe,lammps,deepmd等软件有过多年的使用经验!
机器学习分子动力学课程说明
第一天的课程将从AI与科学的交叉点出发,介绍科学研究的四范式,特别是从大数据时代到AI4Science时代的转变。通过探讨Google DeepMind、微软研究院、Meta FAIR等知名团队的工作,学员将了解AI在科学领域的广泛应用。随后,课程将深入分子动力学模拟的基础知识,包括经验力场与第一性原理方法的对比,以及机器学习力场的兴起。实操部分将涵盖Linux系统操作、虚拟环境配置、Python开发环境的使用,以及LAMMPS和OpenMM等分子模拟软件的入门。
课程要点
1. 理论部分
o AI与科学的交叉:从大数据到AI4Science
o 科学研究的四范式
o 分子动力学模拟的基本方法与发展历史
o 经验力场与第一性原理方法的对比
o 机器学习力场的兴起与应用
2. 实操部分
o Linux系统与超算服务器的常规操作
o 虚拟环境(Anaconda/Mamba)的使用
o Python开发环境的配置与使用
o LAMMPS与OpenMM的入门与基本操作
o 量子化学计算软件的介绍与快速上手
课程说明
第二天的课程将聚焦于机器学习力场的模型设计。理论部分将快速入门机器学习与深度学习,介绍神经网络的基本概念、发展历史及其在科学领域的应用。学员将了解AI模型在科学领域需要遵守的物理约束,以及高效描述局部环境的方法。实操部分将深入DeePMD系列软件的使用,包括安装、输入文件详解、常见功能与问题分析,以及如何结合LAMMPS进行高精度分子动力学模拟。
课程要点
1. 理论部分
o 机器学习与深度学习的快速入门
o 神经网络的基本概念与发展历史
o AI模型在科学领域的物理约束与对称性
o 基于描述符的机器学习力场模型(如HDNNPs、ANI模型)
o DeePMD系列模型的详解与应用
2. 实操部分
o DeePMD的安装与验证测试
o DeePMD输入文件的详解与超参数设定
o DeePMD的常见功能(训练、重启、冻结、压缩等)
o 综合使用LAMMPS与DeePMD进行分子动力学模拟
o 分子模拟数据的后处理与分析
课程说明
第三天的课程将深入探讨等变模型及其在机器学习力场中的应用。理论部分将介绍等变模型的概念、分类与特点,特别是高阶等变模型在数据利用率和泛化能力方面的优势。学员将了解SO(3)群的基本概念及其在等变模型中的应用。实操部分将涵盖DeePMD的多GPU并行训练、LAMMPS的多GPU并行运行,以及如何使用Python代码可视化等变与不变设计的区别。此外,学员将学习如何使用NequIP模型复现高被引论文的结果。
课程要点
1. 理论部分
o 等变模型的概念、分类与特点
o 高阶等变模型的优势与应用
o SO(3)群的入门与张量积
o 欧式神经网络(E3NN)的介绍
o NequIP模型的详解与代码框架
2. 实操部分
o DeePMD的多GPU并行训练
o LAMMPS的多GPU并行运行
o 使用Python可视化等变与不变设计的区别
o NequIP模型的超参数设置与使用
o 复现Nat. Commun.文章结果
课程说明
第四天的课程将聚焦于高效等变模型与通用大模型的应用。理论部分将介绍基于ACE的等变模型(如MACE模型)及其在多个领域的应用。学员将了解机器学习力场领域的“ChatGPT”模型,如MACE-OFF23和MACE-MP0,以及适用于大规模GPU并行的Allegro模型。实操部分将涵盖MACE与Allegro模型的超参数设置、DeePMD与MACE模型的对比,以及如何对通用大模型进行微调与分析。
课程要点
1. 理论部分
o 基于ACE的等变模型(MACE模型)
o 机器学习力场领域的通用大模型(MACE-OFF23、MACE-MP0)
o Allegro模型与SevenNet模型的介绍与比较
2. 实操部分
o MACE与Allegro模型的超参数设置与使用
o DeePMD与MACE模型的对比
o 通用大模型的微调与分析
o DPA-1与DPA-2模型的介绍与特点
课程说明
第五天的课程将综合前四天的内容,进行实际案例分析与未来展望。学员将通过实际案例,综合运用所学知识进行分子动力学模拟与数据分析。课程还将探讨机器学习力场领域的未来发展趋势,特别是如何通过AI技术推动科学研究的范式转变。最后,学员将进行课程总结与讨论,分享学习心得与未来研究方向。
课程要点
1. 综合应用
o 实际案例分析:结合LAMMPS与DeePMD进行复杂体系的分子动力学模拟
o 数据后处理与高质量科研绘图
o 机器学习力场在不同领域的应用案例
2. 未来展望
o AI for Science的未来发展趋势
o 机器学习力场在科学研究中的潜在应用
o 课程总结与讨论
本课程通过五天的密集学习,学员将全面掌握机器学习力场在分子动力学模拟中的应用,从基础理论到高级模型设计,再到实际应用与未来展望。课程内容丰富,理论与实践并重,旨在为学员提供该领域的前沿知识与实用技能,助力其在AI for Science时代的科学研究中取得突破。
近年来,随着人工智能技术的飞速发展,机器学习在科学研究中的应用逐渐成为跨学科研究的前沿热点。2024年诺贝尔物理奖与化学奖均授予“AI for Science”相关领域的突破性成果,这一事件标志着人工智能与基础科学的深度融合已进入新的发展阶段。在材料科学领域,第一性原理计算作为研究材料电子结构和性质的核心工具,为理解微观世界提供了坚实的理论基础。然而,其高昂的计算成本限制了其在大规模复杂体系中的应用。机器学习的引入,为这一问题提供了新的解决方案,通过构建高效的数据驱动模型,实现了从第一性原理精度到大规模模拟的无缝衔接。
机器学习在第一性原理领域的应用不仅加速了材料设计与发现的进程,还为传统理论计算提供了新的视角。例如,通过高通量计算与机器学习相结合,研究者能够快速筛选出具有特定性能的材料,从而显著提高研发效率。此外,机器学习模型还能够挖掘隐藏在数据中的物理规律,为实验研究提供理论支持。在这一背景下,掌握第一性原理与机器学习的交叉知识,已成为现代材料科学研究人员必备的技能。
学习目标本课程旨在为学员提供第一性原理与机器学习交叉领域的系统性培训,并安排了较多的上机实验,提供大量相关代码与示例教程,帮助学员熟悉各种深度学习第一性原理计算方法的使用,快速掌握相关理论知识与实操技能。课程将从基础理论出发,逐步深入到高级应用,学员将具备独立开展第一性原理与机器学习交叉研究的能力,能够运用所学知识解决材料科学中的实际问题,并为未来的研究工作奠定坚实的基础。
讲师简介第一性原理主讲老师来自国内高校,拥有扎实的理论知识和丰富的研究经验,参与多项国家自然科学基金面上项目。熟悉深度学习方法和第一性原理计算及相关软件的使用,具有丰富的编程经验,有深入的研究和优秀的成果。并在多个权威期刊上发表,至今他已经发表了40余篇SCI检索论文。授课方式深入浅出,能够将复杂的理论知识和计算方法讲解得清晰易懂,受到学员们的一致认可和高度评价!
机器学习第一性原理01第一天理解第一性原理计算的基本理论框架,包括薛定谔方程、Hohenberg-Kohn定理、Kohn-Sham方程等核心概念。掌握机器学习在材料科学中的应用现状与发展趋势,了解当前领域内的前沿成果与挑战。
第一天上午
理论内容
介绍量子力学在材料科学中的应用及其重要性。
第一性原理计算的基本概念:从量子力学到材料性质的预测。
机器学习的兴起及其在科学研究中的应用。
机器学习在材料设计、性质预测和高通量计算中的应用案例。
当前机器学习技术在第一性原理领域的突破与挑战。
未来发展趋势:从数据驱动到智能设计。
典型案例分析:如催化剂设计、二维材料的高通量筛选等。
实操内容
Python环境搭建:Anaconda的安装与使用。
Jupyter Notebook的使用:代码编写、运行与调试的基本操作。
安装常用机器学习库:NumPy、Pandas、Matplotlib、Scikit-Learn等。
深度学习框架(PyTorch)的安装与环境配置。
安装第一性原理软件
第一天下午
实操内容
Python的基本语法:缩进、注释、变量命名规则。
数据类型详解:整数、浮点数、字符串、布尔值。
序列类型:列表、元组、集合的操作与区别。
映射类型:字典的创建、访问与修改。
条件语句:if-elif-else的使用场景与逻辑判断。
循环语句:for循环与while循环的语法与应用。
循环控制:break、continue、pass语句的作用与使用场景。
自定义函数:函数的定义、参数传递、返回值。
模块的导入与使用:标准库与第三方库的调用。
类与对象的基本概念:封装、继承、多态。
类的定义与实例化:属性与方法的使用。
面向对象的设计思想:如何通过类组织代码结构。
NumPy数组的创建与操作:数组的形状、索引、切片。
数学运算:矩阵运算、统计函数、随机数生成。
示例应用:数据标准化、矩阵变换等。
Pandas:数据分析利器
数据结构:Series与DataFrame的创建与操作。
数据处理:数据清洗、筛选、分组、聚合。
数据读写:CSV、Excel文件的读取与保存。
示例应用:材料数据的预处理与分析。
Matplotlib:数据可视化
基本绘图:折线图、柱状图、散点图的绘制。
02第二天熟练掌握第一性原理软件的使用方法,包括输入文件编写、任务提交、结果分析等。学会使用Python及其科学计算库(如NumPy、Pandas、Matplotlib)进行数据分析与处理。掌握机器学习库(如Scikit-Learn、PyTorch)的基本使用方法,能够搭建并训练简单的神经网络模型。
第二天上午
理论内容
讲解第一性原理计算:薛定谔方程、波函数与电子状态、Hohenberg-Kohn定理、Kohn-Sham方程、交换-相关泛函、晶格的周期性、平面波与平面波基组、
介绍VASP软件的基本操作和输入文件编写方法。
详细指导如何编写VASP的输入文件,包括INCAR、KPOINTS、POSCAR等。
演示如何提交VASP计算任务:命令行提交、作业调度系统提交、OSZICAR、OUTCAR
第二天下午
实操内容
使用Python实现批量计算任务的生成与提交。
高效计算流程:并行计算、分布式计算的优化。
结构优化结果分析:能量、晶格参数、原子位置的收敛性。
电子结构、力学性质、热学性质的计算与分析。
使用Matplotlib绘制能带图、态密度图等。
实战1:二氧化碳还原反应(CO₂RR)的催化剂设计、选择与催化剂性能相关的特征(如电子结构、表面性质等)、使用Scikit-Learn搭建线性回归、决策树等模型。通过交叉验证评估模型的预测性能。用机器学习预测二氧化碳还原催化剂的少特征模型
实战2:氧还原反应(ORR)和氧进化反应(OER)在能源存储中的重要性。从第一性原理计算结果中提取材料的电子性质和催化活性指标。基于物理直觉和机器学习算法选择关键特征。DFT和机器学习方法加速具有高ORR和OER催化活性的DMSCs的发现
学习高通量计算策略,掌握自动化脚本编写技巧,能够高效处理大规模计算任务。理解机器学习在材料性质预测中的应用,掌握特征工程、模型训练与验证的基本流程。
第三天上午
实操内容
pymatgen的功能与应用场景:从材料结构到计算文件的生成。
材料项目(Materials Project)数据库的访问与数据提取。
使用pymatgen获取晶体结构:通过材料ID或化学式查询。
批量下载结构数据:自动化脚本编写与数据管理。
批量生成计算文件:POSCAR、INCAR等。
自动化生成VASP输入文件。
编写Python脚本,从Materials Project下载一组材料的结构数据。
分析下载数据的格式与内容,提取关键信息(如晶格参数、原子位置等)。
使用pymatgen的API查询Materials Project数据库。
筛选特定条件下的材料数据:如元素组成、晶体结构类型等。
第三天下午
理论内容
介绍晶体结构与电子结构特点
晶体结构的基本概念:布拉维格子、空间群、对称性。
电子结构计算:能带计算流程、能带图的解读。
态密度分析:电子态密度的物理意义与计算方法。
电荷密度分析:电荷分布与材料性质的关系。
材料计算的特征工程
特征类型:空间特征(晶格参数、原子间距等)、拓扑特征(拓扑绝缘体的特征)、化学特征(元素组成、键合类型等)、物理特征(电子结构、力学性质等)。
统计特征与信息熵:如何从数据中提取统计信息。
领域特定特征的构建与优化:结合物理直觉与机器学习方法。
特征工程在材料计算中的重要性。
当前研究热点:如何通过特征工程提高机器学习模型的性能。
实操内容
实战3:VASP计算TiO2的电子能带结构和密度态、电荷密度、功函数
实战4:VASP和机器学习实现二维材料的高通量计算
掌握卷积神经网络、循环神经网络、图神经网络等深度学习模型的基本原理及其在材料科学中的应用。学会使用机器学习力场(如ML-FFs)结合分子动力学软件(如LAMMPS)进行复杂体系的模拟与分析。
第四天上午
理论内容
神经元的基本结构与功能。
常见激活函数:ReLU、Sigmoid、Tanh等。
前向传播与反向传播的基本原理。
网络结构设计:全连接层、卷积层、循环层。
CNN在图像识别中的应用。
RNN在序列数据处理中的优势。
GNN在材料科学中的应用:图结构数据的处理。
实操内容
PyTorch的基本功能与模块化设计。
构建简单的神经网络模型。
实战5:基于图神经网络的钠离子电池正极材料人工智能驱动设计
第四天下午
理论内容
讲解分子动力学模拟的基本原理
分子动力学的基本概念:牛顿运动方程的数值求解。
温度、压力与化学势的定义与计算:热力学量的统计计算方法。
微观状态与系综选择:NVT、NPT、NVE等系综的区别与应用场景。
时间步长与模拟精度的平衡:选择合适的模拟参数。
实操内容
实战6:如何通过机器学习力场提高分子动力学模拟的效率、力场的构建与训练:从第一性原理数据中训练机器学习力场模型、VASP-MD及机器学习力场计算:力场的构建与训练
实战7:AIMD在复杂体系中的应用与挑战、从头算分子动力学模拟AIMD后处理分析-轨迹分析:径向分布函数、扩散系数等。
通过实战案例,如催化剂设计、二维材料高通量计算等,巩固所学知识,提升解决实际问题的能力。学会使用开源工具(如pymatgen、matminer)获取材料数据,构建数据驱动的机器学习模型。
完成本课程后,学员将具备独立开展第一性原理与机器学习交叉研究的能力,能够运用所学知识解决材料科学中的实际问题,并为未来的研究工作奠定坚实的基础。
第五天上午
理论内容
LAMMPS输入文件的编写及任务提交
指导如何编写LAMMPS的输入脚本,并提交计算任务。
in文件基本语法:结合实例,讲解in文件常用命令
LAMMPS在材料科学中的应用现状与挑战。
当前研究热点:机器学习力场与LAMMPS的结合。
实操内容
实战8:如何通过机器学习势实现VASP与LAMMPS的无缝对接;PyXtal_FF的安装与配置:环境搭建与依赖安装;从VASP数据中训练机器学习势,并在LAMMPS中应用;通过LAMMPS模拟验证机器学习势的准确性。
第五天下午
实操内容
通过案例展示LAMMPS在模拟材料力学性能方面的应用-力学性能模拟:应力-应变曲线的计算:模拟材料的拉伸、压缩过程。弹性模量的计算:通过线性拟合应力-应变曲线得到弹性模量。断裂强度的模拟:分析材料在高应力下的断裂行为。
实战9:从第一性原理计算(如VASP)中提取数据:能量、力、应力等;数据清洗、归一化、划分训练集与测试集;使用机器学习框架(如Scikit-Learn、PyTorch)训练原子势模型;调整模型结构与超参数,提高模型的拟合能力和泛化能力;将训练好的模型导入LAMMPS,进行分子动力学模拟;比较模拟结果与第一性原理计算结果。
实战10:傅里叶定律与热扩散方程。分子动力学中的热导率计算:Green-Kubo公式与非平衡分子动力学方法;使用机器学习势(如MLIP)进行大规模分子动力学模拟;计算材料的热导率:通过模拟结果计算热流密度与温度梯度;编写LAMMPS输入脚本,使用机器学习势进行热导率计算。分析模拟结果,讨论材料的热导率与其微观结构的关系。
案例图片:
第一天
理论内容
1.机器学习概述
2.材料与化学中的常见机器学习方法
3.应用前沿
实操内容
Python基础
1.开发环境搭建
2.变量和数据类型
3.列表
4.if语句
5.字典
6.For和while循环
实操内容
Python基础(续)
1.函数
2.类和对象
3.模块
Python科学数据处理
1.NumPy
2.Pandas
3.Matplotlib
第二天
理论内容
1.线性回归
1.1 线性回归的原理
1.2 线性回归的应用
2. 逻辑回归
2.1原理
2.2 使用方法
3. K近邻方法(KNN)
3.1 KNN分类原理
3.2 KNN分类应用
4. 神经网络方法的原理
4.1 神经网络原理
4.2神经网络分类
4.3神经网络回归
实操内容
1.线性回归方法的实现与初步应用(包括L1和L2正则项的使用方法)
2.逻辑回归的实现与初步应用
3.KNN方法的实现与初步应用
4.神经网络实现
项目实操
1.利用机器学习设计高体积模量高熵合金
2.训练机器学习模型预测多孔材料的催化性能
这两个实操项目同时穿插讲解如下内容
A1 机器学习材料与化学应用的典型步骤
A1.1 数据采集和清洗
A1.2 特征选择和模型选择
A1.3 模型训练和测试
A1.4 模型性能评估和优化
第三天
理论内容
1.决策树
1.1决策树的原理
1.2决策树分类
2.集成学习方法
2.1集成学习原理
2.2随机森林
2.3Bosting方法
3.朴素贝叶斯概率
3.1原理解析
3.2 模型应用
4. 支持向量机
4.1分类原理
4.2核函数
实操内容
1.决策树的实现和应用
2.随机森林的实现和应用
3.朴素贝叶斯的实现和应用
4.支持向量机的实现和应用
项目实操
1.使用实验数据训练机器学习模型预测金属有机框架材料中的气体吸附
2.通过机器学习方法筛选新型四元半导体化合物
这两个实操项目同时穿插讲解如下内容
A1 模型性能的评估方法
A1.1 交叉验证:评估估计器的性能
A1.2 分类性能评估
A1.3 回归性能评估
第四天
理论内容
1. 无监督学习
2.1 什么是无监督学习
2.2 无监督算法——聚类
2.3 无监督算法——降维
2. 材料与化学数据的特征工程
2.1分子结构表示
2.2 独热编码
3. 数据库
3.1材料数据库介绍
3.2 Pymatgen介绍
实操内容
1. 分子结构的表示与特征提取
2. 聚类、降维等无监督学习方法应用于分子特征处理
项目实操
1. 在机器学习技术的指导下加速钙钛矿材料的发现
2. 机器学习对CO2 封存的解释和预测
第五天
项目实操
1. 基于分子特征和逻辑回归预测分子性质
2. 基于分子特征的无监督学习综合应用
项目实操
1. 通过机器学习预测 NiCoFe 氧化物催化剂的活性
2. 利用基于成分的能源材料描述符进行机器学习模型的综合预测
机器学习(ML)在材料研究中的应用,让学员能够掌握学习理论知识及熟悉代码实操,文章的复现,学会anaconda、Python、pymatgen等软件、以及机器学习数据采集及清洗、分子结构表示及提取、模型训练和测试、性能评估及优化,KNN、线性回归方法,学会机器学习材料预测,材料分类,材料可视化,多种机器学习方法综合预测等操作技能,独自完成自己的课题研究项目
第一天上午
理论内容
1.材料数据库:介绍Material Project, OQMD, AFLOW等数据库的特点和使用方法。
2.深度学习入门:基础概念,包括神经网络、激活函数、损失函数等。
3.图神经网络:图神经网络的基本原理和在材料科学中的应用。
4.材料特征工程:如何从材料数据中提取有用的特征。
实操内容
Pytorch深度学习框架演练:安装和配置Pytorch,基础的神经网络模型构建和训练。
第一天下午
实操内容
1.Pymatgen介绍及结构文件生成
2.Pymatgen构建机器学习特征:
3.ASE(Atomic Simulation Environment)的使用
4.爬虫获取二维数据集
5.材料结构分析与可视化
第二天上午
实操内容
1. AFLOW数据库的数据获取
1.1 AFLOW数据库功能练习
1.2. 爬虫获取AFLOW数据库的数据
2. OQMD数据库
2.1 OQMD数据库功能练习
2.2 OQMD数据库的数据获取
第二天下午
实操内容
1. material project数据库
1.1 新版material project获取材料XRD、DOS图、能带图、吸收谱等数据
1.2 Pymatgen按照属性要求获取material project材料数据
2. 材料特征工程工具matminer演练
2.1 matminer获取材料数据集
2.2 matminer生成材料描述符演练
第三天上午
理论内容
卷积神经网络(CNN)基础
卷积层、池化层、卷积核、特征图
经典的CNN架构,如LeNet、AlexNet、VGGNet、GoogLeNet和ResNet
循环神经网络(RNN)基础
时间步和隐藏状态、梯度消失和梯度爆炸、RNN的变体
实操和演示内容
基于CNN方法训练扫描电镜图像对锂离子阴极成分及状态的预测
基于RNN和CNN辅助识别有序结构
第三天下午
实操内容
基于数据驱动的功能材料开发案例二(晶体图神经网络实现材料属性预测):
1. 用PYG搭建图神经网络(GCN、GAT)
2. 晶体图神经网络CGCNN模型代码原理
3. 利用晶体图神经网络实现材料属性预测
第四天上午
理论内容
长短期记忆网络、门控网络的架构与原理
输入门、遗忘门、输出门
自注意力机制、多头注意力机制、位置编码、残差连接、编码器和解码器
Transformer
实操内容
基于LSTM、GRU的分子生成模型
Transformer用于聚合物性质预测
第四天下午
理论内容(约1小时)
自回归模型、自编码器、序列生成模型
变分自编码器(VAE)基础
生成对抗网络(GAN)基础
实操内容(约2小时):
GAN模型的构建
训练GAN进行材料属性预测
GAN在材料设计中的案例研究
自编码器和变分自编码器的训练
变分自编码器在材料设计中的应用
培训目标
1.学习Material Project,AFLOW,OQMD三大材料数据库的数据获取方法。
2.学习卷积神经网络、循环神经网络和晶体图神经网络等深度学习方法在材料预测方面的应用。
3.学习主流材料数据库的数据获取方法;
4.深度学习方法在材料预测方面的应用。
部分案例图片
材料基因组视频课程《上下滑动查看》第一天
Python讲解与实操
理论内容:
1.材料基因组概述
2.材料基因组的基本方法
3.材料数据库material project, OPMD, AFLOW
实操内容 :
Python基础
1.开发环境搭建
2.变量和数据类型
3.列表
4.if语句
5.字典
6.For和while循环
实操内容 :
Python基础(续)
1.函数
2.类和对象
3.模块
4.Python科学数据处理
5.NumPy
6.Pandas
7.Matplotlib
第二天
材料基因组与数据库
实操内容:
1. Scikit-learn机器学习操作入门(约1小时)
2. AFLOW数据库
2.1 AFLOW数据库功能练习
2.2. AFLOW数据库的数据获取
实操内容 :
1. OQMD数据库
1.1 OQMD数据库功能练习
1.2 OQMD数据库的数据获取
2. material project数据库
2.1 Pymatgen练习
2.2 Pymatgen获取material project材料数据
第三天
结构数据驱动的高通量计算
实操和演示内容:
基于结构数据驱动的高通量计算:
1. pymatgen大批量结构获取
2. 基于pymatgen的计算文件生成
3. 大批量计算结果的获取与统计
实操内容:
案例一:基于数据驱动的功能材料开发(合金材料)
1. 背景介绍
2. 数据获取
3. 构建特征
4. 机器学习
5. 讨论与评测
穿插常见机器学习算法的介绍
第四天
基于数据驱动的多个功能材料开发案例实操
案例二:基于数据驱动的功能材料开发(半导体材料)
1. 背景介绍
2. 数据获取
3. 构建特征
4. 机器学习
5. 讨论与评测
穿插材料特征工程的介绍
案例三:基于数据驱动的功能材料开发(钙钛矿材料)
1. 背景介绍
2. 数据获取
3. 构建特征
4. 机器学习
5. 讨论与评测
CP2K视频课程《上下滑动查看》第一天
CP2K与量子力学
理论内容
1. CP2K框架
2. DFT(密度泛函理论)基础
3. CP2K的核心:GAPW(Gaussian-augmented plane wave approach)介绍
4. CP2K的input
QM(量子力学)计算实操内容-1
1. 基组文件和势场文件选取
2. 分子体系单点能计算
3. 分子结构优化
4. 分子结构和电子结构的可视化
理论内容
1.分子动力学模拟介绍
2.周期性边界条件
3.MD模拟系综
4.势函数
MM(分子力学)计算实操内容-1
1. 溶剂体系的构造与可视化
2. L-J势场的参数设置
3. 利用L-J势场对溶剂体系的模拟
4. 分子动力学模拟分析(径向分布函数RDF,均方位移MSD,模拟退火…)
第二天
量子力学实操
理论内容
1. 周期性体系
2. 平面波与倒空间
3. DOS(态密度)知识基础
4. 能带知识基础
QM(量子力学)计算实操内容-2
1. 晶体结构的获取与可视化
2. 晶体结构的单点能和结构优化
3. DOS计算和分析
4. 能带计算和分析
理论内容
CP2K、GROMACS和力场类型介绍
MM(分子力学)计算实操内容-2:
1. CP2K、GROMACS计算MD详解
2.热浴、退火计算与分析
3.VMD可视化轨迹与分析
4.Gromacs对轨迹进行后处理分析
5.自由能势能面的模拟
第三天
量子力学实操
理论内容
1. 晶体表面和晶面指数
2. 过渡态理论介绍
QM(量子力学)计算实操内容-3
1. 晶体表面的构造与可视化
2. 晶体表面的结构优化
3. 晶体表面的分子吸附与成键状态分析
4. NEB方法计算离子迁移路径
理论内容
1. AIMD(从头计算分子动力学)的基本知识和应用
2. 自由能势能面介绍
AIMD(从头计算分子动力学)计算实操内容
1.Cu颗粒熔化过程的MD模拟
2.Cu颗粒在CO2中结构演变的MD模拟
3.催化剂作用下N2分解的二维自由能曲面计算
第四天
QM+MM
理论内容
元动力学(metadynamics)介绍
QM(量子力学)计算实操内容-4
1. metadynamics方法的关键参数设置
2. metadynamics方法计算分子解离过程
3. 锂离子电池电极材料锂离子迁移过渡态的计算
理论内容
1.QM/MM理论介绍
2.QM/MM在不同体系的应用
QM/MM计算实操内容-2
1. 一般的溶剂化蛋白的处理流程
2. 蛋白晶体的准备
3. 结构的能量最小化
4. 对体系的预平衡
5. 无限制的分子动力学模拟
6. RMSD、RMSF、能量变化及蛋白的回旋半径分析
第五天
QM+AIMD
理论内容
1. TDDFT计算激发态的介绍
2. 振动熵和零点能的计算
QM(量子力学)计算实操内容-5
1. 分子激发态的计算和结果分析
2. 电化学催化ORR(氧还原反应)过程的计算矫正和台阶图绘制
理论内容
1.不同体系下AIMD建模
2. CP2K电子结构与MD
文献案例分析 实操内容
1.AIMD研究Au/TiO2对CO的催化机理
2.利用DFT和AIMD研究N5H对CO2的催化机理
授课时间机器学习分子动力学
2025.04.19——2025.04.20 (上午09:00-11:30 下午13:30-17:00)
2025.04.23——2025.04.24 (晚上19:00--22:00)
2025.04.26——2025.04.27 (上午09:00-11:30 下午13:30-17:00)
机器学习第一性原理
2025.04.10——2025.04.11 (晚上19:00--22:00)
2025.04.12——2025.04.13 (上午09:00-11:30 下午13:30-17:00)
2025.04.15——2025.04.18 (晚上19:00--22:00)
公费价:每人每个课程¥4980元 (含报名费、培训费、资料费)
自费价:每人每个课程¥4680元 (含报名费、培训费、资料费)
优惠福利:
培训特色及福利1、课程特色--全面的课程技术应用、原理流程、实例联系全贯穿
2、学习模式--理论知识与上机操作相结合,让零基础学员快速熟练掌握 3、课程服务答疑--主讲老师将为您实际工作中遇到的问题提供专业解答
授课方式:通过腾讯会议线上直播,理论+实操的授课模式,老师手把手带着操作,从零基础开始讲解,电子PPT和教程开课前一周提前发送给学员,所有培训使用软件都会发送给学员,有什么疑问采取开麦共享屏幕和微信群解疑,学员和老师交流、学员与学员交流,培训完毕后老师长期解疑,培训群不解散,往期培训学员对于培训质量和授课方式一致评价极高!
学员对于培训给予高度评价
联系人:赵老师
报名电话:15638270801 ( 微信同号)
来源:复合材料前沿