教学科研

首页 > 教学科研 > 正文

新材料学院潘锋团队创建的拓扑数据分析与结构特征提取的AI方法助力材料智能设计

2025-10-28新材料学院

责编:王琳

在人工智能驱动材料设计迅速发展的背景下,如何以科学、可解释且高效的方式从复杂材料结构中提取关键特征,已成为实现智能材料发现的核心挑战。拓扑结构化学作为一种将材料微观结构映射为数学拓扑模型的研究方法,近年来在材料基因组工程、催化活性探索以及能量材料设计等领域,展现出强大的结构表征与性质预测能力。北京大学深圳研究生院新材料学院潘锋教授团队近年来致力于图论/拓扑数据分析方法及其在结构特征提取中的拓展与应用,在该领域取得了一系列创新性成果,包括材料结构的拓扑表示(J. Phys. Chem. Lett., 2023, 14: 954)、材料反向设计(npj Comput. Mater., 2025, 11: 147)、新型固态电解质设计(J. Am. Chem. Soc., 2024, 146, 18535,J. Am. Chem. Soc., 2025, 147, 24)、化学反应路径搜索(CCS Chemistry, 2024, 7, 1)以及催化活性相搜索(Nat. Commun., 2025, 16, 2542)。这些研究系统建立了从拓扑结构表示到性质预测,再到功能材料设计的全链条研究框架,为结构化学与人工智能的深度融合奠定了坚实的理论与方法基础。

近期,北潘锋教授团队提出了一种基于拓扑数据分析(Topological Data Analysis, TDA)的材料结构特征提取框架,为材料结构表征与性质预测提供了兼具数学严谨性与高可解释性的新思路。相关研究成果以题为“Structural Feature Extraction via Topological Data Analysis”为题,发表于国际知名期刊《物理化学快报》(Journal of Physical Chemistry Letters, 2025, 16, 8056–8067, DOI: 10.1021/acs.jpclett.5c01831,Nature Index 期刊)。

用于材料结构特征提取的拓扑数据分析原理

该研究基于代数拓扑理论,将材料的原子结构抽象为数学复形(simplicial or path complexes),并通过计算其拓扑不变量(如Betti数、循环密度等),实现对结构形貌、连通性与孔洞特征的多尺度量化。相较于传统经验型结构描述符(如配位数、局部环境参数)或“黑箱式”深度学习特征,该方法具备更强的结构敏感性与物理可解释性,能够捕有效获材料体系中与性能相关的高维几何与连通信息。

拓扑特征揭示的结构—性质关系

研究团队系统展示了持续同调(Persistent Homology)、GLMY同调及高阶超图同调(Hypergraph Homology)等方法在晶体、MOF和多组分分子体系中的应用,揭示了拓扑特征在描述键合网络、孔隙分布、取向关系和缺陷敏感性方面的优势。通过与图神经网络(GNN)模型结合,团队在缺陷敏感性质预测中使模型误差降低高达55%,并在MOF气体吸附性能预测中将模型R²从0.74提升至0.85,展现出优异的泛化能力与解释性能。研究首次系统总结了拓扑数据分析在多类结构体系(晶体、分子与生物大分子)中的应用机制,并提出了适配不同结构特征的选型指南。例如,持续同调适用于周期性或孔隙主导的体系;GLMY同调适用于具方向性或非平衡行为的体系(如化学反应网络、带电分子图);超图同调则适合分析多体相互作用主导的体系(如蛋白-配体识别、复杂吸附过程)。研究指出,拓扑特征在捕获结构—性质关联关系方面具有独特优势,可为能量材料、催化剂、功能氧化物等体系提供统一的数学表征框架,并为“结构-性能-生成”一体化的材料设计奠定理论基础。

该研究展示了拓扑特征提取和分析与人工智能算法深度融合的潜力。通过在图神经网络和Transformer模型中嵌入拓扑特征,研究团队不仅显著提升了预测精度,也增强了模型输出的可解释性,为理解结构—性能关系提供了量化依据。

本论文在潘锋教授和李舜宁博士共同指导下完成。新材料学院博士生王炳胥与硕士生冯彬为共同第一作者。研究得到了国家自然科学基金、广东省重点实验室等项目支持。

论文链接:https://pubs.acs.org/doi/10.1021/acs.jpclett.5c01831

关闭