南燕新闻

首页 > 南燕新闻 > 正文

新材料学院研发基于图论的结构化学新范式和材料基因组学

2019-09-19新材料学院

  在过去十年中,美国和中国政府相继开展了材料基因组计划(美国)和国家材料基因工程重点专项(中国)。材料基因组计划和工程借鉴生命基因计划成功经验,利用高通量的理论计算和实验及数据库的相融合加速新材料的发现和应用,因此构建高质量的材料大数据系统,全自动化地智能识别并处理所有的晶体结构,是该领域亟待攻克的科学高地,并对于发现新材料,创新材料设计方法具有重大意义。
  北京大学深圳研究生院新材料学院的潘锋教授牵头联合多家高校、研究机构和企业共同承担了2016年国家材料基因工程重点专项,在研究构建的晶体结构(近百万种)大数据时发现了一个关键科学问题:传统结构化学用原子位置及键长键角能否无误判断二个晶体结构是否相同(同构性)? 他们发现材料缺陷和测量误差导致任何通过设定误差阈值来判断结构同构性都会出现偏差,阈值内判断是相同的结构可能是不同,反之亦然。为了突破传统结构化学和晶体学方法局限性,潘锋团队发展了基于图论的结构化学和材料基因研究新范式,将与中心原子成键的最近邻原子定义为结构基元,再把原子或结构基元抽象成图论中的点,结合计算机智能运算,从所选择的中心原子到结构基元再层层逐级由内向外比对,与传统方法不同,新范式是比对点的连接方式,通过逐级比对能实现无误地判断结构同构性及定量描述结构间的异构度与演化关系,以此构建了拥有60万余种独立晶体结构大数据系统,开发了一种基于图论的晶体结构和材料基因的表达方法,将空间原子/分子结构几何拓扑化,极大程度地提高了材料智能识别的效率和精度,并用于探索材料在制备和应用中的结构演化规律。
图 1尖晶石Co3O4晶体的拓扑简化图与实际晶体结构。
  此外,该图论方法还可以不断升级,以解决一些更加复杂的问题,如识别高度扭曲的结构,区分具有强相似性的结构和分类材料大数据中的复杂晶体结构。与传统的结构化学方法相比,使用图论法可以更容易地解决这些问题,提高了材料识别的效率和可靠性。通过使用这种智能技术,该课题组成员们正在基于材料大数据系统开展高通量计算,加快新材料的发现。
图2 运用图论法可以区分很相似的2H相与4H相的SiC晶体
  该研究成果以“Identify crystal structures by a new paradigm based on graph theory for building materials big data”为题发表于SCIENCE CHINA Chemistry,受到了美国科学促进会(AAAS)、中国科学杂志社的重点报道。该论文的通讯作者潘锋教授,共同第一作者为博士生翁谋毅、硕士生王志、博士后钱果裕。该系列工作得到了国家材料基因工程重点研发计划、广东省重点实验室、深圳市科技创新委员会等项目的大力支持。
文章链接:M.Y. Weng, Z. Wang, G.Y. Qian, F. Pan* et.al, Identify crystal structures by a new paradigm based on graph theory for building materials big data. Sci. China Chem., 62, 982-986 (2019)

关闭