11月17日,美国计算机协会(ACM)公布2022年度戈登贝尔新冠特别奖评选结果。北京大学深圳研究生院信息工程学院与鹏城实验室、山东大学组成的联合研究团队在自行研发的鹏程·神农生物信息研究平台上完成的“领先于病毒的进化——通过人工智能模拟预测未来高风险新冠病毒变异株”研究项目成功入围2022年度“戈登贝尔新冠特别奖”,也是本次入围唯一来自中国团队的项目。北大主要参与者是来自信息工程学院的田永鸿教授、陈杰副教授和博士研究生聂志伟和来自数学科学学院的杨超教授。该成果由美国华盛顿大学医院院长John Lynch教授、捷克查尔斯大学Martina Koziar Vasakova教授、西湖大学周强教授提名推荐。入围该奖的其余2个团队为:美国阿贡国家实验室、英伟达、芝加哥大学、加州理工学院联合团队及美国橡树岭国家实验室团队。鹏程·神农团队于众多世界级顶尖强队中脱颖而出,名列前茅,足见中国人工智能在计算集群和科研创新领域已处于全球顶尖水平。
鹏程·神农是基于“鹏城云脑Ⅱ”超大规模算力集群和昇思MindSpore AI框架联合打造的面向生物医学领域的新一代数据密集型生命科学精准计算平台。该平台依托生物大数据、计算生物学理论和技术、人工智能算法和计算集群,实现新药创制和病毒演化预测。
团队研发了首个面向新冠病毒RBD区域变异的全环节模拟流程,通过多层次优化的计算策略、国际领先的新冠病毒变异体精准评价筛选算法,实现了对高风险变异株的演化模拟及精准预测。
图1.首个面向新冠病毒RBD区域变异的AI模拟工作
图2.依托“鹏城云脑Ⅱ”的大规模并行病毒变异模拟全流程
为了在高维变异空间中实现高性能预测,团队充分融合专家知识,复刻病毒在真实世界中的变异规律,构建基于神农大模型的变异体生成器。生成的海量变异体通过多层次的精准病毒关键性质预测算法,进行高通量筛选,以模拟病毒在真实世界变异过程所面临的筛选压力,每秒可生成、筛选超百万条变异体,每天可生成、筛选超1011条变异体。同时通过递进循环微调的范式,逐步缩小病毒的变异空间,最终实现病毒的全流程变异模拟。团队在两天内实现了新冠病毒Alpha、Beta、Gamma、Delta、Omicron BA.5等主流毒株的变异模拟,且可以准确预测大多数的高风险监测变异株,包括BF.7、BQ.1、BA.4.6等。
病毒变异不断冲击着人类抗疫战线。在新冠病毒新变种不断出现的情况下,对潜在高风险变异株的预测有助于疫苗和药物研发的提前部署,为疫情防控决策提供有力支撑。
图3.神农AI大模型在两天内实现了对高风险变异株的演化模拟和精准预测
设立于1987年的“戈登贝尔奖”是国际上高性能计算应用领域的最高学术奖项,主要颁发给高性能应用领域最杰出成就,被称为“超算领域的诺贝尔奖”。在2016年之前,美国、日本曾垄断该奖项长达近30年。该奖项由ACM每年评选和颁发。由于新冠疫情的暴发,ACM于2020年首次设立了“戈登贝尔奖新冠特别奖(ACM Gordon Bell Special Prize for HPC-Based COVID-19 Research)”以表彰在“超算抗疫”领域取得杰出成就的研究成果。