近日,北京大学深圳研究生院,信息工程学院AI4S平台中心主任与化学生物学与生物技术学院合聘研究员陈语谦受邀发表人工智能(AI)对传统中医药(TCM)研究的赋能这一主题,总结了过去二十几年来对于世界最大的中医药数据库(TCMBank)的建立、维护和更新,并且深入探讨了TCM与AI在多个研究领域的整合应用,包括草药筛选、新药发现、诊断治疗原则、药理机制和网络药理学等。该综述还详细探讨了AI通过数据挖掘、模式识别和预测分析,揭示TCM复杂配方的活性成分和作用机制。AI与TCM的结合不仅帮助人们从新的角度理解传统的中医药知识,还开辟了新的研究方法和治疗策略。该成果发表在2024年9月的Chemical Science,第一作者为北京大学化学生物学与生物技术学院博士生宋治霖和中山大学智能工程学院博士生陈观兴,通讯作者为陈语谦,其他相关工作还包括了发表于2023年的Chemical Science和2023年的Signal Transduction and Targeted Therapy(STTT,IF=40.8)。
TCM是天然产物的重要来源,从1981年到2019年,超过60%的FDA批准的小分子药物直接或间接来源于天然产物。此外,TCM还能根据患者的具体需求和偏好提供多种治疗选择。近年来,人工智能(AI)技术的发展为TCM研究带来了巨大潜力。通过AI技术加速药物发现、优化配方和推动TCM现代化,AI技术可以确保TCM在保留传统根基的同时,与最新的科学进展同步发展。目前,在中医院里临床治疗研究中,引入AI不仅提高了诊断的准确性,还促进了个性化医疗的发展,使TCM研究更加高效和精准。
基于人工智能的中医药化学数据分析促进了化学成分的识别、药物发现、个性化治疗和药理作用的阐明,推动了中医药的现代化和可持续发展
目前,中医药的网络药理学研究主要集中在证明中医药理论上,缺乏网络设计和优化原则的明确定义。合理的处方设计可分为自上而下和自下而上两种类型。自上而下的方法基于旧处方设计新处方,而自下而上的方法则不考虑旧处方,完全基于疾病网络设计新处方。陈语谦团队结合了多种可行的方法,首先定义了几种未来最常见的自上而下优化模型。自上而下和自下而上的设计方法都基于计算系统生物学原理利用生物网络建立相关性,但考虑现有处方和中医理论方面存在差异,在中医理论尚未定量表达之前,不考虑旧处方的新公式设计更可能与中医原则相冲突。近年来,中医逐渐向天然产品的分类和组织发展。在人类过度开发的背景下,许多中医药品种面临灭绝,因此陈语谦团队建立一种计算天然产品与中医药物种个体之间相关性的方法,并使用高可靠性模型快速筛选可替代、可优化和可去除的处方成分。作者认为,新处方公式的设计必将成为一个核心研究领域,为中药的可持续发展带来重要影响。
中医处方网络设计与优化方法概述
在中医领域,了解草药与常规药物之间的相互作用对于确保患者安全和治疗效果至关重要。作者针对中药与西药相互作用的综合临床研究给出了一种提案。该提案设定了一个综合临床研究系统,旨在全面探索这些相互作用,如图3所示,该系统分为三个主要模块:临床研究系统、综合系统和基础研究,每个模块关注化学分析和数据整合的不同方面,以预测和分析药物不相容性。临床研究系统主要负责收集和分析临床数据,以评估草药与药物组合的药代动力学和药效学特性。该模块可以利用先进的化学提取方法和分析技术,旨在通过严格的临床测试和化学分析识别潜在的不良相互作用。同时,该模块也可以利用数据挖掘和机器学习算法处理复杂的临床数据,识别预测药物相互作用结果的模式。综合方法的核心是综合系统,其中包含HAZA@home平台。该系统可以结合临床研究和基础研究的数据,为患者提供实时健康监测和预测分析,也可以使用广泛的数据库网络和模拟工具,个性化健康评估和药物相互作用警示,利用人工智能根据个体患者数据调整建议。基础研究系统模块通过深入的化学分析和计算建模来支持综合系统,预测药物靶点并模拟药物相互作用。这包括使用中医和临床药物数据库、ADMET预测模型及创建小分子数据库。这些工具对于理解药物相互作用的生化机制至关重要,有助于开发预防潜在不良反应的策略。该提案体现了在中医药相互作用研究中临床与基础科学方法的整合。通过结合化学分析、实时数据监测和人工智能驱动的预测建模,该系统不仅可以增强对复杂药物相互作用的理解,还将开创中药与药物治疗整合中患者安全的新方法,为未来的研究和应用设定基准。相关研究成果已发表在Chem. Sci. 2024, 15 (41), 16844–16886.(https://doi.org/10.1039/D4SC04107K)
一个全面的自动临床研究系统提案
在中医药(TCM)的现代化过程中,确定草药中的活性成分以及阐明活性成分与靶标之间的作用机制是两个关键方面。构建一个全面且高度可靠的中医药数据库显得尤为重要。自2011年建立以来,陈语谦团队的TCM Database@Taiwan得到了广泛使用和大量引用,并被纳入ZINC数据库。为了进一步推进中医药研究,作者利用自然语言处理技术,建立了知识图谱和分子信号通路,开发了TCMBank,该数据库是TCM Database@Taiwan的升级版,包含9192种草药,61,966种化学成分,15,179个靶标和32,529种疾病,相关研究成果已发表在Chem. Sci. 2023, 14 (39), 10684–10701.(https://doi.org/10.1039/D3SC02139D)。
TCMBank的数据处理框架和目标示意图
在当今医疗领域,中西药的结合治疗越来越普遍,但同时也带来了药物相互作用的风险。为了更好地预测和管理中西药之间的相互作用,减少医疗风险,本研究利用先进的AI技术和大数据分析,开发了多个创新模型和数据库,为中西药相互作用的研究提供了强有力的支持。研究团队发现,超过10%的患者需要同时服用5种药物,20%的老年患者需要同时服用至少10种药物。这一现象对药物相互作用的研究提出了新的挑战。基于药物化学知识,研究团队认为药物的官能团/化学子结构决定了其药代动力学、药效学特性以及中西药的互斥性。因此,他们提出了一个创新的算法,通过建立药物相互作用网络来预测多种药物之间的相互作用。在这个网络中,化合物作为节点,它们的因果关系作为边。中药中所有成分对应的节点形成了一个子网络。通过分析子网络之间的连接,研究团队可以预测中药之间或中药与西药之间是否存在不良反应。未来,AI辅助模型将结合大规模语言模型、自然语言处理和文本挖掘知识图谱技术,开发中西药不良反应数据库,进一步提高预测的准确性和实用性。研究团队在两个现实世界的公共药物相互作用(DDI)数据集上提出了两个模型:3DGT-DDI和SA-DDI。这两个模型在两个公共DDI数据集上实现了最精确的预测性能。基于这些模型的预测结果,研究团队进一步推广到中西药不良反应的预测中。利用TCMBank的大数据驱动,研究团队进行了无监督学习,预测中西药的不良反应。假设中药中的所有成分与西药均不发生不良反应,则确定它们之间不存在相互排斥的反应。如果中药中的一种或多种成分与西药发生不良反应,则存在可能产生不良反应的风险。研究团队利用AI辅助的DDI预测模型获得了中西医可能的不良反应风险的预测结果,相关研究成果已发表在Signal Transduction and Targeted Therapy上(https://doi.org/10.1038/s41392-023-01339-1)。
TCMBank,世界最大的智能中医药数据库的综合分析
上述三项工作论文通讯作者为陈语谦,研究得到了国家自然科学基金面上和重点项目支持。
参考文献
[1] Song, Z.; Chen, G.; Chen, C. Y.-C. AI Empowering Traditional Chinese Medicine? Chem. Sci. 2024, 15 (41), 16844–16886. https://doi.org/10.1039/D4SC04107K.
[2] Lv, Q.; Chen, G.; He, H.; Yang, Z.; Zhao, L.; Chen, H.-Y.; Chen, C. Y.-C. TCMBank: Bridges between the Largest Herbal Medicines, Chemical Ingredients, Target Proteins, and Associated Diseases with Intelligence Text Mining. Chem. Sci. 2023, 14 (39), 10684–10701. https://doi.org/10.1039/D3SC02139D.
[3] Lv, Q.; Chen, G.; He, H.; Yang, Z.; Zhao, L.; Zhang, K.; Chen, C. Y.-C. TCMBank-the Largest TCM Database Provides Deep Learning-Based Chinese-Western Medicine Exclusion Prediction. Signal Transduct. Target. Ther. 2023, 8 (1), 127. https://doi.org/10.1038/s41392-023-01339-1.