教学科研

首页 > 教学科研 > 正文

环境与能源学院大气组在Environmental Science & Technology发表最新研究成果

2026-04-10环境与能源学院

作者:彭杏 马浩楠  |   责编:王琳

近日,北京大学深圳研究生院环境与能源学院大气研究团队在Environmental Science & Technology发表题为Machine-Learning Source Apportionment of Particulate Pollution Aids Urban Emission Regulations的研究论文。该研究提出了一种基于机器学习的PM2.5来源解析模型,利用多尺度气溶胶组分数据,实现对PM2.5来源的近实时追踪和较准确量化。基于中国珠江三角洲地区和美国加州地区近二十年的观测数据,研究表明,该模型能够高效复现传统受体模型的来源解析结果,识别出珠三角以二次硫酸盐和机动车排放为主、加州以机动车排放、二次硝酸盐和生物质燃烧为主的来源特征,并进一步揭示了深圳过去十年人为源得到有效控制因而PM2.5显著下降、美国洛杉矶PM2.5变化趋于平稳且受野火污染增强影响的不同演变趋势。论文提出的机器学习方案可以高效复刻基于受体模型的解析结果,可支持近实时污染来源分析,并为相关政策制定提供重要支撑。

研究背景

降低城市颗粒物污染对于改善空气质量和减少健康风险至关重要,而实现这一目标的前提,是准确识别PM2.5来源。论文指出,现有来源解析方法通常面临数据需求大、技术复杂和计算负担高等限制。传统受体模型虽然应用广泛,但仍存在长期观测成本高、参数优化复杂、依赖专家判断、时效性不足等问题,因而难以及时支撑动态污染过程中的快速响应。

研究方法

研究构建了一个机器学习来源解析框架。首先利用PMF模型和PM2.5化学组分观测数据建立训练数据集,再针对PMF识别出的各个来源分别建立XGBoost模型,以各化学组分作为输入特征、各来源贡献作为目标变量,建立污染组分与来源之间的响应关系,从而在获得PM2.5组分观测数据后,实现对各来源贡献的快速解析。研究使用了深圳2014-2024年长期离线观测数据、2023年在线高时间分辨率观测数据,以及珠三角区域和美国加州多站点长期观测数据,对该框架进行了系统验证。

研究结果

该方法能够较好复现传统PMF来源解析结果,并可同时应用于长期序列和高时间分辨率在线观测数据。论文指出,在深圳长期观测数据上,模型能够保持较高准确性;在在线观测数据上,模型能够实现近实时来源解析,并反映不同来源的日变化和季节变化特征。在区域应用方面,研究显示,珠三角地区PM2.5的主要来源为二次硫酸盐和机动车排放,而加州则主要受机动车排放、二次硝酸盐和生物质燃烧影响。

图1.基于机器学习模型得出的珠三角和加利福尼亚州PM2.5来源解析结果.

进一步分析2014-2024年深圳和洛杉矶的变化趋势发现,深圳PM2.5以1.47 μg/m3/year的速率下降,多数主要来源呈下降趋势;相比之下,洛杉矶PM2.5整体变化趋于平稳,其中生物质燃烧贡献呈显著上升趋势。深圳过去十年PM2.5下降与人为源控制成效有关,而洛杉矶PM2.5变化趋于平稳则受到野火污染增强影响。

2.基于机器学习模型获得2014-2024年深圳和洛杉矶PM2.5来源解析结果

研究结论与意义

论文指出,该机器学习框架在保持与传统受体模型较高一致性的同时,具有更高计算效率和更灵活的输入方式,训练完成后的机器学习模型可在数秒内对新数据输出来源解析结果。该方法可与高时间分辨率在线监测技术结合,实现污染来源快速识别和实时追踪,可用于日常颗粒物防控和重污染过程应急管理;同时,该框架具有较强的时空适用性,可为城市空气质量精细化管理和污染应对提供技术支持。

北京大学深圳研究生院环境与能源学院南燕特聘副研究员彭杏、博士研究生马浩楠和何凌燕教授为论文共同第一作者。北京大学深圳研究生院黄晓锋教授与美国斯坦福大学地球系统科学系王元教授为论文共同通讯作者。该研究得到了国家重点研发计划(2023YFC3709203)、国家自然科学基金(42407132)和IER2024年度基金(IERF202404)的支持。

原文链接:https://doi.org/10.1021/acs.est.5c14501

关闭