

近日,复旦大学环境科学与工程系/环境科学智能研究中心张艳教授团队、人工智能创新与产业研究院(AI3)李昊研究员团队,联合上海科学智能研究院、上海市环境监测中心及上海市浦东新区环境监测站等多家单位,在环境科学与人工智能交叉领域开展科研合作,围绕“基于AI的空气质量精准预报与立体解析”主题取得重要研究进展。相关成果分别在线发表于Nature旗下期刊《npj Clean Air》与环境领域顶尖期刊《Environmental Science & Technology》。
两项研究分别从“多模态大模型对城市空气质量的精准预报技术”和“多污染物三维垂直预测技术”维度展开,克服了传统数值模式的计算耗时瓶颈与应用局限,为城市区域大气污染预警与城市精细化治理提供了全新的智能化技术手段。
进展一:研发FuXi-Air多模态大模型,实现城市级空气质量高精度快速预报
准确的空气质量预报对公众健康保护与污染减排策略至关重要。然而,传统基于物理化学方程的数值模式面临计算成本高、运行缓慢的挑战,且模型对气象前置条件的误差极为敏感,缺乏动态同化实时观测数据的能力,难以在快速变化的城市环境中实现高效的实时响应。为突破这一瓶颈,研究团队构建了气象-排放-污染物深度耦合的多模态空气质量预报大模型—FuXi-Air,可与伏羲气象大模型无缝联接,快速实现空气污染预报预警。
模型架构创新:该模型基于Transformer核心架构,利用自注意力机制提取不同监测站点间的空间依赖关系,并通过交叉注意力机制,将高分辨率的气象预报数据、排放清单与站点观测数据进行动态融合。这一设计有效模拟了气象条件对污染物传输和污染源的综合影响,提升了模型表征复杂污染过程的能力。

图1 模型结构示意图
在北京、上海和深圳三个特大城市的验证中,FuXi-Air能够在25至30秒内完成多站点、六种主要空气污染物(O3、NO2、PM2.5、PM10、SO2、CO)未来72小时、小时级分辨率的预测计算。预测结果表明,模型误差保持在较低水平,其中O3预报性能最佳,其MRE稳定在31.27%–34.12%之间(图2)。同时,模型展现出捕捉城市异质性污染特征的能力,例如在受局地排放主导的城市,其PM2.5平均均方根误差(RMSEavg)仅为9.68 µg/m³,较受区域传输影响显著的城市降幅达64.5%。

图2 FuXi-Air 模型对上海、北京和深圳六种污染物在72小时预报时效内的平均相对误差(MRE)评估曲线
在上海地区的应用性能测评中,FuXi-Air的预报性能整体优于应用于业务预报的空气质量数值模式(CMAQ-AQ6)。特别是在臭氧(O3)、二氧化硫(SO2)和一氧化碳(CO)的预测上,平均均方根误差(RMSEavg)分别降低了36.99%、68.40%和59.36%。此外,针对PM2.5、NO2和PM10的预测,其RMSE也分别降低了8.07%、11.91%和7.74%。通过系统的消融实验证实,多源数据的有效融合是提升预报精度的关键。模式性能也在北京和深圳进行了模拟验证,模型能够较好地捕捉上海、北京和深圳不同城市的污染形成机制差异,展现出良好的泛化能力。
成果发表期刊: npj Clean Air (2026)
论文题目:FuXi-Air: air quality forecasting based on emission-meteorology-pollutant multimodal machine learning
共同第一作者:耿志鑫 樊旭 通讯作者:张艳 李跃武 李昊
论文链接:https://doi.org/10.1038/s44407-026-00061-w
进展二:构建统一机器学习技术框架,揭示大气污染三维垂直演变与层间互作机制
大气污染物的垂直分布对人群暴露评估与精准管控至关重要。然而,受限于垂直观测手段的稀缺以及传统化学传输模型的不确定性,当前对污染物在不同高度层的演变规律认知尚不明确,导致现有空气质量管理大多停留在近地面,难以支撑真正的三维立体防控。为此,研究团队首次将上海中心大厦(623米)的高塔在线观测数据与激光雷达数据进行深度融合,开发了一个多层统一的数据驱动机器学习框架,系统揭示了大气污染在垂直方向上的气象驱动机制及层间相互作用。
研究成功应用并预测了夏季臭氧污染的“V型”垂直结构,并实现了对污染峰值的精准捕捉(图1)。模型在0–0.7km的RMSE仅为12.86µg/m3,在高空区域虽存在一定误差增长,但整体仍稳定刻画了垂直变化特征。这一结果表明,当前AI模型已具备较强的立体污染刻画能力。

图1 典型夏季臭氧污染过程的模型预测结果。(a)污染期间,基于塔楼观测与激光雷达联合获取的上海中心大厦0–3.5 km臭氧垂直分布。(b)同一污染过程中模型预报的臭氧垂直分布。(c)臭氧预报在不同高度层及逐小时的均方根误差(RMSE)评估。(d)按低层(0–0.7 km)、中层(0.7–2.0 km)和高层(2.0–3.5 km)划分的RMSE统计结果。(e)个例期间在稳定边界层(SBL)、混合层(ML)、残余层(RL)和自由流层(FFL)中的RMSE统计。(f)污染过程中不同高度臭氧峰值的预报表现。(g) 污染峰值当天边界层高度的演变。
研究证实,气象因子对污染物预测具有决定性作用,且其影响随预报时效显著增强(图2)。可解释性(SHAP)分析表明,近地面O3主要受气温(T2M)主导;而在高空区域,边界层高度(BLH,贡献率22.30%)和温度垂直积分(VIT,贡献率14.5%)成为主导因素,说明高空污染物分布主要受边界层演变、大气热力学结构及垂直输送过程的共同控制。

图2 不同垂直层中气象因子对预测影响及相对贡献的分析。(a)在0–3.5 km范围内,气象因子对72小时臭氧预报的垂直影响。(b)在0–0.7 km范围内,气象因子对72小时PM2.5预报的垂直影响。(c)基于|SHAP|值的气象变量对O3预测的相对贡献。(d)在0–0.7 km范围内,气象因子在72小时PM2.5预报中的影响机制及相对贡献评估。
大气不同高度层之间并非简单的叠加关系,而是存在明显的“非对称耦合”性质(图3)。低层信息可显著提升中、高层的预测精度(平均绝对误差MAE分别降低3.54%和6.44%),主导了垂直输送过程;中层则可能因复杂的化学过渡机制引入干扰;而高层信息主要有助于中层预测,但抑制低层表现。该发现首次从数据驱动角度量化了大气污染的“垂直反馈机制”,在三维空气质量预报与机制解析上实现了重要技术突破。

图3 层间相互作用对垂直剖面预测性能的影响。(a)去除低层信息对中层和低层的影响。(b)去除中层信息对低层和高层的影响。(c)去除高层信息对中层和高层的影响。(a–c)评估指标为:(Ablated − Baseline) / Baseline(%)。(d–f)实验A、B、C相对于基线预报的差异。(g)在每日臭氧峰值时段,消融实验与基线预报之间的差异。(h)不同预报时效下垂直层间相互作用的变化。
成果发表期刊:Environmental Science & Technology (2026)
论文题目:Multilayer Vertical Interactions of Air Pollution and Meteorological Drivers Revealed by a Unified Data-Driven Model
第一作者:陆溪桥 通讯作者:张艳 杨帆
论文链接:https://doi.org/10.1021/acs.est.5c17638
环境科学与工程系系2024级博士生耿志鑫和2024级硕士生陆溪桥为张艳教授课题组成员,马蔚纯教授和余琦副教授为该研究合作者。其它合作者分别来自上海科学智能研究院、上海市环境监测中心、浦东新区环境监测站和丹麦哥本哈根大学。研究工作得到了国家自然科学基金(42375100)、上海市自然科学基金(22ZR17700)、上海市生态环境局科研项目以及复旦大学AI4S创新基金的资助与支持。目前,FuXi‑Air 大模型已在长三角区域空气质量预测预报中心/上海市环境监测中心完成部署并实现常态化业务化运行,为第七届中国国际进口博览会等重大活动空气质量保障工作提供关键技术支撑,为环境与人工智能交叉领域构建 “产‑学‑研‑用” 深度融合闭环提供了创新实践范例。