来自世界气象组织(WMO)的数据显示,在过去 50 年里,平均每天都会发生一场与天气、气候或水患有关的灾害,每天造成 115 人死亡、2.02 亿美元的经济损失。
因此,构建更准确的天气预报系统,将有助于挽救数百万人的生命,减少数万亿美元的经济损失,意义重大。
然而,传统的天气预报依赖数值天气预报算法(NWP),计算复杂度高、模型构建耗时,难以快速生成预报结果。基于机器学习的天气预报(MLWP)在效率和单次预报准确性上虽有所突破,但在量化预报不确定性和处理复杂时空相关性方面表现不足,表现不及 NWP 集成预报系统。
如今,由 Google DeepMind 研究团队开发的人工智能(AI)模型 GenCast,将天气预报的精度与效率带入了一个崭新的阶段:
GenCast 能够在 8 分钟内生成一组随机的 15 天全球预报,时间步长为 12 小时,分辨率达 0.25°,覆盖超过 80 种地表和大气变量,在 97.2% 的评估指标(共计 1320 个指标)上都优于当前全球最好的中期预报——欧洲中期天气预报中心(ECMWF)的集合预报(ENS),而且具有更好的边际和联合预报分布。
另外,GenCast 在预报极端天气(如高温、强风)、热带气旋路线和风能产量时,也更加有效。
相关研究论文以“Probabilistic weather forecasting with machine learning”为题,已发表在权威科学期刊 Nature 上。
GenCast:更快、更准预报未来天气
GenCast 是一个全新的概率天气预报模型,通过条件扩散模型(conditional diffusion model)生成一系列可能的天气场景。其核心能力在于建模未来天气状态的条件概率分布,即基于当前和之前的天气状态生成未来的预报。这一方式允许 GenCast 以更快的速度和更高的精度提供全球范围 15 天概率性天气预报。
具体而言,GenCast 的架构包括编码器、处理器和解码器三大模块。编码器将初始天气状态映射到一个经过 6 次精细划分的球形网格上,处理器则通过图 transformer 在网格节点间捕捉复杂的时空相关性,而解码器则将结果重新映射回全球纬经度网格,生成最终的天气预报。
图|GenCast 生成天气预报的示意图。
此外,研究团队利用 ERA5 再分析数据对 GenCast 进行了训练,这一数据集包含 40 年间全球范围内的最佳天气估计分析结果,确保了模型的泛化能力和对历史天气模式的深度理解。
为评估 GenCast 的实际性能,研究团队对其进行了基准测试,并将其与当前最先进的系统和模型进行对比。为确保公平对比,所有模型均基于 ERA5 数据进行初始化,并统一分辨率至 0.25°。
在与其他系统对比的实验中,GenCast 生成的天气样本更接近实际观察值,预报分布覆盖了可能的多种情景,为用户提供了对潜在风险的更全面理解。例如,GenCast 在台风海贝思登陆日本前不久的预报非常清晰,在 1~15 天的预估时间内,其球谐功率谱与 ERA5 地面真实值非常接近。
之后,研究团队评估了 GenCast 和 ENS 在极端天气预报方面的整体预报技能、校准和性能,即边际预报性能。边际预报作为对某一时间和地点的天气状况进行的具体预报,是日常天气服务的核心。
GenCast 在这一领域展现了强大的性能优势。其生成的预报分布能够更精确地反映可能的天气情景,不仅在温度、风速和气压等变量的预报上与真实数据高度吻合,还能通过改进的概率校准有效量化预报的不确定性。
具体研究显示,GenCast 在多个气象变量的边际分布预报中表现优于 ENS,在一个涵盖 1320 个评估目标的测试中,GenCast 在 97.2% 的情况下取得更高的技能得分(CRPS),特别是在短期预报(1 至 5 天)中效果显著。
同时,GenCast 在预报高温、强风等极端天气时同样表现卓越。研究采用 Brier 技能得分和相对经济价值(REV)曲线衡量模型性能。结果显示,在预报高温(99.99% 分位点)和极端低温(0.01% 分位点)事件时,GenCast 的表现显著优于 ENS。
此外,GenCast 的边际分布预报展现了良好的校准能力,这意味着它能够准确地识别预报中可能存在的错误或偏差,为用户提供更可靠的天气决策支持。
图|GenCast 的边际预报分布娴熟且校准良好。
除了边际预报,GenCast 在联合预报方面也展现了令人瞩目的表现。联合预报关注天气变量间的空间和时间相关性,对于捕捉全局天气系统的动态特性至关重要。
例如,在热带气旋轨迹预报方面,对热带气旋的路径预报不仅依赖单一变量,还需考虑多层次的大气相互作用。而 GenCast 能够生成具有时空一致性的天气样本,精准地捕捉这些复杂的相关性,从而生成精确预报。
研究特别分析了 GenCast 在台风“海贝思”案例中的表现。台风轨迹预报显示,GenCast 的不确定性评估范围覆盖了更多可能的情景,其在轨迹位置预报上的误差显著低于 ENS。更重要的是,随着预报时间的缩短,GenCast 的不确定性范围逐步收敛,为决策者提供了更精确的着陆时间和地点信息。
除此之外,在区域风能预报中,GenCast 将 10 米风速数据转化为风能输出,其预报精度较 ENS 提高了 20%,尤其在短时间尺度上,为可再生能源调度提供了新的可能性。
图|GenCast 在区域风力和热带气旋预报方面优于 ENS。
尽管 GenCast 在精度与效率上实现了双重突破,但仍有进一步优化空间。例如,提高分辨率以匹配未来升级的 ENS 系统,或者通过蒸馏技术降低计算成本。此外,结合操作性数据进行微调或融入更多传统 NWP 的初始条件处理方法,亦可显著提升其实用性。
AI 如何重塑气候预报未来?
AI 作为“一个改善极端天气预报的更快、更便宜的替代方案”,一向在天气预报领域被寄予厚望,除了谷歌,包括华为、清华大学等在内的科技公司和高校在这一方向均取得了重大进展。
2023 年 7 月,由华为云开发的盘古气象(Pangu-Weather)模型登上了 Nature,其使用 39 年的全球再分析天气数据作为训练数据,预报准确率与全球最好的数值天气预报系统 IFS 相当,且在相同的空间分辨率下比 IFS 快 10000 倍以上。
同期发表在 Nature 上的另一篇论文则介绍了 NowcastNet,其出自机器学习领域泰斗、加州大学伯克利分校教授 Michael Jordan 和清华大学教授王建民领导的研究团队,该模型可以结合物理规律和深度学习,进行实时预报降水。NowcastNet 在临近预报方面表现出色,基于雷达观测数据,可以做到提前 3 小时对 2048 km × 2048 km 的区域进行高分辨降水预报。
2023 年 11 月,Google DeepMind 推出了一款基于机器学习的天气预报模型——GraphCast,在全球 0.25° 的分辨率下,该模型可以在一分钟内预报未来 10 天的数百个天气变量,显著优于传统气象预报方法,同时在预报极端事件方面表现良好。相关研究论文已发表在权威科学期刊 Science 上。
2024 年 3 月,Google Research 洪水预报团队开发了一种 AI 模型,其利用 5680 个测量仪数据训练,可在 7 天内预报未测量流域的日径流。该模型在同日预报和 5 年一遇极端天气事件的预报中,表现优于当时领先的全球洪水预警系统 GloFAS。相关研究论文已发表在权威科学期刊 Nature 上。
2024 年 7 月,Google Research 团队及其合作者推出了一款天气预报和气候模拟模型 NeuralGCM,在 1-15 天短期天气预报中的准确率媲美 ECMWF 模型,并在气旋预报和轨迹模拟上表现优于现有模型。加入海平面温度后,该模型的 40 年气候预报结果与全球变暖趋势高度一致。且 NeuralGCM 可以在 30 秒计算时间内生成 22.8 天大气模拟。相关研究论文已发表在权威科学期刊 Nature 上。
相信在不久的将来,AI 驱动的天气预报将以更快的速度与更高的准确率在灾害预警、能源规划和气候适应等方面发挥更大的作用,为人类应对日益复杂的气候挑战提供更强大的工具。