AI 预测天气,到底有多难?

标签:AI
分享到:

厄尔尼诺现象频繁出现、欧洲冬天越来越冷、多地发生森林火灾等等,随着全球气候变暖,致命热浪、干旱、洪水和台风等各种极端天气正变得越来越普遍。

非政府组织乐施会在 19 年底就发出警告称,过去十年来,气候紧急情况造成的灾难迫使每年有超过 2000 万人流离失所。而据麦肯锡预测,预计到 2050 年,由于极端高温和湿度增加而带来的劳动力损失,将使亚太地区每年损失 4.7 万亿美元的 GDP,约占全球损失总额的三分之二。

如何更精确地提前预测气候并采取及时有效的防范措施是人类应对极端天气的关键。

为什么说人工智能可以

我国的天气预测技术经过了经验统计技术、物理分析技术和动力学分析技术三个阶段,目前普遍采用的是动力分析技术。

传统天气预报的方法是将从卫星观测、地面气象观测站、气象雷达站、L 波段探空系统以及地形、历史气象统计资料等各方收集到的大量数据带入到模型中处理,通过计算得到反映大气各种变量的数值结果,预报员或者科研工作者根据这些变量来推测可能发生的天气。

根据时长不同,天气预报可以分成短期临近预报、短期预报、中期预报、延伸期预报和气候预测。不同时间尺度的预报,使用的预报模型和数据各有不同。

与其它行业不同,气象预测对专业性、时效性等有较高的要求,同时影响预测结果的因素有很多,所以整体预测难度较大。同时,对海量跨越时间和地理区域的数据信息处理,需要耗费大量的计算资源,也很考验硬件设施。

目前主流的动力模型预测方式受计算量的限制,预测的空间和时间尺度都较大,并且对于更长期的预测比如气候预测精度会有比较大的下降。

传统动力模型需要技术上的进一步突破,而人工智能恰恰很擅长处理大数据。

AI 气象预测已在路上

近些年,业界已经开始从传统动力系统预测逐步转向探索 AI 算法预测,气候预测涉及的时间序列问题也在 AI 领域有了很多应用。

17-18 年间,阿里参与举办了两次天气预测竞赛,通过这两次竞赛,业内达成了初步共识:卷积神经网络(CNN)结合循环神经 网络(RNN)可以更好地解决时空预测的问题,即利用 CNN 层从输入的雷达数据中提取特征,并与 LSTM 结合以进行序列预测。这个思想主要源于香港科技大学施行健博士在短临预报上的研究。

气候预测方面,2018 年,自然资源部国家海洋环境预测中心与清华大学合作研发了具有高预测能力的机器深度学习厄尔尼诺预测模型,并在 2019 年厄尔尼诺春季预测会议上实现了试验预测。

厄尔尼诺 / 拉尼娜现象指的是热带太平洋海表温度异常上升 / 下降的气候现象,2014-2016 年间发生的超强厄尔尼诺事件已经成为全球气候异常变化的重要因素之一。由于传统天气预报很难对一年后的情况做出准确预测,所以厄尔尼诺的长期预测一直是个难题。

在 2019 年,气候预测领域迎来了一次重大突破。当年 9 月,南京信息工程大学罗京佳教授与韩国全南国立大学的研究团队一篇名为“Deep Learning for multi-year ENSO forecasts”的论文在《Nature》期刊发表,这篇文章借助人工智能更准确地预测了厄尔尼诺现象。该模型将提前 18 个月预测准确率提高到了 74%,远远超过了当时传统方法 56% 的准确率。

论文提出的模型。CNN 模型包括一个输入层、三个卷积层、两个池化层和一个全连接层,最终输出预测结果。

目前,国内已有企业开始尝试用人工智能做天气预测,但多数企业将研究集中在了短临预报上。

达摩院资深算法专家李昊表示,在短临预报和气候预报的一些任务上,人工智能的精度更高、计算量更小,具有一定的优势。在短临预报上的研究实践表明,AI 算法预测明显优于传统方法。

不过,李昊也指出,在短中期等预报上,AI 还没有体现出明显的优势,而这可能是最值得探索的领域之一。

但用 AI 预测天气的技术目前还不够成熟,整个行业还在一步步探索。

短临预报上,谷歌在去年提出了 MetNet 模型,该模型能够以 2 分钟的间隔和 1km 的分辨率预测未来 8 小时内的降水概率。MetNet 优于 NOAA 当前使用的、基于物理定律的最先进模型,可以提供 7 到 8 小时的预测时间,并且可以预测美国全境内的天气,预测耗时只需几秒钟(之前的模型需要 1 小时)。

谷歌神经网络气象模型 MetNet 的架构

气候预测方面,今年 2 月,达摩院与南京信息工程大学等机构主办 AI 气候预测大赛,聚焦 ENSO(厄尔尼诺与南方涛动的合称)预测,并将预测周期延长到了 2 年。大赛里有 20 多支队伍的预测都超过了 19 年《Nature》文章里的预测结果,其中 13 支队伍研发的 AI 算法模型取得了长周期、精准度高的厄尔尼诺预测结果。

阿里巴巴数字供应链预测算法团队提出了“视频(历史)->NINO3.4(历史)->NINO3.4(未来)”的方案。该方案的基本思想是从 sst 视频数据出发,首先根据 NINO3.4 指标的定义,从 sst 直接计算获得历史 NINO3.4 指标,然后将视频(历史)和 NINO3.4(历史)作为模型的输入,直接预测 NINO3.4(未来)。

阿里巴巴数字供应链预测算法团队创建的模型

也有新的团队模型破除了之前只考虑局部信息的方式,采用整个西太平洋海温时空结构演变的信息,用时空预报作为时间序列预报的进一步扩充,并利用自注意力机制充分提取时空结构信息来做预报。

ENSO 预测问题是个囊括时间、空间、混沌、动力学系统等多个领域的极具挑战性的气象问题,需要长时间的研究才可能取得重大进展,虽然很多模型还存在不足,但可以看出,研究者们正在努力将人工智能最新知识与气象领域进行融合,做出更准确的天气预测。

只有 AI 也不行

由于整个行业还处于早期探索阶段,因此还存在不少挑战。如何建立合理有效的数学和数据模型,并保证算法稳定性是当前研究中面临的主要问题之一。

除了专业技术,研究人员还需要有一个“软技能”:非常了解气象专业知识。AI 算法团队需要对气象知识非常了解后,才能进行抽象设计模型、处理海量数据等工作。但这方面的人才非常匮乏。

此外,仅仅有人工智能技术也是不够的。

2013 年,Earth Risk 发布了一个 40 天的气温概率预报模式 TempRisk Apollo 。该公司把近一百年的历史气象数据和数千亿次的计算用深度学习的方法建立气候模型,再与当前气候条件做比较,运用预测分析方法做出概率判断。

无论是 TempRisk Apollo 模型,还是彩云天气预报 App,都在积极探索人工智能或者集合物理机制的预测模式。

去年杭州云栖大会上,达摩院发布天、空、地多源数据精准分析平台 AI Earth,该平台已在气象、生态环境、水利等领域应用,气象预测方面可实现短临天气预测能力,预测 3 小时内 1 公里网格空间的降水信息。

AI 在气象领域已经有了一定的基础应用,整个行业方兴未艾。李昊也表示,AI 和天气预测的融合在交通、能源、农业等有众多应用前景,是当之无愧的社会基础设施。对于气象这类社会基础设施,阿里会继续大力投入。

相信经过研究者们的不断探索,用 AI 准确预测天气在未来将不再困难。

继续阅读
进击的速溶咖啡:当中国AI开始玩工业化

随着产业化的推进,公众范围对AI的探讨也随之收窄。如今,基本看不到营销号那些关于AI的惊悚标题,也很少有让业界惊喜的底层算法突破。也许有人认为AI泡沫正在破裂,AI寒冬又将到来。但在大众狂欢消退之余,却又能看到商用AI正在中国市场快速兴起。到了2021年,大部分云计算和AI供应商似乎都无暇继续讨论AI的应用场景和应用可行性,而是专注于另一个关键词:成本。

伯克利团队正在训练AI成为外科实习医生

Danyal Fer博士正坐在离距离机械手几英尺的椅子上摆弄着他面前的金属操作杆。

AI 预测天气,到底有多难?

厄尔尼诺现象频繁出现、欧洲冬天越来越冷、多地发生森林火灾等等,随着全球气候变暖,致命热浪、干旱、洪水和台风等各种极端天气正变得越来越普遍。

AI企业活得还好吗?

2020年11月,网上广泛流传着一个视频:一位济南男子为保护个人信息,戴着头盔去看房。媒体闻风而动,调查发现不少房企采取人脸识别与买房折扣挂钩政策,才出现这种极端“艺术行为”。

AI人工智能等同于医生?

2016年3月以来,一款名为AlphaGo(阿尔法狗)的机器人声名鹊起,因为它先后完胜了围棋界名将李世石及柯洁。2017年名为AlphaZero(阿尔法元)的机器人仅训练了3天,又以100:0的悬殊差距战胜了AlphaGo。