Кажется, дождь начинается: похоже, искусственный интеллект превосходит традиционные методы прогнозирования погоды
Новая компьютерная ИИ-модель GraphCast для предсказания погоды, созданная Google, во много раз превзошла традиционные способы, которые десятилетиями использовались по всему миру и привлекали многомиллионные инвестиции. Европейская модель прогнозирования погоды считалась «золотым стандартом» в метеорологии, но и её результаты оказались хуже, чем предсказания ИИ от Google. Подробности и перспективы технологии — под катом.
Сюрприз от Урагана Ли
В сентябре 2023 года исследователи из подразделения DeepMind AI компании Google сфокусировали усилия на предсказаниях погоды в США. И не просто так: дело в том, что как раз в то время ураган Ли находился по крайней мере в 10 днях от береговой линии и населённых пунктов. Метеорологи колебались в своих прогнозах: обрушится ли шторм на крупные северо-восточные города Северной Америки или пройдет мимо? Собственное экспериментальное программное обеспечение Google дало учёным неожиданный прогноз, а именно, что ураган пройдет гораздо дальше на север. Традиционные модели показывали иную картину, согласно которой ураган должен был зайти на побережье.
Представитель команды исследователей Реми Лам говорит, что они не покидали свои рабочие места все эти дни, пока продолжалась работа над прогнозом. Полторы недели спустя ураган Ли нанёс свой удар именно в ту область, как и предсказал GraphCast — Лонг-Айленд и Новую Шотландию вдалеке от населенных пунктов.
Мэтью Чантри, координатор машинного обучения в Европейском центре среднесрочных прогнозов погоды ECMWF, отметил, что системы искусственного интеллекта в метеорологии развивались намного быстрее и результативнее, чем все могли ожидать ещё два года назад. «Мы обнаружили, что GraphCast даже более точный и последовательный в своих прогнозах, чем другие существующие модели машинного обучения, например, Pangu-Weather от Huawei или FourCastNet от Nvidia», — заявил Чантри.
Марк ДэМария, метеоролог из Университета Колорадо, который долгое время работал в Национальном Центре Ураганов США, признаёт, что скептически относился к возможностям искусственного интеллекта в прогнозировании погоды. Теперь сомнения многих синоптиков поменялись на ожидание фундаментальных изменений в метеорологии.
Так начинается дождь или только кажется?
Традиционные модели прогнозов погоды состоят из множества уравнений, которые описывают сложную динамику земной атмосферы. Постоянные наблюдения в режиме реального времени за такими факторами как температура, ветер и влажность позволяют учёным предсказывать погоду на ближайшее время. На протяжении последних десятилетий эти прогнозы становились всё более точными по мере того как учёные углубляли свое понимание физики атмосферных явлений, а объём собираемых данных увеличивался.
То, что делают метеорологи, можно назвать «укрощением» физики хаотических явлений. В 1960-х годах метеоролог и математик Эдвард Лоренц заложил основы теории хаоса. Он заметил, что маленькие неопределенности в данных о погоде могут привести к совершенно колоссальным результатам. Метафору Лоренца об эффекте бабочке, которая взмахом крыльев может вызвать ураган, слышал каждый. По мнению учёного, состояние атмосферы можно прогнозировать максимум на 2 недели вперёд с большими отклонениями от будущей реальности. И у каждого из нас были моменты, когда попытки подстроиться под погоду терпели крах, а планы рушились из-за совершенно противоположных от прогноза климатических явлений.
Учёные надеются, что искусственный интеллект сможет сделать прогнозы гораздо более точными. Новые погодные модели не имеют встроенных формул и условий, а работают по аналогии с ChatGPT. Например, чат-ботам на основе ИИ не интегрируют правила грамматики и синтаксиса. Они самостоятельно их осваивают после обработки определенного количества данных. Аналогичным образом новые модели прогнозирований погоды изучают собранные данные, накопившиеся за десятилетия в реанализе ERA5 от ECMWF.
Проблема заключается в том, что алгоритмы, лежащие в основе ChatGPT, были обучены на основе огромного количества данных, но для атмосферных явлений такого объёма данных нет. Поэтому нет и гарантий, что GraphCast будет корректно работать, как утверждает Мэтью Чантри. В частности, на ураганы приходится лишь незначительная часть из всего объёма существующих данных для обучения ИИ-моделей. То, что правильно предсказанные прогнозы для урагана Ли и некоторых других явлений оказались верными, свидетельствует только о правильном выборе и использовании данных физики атмосферы алгоритмами GraphCast.
Алгоритмы машинного обучения используют сведения о наиболее распространённых явлениях, при этом они могут преуменьшать значение более редких явлений, таких как экстремальные тепловые волны или тропические штормы. Также ИИ-модели для предсказания погоды не могут корректно оценивать ситуацию с осадками.
Шакир Мохамед, научный директор DeepMind, говорит, что дождь, снег и экстремальные погодные явления, в предсказании которых люди заинтересованы больше всего, являются самой сложной задачей для ИИ-алгоритмов. Существуют иные методы прогнозирования осадков, в том числе локализованный радиолокационный подход NowCasting, разработанный DeepMind. Но интеграция двух систем — сложная задача. Исследователи считают, что необходима более точная информация для новых ИИ-моделей, чтобы улучшить результаты прогнозирования. Кроме того, учёные уже занимаются вопросом изменения GraphCast и других моделей для расширениях их функционала, в частности, для предсказания необычных и редких явлений на Земле.
Работа над ошибками
В сравнении с традиционными методами и программами прогноза погоды ИИ модели всё равно побеждают по ряду параметров. Рассмотрим такой пример. Метеорологи и должностные лица, отвечающие за предупреждение и ликвидацию последствий стихийных бедствий, стараются получать максимально точные данные про вероятность и сценарии стихийных бедствий. В этом им помогает создание комплексных прогнозов, которые учитывают все риски и показывают разные возможные результаты. Например, модель «спагетти» используется для предсказания сценариев погоды в тропических регионах, но расчёт каждой ветки занимает много времени.
Возможности искусственного интеллекта, напротив, помогут создать несколько проекций модели «спагетти» за считанные минуты. «Если у вас есть уже обученная ИИ-модель, то даже на старой видеокарте можно получить “спагетти” через 40 секунд. Так что вы можете разработать комплексную модель, которую иными методами при помощи традиционных способов реализовать нельзя», — говорит метеоролог Марк ДэМария.
К сожалению, есть одна слабость всех моделей машинного обучения. При предсказании погоды важно понимать, насколько прогноз может быть неточным исходя из текущих показателей. Лингси Се, старший исследователь ИИ в Huawei, говорит о том, что самое главное для метеорологов при получении прогноза — пояснение к нему. «Мы не можем дать им этого», — говорит он. По этой же причине рано говорить о том, что ИИ полностью заменит традиционную метеорологию в ближайшее время. Также для прогнозов на основе искусственного интеллекта любого рода важны «чистые» наблюдения и данные, свободные от следов самолетов, спутников, разных датчиков.