Медицина, сельское хозяйство, экономика и промышленность — в каких только сферах сегодня не применяют нейронные сети. Технологии машинного обучения добрались и до метеорологии: они анализируют большие массивы данных, выявляют закономерности и составляют прогнозы. Насколько хорошо им это удается? Как устроены такие алгоритмы? Об этом порталу Наука.РФ рассказал научный сотрудник Института природно-технических систем Андрей Лубков, разработавший нейросеть для долгосрочного прогноза погоды.
— Как родилась идея о создании нейросетевой модели для долгосрочного прогноза погоды?
— Идея зародилась в 2012 году. В то время я проходил производственную практику в лаборатории крупномасштабного взаимодействия океана, атмосферы и изменений климата. Я познакомился с севастопольской школой климатологов и ее преемниками, которые были известны далеко за пределами постсоветского пространства, Воскресенской Еленой Николаевной и Полонским Александром Борисовичем. Основным направлением школы было изучение влияния глобальных климатических процессов на региональный климат, в частности, Крыма. Е.Н. Воскресенская предложила мне попробовать разработать модель, основанную на искусственных нейронных сетях для обобщения полученных знаний. Предполагалось, что такая модель сможет давать долгосрочные прогнозы на 1-2 месяца вперед.
— В чем особенности этой нейросети?
— В основе нашей модели лежит многослойный персептрон. Это одна из простейших нейронных сетей (НС). Она представляет собой связанные входной, скрытый и выходной слои — базовые блоки, из которых состоит нейросеть. Эта НС была разработана в 1962 году и обрела популярность с появлением алгоритма обратного распространения ошибки в 1986 году.
Сегодня персептрон как самостоятельная нейросеть используется редко, в основном для специфических задач, к которым можно отнести долгосрочный прогноз. Современные нейронные сети учатся на основе глубокого обучения, а для этого нужны достаточно длинные ряды данных, достигающие десятков тысяч. Наша же модель, в отличие от других нейросетей, может обучаться на коротких рядах — ей необходимо всего лишь 70 значений.
Нейросеть использует эти ряды, чтобы связать барические поля (пространственное распределение атмосферного давления), поля ветра и температуры по всей Земле. Например, если осенью в экваториальных широтах Тихого океана наблюдается пониженное давление, можно предположить, что зима и весна в южной и центральной части России будут теплыми. Чтобы отслеживать такие закономерности, мы разработали специальный алгоритм, выделяющий значимые области в этих полях.
Другой важной частью нашей технологии является расчет множества таких небольших нейронных сетей, как персептрон, — около 260 000. Прогностическую функцию нашей модели составляют 20 наилучших нейросетей.
— Какие данные нужны вашей модели, чтобы составить прогноз погоды?
— Для прогноза погоды используются реанализы. Это своего рода обобщенные массивы данных, в которых уже учтены все возможные типы наблюдений. Этим обобщением занимаются ведущие климатические центры по всему миру. Мы используем реанализ, доступный в открытом виде.
— Насколько точно эта нейросеть предсказывает погоду?
— Точность, а точнее успешность модели на сегодня составляет около 70-75% для прогнозов с заблаговременностью до 6 месяцев и 65-70% — с заблаговременностью до 9 месяцев.
— Насколько такая технология эффективнее, по сравнению с классическими методами прогнозирования и современными нейросетевыми моделями?
— Сопоставления результатов модели проверялись на примере прогноза климатического феномена Эль-Ниньо — Южное колебание.
Классические модели, которые использует Всемирная метеорологическая организация для прогноза этого феномена, имеют предел предсказуемости 8-12 месяцев. Нейросетевые модели, предложенные по большей части китайскими учеными, имеют предел предсказуемости: 17-22 месяца. Этот же предел для нашей модели составляет 22 месяца. Мы считаем это очень даже успешным результатом.
— На какой стадии сейчас этот проект? Можно ли в модели что-то улучшить?
— Конечно. В настоящий момент я работаю над оптимизацией кода. В этом году удалось сократить время расчетов от 36 часов до 5, то есть более чем в 7 раз. Такое ускорение даст возможность не просто прогнозировать какой-либо параметр для определенной локации, а рассчитывать прогноз для множества точек, то есть строить прогностические карты.
— Для каких городов работает модель?
— Она работает для Севастополя, Москвы, Тюмени, Улан-Удэ и для района вблизи горы Ай-Петри. В дальнейшем планируем сделать так, чтобы ее можно было использовать и в других регионах. Но сейчас нам важно, чтобы эта модель была более автоматизированной. Кроме того, ориентировочно осенью появятся прогностические карты среднемесячных аномалий температуры и месячных осадков. В тестовом режиме заблаговременность таких карт будет равна 6 месяцам.
— Как вы видите окончательную версию этой модели?
— Модель — эта такая вещь, которую можно вечно дорабатывать. Однако нейросетевые технологии не стоят на месте, а вычислительные мощности каждый год растут. Сложно предсказать, что будет с этой моделью, к примеру, через 10 лет, и вообще, будет ли она востребована. Вполне возможно, что появится другая разработка, более быстрая и точная.
— Какое у нее практическое применение?
— Мы видим одним из наших потребителей аграрную отрасль. К примеру, модель можно настроить для прогнозирования среднемесячной повторяемости условий, опасных для различных культур. Модель может помочь точнее прогнозировать вероятность возникновения пожаров или экстремальных сезонных паводков. Особенно это было бы актуально в Сибири. За счет удачного алгоритма адаптации модель можно применить для среднемесячной оценки повторяемости множества опасных метеорологических феноменов.
— Возможно ли создать аналогичную нейросеть, но для краткосрочных прогнозов погоды?
— Эту модель можно адаптировать под синоптический масштаб. Но я не думаю, что это целесообразно. Уже есть достаточно точные прогностические гидродинамические модели краткосрочного временного масштаба. В некоторых случаях применяют нейронные сети для уточнения прогнозов.
— Есть ли какие-нибудь трудности, связанные с разработкой подобных технологий?
— Одна из трудностей — скорость развития этих технологий. Поскольку я начинал работать над моделью в 2012 году, модель основана на технологиях, которые тогда были доступны для прогноза коротких рядов. Сейчас такие технологии могут показаться примитивными. Если бы я начинал писать модель в настоящий момент, я бы вряд ли выбрал персептрон. Но это не мешает быть уже написанной модели достаточно успешной.
— Считается, что многие области нашей планеты все еще слабо наблюдаются приборами — океаны, пустыни, горы. Данные в районах, где нет станций, а также локальные резкие перепады температуры, могут приводить к ошибкам в прогнозах. Способны ли нейросети исправить ситуацию?
— Действительно, такая проблема существует. В тех же реанализах используются обобщенные данные в доспутниковую эпоху. Исходя из базовых свойств нейросетей, можно предположить, что использовать модель на основе какой-нибудь нейросети — весьма удачное решение для подобных локаций. В первую очередь, из-за возможности вышеупомянутых работать с зашумленными прогнозируемыми рядами. Возможно, лет через 30 нейросети смогут заполнить эти пробелы.
— Как думаете, может ли в будущем ИИ заменить метеорологов и синоптиков?
— Смотря в каком будущем. Тут больше важен этический вопрос. Даже если современные модели, в том числе нейросетевые, точны, нельзя просто так сократить штат специалистов. Если говорить о прогнозе, думаю, такие модели и специалисты ближайшие 20-30 лет будут работать в команде, то есть будет учитываться мнение эксперта и «бездушной» машины. Снова же, есть необходимость собирать данные проверенными способами, чтобы статистически сопоставлять ряды метеостанций и, например, автоматических метеомодулей. В более далеком будущем, скорее всего, профессия синоптика будет модифицирована под контроль систем моделирования.
Беседовала Анна Шиховец