Нечеловеческие возможности
Сегодня машинное обучение занимает особое место в области физики Солнца, представляя собой самостоятельное научное направление. Его применение позволяет частично заменить или воспроизвести труд астрономов, на который раньше уходило много сил и времени. Однако учёные не останавливаются на достигнутом и ставят перед современными технологиями задачи, которые ранее были трудно формализуемыми, как рассказывает Егор Илларионов.
«Например, мы можем наблюдать изображение Солнца в одной спектральной линии и попытаться реконструировать его, если бы мы видели его в другой. Раньше для этого потребовалась бы физическая модель, которая ещё не была разработана. Однако для машинного обучения это не является проблемой, поскольку у нас есть исходное изображение и пример того, что мы хотим получить. Нейронные сети способны восстановить связь между целевым и исходным изображением», — поясняет учёный.
По словам специалиста, нейронные сети способны на многое. С их помощью можно попытаться реконструировать то, что находится на «тёмной» стороне Солнца. Кроме того, машинное обучение хорошо зарекомендовало себя в прогнозировании долгосрочных трендов в анализе солнечных циклов.
«Также решаются задачи прогноза космической погоды: случатся ли вспышки в ближайшее время и какую опасность они могут представлять для Земли. Раньше для этого использовались либо физические модели, либо эмпирические соотношения. Однако машинное обучение позволяет обработать гораздо больший спектр данных, что делает прогноз более точным и детализированным», — объясняет Егор Илларионов.
Самым современным подходом в рамках машинного обучения в физике Солнца на сегодняшний день являются нейронные сети. Однако пока рано делать заявления о том, что они лучше всего справляются с прогнозированием вспышек на Солнце. Учёные не спешат переходить «в один шаг» на современные технологии, поскольку это таит в себе множество опасностей, таких как пропущенные явления или ложноположительные сигналы.
«Поэтому говорить, что мы сейчас возьмём и перейдём на нейронные сети и их прогнозы, пока рано. Сегодня идёт изучение возможностей этой технологии, где она даёт точные результаты и в каких ситуациях», — говорит Егор Илларионов.
Фото поверхности Солнца, NASA
Нейросети помогут быть точнее
Сегодня современные технологии, основанные на нейронных сетях, применяются в крупных мировых центрах, которые формируют прогноз космической погоды. Однако в них искусственный интеллект — это скорее эксперимент, научное исследование, чем полноценная инструментальная база. Но в будущем нейронные сети должны помочь учёным увеличить точность получаемых прогнозов.
«Для нас очень важно аккумулировать разнородные наблюдения и из них попытаться построить прогноз. Традиционные схемы обычно оперируют небольшим количеством показателей, потому что человеку трудно выявлять связь между большим количеством параметров. А нейросети для этого замечательно приспособлены. Они в большом наборе разнородных данных способны улавливать взаимосвязи. Поэтому мы ожидаем, что прогноз станет точнее», — поясняет Егор Илларионов.
По словам учёного, для задач машинного обучения за последнее время появилось до 50-100 новых датасетов — обработанных и структурированных наборов данных. При этом сам процесс подготовки их — это трудоёмкий и долгий процесс, для которого требуется масса времени и экспертов.
Искусственный интеллект уже можно встретить повсеместно. Фото: 123rf
Например, от специалистов потребуется отметить контуры всех активных областей на изображении солнечного диска. При этом спутник делает один такой снимок раз в 12 секунд. Ни у одной команды не хватит сил и времени разметить все области на всех снимках, поэтому подготовка таких данных является отдельной частью машинного обучения, а собранная и унифицированная определённым образом информация представляет собой большую ценность.
«К счастью, физика Солнца не коммерческая область, поэтому люди постепенно приходят к тому, что для науки полезно и выгодно выкладывать данные в открытый доступ. Это является и дополнительной проверкой, и существенно ускоряет работу других исследователей. За последнее время появился целый спектр новых датасетов, которые используются не только для машинного обучения, но и активно вовлекаются в более традиционные работы. Например, по статистическому анализу или проверке теоретических моделей», — отмечает Егор Илларионов.
Опыт отечественный и международный
При разработке алгоритма российские учёные чаще всего обращаются к российским технологиям. Например, к суперкомпьютеру «Ломоносов II», установленному в МГУ. Этот вычислительный комплекс обладает набором графических процессоров, на которых обучаются современные модели ИИ.
Также при создании нейронных сетей используются так называемые фреймворки — набор готовых инструментов и стандартных реализаций для обеспечения быстрой разработки. В основном они разрабатываются международным сообществом, поэтому учёные могут работать по принципу «открытого кода».
Сегодня машинное обучение стало неотъемлемой частью исследований в области физики Солнца. Однако, чтобы достичь этого, недостаточно просто разработать нейросеть и объявить её частью науки. Необходимо наличие связующих элементов, которые объединяют все исследования в единую систему.
К таким элементам относятся база данных, универсальный программный код и междисциплинарный подход. Обучение нейронных сетей требует специальной инфраструктуры, которую можно создать лишь при тесном сотрудничестве физиков, специалистов по машинному обучению и тех, кто занимается поддержкой инфраструктуры.