ЗАКАЗАТЬ УСЛУГИ
NASA и IBM открыто опубликовали модель Geospatial AI Foundation для наблюдения Земли
8/08/2023
NASA и IBM открыто опубликовали модель Geospatial AI Foundation для наблюдения Земли

Государственно-частное партнерство с участием NASA и IBM Research привело к выпуску первой базовой модели геопространственного искусственного интеллекта (ИИ) NASA с открытым исходным кодом для наблюдения Земли. Построенный с использованием набора данных NASA Harmonized Landsat Sentinel-2 (HLS), выпуск модели геопространственной основы HLS (HLS Geospatial FM) является важной вехой в применении ИИ для наук о Земле. Модель имеет широкий спектр потенциальных применений, включая отслеживание изменений в землепользовании, мониторинг стихийных бедствий и прогнозирование урожайности сельскохозяйственных культур. HLS Geospatial FM доступен на Hugging Face  общедоступном репозитории для моделей машинного обучения с открытым исходным кодом.

Важную роль в этой работе сыграла Межведомственная группа NASA по внедрению и перспективным концепциям (IMPACT). Расположенный в Центре космических полетов им. Маршалла NASA в Хантсвилле, штат Алабама, IMPACT является компонентом программы NASA «Системы данных о Земле» (ESDS) и отвечает за расширение использования данных наблюдения Земли NASA за счет инноваций, партнерских отношений и технологий, включая применение ИИ к этим данным.

«Базовые модели ИИ для наблюдений Земли обладают огромным потенциалом для решения сложных научных проблем и ускорения более широкого развертывания ИИ в различных приложениях», — говорит д-р Рахул Рамачандран, менеджер IMPACT и старший научный сотрудник Marshall. «Мы призываем сообщества наук о Земле и приложений оценить эту первоначальную модель основы HLS для различных применений и поделиться отзывами о ее достоинствах и недостатках».

Наряду с NASA и IBM Research, в этих совместных усилиях участвовали Центр геопространственной аналитики Университета Кларка, ЕКА (Европейское космическое агентство), Геологическая служба США и Национальная лаборатория Ок-Ридж Министерства энергетики США. Эта работа является частью Научной инициативы NASA с открытым исходным кодом (OSSI), обязательства по созданию инклюзивного, прозрачного и совместного открытого научного сообщества в течение следующего десятилетия. Разработка HLS Geospatial FM началась в январе 2023 года, а FM был выпущен в июле 2023 года.

Значение базовых моделей

Базовые модели FM — это типы моделей ИИ, обученных на широком наборе немаркированных данных. Они могут использоваться для разных задач и могут применять информацию об одной ситуации к другой. Цель работы NASA/IBM состоит в том, чтобы предоставить исследователям более простой способ анализа и извлечения информации из больших наборов данных NASA, связанных с земными процессами.

«Мы считаем, что базовые модели могут изменить способ анализа данных наблюдений и помочь нам лучше понять нашу планету», — говорит директор по научным данным NASA Кевин Мерфи. «И, открывая такие модели и делая их доступными для всего мира, мы надеемся приумножить их влияние».

ИИ FM могут сыграть ключевую роль в понимании взаимосвязанных процессов на нашей планете и климатических последствий продолжающихся природных и антропогенных изменений. FM, которые предварительно обучены на данных наблюдения Земли, могут ускорить анализ огромных объемов данных двумя основными способами.

Во-первых, FM не нуждаются в больших наборах обучающих данных, создание которых может быть трудоемким и ресурсоемким. Возможность обучать FM на гораздо меньших наборах данных может сэкономить время и деньги. Во-вторых, FM могут сократить избыточные усилия по созданию последующих приложений, которые используют выход ЧМ для выполнения конкретной задачи, такой как отслеживание изменений в землепользовании или мониторинг стихийных бедствий.

Согласованный сбор данных Landsat Sentinel-2

Образ

HLS — это логический набор данных, на котором строится работа FM. Проект HLS обеспечивает согласованные данные о коэффициенте отражения поверхности от Operational Land Imager (OLI) на борту совместных спутников NASA/USGS Landsat 8 и 9 и мультиспектрального прибора (MSI) на борту спутников Европейского союза Copernicus Sentinel-2A и Sentinel-2B. Комбинированные измерения датчиков позволяют проводить глобальные наблюдения за сушей каждые 2-3 дня с пространственным разрешением 30 метров.

NASA IMPACT сыграл важную роль в разработке архитектуры обработки HLS для достижения почти глобального охвата. Снимки HLS могут быть интерактивно изучены с помощью инструмента визуализации данных NASA Worldview Earth Science и могут быть загружены через NASA Earthdata Search.

Дорога к HLS Geospatial FM

Инфраструктура, необходимая для ИИ FM, постоянно развивается по мере того, как архитектуры нейронных сетей, используемые для обучения этих моделей, становятся все более сложными. FM обычно обучаются на массивных наборах данных, что требует значительных вычислительных мощностей.

В рамках сотрудничества NASA и IBM IBM Research обучила HLS Geospatial FM на суперкомпьютере IBM Cloud Vela с использованием стека IBM watsonx FM, который представляет собой облачную платформу для обучения и развертывания FM. Стек IBM watsonx FM в настоящее время работает в управляемой облачной среде NASA Science Managed Cloud Environment (SMCE). Расположенный в Центре космических полетов имени Годдарда NASA в Гринбелте, штат Мэриленд, SMCE предназначен для ускорения научных исследований NASA, обеспечивая быстрый доступ к облачным ресурсам для быстрого прототипирования и открытого сотрудничества.

Оценка модели

Команды NASA, IBM Research и Университета Кларка находятся в процессе оценки HLS Geospatial FM для широкого спектра последующих приложений, включая классификацию, обнаружение объектов, сегментацию временных рядов и поиск сходства. FM уже применялся для картографирования наводнений, где он достиг самых современных характеристик с использованием меньших выборок. Наряду с картографированием наводнений, FM также применяется для идентификации пожаров, что является критически важным компонентом для активного управления пожарами и восстановления после пожара. Кроме того, используя данные временных рядов, команды продемонстрировали преимущества использования модели FM для картографирования почвенно-растительного покрова и типов сельскохозяйственных культур в различных географических регионах на территории сопредельных Соединенным Штатам.

Тонкая настройка модели

Недавний семинар продемонстрировал потенциал ФМ ИИ для приложений наук о Земле. Семинар, организованный IMPACT в сотрудничестве с Техническим комитетом по информатике наук о Земле (ESI TC) Института инженеров по электротехнике и электронике (IEEE GRSS) и Техническим комитетом по информатике наук о Земле (ESI TC), охватывал разработку FM с использованием данных HLS и включал практическое упражнение по тонкой настройке FM с использованием watsonx.ai IBM. Участники также применили модель к новым данным HLS и успешно настроили FM для обнаружения паводковых вод и их идентификации.

Семинар продемонстрировал, что при наличии правильных учебных пособий, платформы и инфраструктуры можно быстро обучить геологов эффективному использованию FМ для последующих приложений. Это значительный шаг вперед в развитии ИИ для наук о Земле, так как открывает возможность использования FМ для решения широкого круга задач.

Дальнейшие действия

Наряду с работой над HLS Geospatial FM, NASA и IBM разрабатывают другие приложения для извлечения информации из наблюдений Земли, включая большую модель, основанную на различных науках о Земле. В соответствии с руководящими принципами и принципами открытой науки NASA, модели и продукты, полученные в результате этой совместной работы, будут открыты и доступны для всего научного сообщества.

ОТПРАВИТЬ ЗАПРОС

Контакты

ООО "Геоинформ"

ИНН/ОГРН 5032280247/1145032004688

143002, Московская область, г. Одинцово, ул. Садовая, д. 3Б, офис 704

+7 (495) 228-78-13

E-mail: info@geoinform.su

www.geoinform.su