Исследователи Массачусетского технологического института разработали метод, который поможет отслеживать состояние океанов. Они представили технику машинного обучения, которая автоматически объединяет очень сложный набор глобальных данных об океане, чтобы найти сходства между разными локациями, основываясь на взаимодействиях между различными видами фитопланктона.
Сейчас ученые разграничивают морские сообщества с помощью спутниковых снимков хлорофилла, пигмента, вырабатываемого фитопланктоном. Концентрации хлорофилла могут указывать, насколько богата или продуктивна экосистема в одном регионе по сравнению с другим. Но карты хлорофилла могут дать только общее представление о концентрации жизни в данном регионе. При этом два региона с одинаковой концентрацией хлорофилла могут фактически содержать разные комбинации жизни растений и животных.
«Это как если бы вы смотрели на все регионы суши, где нет больших объемов биомассы, например, Антарктиду и Сахару», — отмечают исследователи.
Новая техника же позволила разделить океан на более чем 100 типов «провинций», которые отличаются по своему экологическому составу. Найдя сходства между ними, исследователи сгруппировали «провинции», исходя из 12 более общих категорий. Они отмечают, что учет таких экологических тонкостей необходим для отслеживания здоровья и продуктивности океана.
«Экосистемы меняются вместе с изменением климата, и необходимо отслеживать структуру сообществ, чтобы понять, как они влияют на рыболовство и способность океана поглощать углекислый газ», — говорят авторы исследования.
Новая методика машинного обучения SAGE предназначена для сбора больших и сложных наборов данных и вероятностного проецирования этих данных в более простой, низкоразмерный набор.
«Это похоже на приготовление печенья», — говорит один из участников команды. — «Вы берете этот ужасно сложный шарик данных и раскручиваете его, чтобы раскрыть элементы».
В частности, исследователи использовали алгоритм кластеризации, который предназначен для «ползания по набору данных» и выявления областей с большой плотностью точек — признак того, что эти точки имеют что-то общее.
Алгоритм обучали на основе данных об океане из Дарвинского проекта Массачусетского технологического института, трехмерной модели мирового океана, которая сочетает в себе модель климата, включая ветер, течения и температуры, и модель экологии. В нее входит 51 вид фитопланктона, а также способы его роста и взаимодействия друг с другом, с окружающим климатом и доступными питательными веществами.
Присвоив каждой из 100 провинций собственный цвет, ученые создали новую карту мирового океана. При этом регионы, вошедшие в состав 12 «мегапровинций», состояли из очень разных биологических видов.
«Например, провинции D и K имеют почти одинаковое количество биомассы, но, когда мы смотрим глубже, у K есть диатомеи и почти нет прокариот, в то время как у D почти нет диатомей и много прокариот. А со спутника они могут выглядеть одинаково», — отметили авторы.
Команда также разработала онлайн-виджет, который может использоваться для поиска новых сходств среди 100 провинций. Таким образом, другие исследователи смогут делить провинции на большее количество групп и углубиться в определенные данные. Задача по поиску мест с необычными и интересными для изучения экосистемами значительно упрощается.
Исследование частично финансировалось НАСА и Лабораторией реактивного движения.
См. также: