Цифровые двойники — это воспроизведенные с помощью технологий цифровые представления объектов из реального мира. Благодаря системам управления большими данными цифровые двойники в сельском хозяйстве можно использовать для прогнозирования будущего урожая. Учёные из Южной Кореи Стивен Ким и Сон Хо создали цифровые двойники мандариновых деревьев, чтобы продемонстрировать возможность их использования в сельском хозяйстве. Мандарин в качестве модельной культуры был выбран из-за его широкого распространения на корейском острове Чеджу и возможности многолетнего наблюдения.

Авторы исследования использовали Open API для сбора данных из различных источников на острове Чеджу площадью 185 тыс. га. Визуализация и анализ данных, включающие статистические модели и алгоритмы машинного обучения, демонстрируют, что будущее за точным сельским хозяйством, при котором можно управлять каждым плодовым деревом на индивидуальной основе.
Цифровые двойники позволяют пользователям моделировать и анализировать данные для принятия обоснованных решений. Технология создания цифровых двойников опирается на интеграцию передовых технологий, включая информационно-коммуникационные технологии (ИКТ), Интернет вещей (IoT), дистанционное зондирование, географические информационные системы (ГИС), анализ больших данных и искусственный интеллект (ИИ).
ИКТ обеспечивают инфраструктуру и коммуникационные сети, необходимые для сбора, объединения, хранения и анализа данных с устройств IoT и дистанционного зондирования, благодаря чему фермеры могут получать доступ к цифровым платформам для точного земледелия и управления сельскохозяйственными культурами. Беспроводные устройства Интернета вещей, такие как датчики, собирают сельскохозяйственные данные, включая информацию о погодных условиях, влажности почвы и физиологических характеристиках растений. Кроме того, цифровые изображения, полученные с помощью БПЛА и спутников (дистанционное зондирование), позволяют фермерам вносить удобрения в зависимости от потребностей сельскохозяйственных культур на конкретной территории.
Анализ мандариновых деревьев: лучше больше или слаще?
Исследовательская группа разработала цифровых двойников для управления мандариновыми садами на открытых полях Чеджу: были отобраны случайным образом 30 мандариновых садов на Чеджу, собраны данные о погоде, методах ведения сельского хозяйства и качестве плодов в каждом саду. Данные о погоде были получены с помощью датчиков, установленных в каждом саду и способных регистрировать температуру, относительную влажность и атмосферное давление (среднее за день).
Данные о методах ведения сельского хозяйства были предоставлены фермерами, которые сообщали о типе метода, количестве обработок, дате, единицах измерения и названии агрохимического продукта. В каждом саду случайным образом были отобраны 100 мандариновых деревьев, и за этими деревьями неоднократно наблюдали с третьей недели октября по четвёртую неделю ноября 2021 года. Содержание сахара, размер плодов и расположение плодов (верхнее, среднее и нижнее) фиксировались в трёх экземплярах (по одному на каждый уровень расположения плодов) каждую неделю для каждого дерева.

С помощью модели цифрового двойника можно объяснить данные о качестве плодов в зависимости от конкретного места и времени. Размер каждой точки данных пропорционален предполагаемому среднему размеру плодов, а уровень содержания сахара обозначен цветом. Более темный цвет (коричневый) указывает на высокий уровень сахара. В конце ноября наблюдаемый уровень сахара был выше в садах, расположенных в южном регионе, чем в садах в северном регионе. Время и местоположение являются информативными факторами, влияющими на содержание сахара и размер плодов соответственно.
Монотонная взаимосвязь — это тип связи между двумя переменными, при котором можно указать только общее направление связи без использования каких-либо количественных характеристик. Немонотонная взаимосвязь — тип связи между двумя переменными, при котором присутствие (отсутствие) одной переменной систематически связано с присутствием (отсутствием) другой переменной, но неизвестно, приводит ли увеличение одной переменной к увеличению или уменьшению другой).
Объединенный набор данных показал, что содержание сахара имело монотонную взаимосвязь с некоторыми характеристиками почвами (содержание калия, магния, уровень рН и электропроводности) и переменными, связанными с погодой (температура и влажность). Содержание сахара в плодах имело немонотонную взаимосвязь с почвой, содержащей фосфат, кальций, органические вещества и атмосферным давлением воздуха. Высокое содержание кальция сильнее влияло на размер плодов, чем на содержание сахара. Это наблюдение позволяет предположить, что чрезмерное внесение удобрений с содержанием кальция может привести к появлению слишком крупных плодов.
Частота и время проведения сельскохозяйственных работ различались в зависимости от сада. В большинстве садов (27 из 30) велась запись и предоставлялась информация о сельскохозяйственных работах, включая обрезку, внесение удобрений, опрыскивание, мульчирование и прореживание. Хотя известно, что каждая сельскохозяйственная практика полезна, частота и время применения в разных садах различались.
Значительные различия в созревании и качестве плодов наблюдались между двумя садами, несмотря на то, что в них выращивался один и тот же сорт, что указывает на идентичный генотип. Эти различия могут быть обусловлены различными факторами окружающей среды, а также различиями в методах ведения сельского хозяйства и управления, о которых говорилось ранее. Аналогичным образом заметные различия в содержании сахара и размере плодов наблюдались в пределах одного сада несмотря на то, что выращивался один и тот же генотип. Эти различия в меньших масштабах, вероятно, обусловлены факторами микроокружения. Это наглядно демонстрирует важность сбора данных о микроклимате в саду.
В разных садах наблюдались разные тенденции в отношении содержания сахара и размера плодов. В большинстве садов со временем увеличивалось содержание сахара в плодах, в то время как размер плодов в разных садах изменялся по-разному. Мандарины собирали одновременно, начиная с третьей недели октября, что совпало с началом оценки качества плодов.
Что сказал двойник?
Модель цифрового двойника мандариновых садов со смешанными эффектами показала, что среднее содержание сахара в плодах продолжало увеличиваться со временем, в значительной степени не завися от продолжающегося сбора урожая, и постоянное увеличение среднего содержания сахара было статистически значимым. Модель показала, что средний размер плодов уменьшился после первой недели, но закономерность была не такой очевидной, как в случае со средним содержанием сахара.
Алгоритм автоматического машинного обучения (AutoML) лучше предсказывал размер плодов, чем содержание сахара, когда они анализировались с учётом времени наблюдения за плодами и переменных на уровне сада, включая методы ведения сельского хозяйства (удобрение, мульчирование, обрезка, опрыскивание и прореживание) и погодные переменные (температура, влажность, атмосферное давление). Выбранной моделью стала составная ансамблевая модель, которая показала среднеквадратичную ошибку (RMSE) = 0,97, среднюю абсолютную ошибку (MAE) = 0,76 и коэффициент детерминации (R2) = 0,43 для содержания сахара, а также RMSE = 3,73, MAE = 2,96 и R2 = 0,84 для размера плодов. Индекс плодового сада был признан наиболее важным предиктором, за ним следует давление воздуха как для содержания сахара, так и для размера плодов.
Значительная вариативность качества плодов наблюдалась в пределах одного сада. После выявления группы деревьев, дающих плоды с низким содержанием сахара, с помощью иерархического кластерного анализа к каждому выбранному дереву можно применить индивидуальные методы ведения сельского хозяйства для повышения содержания сахара. Деревья с низким содержанием сахара могут выиграть от специальных методов ведения сельского хозяйства, таких как выращивание под навесом, контроль полива, внекорневая подкормка, правильная обрезка и прореживание, которые повысят содержание сахара. Аналогичным образом, когда кластерный анализ выявляет деревья с очень мелкими плодами, можно применять такие методы ведения сельского хозяйства, как прореживание плодов или поздний сбор урожая.
Таким образом, кластерный анализ может стать ещё одним статистическим инструментом для точного земледелия, определяющим конкретные потребности отдельных деревьев для повышения содержания сахара и размера плодов.
Плодовые деревья занимают больше места, чем другие культуры, и состав почвы в пределах сада различается. На плодовое дерево напрямую влияет почва под ним, а не вся почва на поле. Кроме того, добиться равномерного распределения удобрений в пределах двухмерного пространства сада непросто, и ещё сложнее выявить различия в качестве плодов в зависимости от химического состава почвы на уровне региона или сада.
Если бы мы могли измерять химический состав почвы в определённых точках с помощью IoT-датчика, можно было бы вносить удобрения в соответствии с потребностями каждого компонента. Каждое дерево получало бы точное количество питательных веществ, необходимых для оптимального роста, а точечное внесение удобрений способствовало бы точному земледелию и точному сохранению природы за счёт минимизации нецелевого использования удобрений.
Цифровые двойники в сельском хозяйстве могут открыть новую эру индивидуального сельского хозяйства благодаря междисциплинарному сотрудничеству между исследователями в области сельского хозяйства, фермерами, статистиками, инженерами-программистами и другими специалистами.
Все коды и связанные с ними данные доступны в репозиториях Github (https://github.com/heoseong/Digital_twin) и Zenodo (https://zenodo.org/records/10531851, https://doi.org/10.5281/zenodo.10531851)53.