
«`html
Мониторинг здоровья почвы с помощью машинного обучения на основе микробиома:
Мониторинг здоровья почвы критичен для поддержания экологической и коммерческой ценности агроэкосистем, требуя оценки биологических, химических и физических свойств почвы. Традиционные методы мониторинга этих свойств могут быть дорогими и непрактичными для регулярного анализа. Однако микробиом почвы предлагает богатый источник информации, который можно анализировать с высокой степенью эффективности с использованием методов секвенирования высокого пропускания. Данное исследование исследует потенциал моделей машинного обучения (ML), в частности, случайного леса (RF) и метода опорных векторов (SVM), для прогнозирования 12 ключевых показателей здоровья почвы, включая статус вспашки и текстуру почвы, с использованием данных ампликонов гена 16S рРНК. Модели продемонстрировали высокие прогностические возможности, достигая значения Kappa около 0,65 для категориальных оценок и значения R² около 0,8 для числовых прогнозов, особенно выделяясь в прогнозировании биологических показателей здоровья почвы перед химическими и физическими.
Методы:
Было проведено всестороннее оценивание здоровья почвы с использованием 949 образцов почвы из различных фермерских угодий по всей США и Канаде в соответствии с рекомендациями протокола CASH (Comprehensive Assessment of Soil Health). Для сохранения целостности композиции микробиома образцы были однородно смешаны, обсушены и проанализированы в течение двух месяцев в Лаборатории здоровья почвы Корнеллского университета. Каждый образец прошел тщательный анализ 12 ключевых биологических, химических и физических показателей здоровья почвы, которые впоследствии нормализованы и категоризированы для практического управления. Общая ДНК была извлечена с использованием набора DNeasy PowerSoil, а затем произведено количественное определение. Бактериальные сообщества были профилированы путем секвенирования региона V4 гена 16S рРНК. Данные секвенирования были обработаны с помощью QIIME2, с использованием DADA2 для назначения вариантов последовательностей ампликонов (ASV) и таксономии, а также были использованы методы, такие как рарификация, пропорциональность, нормализация CSS и фильтрация разреженности для создания пяти различных типов наборов данных для подготовки данных для дальнейшего анализа.
Анализ применения машинного обучения на основе микробиома для прогнозирования здоровья почвы:
Континентальный опрос аграрных земель Северной Америки позволил оценить прогностическую точность моделей машинного обучения с использованием данных микробиома почвы. SVM выделялся в классификации здоровья почвы, в то время как RF показал более высокую эффективность в задачах регрессии. Нормализация глубины чтения и таксономическое разрешение значительно влияли на точность модели. Самыми прогностическими характеристиками оказались конкретные ASV, связанные с показателями здоровья, такими как активный углерод. Кросс-валидация с независимыми наборами данных подтвердила устойчивость моделей, особенно в прогнозировании биологических показателей. Микробиомы почвы показали значительное географическое разнообразие, при этом химические свойства являются основным фактором различий в составе сообщества.
Потенциал и вызовы моделей машинного обучения на основе микробиома для прогнозирования здоровья почвы:
Данное исследование подчеркивает потенциал использования моделей машинного обучения на основе микробиома для прогнозирования показателей здоровья почвы. Опрос по микробиомам почвы гена 16S рРНК показал, что, хотя эти модели могут эффективно прогнозировать биологические показатели здоровья, их точность в отношении химических и физических показателей ниже. Модели столкнулись с проблемами из-за ограниченного диапазона значений pH почвы и недостаточной представленности экстремальных условий здоровья почвы в наборе данных. Улучшение точности этих моделей потребует лучшего представления разнообразных состояний здоровья почвы, особенно в экстремальных случаях, и преодоление трудностей в обработке почв с низкими показателями здоровья, которые склонны к более филогенетически разнообразным.
Не смотря на эти вызовы, исследование делает вывод, что модели машинного обучения на основе микробиома показывают перспективы в дополнении или потенциальной замене традиционных оценок здоровья почвы, особенно в биологических показателях. Полученные результаты указывают на то, что с увеличением доступных данных, особенно региональных или управленческих, точность этих моделей улучшится. Исследование также подчеркивает необходимость разработки методов с высокой производительностью для сбора данных микробиома, особенно для почв с низкими выходами ДНК. В то время как модели L2-линейных SVM показали лучшую эффективность по сравнению с RF в задачах классификации, модели RF выделялись в задачах регрессии, что указывает на отсутствие четкого предпочтения к конкретному алгоритму ML для прогнозирования здоровья почвы. Будущие исследования и применение подходов машинного обучения на основе микробиома в рамках здоровья почвы могут улучшить цифровое земледелие и обеспечить комплексную оценку здоровья почвы.
Источник изображения:
(image source)
«`