сверхбольшие архивы спутниковых данных и возможности их распределенного анализа

назад

Оценка эффективности мультисезонных моделей машинного обучения для оперативного распознавания озимых культур на больших территориях

Плотников Д.Е., Бойматов Ю.Ш., Елкина Е.С., Щербенко Е.В., Плотникова А.С.

// Современные проблемы дистанционного зондирования Земли из космоса, 2024. № Т. 21. № 5.. С.116-129.

ISSN 2070-7401 (Print), ISSN 2411-0280 (Online)

Оценивались возможности ансамблевых методов машинного обучения Random Forest и XGBoost (англ. eXtreme Gradient Boosting) для распознавания озимых культур на больших территориях при обучении на мультисезонных наборах данных за пять последовательных лет. В рамках исследования были проведены два эксперимента: по сравнению эффективности мультисезонных моделей указанных архитектур и по сравнению мультисезонной модели и серии односезонных моделей оптимальной архитектуры. Оценка результатов экспериментов проводилась для региона исследования, охватывающего более 94 % посевных площадей озимых Российской Федерации, на основе сравнения с данными Росстата и опорными картами, полученными методом экспансии обучающей выборки, с использованием метрики RMSE (англ. root mean squared error) и коэффициента детерминации R 2, а также метрики F-score по классу «озимые». В первом эксперименте была продемонстрирована перспективность мультисезонных моделей, причём мультисезонная модель Random Forest показала себя эффективнее и стабильнее, чем XGBoost, улучшение RMSE по сравнению с опорными картами составило в среднем 28 тыс. га и наблюдалось для любого из пяти сезонов; относительное улучшение составило 15 % в среднем, достигая 35 %. Результаты второго эксперимента по сравнению пяти сезонных моделей и мультисезонной модели Random Forest также указали на эффективность мультисезонной модели: суммарное за пять сезонов значение RMSE мультисезонной модели в 1,32–2,02 раз меньше, чем для односезонных моделей, а среднее значение F-score для любой односезонной модели находится в диапазоне 0,75–0,79, в то время как для мультисезонной модели достигает значения 0,84.

Ссылка на текст: http://d33.infospace.ru/jr_d33/2024v21n5/116-129.pdf
  • Институт космических исследований РАН, Москва
  • Московский физико-технический институт, Долгопрудный, Московская обл.
  • ООО «ИКИЗ», Москва
  • Центр по проблемам экологии и продуктивности лесов РАН, Москва
назад