Сравнительный анализ методов машинного обучения при картографировании массивов открытых песков по спутниковым данным
Полтарин В.С., Шинкаренко С.С.
// Материалы 22-й Международной конференции «Современные проблемы дистанционного зондирования Земли из космоса». Москва: ИКИ РАН, 2024. С.201.
978-5-00015-067-2
Проблема деградации аридных пастбищ России интенсифицировалась после периода относительно устойчивого функционирования после 2018-2019 гг. в большинстве регионов юга европейской России . Картографирование подвижных песчаных массивов по данным дистанционного зондирования позволяет своевременно выявить наиболее подверженные интенсивным дефляционным процессам участки, что дает возможность разработать мероприятия по их стабилизации. В докладе рассматривается сравнительная характеристика ансамблевых методов машинного обучения для задач бинарной классификации открытых песков и дефлированных территорий в аридных пастбищных ландшафтах на основе обучающей выборки, полученной с помощью масок максимальных и минимальных значений площади открытых песков за весь рассматриваемый год по ежемесячным данным Sentinel-2. Приведены основные шаги для получения качественной классификации с помощью библиотеки scikit-learn для python, различные метрики точности, а также временные затраты на обучение ансамблевых моделей. Выявлено, что при сопоставимом уровне точности при использовании различных методов, основными критериями для выбора модели является минимальное число необходимых гиперпараметров, а также время, затраченное на обучение. Схожие с открытыми песками по спектрально-отражательным свойства солончаки были предварительно картографированы. Автоматизированное дешифрирование для задач обнаружения открытых песков и дефлированных территорий по спутниковым данным ансамблевыми методами машинного обучения имеет высокую точность, автономность выполнения, а также универсальность в использовании модели на протяжении года даже с учетом фенологических изменений. Границы полигонов, полученные в результате расчета моделей, хорошо согласуются с уже имеющимися данными, однако по подсчетам площадей было выявлено, что модели машинного обучения способны идентифицировать те пиксели, которые классические методы были не способны найти. Выявлено, что при корректном подборе гиперпараметров, точность итоговой модели составляет около 99%, а время, затраченное на работу, различается весьма заметно. Таким образом, наиболее быстрые результаты дали модели HistogramGradientBoosting и XGBoost, но при сравнении этих моделей в контексте точности, метод HistogramGradientBoosting проигрывает.
Ссылка на текст:
http://conf.rse.geosmis.ru/files/books/2024/10660.htm
- Институт космических исследований РАН, Москва