Надпись: Методы и подходы

Тематическая обработка и анализ спутниковых данных для задач картографирования лесных и других наземных экосистем

В рамках задачи опробована методика тематической обработки, сочетающая объектно-ориентированный подход при анализе спутниковых изображений с алгоритмом классификации на основе ансамбля решающих деревьев.

Процесс тематической обработки композитного изображения Landsat состоял из следующих основных шагов:

1) Сегментация спутникового изображения. Сегментация осуществлялась алгоритмом Full Lambda Schedule (Redding et al., 1999, Crisp et al., 2003). Был определен средний размер сегмента (масштаб). Оптимальное значение оценивалось на основе анализа изменений средней локальной вариации изображения при разных уровнях детальности сегментации (Drǎgut et al., 2010, Ming et al., 2015).

2) Формирование обучающей выборки. Обучающая выборка формировалась из полученных в результате сегментации однородных участков изображения площадью не менее 2 га на основе регулярной сети с шагом 6 км. Всего было выбрано 1336 эталонных сегментов (ЭС), распределенных на 11 тематических классов карты. Принадлежность сегментов к тому или иному тематическому классу определялась на основе визуальной интерпретации изображения Landsat и открытых материалов спутниковой съемки сверхвысокого разрешения DigitalGlobe.

3) Тематическая классификация изображения. Классификация осуществлялась алгоритмом «случайных лесов», или Random Forest (Breiman, 2001) на уровне сегментов спутникового изображения (по средним значениям индексов и спектральных яркостей в каналах). Использовался ансамбль из 1000 деревьев, число случайных признаков (т.е. слоев изображения), одновременно выбираемых для классификации, равнялось трем. Классификация проходила в три этапа. На первом этапе исходное изображение классифицировалось на три основных класса – леса, непокрытые лесом земли и водные объекты. Далее классы «лес» и «непокрытые лесом земли» классифицировались независимо друг от друга на шесть и четыре класса соответственно. На завершающем этапе все 11 классов объединялись вместе, и к ним добавлялся класс «Урбанизированные территории», выделенный на основе векторной маски дорог и поселений по данным проекта OpenStreetMap (http://gis-lab.info/qa/osmshp.html).

Подготовка спутниковых данных для выявления долгосрочных изменений лесов

На этапе предварительной обработки выполнялось маскирование облачности («обнуление значений») с помощью ранее разработанных алгоритмов (Белова, Ершов, 2011; Гаврилюк, Ершов, 2012). Затем выполнялось формирование многослойных изображений для следующих трех спектральных каналов: красного (0,63-0,69 мкм), ближнего инфракрасного (0,76-0,90 мкм) и среднего инфракрасного (1,55-1,75 мкм) каналов (http://landsat.gsfc.nasa.gov/). Каждое изображение содержало 200 слоев спутниковых наблюдений модельной территории за период с 1984 по 2016 годы. С помощью статистического алгоритма «простого скользящего среднего» SMA (Грешилов и др., 1997) в окне размером [1х15] (сглаживающий интервал) пикселей проводилась обработка 200 слоев каждого пиксела изображения с целью заполнения пропусков в измерениях спектральных яркостей из-за облачного покрова. Алгоритм использует семь значений справа и семь значений слева от центрального пиксела в сглаживающем интервале для процедуры осреднения.

 

Общий вид функции представлен ниже:

, где         

SMARcпростое скользящее среднее значение в точке Rc; n размер сглаживаемого интервала (окна); mколичество измерений от центрального пиксела, включая сам центральный пиксел (в нашем случае m=8); iномер значения в сглаживаемом интервале; cномер пиксела во временном ряду, для которого производится расчет среднего; Rяркость спектрального канала.

 

Из анализа исключаются нулевые значения яркостей. Также для первых и последних семи слоев анализ не производится. В результате применения данной процедуры по каждому спектральному каналу создан новый многослойный продукт из 186 слоев. На завершающей стадии подготовки спутниковых изображений выполнялась процедура осреднения  значений спектральных яркостей внутри каждого года. В результате из 200 слоев осталось 28, соответствующих году в порядке возрастания от 1985 по 2015 год. Двух этапное осреднение было вызвано тем, что в каждом годе имеется разное количество спутниковых данных, что не всегда могло обеспечить возможность построения непрерывной функции в течение всего периода наблюдения. Как отмечалось выше в тексте, во временной ряд не удалось включить данные съемки LANDSAT 1991, 1997 и 1999 годов на территорию национального парка «Смоленское Поозерье» из-за отсутствия таковых в архивах USGS. Из полученных средних многослойных изображений трех спектральных каналов были сформированы временные ряды вегетационных индексов: (1) нормализованный разностный вегетационный индекс (NDVI) (Tucker, 1977), (2) коротковолновый вегетационный индекс (SWVI) (Fraser et al., 2000) и вегетационный индекс стареющей растительности из красного и среднего ИК каналов (NDSVI) (Marsett et al.,2006).

Классификация стадий восстановительных сукцессий лесов

Предварительно мы провели анализ точности три алгоритма классификации растительности по спутниковым данным. Для анализа был выбран безоблачная сцена Landsat-8, полученная 18 июня 2016 года. Для проведения эксперимента классификации изображение было предварительно обработано методом (Белова, Ершов, 2011). Для классификации визуально с помощью геопортала «Планета земля», данных наземных обследований была подготовлена обучающая выборка, содержащая участки поверхности, относящиеся к четырем классам восстановительных сукцессий: 1 – открытая почва, 2 – луговая растительность, 3 – лиственный лес, 4 – хвойный лес.

С применением обучающей выборки проведена классификация спутникового изображения тремя различными алгоритмами: «случайный лес» (Breiman, 2001), «максимального правдоподобия» (ERDAS Field Guide, Fifth Edition, 1999), локально-адаптивной классификации методом минимального расстояния «ЛАСКА» (Ершов и др., 2015). В результате работы алгоритмов получены картографические продукты современных стадий восстановительных сукцессий нелесных и непокрытых лесом территорий.

Для оценки достоверности полученных продуктов сформирована случайная сеть из 249 контрольных точек, в которых проведена визуальная проверка соответствия выявленного класса, определенной по данным Landsat-8 и детальных снимков геопортала «Планета земля».

Наилучший алгоритм, выбранный по результатам тестирования затем используется для классификации видов восстановительных сукцессий на спутниковых изображениях 1990, 2000, 2010 и 2015 годов.

Результаты применения вышеописанных методов анализа спутниковых изображений приводятся в разделе РЕЗУЛЬТАТЫ.

Иллюстрация с сайта
http://www.stihi.ru/2016/11/10/7580