9.10. MOLUSCE 5.0¶

MOLUSCE, акроним от Modules for Land Use Change Simulations, представляет собой расширение (plug-in) для геоинформационной системы QGIS, предназначенное для анализа динамики состояния территорий двух временных срезов и прогноза развития территорий. В работе модуля могут задействоваться несколько алгоритмов, в том числе на основе нейросетей.

Расширение доступно для установки из менеджера плагинов QGIS. После установки появляется в меню «Растр».

9.10.1. Подготовка исходных данных¶

В качестве входных данных расширению требутся:

Карты начальных и конечных состояний территории. Это растровые изображения, в пикселях которых закодированы номера состояний территории (например, 1=лес, 2=поле, 3=городская застройка и т.п.).

Минимум:

карта исходного состояния (Начальная_дата),
карта конечного состояния (Начальная_дата+N).
карта для валидации (Начальная_дата + 2N). Для оценки качества построенной модели прогноза рекомендуется использование еще третьей карты, с которой будет сравниваться прогнозное значение.

N - глубина прогноза, которая измеряется в зависимости от задачи в днях, неделях, месяцах, годах и т.д.

Карты факторов, влияющих на изменение территории. Исследователь строит гипотезы о том, какие факторы могли повлиять на наблюдаемые изменения, и предоставляет расширению карты интенсивностей данных факторов. Например, если исследователь работает над проблемой изчезновения лесов, такими факторами могут быть: карта почв (каждый тип почвы закодирован своим числом), карта расстояний от дорог (пиксели карты содержат число – кратчайшее расстояние от точки, связанной с данным пикселем, до дороги), карта плотности населения и т.п.

Если есть данные об изменении этих факторов, можно добавить в проект две версии каждого слоя, отражающие состояние факторов в разный период: для обучения модели и для симуляции.

У всех входных растров должны совпадать:

разрешение
охват
размер в пикселях

Рекомендуем создать для растров таблицу атрибутов из текущей символики. Это даст возможность видеть название классов при идентификации пикселей. Также рекомендуем в настройках стиля выбрать «Палитра - уникальные значения», когда каждый класс будет отмечен на карте соответствующим цветом.

9.10.2. Загрузка данных и обучение модели¶

Интерфейс модуля содержит несколько вкладок, которые используются последовательно.

Входные данные¶

Слева списком представлены все растровые слои. Из них нужно выбрать растр начальных состояний и растр конечных состояний. Ниже задать пространственные переменные. Затем нажмите Проверить совпадение пространственных характеристик. После успешной проверки станут доступными остальные вкладки.

Рис. 9.32. Загрузка выходных данных¶

Корреляции¶

В этой вкладке можно при необходимости рассчитать насколько исследуемые факторы влияния связаны между собой. Если корреляция между двумя факторами высокая, может быть достаточно использовать один из них. Для непрерывных величин пользователь может рассчитать коэффициент корреляции, а для номинальных – коэффициент Крамера или коэффициент JIU (joint information uncertainty).

Выберите два фактора в выпадающих меню или отметьте «Рассчитать для всех растров».

../../_images/molusce_correlation_ru.png

Рис. 9.33. Расчет корреляции¶

Изменение территорий¶

На вкладке «Изменение территорий» нажмите Обновить таблицы.

Будет создано несколько таблиц: «Статистика по классам», «Матрица переходов» (показывает, из каких классов в какие были трансформации и сколько). Эта информация уже быть использована сама по себе для решения ряда задач.

Далее нажмите Создать карту изменений и задайте путь и имя для создаваемого растра. Каждый тип изменения на карте будет помечен определенным цветом. Рекомендуется для этого слоя также создать таблицу атрибутов растра.

../../_images/molusce_area_change_ru.png

Рис. 9.34. Таблицы изменений¶

Полученные таблицы можно сохранить отдельно. Вызовите контекстное меню с любой ячейки таблицы и скопируйте выделенные ячейки или таблицу целиком с заголовками строк и столбцов.

Рис. 9.35. Копирование таблицы¶

Моделирование: Обучение модели для предсказания будущих изменений¶

Доступны четыре типа модели:

Нейронные сети (многослойный перцептрон) - используется чаще всего
Значимость признака
Многокритериальная оценка
Логистическая регрессия

Рис. 9.36. Обучение модели¶

Далее настраивается выборка, которая будет использоваться для обучения модели.

Тип выборки:

полная - все доступные данные, занимает много времени;
случайная - используется чаще всего, работает гораздо быстрее, но может не включать примеры каких-то типов переходов;
стратифицированная - стремится равномерно охватить все сценарии перехода.

Также можно настроить количество примеров, входящих в выборку, это влияет как на точность модели, так и на скорость обучения.

Параметры обучения модели:

Количество соседних пикселей, которые учитываются при анализе (обычно используется значение 1 или 0)
Коэффициент скорости обучения (чем меньше значение, тем модель осторожнее)
Максимальное количество итераций - количество циклов обучения. Слишком высокое значение может привести к переобучению модели.
Количество скрытых слоёв - уровень сложности модели.

Нажмите Обучить нейросеть. На графике будут отображаться кривая обучения и кривая ошибок. Если в процессе видно, что обучение идёт плохо, можно нажать Остановить и изменить параметры.

При успешном обучении обе кривые плавно идут вниз и параметр «Текущая каппа-статистика» составляет около 0,8 и более.

Рис. 9.37. Типичный вид кривых обучения¶

После обучения модели можно сохранить выборку примеров как отдельный слой. Это позволяет проверить, все ли виды переходов были учтены при обучении модели.

Обученную модель также можно сохранить в файл и затем загрузить и использовать снова, даже после закрытия программы.

При загрузке модели будет проведена проверка совместимости. Модель можно использовать только для растров с теми же характеристиками и при том же порядке факторов.

../../_images/molusce_model_loaded_ru.png

Рис. 9.38. Модель загружена из файла¶

9.10.3. Симуляция состояния территории на заданное время вперёд¶

После обучения можно применить модель для построения прогноза.

На вкладке «Симуляция» необходимо задать количество итераций симуляции, т.е. количество периодов, на которые строится прогноз (по умолчанию это значение равно 1) и путь для создаваемых файлов.

Для симуляции можно учесть изменившиеся пространственные факторы. Растровые слои со значениями пемеренных для периода симуляции должны быть добавлены в проект.

Отметьте пункт «Использовать отдельную версию пространственных переменных для симуляции» и выберите из списка слоёв нужные в том же порядке, что на вкладке «Входные данные», только вместо слоя, использовавшегося при обучении модели, добавьте его новый вариант. Чтобы убедиться, что порядок и размерные характеристики слоёв совпадают, нажмите Проверить консистентность.

Для запуска симуляции нажмите Пуск.

../../_images/molusce_simulation_ru_2.png

Рис. 9.39. Настройки симуляции, стрелочкой показан фактор, актуальный для периода симуляции¶

Помимо собственно результата симуляции также можно сгенерировать:

Карту потенциальных переходов (для каждого из переходов создается растр со значениями от 0 до 100%, показывающими степень вероятности такого перехода в указанный период)
Карту уверенности в прогнозе (значения от 0 до 100%, где 0 - низкая уверенность, скорее всего это переходы, которые не попали в выборку для обучения модели)

9.10.4. Валидация результатов¶

Валидацию можно провести, если есть карта истинных значений для периода, на который был построен прогноз. Также на этой вкладке можно расчитать каппа-статистику.

При валидации можно создать карту ошибок. Она содержит три типа пикселей:

Постоянный (класс пикселя не изменился за всю его жизнь, и прогноз это предсказал)
Пустой (правильные предсказания модели)
Ошибка (прогноз не совпал с истинным значением)

Посмотрите запись нашего вебинара о работе плагина на youtube, rutube.