2.2.24. Кластеризация изображений¶
Выполняет автоматическую кластеризацию изображения (например, спутникового снимка) на заданное число классов. Используется алгоритм K-Means.
Можно настроить:
Количество кластеров
Метод инициализации K-Means. Может быть „k-means++“ или „random“. Оставьте пустым, чтобы использовать значение по умолчанию (k-means++).
K-means++ выбирает центроиды таким образом, чтобы максимизировать расстояние между ними. Это помогает улучшить качество кластеризации и ускоряет сходимость алгоритма.
Максимальное количество итераций алгоритма k-means за один прогон. Оставьте пустым, чтобы использовать значение по умолчанию (300).
Количество итераций, необходимых для сходимости алгоритма K-means, зависит от различных факторов, таких как начальное состояние центроидов, распределение данных и количество кластеров. Обычно необходимо от нескольких десятков до нескольких сотен итераций.
Используемый алгоритм K-means. Может быть одним из „lloyd“, „elkan“. Оставьте пустым, чтобы использовать значение по умолчанию (lloyd).
Lloyd — это классический вариант K-Means, который хорошо работает для сферических кластеров с одинаковой плотностью, но может давать плохие результаты для других форм или размеров кластеров. Elkan — более быстрый вариант классического K-Means, что может быть эффективнее на некоторых наборах данных с хорошо определёнными кластерами, однако требуется больше памяти.
На входе:
Растр в GDAL-совместимом формате (предпочтительно GeoTIFF). Может содержать любое количество каналов, все они будут использованы для расчёта кластеров. Каждый канал будет использован как признак для кластеризации. Еслив каналов три, то в трехмерном пространстве, если один - то в одномерном и т.п.
На выходе:
Кластеризованый растр.
Посмотреть видео на youtube, rutube.
Запуск инструмента: https://toolbox.nextgis.com/operation/image_clustering
Попробуйте инструмент в действии, скачав наш пример:
Набор исходных данных для проверки работы инструмента. Внутри архива пошаговая инструкция.
Пример результата работы инструмента.