NewTechAudit Nov 12 2021 at 10:08

Сегментация изображений со спутника с помощью сверточной нейронной сети

5 min

6.2K

Python * Programming * Machine learning *

Comments 10

Mihahanya Nov 12 2021 at 10:59

В статье не хватает примеров тренировочных данных (входных, выходных), выводов нейронной сети.

Из данного кода не особо понятна архитектура сети. В чем преимущество U-Net моделей?

print(model.summary()) # выводится это так

Нету графиков процесса обучения. Вдруг предоставленный вывод вообще является результатом переобученной сети.

Подача информации не особо структуризирована и не подкреплена фактами. Создается впечатление, что автор писал статью впопыхах.

Хотелось бы чтобы автор доработал статью, ведь тема то интересная.

NewTechAudit Nov 23 2021 at 11:23

U-Net используется во многих конкурсах по сегментации изображений, ввиду чего для обучения была выбрана именно она. Преимущество в том, что в данной модели можно использовать небольшой набор данных и получить хороший результат. Также U-Net быстро обучается. U-Net сжимает исходную картинку, а далее пытается восстановить из него маску.

count_enable Nov 12 2021 at 13:23

То есть выбираем патч рандомным образом и формируем для него маску. На данном патче будет тренироваться модель.

Нет, модель не будет тренироваться на одном "патче". Нужен целый набор данных, который генерируется из исходного, в т.ч. путём случайной обрезки.

Сверточная нейронная сеть состоит из четырех шагов: Convolution, Max Pooling, Flattening и Full Connection

В литературе эти "шаги" называют типами слоёв и их нужно много.

Также был использован ReLu Layer, который избавил feature map от отрицательных значений и превратил их в нули.

С каждым новым сентенсом русские слова сначала заменяются англицизмами, а потом и чистым английским. В previous предложении feature maps ещё быль фильтрами.

В итоге выявилось, что наилучшая модель наблюдается с BatchNormalization – методом, повышающим производительность обучения

Очень неожиданный вывод, учитывая что BatchNorm стала де-факто стандартным методом уже лет пять как.

Автор так спешил поделиться кодом, что забыл даже сообщить какой фрейворк используется. Или мы просто открываем питоновскую консоль и начинаем туда писать?

NewTechAudit Nov 23 2021 at 11:23

Открываем Anaconda или PyCharm, и начинаем писать код

count_enable Nov 23 2021 at 12:01

И даже не надо import keras, tf ?

mattroskin Nov 12 2021 at 16:12

Спасибо, интересно было бы узнать, как вы делали разметку обучающих данных. Или использовался какой-то готовый датасет?

NewTechAudit Nov 23 2021 at 11:23

Использовался готовый датасет с масками объектов

x2v0 Nov 13 2021 at 11:26

Чем этот метод лучше обычной edge detection?

Применим ли этот метод для сегментации внутренних органов человека? Скажем, кровеносных сосудов.

NewTechAudit Nov 23 2021 at 11:36

Да, данный метод применим для сегментации внутренних органов человека. Например в конкурсе на Kaggle “Data Science Bowl 2018” решалась медицинская задача – идентификация клеточных ядер с целью анализа реакции клеток на различные обработки. Исходные данные состоят из картинок сегментированных ядер.

NewTechAudit Nov 23 2021 at 11:24

Edge detection используется с помощью встроенной библиотеки OpenCV, где можно использовать разные методы распознавания границ объектов. Однако U-Net сможет распознать более зашумленные изображения или более мелкие, благодаря своей архитерктуре.