Search
Write a publication
Pull to refresh

Comments 10

В статье не хватает примеров тренировочных данных (входных, выходных), выводов нейронной сети.

Из данного кода не особо понятна архитектура сети. В чем преимущество U-Net моделей?

print(model.summary()) # выводится это так

Нету графиков процесса обучения. Вдруг предоставленный вывод вообще является результатом переобученной сети.

Подача информации не особо структуризирована и не подкреплена фактами. Создается впечатление, что автор писал статью впопыхах.

Хотелось бы чтобы автор доработал статью, ведь тема то интересная.

U-Net используется во многих конкурсах по сегментации изображений, ввиду чего для обучения была выбрана именно она. Преимущество в том, что в данной модели можно использовать небольшой набор данных и получить хороший результат. Также U-Net быстро обучается. U-Net сжимает исходную картинку, а далее пытается восстановить из него маску.

То есть выбираем патч рандомным образом и формируем для него маску. На данном патче будет тренироваться модель.

Нет, модель не будет тренироваться на одном "патче". Нужен целый набор данных, который генерируется из исходного, в т.ч. путём случайной обрезки.

Сверточная нейронная сеть состоит из четырех шагов: Convolution, Max Pooling, Flattening и Full Connection

В литературе эти "шаги" называют типами слоёв и их нужно много.

Также был использован ReLu Layer, который избавил feature map от отрицательных значений и превратил их в нули.

С каждым новым сентенсом русские слова сначала заменяются англицизмами, а потом и чистым английским. В previous предложении feature maps ещё быль фильтрами.

В итоге выявилось, что наилучшая модель наблюдается с BatchNormalization – методом, повышающим производительность обучения

Очень неожиданный вывод, учитывая что BatchNorm стала де-факто стандартным методом уже лет пять как.

Автор так спешил поделиться кодом, что забыл даже сообщить какой фрейворк используется. Или мы просто открываем питоновскую консоль и начинаем туда писать?

Открываем Anaconda или PyCharm, и начинаем писать код

Спасибо, интересно было бы узнать, как вы делали разметку обучающих данных. Или использовался какой-то готовый датасет?

Использовался готовый датасет с масками объектов

Чем этот метод лучше обычной edge detection?

Применим ли этот метод для сегментации внутренних органов человека? Скажем, кровеносных сосудов.

Да, данный метод применим для сегментации внутренних органов человека. Например в конкурсе на Kaggle “Data Science Bowl 2018” решалась медицинская задача – идентификация клеточных ядер с целью анализа реакции клеток на различные обработки. Исходные данные состоят из картинок сегментированных ядер.

Edge detection используется с помощью встроенной библиотеки OpenCV, где можно использовать разные методы распознавания границ объектов. Однако U-Net сможет распознать более зашумленные изображения или более мелкие, благодаря своей архитерктуре.

Sign up to leave a comment.

Articles