VolinNilov 26 окт 2022 в 16:00

#3 Нейронные сети для начинающих. Работа с изображениями в OpenCV. Алгоритм Canny Edge Detector

11 мин

20K

Блог компании RUVDS.comBig Data*Python*Алгоритмы*Машинное обучение*

Туториал

Технотекст 2022

+35

Комментарии 30

fk0 26 окт 2022 в 16:09

Преобразование изображения в оттенки серого.
Уменьшение размерности изображения (в пикселях) в 4 раза.

По меньшей мере больше половины алгоритмов реализуются классическими способами и нейронные сети для этого совершенно не нужны.

И, насколько я понимаю, OpenCV хотя и может, но соврешенно не значит что использует вообще нейронные сети для значительной части функций.

И да, третий алгоритм наверняка реализуется без нейронных сетей.

VolinNilov 26 окт 2022 в 19:09

Здравствуйте, да, Вы правы, часть алгоритмов и в частности часть функций в OpenCV выполняется без применения нейронных сетей, но концепция данной серии статей именно в применении нейросетевого подхода к решению задачи, поэтому в этой и предыдущих статьях я стараюсь осветить именно нейросетевой подход к решению

masai 26 окт 2022 в 20:32

поэтому в этой и предыдущих статьях я стараюсь осветить именно нейросетевой подход к решению

Но в этой статье же нет нейронных сетей.

VolinNilov 26 окт 2022 в 20:38

Алгоритм Canny Edge Detector можно отнести к группе алгоритмов машинного обучения и машинного зрения в частности

masai 26 окт 2022 в 20:51

Это действительно алгоритм компьютерного зрения, но он точно не относится к машинному обучению. Разве что его можно использовать для предобработки данных или как элемент какой-то модели.

Но речь не об этом. Я лишь хотел сказать, что нейронных сетей в этой конкретной статье нет.

dimnsk 27 окт 2022 в 09:20

а что такое нейросетевой подход?

VolinNilov 27 окт 2022 в 09:31

Нейросетевой подход в моём понимании это подход к решению задачи с применением нейронных сетей

masai 26 окт 2022 в 20:30

Всё так. В этой статье нейронных сетей нет.

VolinNilov 26 окт 2022 в 20:36

Здравствуйте, позвольте не согласиться с Вашим высказыванием, алгоритм Canny Edge Detector является одним из алгоритмов машинного обучения и машинного зрения в частности, так что я не совсем согласен с Вами. К тому же в названии статьи чётко указано, что здесь речь идёт об аспектах обработки изображения в OpenCV, а так же про сам алгоритм Canny Edge Detector. Данная статья входит в цикл статей про нейронные сети и даже если Вы не усмотрели здесь нейросетевого подтекст, то хочу Вас заверить, что в таком случае данный материал можно квалифицировать как теоретическую основу для изучения и базового погружения в мир нейронных сетей

masai 26 окт 2022 в 20:57

Это ваш цикл статей, так что вы выбираете темы, никаких проблем. В подобном цикле вполне могут быть статьи про предобработку изображений. Не обязательно в каждой статье цикла именно нейронную сеть обучать.

Единственное, что я хотел сказать, это то, что в этой конкретной статье нет ни нейронных сетей, ни машинного обучения. Детектор границ Кэнни — это не машинное обучение. В противном случае, что именно в нём обучается или что он обучает?

VolinNilov 26 окт 2022 в 21:10

Да Вы правы, конкретно алгоритм под собой не имеет нейросетей, он применяется при решении некоторых задач для машинного зрения

panteleymonov 26 окт 2022 в 16:18

От простой разницы между компонентами цвета до вейвлет фильтра можно вычислять контуры с разной степенью качества, детализации и отсеивания шумов. Причем тут нейронные сети?

Давайте теперь ДКТ называть нейронной сетью.

VolinNilov 26 окт 2022 в 19:11

Здравствуйте, что конкретно Вы понимаете под ДКТ?

Также хотелось бы сказать, что действительно к данным задачам существует несколько подходов, я лишь стараюсь осветить подход с точки зрения нейронных сетей, не отрицая, что задачу можно решить и другими методами

masai 26 окт 2022 в 20:33

Здравствуйте, что конкретно Вы понимаете под ДКТ?

Очевидно, имеется в виду DCT, то есть дискретное косинус-преобразование.

VolinNilov 26 окт 2022 в 20:40

Конечно же DCT нельзя назвать нейронной сетью, здесь я с Вами полностью согласен, но это математический модуль, который как и алгоритм Canny Edge Detector применяется в нейронных сетях

masai 26 окт 2022 в 21:02

алгоритм Canny Edge Detector применяется в нейронных сетях

Как часть нейронной сети именно детектор Кэнни я, кстати, не припомню. Хотя, скажем, есть много работ, когда использовали фильтры Габора.

Кроме как на входе этот детектор особо поставить больше некуда (впрочем, модели бывают разные, может кто-то и приспособил для обработки feature maps, хотя я большого смысла в этом не вижу), так что я б отнёс его скорее к методам преобработки данных.

VolinNilov 26 окт 2022 в 21:18

Согласен с Вами, но как Вы уже заметили, этот алгоритм можно использовать не только в качестве предобработки, хотя согласен, что он основное его применение как раз таки в этом. В статье я приложил ссылки на научные статьи по этой теме, дублирую их здесь (по ссылкам pdf документы для скачивания, один из них автоматом качается, так что не пугайтесь; прикладываю статьи для общего понимания основных направлений применения этого алгоритма):

https://osf.io/yrmk5/download
https://www.sciencedirect.com/science/article/pii/S2212017312004136?ref=pdf_download&fr=RR-2&rr=760529f4dc529d69

Спасибо за дискуссию)

masai 27 окт 2022 в 23:23

Увы, эти статьи не про применение детектора. В первой описывается реализация на ПЛИС, а во второй модификация детектора.

В принципе, можно и не для предобработки применять. Есть дифференцируемые реализации детектора. Можно ставить его на выходе сети как промежуточное звено между моделью и функцией потерь. Но, как я уже писал, это экзотика. Может, я такое и встречал, но сходу вспомнить не могу.

VolinNilov 27 окт 2022 в 23:51

Да, Вы правы, спасибо за замечание

panteleymonov 27 окт 2022 в 21:10

Конечно же DCT нельзя назвать нейронной сетью

Условно можно, и я привел ее пример именно из-за параллелей. Поскольку нейронная сеть после обучения становится своеобразным фильтром подобным в том числе DCT. Но дискретное косинусное преобразование получено иным путем и не имеет излишек или нехватки узлов (и много чего еще "ненужного"), также как и методы описываемые в вашей статье. Нейронная сеть это все-таки что-то более обобщенное и гибкое.

Я думаю ваша вводная часть должна раскрыть то, что данная статья посвящена вспомогательной математике.

VolinNilov 27 окт 2022 в 23:27

Спасибо за замечание, учту в дальнейших работах)

iShrimp 26 окт 2022 в 20:07

Если уж зашла речь про преобразование цветовых пространств, то нужно обязательно упомянуть про гамма-коррекцию: поскольку дефолтное пространство sRGB нелинейно, перед любыми манипуляциями с цветом проводится процедура gamma expansion, а по окончании преобразований - gamma compression.

VolinNilov 26 окт 2022 в 20:17

Здравствуйте, спасибо за дополнение! Всего в одной статье охватить не возможно, поэтому я очень ценю такие посты, где можно найти дополнения!

Опять же хочу заметить, что в статье рассмотрены не все возможности функций и конечно же не весь теоретический потенциал, который можно рассмотреть в каждом пункте. В статье я старался осветить моменты, которые были необходимы для выполнения конкретной задачи, которую я описал в самом начале.

catBasilio 26 окт 2022 в 20:23

И где тут нейронные сети? Все что вы описали, OpenCV делает без них.

VolinNilov 26 окт 2022 в 20:41

В данной статье речь идёт об некоторых аспектах обработки изображения, а также описание и применение алгоритма Canny Edge Detector, в данном случае это аспекты нейронных сетей и машинного зрения

Kotofay 26 окт 2022 в 21:07

Алгоритм довольно подробно рассматривали в https://habr.com/ru/post/114589/

VolinNilov 26 окт 2022 в 21:23

Здравствуйте, спасибо, что предоставили прекрасный туториал по этому алгоритму, здесь он и вправду раскрыт намного подробнее чем у меня, я его добавлю к пояснительным материалам

p0cky 28 окт 2022 в 07:47

В библиотеке OpenCV для этого существует функция resize. У этой функции, в свою очередь, есть три метода: INTER_CUBIC, INTER_LINEAR и INTER_AREA.

Dushnila mode enabled
Если мне не изменяет память, методы есть у класса, но никак не у функций.

Dushnila mode disabled

AlexBogatyrev 31 окт 2022 в 00:16

Все сильно проще в этом алгоритме. Здесь просто работа сверток (гауссовский фильтр, и дискретное приближение производных через свертку) и работа с их значениями.

Под производными в данном контексте подразумевают обычные горизонтальные и вертикальные свертки типа (-0,5 | 0 | 0,5) для первой, и (1 | - 2 | 1) для второй. По ним считается и градиент и магнитуда.

Подавление немаксимумов - по округленому (до 45 градусов) направлению градиента берется пиксель и два соседних. Если его значение большее из 3-х - пиксель остается, нет - удаляется.

Двухпороговая фильтрация нужна, чтобы избежать дырок в контуре, и сверяются по значению магнитуды. По первому порогу (сильные) границы - это границы. По второму порогу (слабые) границы - это границы, если рядом есть сильные. Остальное не границы.

U235a 21 дек 2024 в 12:44

Немного критики:

если в результате выполнения данного кода возникла ошибка, есть три возможных причины для этого. Первая — вы неправильно задали путь к файлу. Вторая — такого файла просто не существует, и третья — тип изображения (jpg/jpeg/png) задан неверно.

Еще есть четвертая и основная причина: кирилица в путях к файлу. imread из OpenCV не поддерживает такие пути. Так сложилось исторически.

Но что такое рёбра? Края — это особенности изображения, которые можно использовать для оценки и анализа структуры объектов на нём.

Вы уж определитесь с терминами. Края, кромки, границы, ребра... Используйте какое-то одно слово для edge, не вносите путаницу.

Нейросетей в статье нет. Совсем. Зачем тогда использовать это слово в заголовке?

Самое интересное, что для выделения самого темного объекта никакие детекторы границ и контуры не требуются. Нам нужно найти объект, поэтому логично работать напрямую с объектами, точнее с Connected components. Из плюсов: получаем сразу их количество, Bbox'ы, площади, центроиды.

import cv2

import numpy as np

img = cv2.imread('test_image.jpg')

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

bw=cv2.threshold(gray, 240, 255, cv2.THRESH_BINARY_INV)[1]

retval, labels, stats, _=cv2.connectedComponentsWithStats(bw)

bright=np.full(retval, 255.0) # средние яркости объектов

for i in range(1, retval):

if stats[i,4]<500: # селекция по площади объектов

continue

x0,y0,x1,y1=stats[i,0],stats[i,1],stats[i,0]+stats[i,2],stats[i,1]+stats[i,3] mask=cv2.compare(labels[y0:y1,x0:x1], i, cv2.CMP_EQ)

bright[i]=cv2.mean(gray[y0:y1,x0:x1], mask)[0]

idx=np.argmin(bright)

cv2.rectangle(img, stats[idx, :4], (0,0,255))

cv2.imshow('Image with selected object', img)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий