Pull to refresh

Эффективная сегментация изображений на графах

Reading time 10 min
Views 39K
Algorithms *

Сегментация изображений и выделение границ объектов (edge detection) играют важную роль в системах Computer Vision и применяются для задач распознавания сцен и выделения (определения) объектов. По большому счету, это такой же инструмент, как, например, сортировка, предназначенный для решения более высокоуровневых задач. И поэтому понимание устройства данного класса алгоритмов не будет лишним при построении подобных систем с учетом предъявляемых требований (в плане качество/производительность) и специфики поставленных задач.

В данной статье кратко описан алгоритм «Efficient Graph-Based Image Segmentation» авторов Pedro F. Felzenszwalb (MIT) и Daniel P. Huttenlocher (Cornell University), опубликованный в 2004 году. Да, алгоритм относительно старенький, но, несмотря на это, он до сих пор остается весьма популярным, демонстрируя неплохие результаты в плане производительности.

Под катом – большая смесь картинок и текста, не требовательная к текущему уровню знаний тематики. Любопытство приветствуется.

Мсье хочет знать толк в сегментации
Total votes 164: ↑163 and ↓1 +162
Comments 48

Классификация и выделение объектов на изображениях

Reading time 7 min
Views 32K
Image processing *
Sandbox
Здрайствуйте!
В связи со сферой своей деятельности, собрался, на мой взгляд, очень ценный материал, которым хочу поделиться с вами. Думаю некоторым он будет крайне важен и полезен, возможно мои наработки сэкономят Вам время, в случае чего буду рад. И так ближе к делу. На Хабре уже есть хороший обзор алгоритмов кластеризации данных. Детально рассмотрена теория, но практических результатов нет, как обычно практика не так легка, как кажется. Поэтому хочу представить вашему сведению реальные результаты, проблемы и их решений возникшее при кластеризации (точней сказать сегментации, потому что объект кластеризации — статическое изображение). Под катом будет и сегментация, и цифровая обработка изображений. Прошу…

Читать дальше
Total votes 5: ↑5 and ↓0 +5
Comments 7

Сегментация изображений методом квантилей

Reading time 5 min
Views 11K
Image processing *
Sandbox
image Сегментацией называется присвоение пикселям изображения меток так, что области, обладающие сходными в определённом смысле свойствами, имеют одинаковые метки. Также сегментацией порой называют поиск проекции объекта на изображении. Данный топик расскажет о простом, но эффективном методе поиска проекции объекта, называемом методом квантилей. Указана область применимости метода и приведены некоторые модификации, повышающие эффективность.
Читать дальше →
Total votes 77: ↑72 and ↓5 +67
Comments 40

Алгоритмы выделения контуров изображений

Reading time 4 min
Views 153K
Image processing *
Sandbox
В свете недавних статей об обработке изображений я хотел бы немного рассказать об алгоритмах выделения контуров: методы Робертса, Превитта и Собеля (эти методы взяты для рассмотрения как самые известные и часто используемые).

Читать дальше →
Total votes 83: ↑78 and ↓5 +73
Comments 45

Viola Jones на собственной шкуре, часть 2. — Emotion? — OMG, Yes!!!

Reading time 16 min
Views 40K
Algorithms *
Привет всем еще раз! Я решил сразу попробовать выпустить две статьи, практически в одно время, чтобы не прерывать цепь повествования, т.к. начало данной статьи очень важно!
Итак, многие ждали примеры моей программы и объяснения ее работы с точки зрения написания кода. Я же рассказываю последовательно, чтобы каждый смог ее повторить у себя на компьютере. Обращайте внимание побольше на обильные комментарии в коде, в них сила! И не бойтесь мега-мелкого скролла, т.к. информации много. Передислоцируйтесь в место с хорошим интернетом, в статье много схем и фотографий!
Let's get it started!
Total votes 40: ↑26 and ↓14 +12
Comments 10

Пример сегментации изображений средствами PHP

Reading time 4 min
Views 11K
PHP *Image processing *
Sandbox
Добрый день,
довольно редко, но все же встает вопрос о необходимости в автоматическом режиме делить изображение на логические фрагменты. Если вы ограничены только средствами PHP, то задача становится немного трудней, но все же решаема.
В данной статье я рассмотрю частный случай распознавания образов, ориентированный на не слишком изощренную публику.
В статье используются примеры с одного из сайтов с явным указанием ссылки, сайт не мой, изначально не было мыслей писать статью.
Читать дальше →
Total votes 41: ↑38 and ↓3 +35
Comments 3

Обзор алгоритмов сегментации

Reading time 8 min
Views 75K
Intel corporate blog Algorithms *Image processing *Mathematics *

Этим летом мне посчастливилось попасть на летнюю стажировку в компанию Itseez. Мне было предложено исследовать современные методы, которые позволили бы выделить местоположения объектов на изображении. В основном такие методы опираются на сегментацию, поэтому я начала свою работу со знакомства с этой областью компьютерного зрения.
Сегментация изображения — это разбиение изображения на множество покрывающих его областей. Сегментация применяется во многих областях, например, в производстве для индикации дефектов при сборке деталей, в медицине для первичной обработки снимков, также для составления карт местности по снимкам со спутников. Для тех, кому интересно разобраться, как работают такие алгоритмы, добро пожаловать под кат. Мы рассмотрим несколько методов из библиотеки компьютерного зрения OpenCV.
Читать дальше →
Total votes 27: ↑27 and ↓0 +27
Comments 15

Пример реализации методов обработки и распознавания изображений на Android

Reading time 14 min
Views 21K
Algorithms *Development for Android *Image processing *
Sandbox
Занимаясь разработкой приложений под ОС Android возникают интересные идеи, которые хочется попробовать, либо есть какой-то набор теоретических знаний и их хочется применить на практике, из совокупности этих факторов и возникла идея описываемого проекта.

Существует много статей о распознавании текста, о компьютерном зрении и об отдельных алгоритмах распознавания. В этой же публикации демонстрируется попытка реализации задачи, связанной с нахождением ключевого слова на изображении текста, что может позволить, например, найти необходимое место для чтения какого-либо текста в DjVu без распознавания самого текста.

Пример реализации представлен в виде Android приложения, а исходным изображением является скриншот текста, с введенным ключевым словом, для решения задачи применяются различные алгоритмы обработки и распознавания изображений.
Читать дальше →
Total votes 20: ↑19 and ↓1 +18
Comments 2

Использование сверточных сетей для поиска, выделения и классификации

Reading time 5 min
Views 47K
Recognitor corporate blog Image processing *Machine learning *
Недавно ZlodeiBaal опубликовал статью «Нейрореволюция в головах и сёлах», в которой привел обзор возможностей современных нейронных сетей. Самым интересным, на мой взгляд, является подход с использованием сверточных сетей для сегментации изображений, про этот подход и пойдет речь в статье.

segnet.png


Уже давно появилось желание изучить сверточные сети и узнать что-то новое, к тому же под рукой есть несколько последних Tesla K40 с 12Гб памяти, Tesla c2050, обычные видеокарты, Jetson TK1 и ноутбук с мобильной GT525M, интереснее всего конечно попробовать на TK1, так как его можно использовать практически везде, хоть на столб фонарный повесить. Самое первое с чего начал, это распознавание цифр, тут конечно удивить нечем, цифры уже давно неплохо распознаются сетями, но при этом постоянно возникает потребность в новых приложениях, которые должны что-то распознавать: номера домов, номера автомобилей, номера вагонов и т.д. Все бы хорошо, но задача распознавания цифр является лишь частью более общих задач.
Читать дальше →
Total votes 35: ↑30 and ↓5 +25
Comments 24

Конкурс Topcoder «Konica-Minolta Pathological Image Segmentation Challenge». Заметки участника

Reading time 5 min
Views 4.3K
AvitoTech corporate blog Algorithms *Image processing *Machine learning *

Привет! Пока мы ждём субботу и Avito Data Science Meetup: Computer Vision, расскажу вам про моё участие в соревновании по машинному обучению KONICA MINOLTA Pathological Image Segmentation Challenge. Хотя я уделил этому всего несколько дней, мне повезло занять 2 место. Описание решения и детективная история под катом.


Читать дальше →
Total votes 27: ↑25 and ↓2 +23
Comments 4

Технологии беспилотных автомобилей. Лекция Яндекса

Reading time 6 min
Views 15K
Яндекс corporate blog Algorithms *Industrial Programming *Machine learning *
Яндекс продолжает разрабатывать технологии беспилотных автомобилей. Сегодня мы публикуем лекцию одного из руководителей этого проекта — Антона Слесарева. Антон выступил на «Data-ёлке» в конце 2017 года и рассказал об одной из важных компонент стека технологий, необходимых для работы беспилотника.


— Меня зовут Антон Слесарев. Я отвечаю за то, что работает внутри беспилотного автомобиля, и за алгоритмы, которые готовят машины к поездке.
Total votes 29: ↑27 and ↓2 +25
Comments 10

Машинное зрение. Что это и как им пользоваться? Обработка изображений оптического источника

Reading time 12 min
Views 87K
Programming *LabVIEW *
Машинное зрение — это научное направление в области искусственного интеллекта, в частности робототехники, и связанные с ним технологии получения изображений объектов реального мира, их обработки и использования полученных данных для решения разного рода прикладных задач без участия (полного или частичного) человека.

Читать дальше →
Total votes 15: ↑11 and ↓4 +7
Comments 17

Интерактивная сегментация: выделяем кошек, собак и людей

Reading time 7 min
Views 5.1K
Samsung corporate blog Image processing *Machine learning *
Мы уже рассказывали про некоторые работы исследователей из московского Центра искусственного интеллекта Samsung. Недавно вышла статья «f-BRS: Rethinking Backpropagating Refinement for Interactive Segmentation» Константина Софиюка, Ильи Петрова, Ольги Бариновой и Антона Конушина, которая была принята на всемирную конференцию по компьютерному зрению CVPR 2020. И в этом посте мы расскажем, о чем пишут наши коллеги в этой работе и об интерактивной сегментации как прикладной задаче компьютерного зрения в целом. 


Читать дальше →
Total votes 8: ↑8 and ↓0 +8
Comments 2

Как я обучил модель для обнаружения и сегментации печатей

Reading time 4 min
Views 4.6K
Machine learning *

Привет хабр! Сегодня хочу поделиться своим кейсом. Обнаружение печатей позволило бы автоматизировать множество рутиных задач, упростив работу человека. Для своей задачи я использую модель Mask R-CNN.

Mask R-CNN представляет собой двухэтапную структуру: на первом этапе сканируется изображение и генерируются предложения (области, которые могут содержать объект). На втором этапе предложения классифицируются и создаются ограничивающие рамки и маски.

Читать далее
Total votes 6: ↑4 and ↓2 +2
Comments 6

ИИ от МФТИ: проектирование «глаз» для городских беспилотников

Reading time 3 min
Views 1.6K
Университет 20.35 corporate blog Big Data *Machine learning *Robotics development *Development for IOT *
Recovery mode

Исследователи Центра компетенций НТИ по направлению Искусственный интеллект на базе МФТИ работают над созданием автономной системы интеллектуального анализа фото- и видеоинформации для использования в беспилотниках и системах анализа обстановки в режиме реального времени. Она позволит летательным аппаратам безопасно перемещаться в городе, что, в свою очередь, может помочь развить беспилотную доставку. 

Читать далее
Total votes 6: ↑5 and ↓1 +4
Comments 4

Создаем точные датасеты для сегментации (доступны на kaggle)

Reading time 2 min
Views 2.4K
Image processing *Machine learning *

Начнем с простого примера: как думаете, легко найти более или менее адекватный датасет, который позволил бы ну хоть как-то поработать с квадрокоптерами?

Вполне может оказаться, что среди первых достойных результатов окажется именно этот набор. Обновил его совсем недавно, увеличив примерно вдвое. Под катом больше деталей (включая парусную яхту А, которая уже в прошлом году путешествовала в несколько странном виде), но если интересны исключительно датасеты: список доступных на текущий момент (пополняется). Да, пожалуйста, напишите какие датасеты могут быть полезны именно вам.

Читать далее
Rating 0
Comments 2

Как с помощью суперпикселей улучшить аннотацию данных

Reading time 5 min
Views 2.3K
SkillFactory corporate blog Python *Programming *Image processing *Machine learning *
Translation

К старту флагманского курса по Data Science рассказываем о суперпикселях, которые улучшают сегментацию данных, и знакомим читателей с платформой Kili Technologies, в инструментах которой они реализованы. Под катом подробности и ссылка на код быстрой реализации алгоритма сегментации SLIC.

Читать далее
Total votes 6: ↑4 and ↓2 +2
Comments 2

Transformers for Dense Prediction

Reading time 5 min
Views 1.5K
Image processing *Machine learning *
Sandbox

Трансформеры уже захватили мир машинного обучения, начав свой путь с обработки текстов, перешли в другие области как: аудио, работа с графами, работа видео . В этом посте хотел бы остановиться на теме dense prediction в компьютерном зрении (segmentation, monodepth estimation) и поделиться работами на эту тему.

Читать далее
Total votes 2: ↑2 and ↓0 +2
Comments 0

Как мы научились дистанционно оценивать техническое состояние автомобиля

Reading time 7 min
Views 6.3K
Финолаб corporate blog Data Mining *Image processing *
⚒️ Data Mining season

Добрый день, коллеги! Меня зовут Елена Волченко. В компании Финолаб я являюсь руководителем отдела машинного обучения и анализа данных. Этой статьей я хочу начать цикл публикаций о создании нашей командой сервиса дистанционной оценки технического состояния автомобилей на основе технологий искусственного интеллекта.

Мой рассказ будет разделен на две части. В первой расскажу о потребностях и проблемах в дистанционной оценке повреждений автомобилей. Во второй - о том, как мы решали эту задачу с помощью нейронных сетей и классического machine learning, с какими проблемами сталкивались, каких результатов достигли и что еще предстоит сделать.

Читать далее
Total votes 25: ↑25 and ↓0 +25
Comments 19

TransUNet — революция в традиционной сегментации изображений

Reading time 4 min
Views 3.1K
OTUS corporate blog Artificial Intelligence
Translation

В настоящее время U-сеть занимает доминирующее положение в сфере решения задач по сегментации изображений, особенно в области медицинской визуализации. Среди большинства из предложенных на сегодняшний день U-сетей в качестве базовых структур широко используются сверточные нейронные сети (CNN).

Однако CNN могут эффективно использовать только информацию ближнего радиуса действия (“последних 100 метров”) (или локальную) из-за небольшого размера ядра свертки, что не позволяет им в достаточной степени исследовать данные в задачах, содержащих компоненты с зависимостями на больших расстояниях.

Трансформеры, обычно используемые для обработки естественного языка (NLP), могут эффективно исследовать информацию на дальних расстояниях, но недостаточно надежны в работе с данными вблизи, как это делают CNN.

Чтобы использовать возможности CNN для компенсации недостатков трансформеров и с другой стороны в задачах сегментации изображений, Чен (Chen) и др. предложили TransUNet, которая также является первой моделью сегментации изображения, построенная на основе трансформера. Стоит также отметить, что авторы удостоверились в перспективности объединения CNN и трансформеров, сначала попытавшись использовать чистую архитектуру трансформера для сегментации изображения. Однако она не сработала так же хорошо, как внедрение CNN в их архитектуру, поскольку трансформеры не так хороши при эксплуатации локальных возможностей, как CNN.

Читать далее
Total votes 10: ↑7 and ↓3 +4
Comments 0
1