Как стать автором
Обновить

#2 Нейронные сети для начинающих. NumPy. MatplotLib. Операции с изображениями в OpenCV

Блог компании RUVDS.com Python *Обработка изображений *Big Data *
Tutorial

Это вторая статья из серии введения в «Нейронные сети для начинающих». Здесь и далее мы постараемся разобраться с таким понятием — как обработка графических данных, визуализация данных, а также на практике решим пару простых задач. Предыдущая статья — #1 Нейронные сети для начинающих. Решение задачи классификации Ирисов Фишера
Маленький совет из будущего: «В данной статье будут затронуты некоторые понятия, о которых я писал раньше, так что для полного понимания темы, советую прочитать и предыдущую статью»
На самом деле, на хабре было множество публикаций по этой теме, но все они говорят о разных вещах. Давайте разберёмся и соберём всё в одну кучку, для полноценного понимания картины мира.
Читать дальше →
Всего голосов 28: ↑26 и ↓2 +24
Просмотры 2.4K
Комментарии 2

OpenCV Hackathon is coming

Open source *
image

Этим летом библиотека OpenCV отмечает свой двадцатый юбилей. OpenCV — самая большая библиотека компьютерного зрения в мире. Она используется чуть ли не в каждом мобильном телефоне, планшете и камере, не говоря уже о настольных системах и серверах. SourceForge рапортует о 20 миллионах скачиваний релизных версий библиотеки, и это число продолжает расти.
Читать дальше →
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 2.9K
Комментарии 0

OpenCV ищет студентов для Google Summer of Code-2021

Алгоритмы *

Крупнейшая библиотека компьютерного зрения OpenCV присоединилась к программе Google Summer of Code-2021 и объявляет набор студентов, которые хотели бы попробовать свои силы и заодно помочь улучшить работу библиотеки. Детальную информацию об OpenCV и ее участии в GSoC можно найти здесь

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 1.7K
Комментарии 0

Вебинар: Методы получения трехмерных моделей по изображениям

Алгоритмы *Машинное обучение *AR и VR Будущее здесь

19 августа в 16:30 в рамках цикла открытых технических вебинаров компании Xperience AI с докладом выступит Виктор Ерухимов, CEO компании Itseez3D, один из создателей библиотеки OpenCV и член совета директоров OpenCV Foundation.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 1.4K
Комментарии 0

Samsung приглашает на открытую онлайн конференцию об Open Source

Блог компании Samsung Open source *Конференции

15 сентября 2021 г. компания Samsung Electronics проведет международную открытую онлайн конференцию Samsung Open Source Conference Russia 2021. Это масштабное ежегодное мероприятие для open-source разработчиков, которое научно-исследовательское подразделение Samsung (Samsung Research) проводит с 2014 года. В этом году конференция впервые пройдет не только в Сеуле, но и в России при поддержке российского Исследовательского центра Samsung (SRR).

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 2.1K
Комментарии 1

Открытый семинар «От COLMAP к NeRF: обзор методов трехмерной реконструкции объектов по изображениям»

Работа с 3D-графикой *Машинное обучение *

Виктор Ерухимов, CEO компании Itseez3D, прочитает открытый семинар «От COLMAP к NeRF: обзор методов трехмерной реконструкции объектов по изображениям».

О спикере: Виктор Ерухимов, руководит созданием Avatar SDK — платформы, позволяющей генерировать 3D аватаров по селфи для мета-вселенных. Является членом совета директоров OpenCV Foundation и автором книги OpenVX Programming Guide.

На семинаре пойдет речь о создании 3D моделей объектов реального мира по их изображениям. Начнем с базовых принципов проективной геометрии, на которых работают классические системы 3D реконструкции, например, COLMAP. Затем поговорим про методы, основанные на машинном обучении, как параметрические (morphable models), так и непараметрические. Обсудим методы, позволяющие восстанавливать 3D форму и генерировать фотореалистичные изображения объектов и 3D сцен.

Зарегистрироваться на семинар можно по ссылке.

Вы можете посмотреть часть видео с прошедших семинаров в открытом доступе на нашем YouTube-канале.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 487
Комментарии 0

Открытый семинар «Light and Сolour»

Data Engineering *

Открытый семинар пройдёт 17 марта в 16:30 (мск). На семинаре поговорим о том, как представлен цвет в компьютерной графике: цветовые модели, стандарты кодирования и отображения, динамический диапазон, и как эти вещи связаны с физикой света и особенностями человеческого восприятия.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 221
Комментарии 0

Face Detection на джаве — это просто!

Java *
Спешу поделиться с вами своею радостью :) Столкнулся я тут недавно с задачкой — нужно было определить местонахождения лиц на картинке.

Зачем это нужно — другой вопрос: мне, лично, понадобилось для создания модели распределения внимания по картинке, а кому-то, может быть, нужно для того, чтобы людей как в фейсбуке автоматически на групповой фотографии выделять.

Алгоритмы, в принципе, неплохо известны. Одним из лучших является алгоритм Viola & Jones, но поиск готовых имплементаций результатов не принёс. Было расстроился, но обратил внимание на замечательную нативную библиотеку — OpenCV. Библиотека ценна не только реализацией основных алгоритмов компьютерного зрения, но тем, что встречается решительно на всех платформах.

И что же вы думаете? Одним из первых в гугле выпадает вот такой замечательный проект JNI интерфейса к OpenCV!

Несколько минут закачки, десяток минут чтения документации с установкою программы, и ещё десяток — написание теста. А потом, и вот этими четырьмя строчками, просто берём и распознаём на картинке лица!

OpenCV cv = new OpenCV();
cv.loadImage("test.jpg", 300, 400);
cv.cascade("haarcascade_frontalface_default.xml");
Rectangle bounds[] = cv.detect();

Читать дальше →
Всего голосов 71: ↑68 и ↓3 +65
Просмотры 26K
Комментарии 76

Распознавание дорожных знаков (OpenCV)

Обработка изображений *
Здраствуйте, решил поделиться своим опытом применения OpenCV (Intel) при решении практической задачи.

Зачада стояла следущая — автоматическое распознавание дорожных знаков на видео желательно в режиме реального времени. К большому сожалению на русском языке очень мало информации по подобной проблеме, и еще меньше примеров.
Вообщем пошарив по интернету, было принято решение использовать библиотеку OpenCV, которая располагала необходимым мат. аппаратом и как позже оказалось, довольно высокой производительностью.

Читать дальше →
Всего голосов 41: ↑40 и ↓1 +39
Просмотры 44K
Комментарии 18

Взлом каптчи файлообменника

Искусственный интеллект

Введение



В данной статье коротко рассказывается о процессе взлома captcha с ifolder.ru. Применение в процессе языка Python и сторонних библиотек. Применение алгоритма преобразований Хафа в составе библиотеки Open Computer Vision © Intel позволит нам избавиться от шума на изображении, простая в использовании и быстрая библиотека FANN (Fast Artificial Neural Network) сделает возможным применение искусственной нейронной сети для задачи распознавания образа.

Моя мотивация состояла, прежде всего, в том, чтобы попробовать язык Python. Как известно, лучший способ изучить язык — решить на нём какую-нибудь прикладную задачу. Поэтому параллельно описанию процесса обработки изображения я буду рассказывать о том, какие библиотеки и для чего я использовал.
Сломать мозг
Всего голосов 183: ↑178 и ↓5 +173
Просмотры 28K
Комментарии 68

В поисках НЛО. Детект объектов на изображении

Искусственный интеллект
Взлом captcha это, конечно, интересно и познавательно, но, по большому счёту, бесполезно. Это лишь частный случай задачи, которая возникает в одном из интересных направлений развития IT – распознавание образов (pattern recognition).



Сегодня мы рассмотрим алгоритм (точнее, более правильно считать это методикой, т.к. она объединяет в себе множество алгоритмов), который стоит на стыке таких областей, как Machine Learning и Computer Vision.

С помощью этого алгоритма мы будем искать НЛО (позарился на святое) на изображениях.

Уберите детей!
Всего голосов 92: ↑91 и ↓1 +90
Просмотры 32K
Комментарии 37

OpenCV (компьютерное зрение). Установка под MSVS 2008. «Hello World»

Чулан
image
OpenCV — это библиотека алгоритмов компьютерного зрения, обработки изображений. Исходный код является октрытым.

Эта вещь очень интересная и ей можно найти много применений: идентификация пользователя за компьютером, распознавание предметов, трэкинг объектов, а уж в робототехнике применений ещё больше!

В этом посте я опишу подробную установку данной библиотеки и мы напишем простейшую программу — этакий «Hello World» в компьютерном зрении. :)
Читать дальше →
Всего голосов 27: ↑24 и ↓3 +21
Просмотры 6.4K
Комментарии 24

OpenCV. Вывод видео

Чулан
image

Сегодня я вам покажу как вывести видео в нашем приложении при помощи OpenCV. Это так же легко, как и работа с изображением. Помимо прошлых действий нам потребуется сделать цикл, для чтения каждого кадра видео, так же нам потребуется команда, по который мы сможем выйти из этого цикла, если видео покажется слишком скучным.=)
Приступим!

Читать дальше →
Всего голосов 12: ↑11 и ↓1 +10
Просмотры 3.8K
Комментарии 1

OpenCV. Видео с камеры. Пишем в файл

Чулан
image
Приветствую!

В прошлых уроках:
OpenCV. Вывод видео
OpenCV (компьютерное зрение). Установка под MSVS 2008. «Hello World»

Мы научились устанавливать OpenCV, написали первую программу и считывали видео из файла.

Сейчас я хочу показать вам, как просто захватывать видео с камеры и научимся сохранять видео в файл.
Поехали!
Читать дальше →
Всего голосов 12: ↑11 и ↓1 +10
Просмотры 8.6K
Комментарии 8

OpenCV. Сравнительный анализ оболочек под C#

Чулан
Занимаясь анализом фото и видео потоков, поиском информации на изображении невольно столкнулся с открытой библиотекой OpenCV, про которую уже не раз упоминалось на Хабре. Но проблема в том, что OpenCV реализована для C++, а я программирую на C#.
Итак, чтобы не изучать C++ в тех тонкостях, которые мне бы потребовались для использования OpenCV я решил поискать wrapper этой библиотеки написанный под C#.
Читать дальше →
Всего голосов 14: ↑11 и ↓3 +8
Просмотры 7.1K
Комментарии 6

Автоматизация очистки снимков документов с помощью Sikuli

Алгоритмы *
Некоторое время назад меня попросили расширить один давний комментарий до полноценного топика. Не думаю, что сам по себе он достаточно интересен, но у меня возникла идея: почему бы не совместить полезное с приятным и не познакомиться поближе с одним любопытным инструментом, новость о котором недавно облетела все айтишные ресурсы.

Проблема


Основная задача, которую будем решать в рамках данного топика — подготовка сканов и фотографий письменных источников (книг, лекций и т.п.) для их печати, компактного хранения, упаковки в djvu и т.п.
Photoshop и FineReader рассматривать не будем. Хотя они и предоставляют ряд полезных инструментов, но стоят денег, вообще говоря.
При наличии сканера обычно всё просто: получаются изображения достаточно хорошего качества, чтобы можно было обойтись минимальной обработкой.
С фотографиями интереснее: добавляются проблемы с освещением и геометрические искажения. Увы, исправление геометрических искажений автоматизировать, как минимум, сложно. А вот с освещением и фоном вполне можно побороться. Чем и займёмся.
Читать дальше →
Всего голосов 26: ↑25 и ↓1 +24
Просмотры 7.7K
Комментарии 28

UnLogo, или как избежать маркетинга

Алгоритмы *
Хочется представить хабрасообществу интересный проект, который, пока что не освещался на хабре.

UnLogo

По словам разрабочиков: UnLogo это веб-сервис, который избавляет ваше видео от логотипов и прочей корпоративной атрибутики.

Используя открытые компоненты OpenCV и FFMPEG, а так-же базу логотипов различных компаний данный софт может убирать логотипы из видеофайлов.

Видео под катом.

Читать дальше →
Всего голосов 7: ↑6 и ↓1 +5
Просмотры 1K
Комментарии 5

Измерение расстояния до объекта и его скорости

Обработка изображений *
Из песочницы
Tutorial
Технологию, которую я собираюсь Вам представить, я не встречал в найденных мной методах определения расстояния до объекта на изображении. Она не является ни универсальной, ни сложной, суть её заключается в том, что видимое поле (будем считать, что мы используем видеокамеру) калибруется линейкой и затем сопоставляется координата объекта на изображении с отметкой на линейке. То есть измерение ведётся по одной линии или оси. Но нам не нужно хранить отметку на линейке для каждого пикселя, алгоритму для калибровки нужно только знать размер линейки в пикселях и в метрах, а также координату пикселя, который является фактической серединой линейки. Очевидное ограничение — работает только на плоских поверхностях.

Кроме самого метода в статье рассмотрена его реализация на языке Python с использованием библиотеки OpenCV, а также рассмотрены особенности получения изображений с вебкамер в Linux, используя video4linux2 API.


Читать дальше →
Всего голосов 65: ↑63 и ↓2 +61
Просмотры 52K
Комментарии 12

Распознавание некоторых современных CAPTCHA

Python *Алгоритмы *Обработка изображений *
Из песочницы
Именно так называлась работа, представленная мной на Балтийском научно-инженерном конкурсе, и принёсшая мне очаровательную бумажку с римской единичкой, а также новенький ноутбук.

Работа заключалась в распознавании CAPTCHA, используемых крупными операторами сотовой связи в формах отправки SMS, и демонстрации недостаточной эффективности применяемого ими подхода. Чтобы не задевать ничью гордость, будем называть этих операторов иносказательно: красный, жёлтый, зелёный и синий.

Читать дальше →
Всего голосов 319: ↑313 и ↓6 +307
Просмотры 76K
Комментарии 147

Опубликован код алгоритма Predator

Алгоритмы *
Хотя сам Зденек Катал был против, но исходные коды его алгоритма отслеживания объектов в видеопотоке Tracking-Learning-Detection (aka Predator) всё-таки попали в открытый доступ. Судя по всему, они были какое-то время выложены на сайте автора и кто-то успел сделать копию. А поскольку код публиковался под лицензией GPL 2.0, то не осталось никаких препятствий для его дальнейшего распространения.

Проект TLD на github: 1, 2, 3, 4, 5

Основная часть сделана на Matlab и его относительно легко можно транслировать в C за пару дней.

Сам трекинг осуществляется методом Лукаса-Канаде и с помощью OpenCV.
Всего голосов 71: ↑69 и ↓2 +67
Просмотры 11K
Комментарии 51