Как стать автором
Обновить

OpenCV Hackathon is coming

Время на прочтение 1 мин
Количество просмотров 3.3K
Open source *
image

Этим летом библиотека OpenCV отмечает свой двадцатый юбилей. OpenCV — самая большая библиотека компьютерного зрения в мире. Она используется чуть ли не в каждом мобильном телефоне, планшете и камере, не говоря уже о настольных системах и серверах. SourceForge рапортует о 20 миллионах скачиваний релизных версий библиотеки, и это число продолжает расти.
Читать дальше →
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 0

OpenCV ищет студентов для Google Summer of Code-2021

Время на прочтение 1 мин
Количество просмотров 1.8K
Алгоритмы *

Крупнейшая библиотека компьютерного зрения OpenCV присоединилась к программе Google Summer of Code-2021 и объявляет набор студентов, которые хотели бы попробовать свои силы и заодно помочь улучшить работу библиотеки. Детальную информацию об OpenCV и ее участии в GSoC можно найти здесь

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Вебинар: Методы получения трехмерных моделей по изображениям

Время на прочтение 1 мин
Количество просмотров 1.6K
Алгоритмы *Машинное обучение *AR и VR Будущее здесь

19 августа в 16:30 в рамках цикла открытых технических вебинаров компании Xperience AI с докладом выступит Виктор Ерухимов, CEO компании Itseez3D, один из создателей библиотеки OpenCV и член совета директоров OpenCV Foundation.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Открытый семинар «От COLMAP к NeRF: обзор методов трехмерной реконструкции объектов по изображениям»

Время на прочтение 1 мин
Количество просмотров 698
Работа с 3D-графикой *Машинное обучение *

Виктор Ерухимов, CEO компании Itseez3D, прочитает открытый семинар «От COLMAP к NeRF: обзор методов трехмерной реконструкции объектов по изображениям».

О спикере: Виктор Ерухимов, руководит созданием Avatar SDK — платформы, позволяющей генерировать 3D аватаров по селфи для мета-вселенных. Является членом совета директоров OpenCV Foundation и автором книги OpenVX Programming Guide.

На семинаре пойдет речь о создании 3D моделей объектов реального мира по их изображениям. Начнем с базовых принципов проективной геометрии, на которых работают классические системы 3D реконструкции, например, COLMAP. Затем поговорим про методы, основанные на машинном обучении, как параметрические (morphable models), так и непараметрические. Обсудим методы, позволяющие восстанавливать 3D форму и генерировать фотореалистичные изображения объектов и 3D сцен.

Зарегистрироваться на семинар можно по ссылке.

Вы можете посмотреть часть видео с прошедших семинаров в открытом доступе на нашем YouTube-канале.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 0

Открытый семинар «Light and Сolour»

Время на прочтение 1 мин
Количество просмотров 259
Data Engineering *

Открытый семинар пройдёт 17 марта в 16:30 (мск). На семинаре поговорим о том, как представлен цвет в компьютерной графике: цветовые модели, стандарты кодирования и отображения, динамический диапазон, и как эти вещи связаны с физикой света и особенностями человеческого восприятия.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Face Detection на джаве — это просто!

Время на прочтение 1 мин
Количество просмотров 27K
Java *
Спешу поделиться с вами своею радостью :) Столкнулся я тут недавно с задачкой — нужно было определить местонахождения лиц на картинке.

Зачем это нужно — другой вопрос: мне, лично, понадобилось для создания модели распределения внимания по картинке, а кому-то, может быть, нужно для того, чтобы людей как в фейсбуке автоматически на групповой фотографии выделять.

Алгоритмы, в принципе, неплохо известны. Одним из лучших является алгоритм Viola & Jones, но поиск готовых имплементаций результатов не принёс. Было расстроился, но обратил внимание на замечательную нативную библиотеку — OpenCV. Библиотека ценна не только реализацией основных алгоритмов компьютерного зрения, но тем, что встречается решительно на всех платформах.

И что же вы думаете? Одним из первых в гугле выпадает вот такой замечательный проект JNI интерфейса к OpenCV!

Несколько минут закачки, десяток минут чтения документации с установкою программы, и ещё десяток — написание теста. А потом, и вот этими четырьмя строчками, просто берём и распознаём на картинке лица!

OpenCV cv = new OpenCV();
cv.loadImage("test.jpg", 300, 400);
cv.cascade("haarcascade_frontalface_default.xml");
Rectangle bounds[] = cv.detect();

Читать дальше →
Всего голосов 71: ↑68 и ↓3 +65
Комментарии 76

Распознавание дорожных знаков (OpenCV)

Время на прочтение 2 мин
Количество просмотров 45K
Обработка изображений *
Здраствуйте, решил поделиться своим опытом применения OpenCV (Intel) при решении практической задачи.

Зачада стояла следущая — автоматическое распознавание дорожных знаков на видео желательно в режиме реального времени. К большому сожалению на русском языке очень мало информации по подобной проблеме, и еще меньше примеров.
Вообщем пошарив по интернету, было принято решение использовать библиотеку OpenCV, которая располагала необходимым мат. аппаратом и как позже оказалось, довольно высокой производительностью.

Читать дальше →
Всего голосов 41: ↑40 и ↓1 +39
Комментарии 18

Взлом каптчи файлообменника

Время на прочтение 9 мин
Количество просмотров 44K
Искусственный интеллект

Введение



В данной статье коротко рассказывается о процессе взлома captcha с ifolder.ru. Применение в процессе языка Python и сторонних библиотек. Применение алгоритма преобразований Хафа в составе библиотеки Open Computer Vision © Intel позволит нам избавиться от шума на изображении, простая в использовании и быстрая библиотека FANN (Fast Artificial Neural Network) сделает возможным применение искусственной нейронной сети для задачи распознавания образа.

Моя мотивация состояла, прежде всего, в том, чтобы попробовать язык Python. Как известно, лучший способ изучить язык — решить на нём какую-нибудь прикладную задачу. Поэтому параллельно описанию процесса обработки изображения я буду рассказывать о том, какие библиотеки и для чего я использовал.
Сломать мозг
Всего голосов 183: ↑178 и ↓5 +173
Комментарии 68

В поисках НЛО. Детект объектов на изображении

Время на прочтение 6 мин
Количество просмотров 54K
Искусственный интеллект
Взлом captcha это, конечно, интересно и познавательно, но, по большому счёту, бесполезно. Это лишь частный случай задачи, которая возникает в одном из интересных направлений развития IT – распознавание образов (pattern recognition).



Сегодня мы рассмотрим алгоритм (точнее, более правильно считать это методикой, т.к. она объединяет в себе множество алгоритмов), который стоит на стыке таких областей, как Machine Learning и Computer Vision.

С помощью этого алгоритма мы будем искать НЛО (позарился на святое) на изображениях.

Уберите детей!
Всего голосов 92: ↑91 и ↓1 +90
Комментарии 37

OpenCV (компьютерное зрение). Установка под MSVS 2008. «Hello World»

Время на прочтение 4 мин
Количество просмотров 12K
Чулан
image
OpenCV — это библиотека алгоритмов компьютерного зрения, обработки изображений. Исходный код является октрытым.

Эта вещь очень интересная и ей можно найти много применений: идентификация пользователя за компьютером, распознавание предметов, трэкинг объектов, а уж в робототехнике применений ещё больше!

В этом посте я опишу подробную установку данной библиотеки и мы напишем простейшую программу — этакий «Hello World» в компьютерном зрении. :)
Читать дальше →
Всего голосов 27: ↑24 и ↓3 +21
Комментарии 24

OpenCV. Вывод видео

Время на прочтение 2 мин
Количество просмотров 6.2K
Чулан
image

Сегодня я вам покажу как вывести видео в нашем приложении при помощи OpenCV. Это так же легко, как и работа с изображением. Помимо прошлых действий нам потребуется сделать цикл, для чтения каждого кадра видео, так же нам потребуется команда, по который мы сможем выйти из этого цикла, если видео покажется слишком скучным.=)
Приступим!

Читать дальше →
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 1

OpenCV. Видео с камеры. Пишем в файл

Время на прочтение 3 мин
Количество просмотров 13K
Чулан
image
Приветствую!

В прошлых уроках:
OpenCV. Вывод видео
OpenCV (компьютерное зрение). Установка под MSVS 2008. «Hello World»

Мы научились устанавливать OpenCV, написали первую программу и считывали видео из файла.

Сейчас я хочу показать вам, как просто захватывать видео с камеры и научимся сохранять видео в файл.
Поехали!
Читать дальше →
Всего голосов 12: ↑11 и ↓1 +10
Комментарии 8

OpenCV. Сравнительный анализ оболочек под C#

Время на прочтение 3 мин
Количество просмотров 14K
Чулан
Занимаясь анализом фото и видео потоков, поиском информации на изображении невольно столкнулся с открытой библиотекой OpenCV, про которую уже не раз упоминалось на Хабре. Но проблема в том, что OpenCV реализована для C++, а я программирую на C#.
Итак, чтобы не изучать C++ в тех тонкостях, которые мне бы потребовались для использования OpenCV я решил поискать wrapper этой библиотеки написанный под C#.
Читать дальше →
Всего голосов 14: ↑11 и ↓3 +8
Комментарии 6

Автоматизация очистки снимков документов с помощью Sikuli

Время на прочтение 10 мин
Количество просмотров 7.9K
Алгоритмы *
Некоторое время назад меня попросили расширить один давний комментарий до полноценного топика. Не думаю, что сам по себе он достаточно интересен, но у меня возникла идея: почему бы не совместить полезное с приятным и не познакомиться поближе с одним любопытным инструментом, новость о котором недавно облетела все айтишные ресурсы.

Проблема


Основная задача, которую будем решать в рамках данного топика — подготовка сканов и фотографий письменных источников (книг, лекций и т.п.) для их печати, компактного хранения, упаковки в djvu и т.п.
Photoshop и FineReader рассматривать не будем. Хотя они и предоставляют ряд полезных инструментов, но стоят денег, вообще говоря.
При наличии сканера обычно всё просто: получаются изображения достаточно хорошего качества, чтобы можно было обойтись минимальной обработкой.
С фотографиями интереснее: добавляются проблемы с освещением и геометрические искажения. Увы, исправление геометрических искажений автоматизировать, как минимум, сложно. А вот с освещением и фоном вполне можно побороться. Чем и займёмся.
Читать дальше →
Всего голосов 26: ↑25 и ↓1 +24
Комментарии 28

UnLogo, или как избежать маркетинга

Время на прочтение 2 мин
Количество просмотров 1.1K
Алгоритмы *
Хочется представить хабрасообществу интересный проект, который, пока что не освещался на хабре.

UnLogo

По словам разрабочиков: UnLogo это веб-сервис, который избавляет ваше видео от логотипов и прочей корпоративной атрибутики.

Используя открытые компоненты OpenCV и FFMPEG, а так-же базу логотипов различных компаний данный софт может убирать логотипы из видеофайлов.

Видео под катом.

Читать дальше →
Всего голосов 7: ↑6 и ↓1 +5
Комментарии 5

Измерение расстояния до объекта и его скорости

Время на прочтение 9 мин
Количество просмотров 54K
Обработка изображений *
Туториал
Из песочницы
Технологию, которую я собираюсь Вам представить, я не встречал в найденных мной методах определения расстояния до объекта на изображении. Она не является ни универсальной, ни сложной, суть её заключается в том, что видимое поле (будем считать, что мы используем видеокамеру) калибруется линейкой и затем сопоставляется координата объекта на изображении с отметкой на линейке. То есть измерение ведётся по одной линии или оси. Но нам не нужно хранить отметку на линейке для каждого пикселя, алгоритму для калибровки нужно только знать размер линейки в пикселях и в метрах, а также координату пикселя, который является фактической серединой линейки. Очевидное ограничение — работает только на плоских поверхностях.

Кроме самого метода в статье рассмотрена его реализация на языке Python с использованием библиотеки OpenCV, а также рассмотрены особенности получения изображений с вебкамер в Linux, используя video4linux2 API.


Читать дальше →
Всего голосов 65: ↑63 и ↓2 +61
Комментарии 12

Распознавание некоторых современных CAPTCHA

Время на прочтение 15 мин
Количество просмотров 77K
Python *Алгоритмы *Обработка изображений *
Из песочницы
Именно так называлась работа, представленная мной на Балтийском научно-инженерном конкурсе, и принёсшая мне очаровательную бумажку с римской единичкой, а также новенький ноутбук.

Работа заключалась в распознавании CAPTCHA, используемых крупными операторами сотовой связи в формах отправки SMS, и демонстрации недостаточной эффективности применяемого ими подхода. Чтобы не задевать ничью гордость, будем называть этих операторов иносказательно: красный, жёлтый, зелёный и синий.

Читать дальше →
Всего голосов 319: ↑313 и ↓6 +307
Комментарии 148

Опубликован код алгоритма Predator

Время на прочтение 1 мин
Количество просмотров 11K
Алгоритмы *
Хотя сам Зденек Катал был против, но исходные коды его алгоритма отслеживания объектов в видеопотоке Tracking-Learning-Detection (aka Predator) всё-таки попали в открытый доступ. Судя по всему, они были какое-то время выложены на сайте автора и кто-то успел сделать копию. А поскольку код публиковался под лицензией GPL 2.0, то не осталось никаких препятствий для его дальнейшего распространения.

Проект TLD на github: 1, 2, 3, 4, 5

Основная часть сделана на Matlab и его относительно легко можно транслировать в C за пару дней.

Сам трекинг осуществляется методом Лукаса-Канаде и с помощью OpenCV.
Всего голосов 71: ↑69 и ↓2 +67
Комментарии 51

Система учета на базе OCR системы

Время на прочтение 5 мин
Количество просмотров 7.3K
Обработка изображений *
Из песочницы

Пролог


По ходу своей трудовой деятельности получил задачу придумать и реализовать систему учета рекламной информации. Учет заключался в проверке наличия нужной информации на нужном рекламном щите. Щит и полиграфия пронумерованы.
В качестве исходной информации для системы предлагалось использовать фото. После торговли согласования с дизайнерами было оговорено, что оба номера будут располагаться внутри одной рамки. Единственное, что рамка могла быть в любом месте щита.
Собственно на этом постановка задачи заканчивается и начинается повествование о реализации.
Задача решается в три действия:
  1. Нахождение нужного прямоугольника на изображении.
  2. Распознавание текста.
  3. Проверка правильности распознавания.

Читать дальше →
Всего голосов 23: ↑20 и ↓3 +17
Комментарии 15

PSNR и SSIM или как работать с изображениями под С

Время на прочтение 4 мин
Количество просмотров 25K
Программирование *
Из песочницы
imageВ данной статье я коснусь базовых принципов, как работать с изображениями. Для этого я выбрал библиотеку OpenCV. Она распространяется бесплатно, так что скачать ее не составит труда.
Когда мне на учебе дали задание написать две метрики для оценки различия двух картинок, в частности качества видоизмененной от исходной, меня это конечно все это немного смутило. Знания в программировании были, мягко говоря, не очень большими, как-никак был только на первом курсе. Благо, какую библиотеку выбрать сказали заранее, так что с этим труда не возникло. А вот как ее использовать это было уже на порядок сложнее, все, что я в основном смог нарыть в интернете, было на английском, хоть я его и знаю на уровне, что могу читать тех. литературу, вследствие огромности самой библиотеки, подходило мало. Отлично, что удалось, какие функции и как использовать, я смог потом уточнить у преподавателя. А требовалось только понять как обращаться к самой картинке, в частности к отдельным пикселям изображения. Кого заинтересовало, добро пожаловать под кат.
Читать дальше →
Всего голосов 20: ↑17 и ↓3 +14
Комментарии 14