Все потоки

Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

SmartEngines 30 июн 2015 в 10:02

Поиск четырёхугольников документов на мобильных устройствах

6 мин

14K

Блог компании Smart EnginesРазработка мобильных приложений * Алгоритмы * Обработка изображений * Программирование *

Некоторые из модулей распознавания документов, разработанных нашей компанией, в качестве первого этапа своей работы должны определять расположение объекта на поступающем изображении или в видеопотоке. Сегодняшняя статья посвящена одному из задействованных у нас подходов к решению этой задачи.

Постановка задачи

Для начала определим, какую информацию мы можем использовать в своих целях.
В приложениях достаточно жёстко заданы предполагаемые типы документов. Будем считать, что никто всерьёз не пытается распознать паспорт приложением для банковских карт или наоборот, а значит нам известны, как минимум, пропорции искомого объекта. Также заметим, что абсолютное большинство мобильных девайсов имеет камеры с фиксированным фокусным расстоянием.

Читать дальше →

+14

mikozh 30 июн 2015 в 09:55

OpenCV и иллюзия кругов на воде

5 мин

12K

Обработка изображений *

Из песочницы

Предлагаю читателям «Хабрахабра» статью о том, как школьная физика и OpenCV позволяют сделать иллюзию волн на воде. Основная сложность состоит в выборе красивого уравнения и переносе эффекта преломления света на границе раздела сред из трехмерного мира на плоскую картинку.

Читать дальше →

+12

OsipovRoman 29 июн 2015 в 15:29

Детекция кожи в Wolfram Language (Mathematica)

5 мин

11K

Блог компании Wolfram ResearchПрограммирование * Обработка изображений * Машинное обучение * Алгоритмы *

Перевод

Перевод поста Matthias Odisio "Seeing Skin with Mathematica".
Скачать файл, содержащий текст статьи, интерактивные модели и весь код, приведенный в статье, можно здесь.
Выражаю огромную благодарность Кириллу Гузенко за помощь в переводе.

Детекция кожи может быть довольно полезной — это один из основных шагов к более совершенным системам, нацеленным на обнаружение людей, распознавание жестов, лиц, фильтрации на основе содержания и прочего. Несмотря на всё вышеперечисленное, моя мотивация при создании приложения заключалась в другом. Отдел разработки и исследований в Wolfram Research, в котором я работаю, подвергся небольшой реорганизации. С моими коллегами, которые занимаются вероятностями и статистикой, которые стали находиться ко мне значительно ближе, я решил разработать небольшое приложение, которое использовало бы как функционал по обработке изображений в Mathematica, так и статистические функции. Детекция кожи — первое, что пришло мне в голову.

Оттенки кожи и внешность могут варьироваться, что усложняет задачу детекции. Детектор, который я хотел разработать, основывается на вероятностных моделях для цветов пикселей. Для каждого пикселя изображения, поданного на вход, детектор кожи выдаёт вероятность того, что этот пиксель принадлежит области кожи.

Skin detection model

Skin detection model

Читать дальше →

+13

moccachin 25 июн 2015 в 11:49

Сравнение анимации GIF, WebP, APNG, BPG

3 мин

65K

Блог компании .ioОбработка изображений *

Чтобы создать эффект движения нужно повторить слегка измененную картинку с достаточно высокой скоростью. Например в кино эта скорость составляет 24 кадра в секунду. Чем она выше, тем движение выглядит плавнее.

Читать дальше →

+6

mikhailm1 24 июн 2015 в 19:12

Детектор эллипсов в реальном времени

4 мин

19K

Обработка изображений *

Из песочницы

Первым шагом при разработке приложения, работающего с дополненной реальностью, является выбор метки с ее последующим распознаванием в реальном времени. Ряд алгоритмов предлагает использовать специально созданные метки, ряд обучается на подходящем изображении, мы же решили остановиться на том, что почти всегда есть у всех под рукой – монетах. Их выбор в качестве меток и привел нас к задаче поиска эллипсов. Конечно, из-за искажений камеры и небольшой цилиндричности монета на изображении не всегда является точно эллипсом, но достаточно близка по форме к этой кривой. В качестве целевой платформы был выбран современный телефон на ARM-процессоре. Для дополнения в реальном времени требуется не меньше 20 кадров в секунду, так что можно тратить не более 50 миллисекунд на обработку каждого кадра.

Подробности решения задачи

+24

moccachin 19 июн 2015 в 10:39

Как определить лицо на фотографии с помощью PHP

3 мин

40K

Блог компании .ioОбработка изображений *

Recovery Mode

Определение лиц используется в соцсетях, фото-редакторах, видеочатах, умной капче, time tracking программах — можно придумать еще множество применений этой функции.

Читать дальше →

+15

Capuchin 12 июн 2015 в 08:42

Умный кроп на основе энтропии

2 мин

26K

Блог компании .ioPHP * Обработка изображений *

Во многих веб-приложениях существует необходимость автоматического кропа — будь то вырезание аватарки из загруженного фото, превью крупных изображений или создание миниатюр в больших галереях.

Но машины все еще не люди, и далеко не всегда будет вырезана нужная область. Старые способы типа вырезать миниатюру 100х100 из левого верхнего угла или из центра отходят на второй план, и на арену выходит смарт-кроп.

Читать дальше →

+12

MisterSpock 11 июн 2015 в 09:52

Об организации рабочего процесса фотографа. (Сравнивая с мнением журнала What Digital Camera)

9 мин

7.4K

Обработка изображений *

Я несколько раз уже писал в своём блоге о различных аспектах организации рабочего процесса, приводящего увлечённого цифровой фотографией любителя от съёмки к готовой фотокартине, сетевому альбому или домашней коллекции. Недавно за этот же вопрос решил взяться авторитетный английский журнал What Digital Camera, опубликовавший статью «Speed Up Your Workflow» с краткими рекомендациями, касающимися оптимизации всех шагов рабочего процесса цифрового фотографа.

Читать дальше →

-16

OsipovRoman 10 июн 2015 в 14:45

Автоматизированное создание диаграмм в xkcd-стиле: из серьёзного в забавное

5 мин

21K

Блог компании Wolfram ResearchПрограммирование * Занимательные задачкиОбработка изображений *

Перевод

Перевод поста Виталия Каурова "Automating xkcd Diagrams: Transforming Serious to Funny".
Скачать файл, содержащий текст статьи, интерактивные модели и весь код, приведенный в статье, можно здесь.
Выражаю огромную благодарность Кириллу Гузенко за помощь в переводе.

Утром в понедельник я наткнулся на интересный вопрос, опубликованный в Mathematica Stack Exchange, с нехитрым заголовком — "создание графиков в xkcd-стиле". Из-за популярности веб-комиксов xkcd Рэндалла Манро (Randall Munroe), я ожидал, что люди добавят себе несколько закладок этой страницы и с десяток up-vote. Тогда я ещё не знал, как всё обернётся. Сложно предсказать вирусность какого-то мема, однако если удалось создать такой, то весьма здорово наблюдать, как растёт его популярность и как он распространяется в интернете. Через два дня этот пост имел уже более 100 тысяч просмотров, двести up-vote и 150 закладок; стали возникать ответы и схожие посты в других разделах Stack Exchange, в Twitter разразился небольшой ураган по этому поводу, появлялись обсуждения в Hacker News и reddit. Тут я приведу оригинал поста Amatya с примером изображения в xkcd-стиле:

«Я получил электронное письмо, на которое я захотел ответить с графиком в xkcd-стиле, но я не мог справиться с этим. Всё, что я рисовал, выглядело как надо, однако я не мог придумать такой команды для Plot Legends, чтобы сделать фрагменты текста плавающими. Может, есть какие-то идеи, как можно было бы создать графики в xkcd-стиле? Когда всё выглядит рисованным от руки и неточным. Думаю, рисование таких странных кривых в Mathematica должно быть трудным в реализации.»

Walking back to my front door at night

Читать дальше →

+38

SmartEngines 9 июн 2015 в 08:00

Проблемы распознавания ID-документов на мобильных устройствах на примере машинно-читаемых зон

14 мин

35K

Блог компании Smart EnginesРазработка мобильных приложений * Обработка изображений * Android * iOS *

Рис. 1 — Загранпаспорт РФ с MRZ-зоной (Источник изображения: en.wikipedia.org/wiki/Russian_passport)

Здравствуйте, сегодня мы хотим рассказать вам об особенностях задачи распознавания документов, удостоверяющих личность, с помощью мобильного телефона. В качестве примера мы рассмотрим задачу распознавания машинно-читаемых зон MRZ на изображениях и на кадрах видеопотока, полученных с камеры мобильного устройства.

Читать дальше →

+11

Capuchin 5 июн 2015 в 13:37

Как определить дубликаты картинок с помощью PHP

4 мин

47K

Блог компании .ioОбработка изображений * PHP *

В любом проекте человеческий фактор никто не отменял, и если пользователи самостоятельно грузят картинки на сайт – появления дубликатов не избежать. Когда доходит до тысяч файлов, глазами всего не пересмотреть, а повторяющиеся картинки мало того, что никому не нужны, так еще и занимают место, тратят ресурс и в конце концов тормозят работу.

Потому рано или поздно встает вопрос автоматизации процесса поиска повторов, и тут мы рассмотрим основные, а также попробуем в деле.

Читать дальше →

+28

andreiselin 5 июн 2015 в 08:35

Как я png в 4 раза уменьшал

4 мин

24K

JavaScript * Обработка изображений *

Из песочницы

Эта идея возникла год назад, когда мне на просчет пришел проект веб-игры с большим количеством анимации, которую предполагалось делать спрайтами в хорошем качестве (большими спрайтами) и с качественным альфаканалом (в смысле, не с индексированным цветом прозрачности). В этой игре вы бросаете кости на стол и надо, чтобы они падали всегда по-разному.

Сделать одну такую png-анимацию размером одного кадра 400 на 400 мне, как в том числе аниматору, не составляло труда. Сделать сбрасывание кубиков всегда разным представлялось задачей нетривиальной ни в одном месте. Однако замотивированный круглой суммой из волосатых рук я начал штурм, думая в первую очередь о том, как сделать игру одновременно и красивой (так как изначально я дизайнер, трехмерщик и эстэт, а программистом не стану никогда), и такой, которая загрузится меньше чем за тысячу минут.

Читать дальше →

+19

germn 5 июн 2015 в 08:35

Релиз OpenCV 3.0 с поддержкой Python 3

1 мин

38K

Python * Обработка изображений *

Вышла третья версия OpenCV (Open Computer Vision Library) — популярной библиотеки алгоритмов компьютерного зрения, обработки изображений и численных алгоритмов общего назначения с открытым исходным кодом.

Релиз включает примерно 1500 патчей, отправленных через github. Упомянуто, что в OpenCV использовано большое количество интеллектуальной собственности Intel (IPPCV), которую компания передала пользователям библиотеки бесплатно, без лицензионных выплат, для коммерческого и некоммерческого использования. Аппаратное ускорение с использованием OpenCL теперь доступно разработчикам через T-API (transparent API). Помимо этого, в третью версию OpenCV добавлено огромное количество новых возможностей, улучшений производительности и стабильности, подробнее обо всём можно почитать по ссылке.

Это первая стабильная версия библиотеки, которая полностью поддерживает Python 3. Для Windows и Python 3.4 бинарники уже можно скачать на сайте lfd.uci.edu. Модуль всё ещё имеет название cv2.

Читать дальше →

+22

SmartEngines 2 июн 2015 в 08:30

Поиск периодических элементов защиты Паспорта РФ с помощью преобразования Фурье

7 мин

32K

Блог компании Smart EnginesАлгоритмы * Математика * Обработка изображений * Программирование *

Многие документы содержат защитные элементы, такие как голограммы, водяные знаки, гильош и т.д. В процессе сканирования таких документов возникает проблема — защитные элементы мешают системам распознавания (OCR). При разработке Smart PassportReader мы провели исследование, направленное на поиск и устранение подобных защитных элементов с изображений документов.

Рассмотрим пример паспорта гражданина РФ, на котором легко увидеть периодический голографический узор.

Если научиться находить подобные узоры, то появляется возможность использовать алгоритмы устранения защитных элементов не на всем изображении, а только в местах присутствия этих элементов, чтобы сохранить максимум полезной информации, поскольку такие алгоритмы часто ухудшают качество информативных участков изображения. Кроме того, системы распознавания могут использовать факт нахождения защитного элемента в областях символов для варьирования настроек или снижения уровня уверенности в результате.

В статье мы расскажем о методе определения наличия (детектирования) периодических шаблонов, использующем преобразование Фурье, который показал хорошие результаты в детектировании голографического узора на Российских паспортах.

Читать дальше →

+30

rocknrollnerd 2 июн 2015 в 07:30

Внезапный диван леопардовой расцветки

8 мин

84K

Алгоритмы * Машинное обучение * Обработка изображений *

Если вы интересуетесь искусственным интеллектом и прочим распознаванием, то наверняка уже видели эту картинку:

А если не видели, то это результаты Хинтона и Крижевского по классификации ImageNet-2010 глубокой сверточной сетью

Давайте взглянем на ее правый угол, где алгоритм опознал леопарда с достаточной уверенностью, разместив с большим отрывом на втором и третьем месте ягуара и гепарда.

Это вообще довольно любопытный результат, если задуматься. Потому что… скажем, вы знаете, как отличить одного большого пятнистого котика от другого большого пятнистого котика? Я, например, нет. Наверняка есть какие-то зоологические, достаточно тонкие различия, типа общей стройности/массивности и пропорций тела, но мы же все-таки говорим о компьютерном алгоритме, которые до сих пор допускают какие-то вот такие достаточно глупые с человеческой точки зрения ошибки. Как он это делает, черт возьми? Может, тут что-то связанное с контекстом и фоном (леопарда вероятнее обнаружить на дереве или в кустах, а гепарда в саванне)? В общем, когда я впервые задумался над конкретно этим результатом, мне показалось, что это очень круто и мощно, разумные машины где-то за углом и поджидают нас, да здравствует deep learning и все такое.

Так вот, на самом деле все совершенно не так.

под катом пятна

+141

Lorents 28 мая 2015 в 17:19

Image Catalyst 2.5

3 мин

26K

Обработка изображений *


Adobe Photoshop CC 2014 (Save For Web) — 59,78 КБ	kraken.io — 54,90 КБ	Image Catalyst (Xtreme) — 51,39 КБ

Image Catalyst — программа для комплексной оптимизации/сжатии изображений форматов PNG, JPEG и GIF без потери качества в рамках того же формата.

Читать дальше →

+21

Zalina 22 мая 2015 в 14:58

Анализ изображений и видео. Обнаружение текста на изображениях

1 мин

27K

Блог компании ЯндексПрограммирование * Обработка изображений * Алгоритмы *

Сегодня мы публикуем последнюю лекцию курса «Анализ изображений и видео», прочитанного Натальей Васильевой — старшим научным сотрудником HP Labs и руководителем HP Labs Russia. Наталья Сергеевна читала курс, посвящённый анализу изображений, в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS клуба.

Всего в программе девять лекций, из которых уже были опубликованы:

Под катом вы найдете план новой лекции и слайды.

Читать дальше →

+34

Capuchin 22 мая 2015 в 13:48

JPEG 2000, JPEG-XR и WebP в стране упущенных возможностей

3 мин

78K

Блог компании .ioPHP * Обработка изображений *

Ни для кого не секрет, что первым пунктом в оптимизации сайтов стоит графика. Потому многие крупные корпорации годами пыхтят над разработкой оптимальных форматов, в перспективе способных заменить существующие и разом осчастливить и разработчиков, и пользователей. Но лягушка все никак не превратится в царевну, и в распределении форматов по сети из года в год ничего интересного не происходит:

Попробуем разобраться, почему JPEG 2000, JPEG-XR и WebP все еще пасут задних, и действительно ли они такие классные, как заявлено.

Читать дальше →

+27

varerysan 22 мая 2015 в 11:08

Установка OpenCV 3.0.0-rc1 (с использованием IPP и TBB) на Intel Edison Yocto. USB-камера в OpenCV

10 мин

15K

Блог компании IntelОбработка изображений *

Туториал

Перевод

Плата Intel Edison обладает достаточной вычислительной мощностью, поэтому было бы логично использовать все её возможности. Одна из ресурсоемких задач это компьютерное зрение.
В этой статье мы опишем, как собрать и установить библиотеку OpenCV на плату Intel Edison и подключить USB-камеру. OpenCV мы соберём с включенным IPP и TBB, что позволит библиотеке полностью использовать оба ядра Intel Edison.

Читать дальше →

+17

Videoanalitic 21 мая 2015 в 09:11

Два противоположных направления ВИДЕОАНАЛИТИКИ: «жесткая» и «гибкая», кто сильней?

5 мин

6.6K

Big Data * Алгоритмы * Обработка изображений *

Проблема – сокращения избыточной видео информации – крайне актуальна для сегодняшнего видеонаблюдения, объем данных которого не способен уже переварить человек. Только каждый решает ее по-разному: одни – путем поиска важных моментов, другие – путем фильтрации незначительных. Что эффективнее?

Читать дальше →

+3

1 2 ...

93

94 95 ...