Обновить
56.37

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Жестовое управление для Android устройств на GTC 2013

Время на прочтение1 мин
Количество просмотров8K
image

На конференции NVIDIA GTC 2013 был представлен прототип технологии распознавания жестов Nuidroid. Отличительными особенностями представленного продукта является его оптимизация под ARM архитектуру, а также полная совместимость с Android устройствами.
Читать дальше →

Щелевая съёмка: Ловля птичек с помощью питона

Время на прочтение3 мин
Количество просмотров22K


Прочитав несколько месяцев назад статью про щелевую съемку, я твердо решил написать небольшую утилитку, позволяющую создавать щелевые фотографии. Перетряхнув закрома, я обнаружил следующие ресурсы: отложенный в долгий ящик учебный курс по Python, старенький ноутбук, камеру GoPro, несколько часов свободного времени, март месяц и кормушку для птиц.
Читать дальше →

Moedls: смартфон + лазер = 3D сканер

Время на прочтение1 мин
Количество просмотров18K


3D-печать стремительно набирает популярность. Появляются всё более и более доступные принтеры. Но разработка 3D моделей всё ещё является большой проблемой. Энтузиасты вынуждены создавать их в специальных редакторах, что требует некоторых навыков и большого количества времени, или же пользоваться услугами платных сервисов.
Читать далее

Ангелы на фотографии или «НЛО из принтера 2»

Время на прочтение2 мин
Количество просмотров39K
Здравсвуйте, уважаемое хабрасообщество. Не уверен, что вас заинтересует этот небольшой очерк, но, возможно, кто-то как и я не сталкивался с этим вопросом.



Все вы помните не в меру смешную историю с НЛО из принтера, когда человеческое невежество порождает невероятные фантазии. Я думал, такое бывает только по телевизору, но ошибался.

Сегодня, как эникейщику, пришлось зайти к одному человеку, коего я считаю религиозным фанатиком.
Совершенно без какого либо повода он показал мне фотографию 10x15, которую он снял собственноручно. На фотографии церковь (в силу своей религиозной фанатичности, он фотографирует их очень часто) с одним, с позволения сказать, феноменом: по всей фотографии располагались белые полупрозрачные пятна на манер боке. Самой фотографии у меня нет, фанатик отказался его дать.
Читать дальше →

Построение системы оптического распознавания структурной информации на примере Imago OCR

Время на прочтение19 мин
Количество просмотров37K
В настоящей заметке я расскажу о том, как можно построить систему оптического распознавания структурной информации, опираясь на алгоритмы, применяющиеся в обработке изображений и их реализации в рамках библиотеки OpenCV. За описанием системы стоит активно развивающийся open source проект Imago OCR, который может быть непосредственно полезен в распознавании химических структур, однако в заметке я не буду говорить о химии, а затрону более общие вопросы, решение которых поможет в распознавании структурированной информации различного рода, например таблицы или графики.
Читать дальше →

Распознавание пола в изображениях и видео

Время на прочтение8 мин
Количество просмотров52K
В данной статье представлен алгоритм распознавания пола, обладающий точностью 93.1% [1]. Статья не требует каких-либо предварительных знаний в области обработки изображений или машинного обучения. После прочтения статьи читатель будет в состоянии выполнить рассмотренный алгоритм самостоятельно.


Читать дальше →

Компания MakerBot представила настольный 3D сканер

Время на прочтение2 мин
Количество просмотров22K


На Хабре упоминания о компании MakerBot появляются достаточно часто. Большей частью в связи с 3D принтерами, которые эта компания производит. К примеру, одна из моделей, Replicator даже назван самым совершенным десктопным 3D принтером. Сейчас компания анонсировала новое устройство, тоже настольное. Только это уже не принтер, а сканер, и у него действительно очень небольшие размеры.

Читать дальше →

Метаданные фото-архива. XMP тэги лиц. [HowTo]

Время на прочтение3 мин
Количество просмотров18K
Недавно я прочел статью «Метаданные для организации хранения фото-архива», размещенную на Хабрахабре. Но, к сожалению, она не ответила на мои вопросы, которые носили более практический характер. Надеюсь мой пост будет полезен всем тем, кто занимается систематизацией своих фото-архивов.

Читать дальше →

Google поставил редирект с Picasa Web Albums на Google+ Photos

Время на прочтение2 мин
Количество просмотров28K


Корпорация Google, как и некоторые другие компании, уже долгое время избавляется от непрофильных/непопулярных среди пользователей активов. В эти «балластные» активы попадают некогда очень популярные сервисы, бывшие у всех на слуху. Например, Picasa. Пользователей Picasa Web Albums сейчас стараются перевести на аналогичный функционал в Google+.

Читать дальше →

Space Invaders в космосе

Время на прочтение1 мин
Количество просмотров36K


Нет, это не персонаж игры «Космические захватчики», а результат сильного гравитационного линзирования. Что это такое, а также другие примечательные парадоксы в этой области космоса под катом.

Читать дальше →

CeBIT 2013: Очки дополненной реальности SMI, следящие за глазами

Время на прочтение1 мин
Количество просмотров28K
image
Пока прогрессивное человечество следит за проектом Google Glasses, немцы выкатили на CeBIT 2013 свои очки дополненной реальности. Большие, страшные, неудобные, но интересные.
Читать дальше →

Yarr — dataflow-фреймворк (обработки изображений) на Хаскеле

Время на прочтение7 мин
Количество просмотров9.7K


Зондирование обстановки на Реддите показало, что едва ли хоть кто-то всерьез занимается обработкой изображений на Хаскеле, несмотря на то, что достаточно популярная библиотека Repa предполагает работу с изображениями как одно из основных приложений. Надеюсь, ситуацию сможет изменить библиотека Yarr (документация, гитхаб).

Я называю библиотеку dataflow-фреймворком, потому что она обобщена для обработки массивов (от одномерных до трехмерных) элементов любых типов, в том числе векторов чисел, например координат, комплексных чисел. Но основное предполагаемое применение — обработка двумерных массивов из векторов цветовых компонент, т. е. изображений. Фреймворк непосредственно не содержит алгоритмов обработки изображений, а предоставляет мощную инфраструктуру для их написания.
Читать дальше →

Первая игра, которую делают с помощью фотограмметрии

Время на прочтение1 мин
Количество просмотров51K


Фотограмметрия — технология дистанционного зондирования, позволяющая определять геометрические свойства объектов по нескольким фотографическим изображениям с разных ракурсов. Более продвинутая разновидность под названием стереофотограмметрия позволяет построить приближённую 3D-модель объекта.

Раньше фотограмметрия применялась, преимущественно, в геологии, топографии и археологических раскопках. В последнее время её начали применять в киноиндустрии, а сейчас с помощью этой техники создаётся компьютерная игра.
Читать дальше →

Ближайшие события

Бот для шашек (часть 1)

Время на прочтение2 мин
Количество просмотров101K
После прочтения поста на хабре «Шахматный бот», хотелось сделать свой, но так как посчитал, что шахматы сразу не получатся, то решил потренироваться на шашках (чтоб было больше мотивации взял знаменитые «Русские стрип-шашки»).
В отличии от выше упомянутого поста, где только несколько скринов и видеоролик, постараюсь рассказать подробнее…
Читать дальше →

Использование OpenCV в Delphi

Время на прочтение2 мин
Количество просмотров30K
Так случилось, что я активно использую Delphi в своей работе (программирование по работе, собственные открытые и закрытые проекты) и вот мне понадобилось написать программу, использующую открытую библиотеку компьютерного зрения OpenCV. Что же делать, ведь официально OpenCV использовать в Delphi невозможно, а перебираться на C ради одной программы слишком долго.

Но нет ничего невозможного…
Читать дальше →

Логотип по стандартам HTML5 или Как поставить векторную картинку на веб-страницу

Время на прочтение3 мин
Количество просмотров50K
Рисуем логотип
20-летнему юбилею тега IMG посвящается
25 февраля 1993 года Марк Андрессен (Marc Andreessen) написал:
Предлагаю новый опциональный HTML-тег: IMG
При нем должен обязательно указываться аргумент SRC=«url».
Тег отсылает к файлу растрового изображения (bitmap или pixmap). Браузер будет запрашивать этот файл в Сети, распознавать как изображение и вставлять в текст сообразно месту тега в коде страницы .


Допустим, вы нарисовали в Corel Draw! логотип компании и собираетесь разместить его на сайте не как-нибудь, а формате HTML5. И, соответственно, размещать картинку не в растровом формате, а в .SVG

Зачем мне картинка в SVG?


Что это дает, понятно – при любом масштабировании на планшете или любом другом гаджете мы имеем идеально точно отрисованную картинку, насколько детализированной она бы ни была.
Читать дальше →

Распознавание коридоров в тексте

Время на прочтение2 мин
Количество просмотров27K
Коридор (river) — совпадение пробелов по вертикали или наклонной линии в трёх и более смежных строках, один из дефектов вёрстки. Дефект устраняется довольно легко, но сложность заключается в его автоматическом обнаружении.

Коридор появляется не только из-за специфичного расположения пробелов, но из-за формы глифов. Например, в двух текстах пробелы расположены в одинаковых местах. В первом хорошо заметны два коридора, а во втором дефекта нет.

               
Читать дальше →

В Сеть выложили 320 гигапиксельную панораму Лондона

Время на прочтение1 мин
Количество просмотров59K


На Хабре уже публиковались новости о подобных достижениях, когда фотографировали то Млечный Путь, то Эверест, то еще что-нибудь. На этот раз постаралась компания British Telecom, выложившая в общий доступ огромную панораму центра Лондона. Само собой, для такой фотографии создан собственный сайт, где все это и можно посмотреть.

Читать дальше →

Вычисление оптического потока методом Лукаса-Канаде. Теория

Время на прочтение7 мин
Количество просмотров59K

В системах компьютерного зрения и обработки изображений часто возникает задача определения перемещений объектов в трехмерном пространстве с помощью оптического сенсора, то есть видеокамеры. Имея на входе последовательность кадров, необходимо воссоздать запечатленное на них трехмерное пространство и те изменения, которые происходят с ним с течением времени. Звучит сложно, но на практике зачастую достаточно найти смещения двухмерных проекций объектов в плоскости кадра.

Если мы хотим узнать на сколько тот или иной объект объект сместился по отношению к его же положению на предыдущем кадре за то время, которое прошло между фиксацией кадров, то скорее всего в первую очередь мы вспомним про оптический поток (optical flow). Для нахождения оптического потока можно смело воспользоваться готовой протестированной и оптимизированной реализацией одного из алгоритмов, например, из библиотеки OpenCV. При этом, однако, очень невредно разбираться в теории, поэтому я предлагаю всем заинтересованным заглянуть внутрь одного из популярных и хорошо изученных методов. В этой статье нет кода и практических советов, зато есть формулы и некоторое количество математических выводов.
Читать дальше →

Детектирование ладоней и пальцев на изображении

Время на прочтение3 мин
Количество просмотров34K

С течением времени изменяются наши представления о способах взаимодействия с компьютером. На смену «классических» клавиатуры и мыши, в нашу жизнь прочно вошли тачпады и сенсорные экраны. Но это не последняя ступень эволюции для средств ввода информации. С появлением устройств дополненной реальности, например таких, как Google Glass, возникает необходимость в интерфейсах способных гармонично вписываться в данную концепцию. Предпосылки к возникновению таких интерфейсов имеются, так, например, появились такие устройства как Intel Creative Camera, Microsoft Kinect или Leap Motion. Основными управляющими элементами в данных устройствах являются руки пользователя. Поэтому, одной из фундаментальных алгоритмических задач, для взаимодействия с подобными устройствами, является детектирование рук и пальцев пользователя и реконструкция их пространственного расположения.
В данной статье речь пойдет о одном из способов решения задачи детектирования ладоней и пальцев.
Читать дальше →

Вклад авторов