Обновить
58.34

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Распознавание номеров: от А до 9. Часть 3

Время на прочтение6 мин
Количество просмотров81K
Неделю назад мы опубликовали статью про открытый сервер для распознавания изображений автомобильных номеров. Теперь, как и обещали, статья про то, как отправлять на него свои фотографии с номерами. Наша цель была, как вы помните, вовсе не ругаться друг на друга неприличными словами, а именно сделать функционирующий сервер в интернете, который справляется с фотографиями и отправляет назад результат распознавания.


(часть фотографий, присланных в течение недели)
Читать дальше →

Поклонник Tron создал для себя виртуальную реальность при помощи 3 Kinect-ов и Oculus Rift

Время на прочтение1 мин
Количество просмотров60K


Посмотрев Tron еще в 1985 году, ОЛивер Крейлос (Oliver Kreylos) сразу стал поклонником виртуальной реальности. Но только сейчас, в 2014 году, ему удалось воплотить (хотя и частично) свою мечту в реальности, создав собственную виртуальную реальность и введя себя в созданный мир.

Само собой, для этого понадобилось аппаратное и программное обеспечение, включая сразу три Kinect от Microsoft и Oculus Rift. Три Кинекта используются для сканирования пространства, и трансляции сведенного потока в виртуальный мир.

Читать дальше →

Восход Земли «глазами» аппарата Lunar Reconnaissance Orbiter

Время на прочтение1 мин
Количество просмотров22K


Фотография, названная «Восход Земли» является одной из наиболее значимых из всех фото, которые делали представители NASA. Сделали эту фотографию 24 декабря 1968 года с борта корабля «Аполлон-8». Собственно, об этом уже писали на Хабре.

В этом году, в феврале, ученые получили ряд снимков восхода Земли, снимков, сделанных аппаратом Lunar Reconnaissance Orbiter 1 февраля 2014 года.

Читать дальше →

Не соблаговолите ли больше не нарушать, сэр (мэм)?

Время на прочтение4 мин
Количество просмотров67K
Примерно неделю назад Vasyutka опубликовал пост про распознавание номеров и обещал, что мы выложим софт, который можно будет опробовать. Мы немножко схитрили, не рассказав все подробнее. Ну, а то бы никакой интриги не было! Ядро алгоритма распознавания мы сделали с полгода назад, но тот проект, для которого оно было сделано, не двинулся. Он остановился где-то на альфа-версии. Подумав, и посовещавшись с заказчиком, мы решили, что это нехорошо, когда такой алгоритм пылится на полке и не приносит пользу обществу. С другой стороны выкладывать все исходники распознающей части не хотелось. Тогда и родилась идея, о которой пойдёт речь в этой статье.
image
Решили мы, собственно, сделать открытый сервер, который бы распознавал номера, приходящие http-запросами. Так как вся идея некоммерческая, то сервер, конечно, слабенький, но на то, чтобы народ игрался, надеюсь, его хватит.
А вот тут крутой поворот сюжета. Пост этот не про протокол обращения к серверу. Об этом будет следующий пост. Этот пост о программе, которую мы начали делать как пример работы с сервером, но которая вылилась в интересную на наш взгляд концепцию. В статье будет рассказано про Android-приложение, которым можно сфотографировать номер автомобиля… И обругать владельца бранным словом! Ну, или посмотреть статистику того, сколько раз сего автомобилиста обругали.
Те, кому невтерпёж, смогут расковырять работу с сервером из исходников в конце статьи. Остальных подержим пару дней в напряжении, а потом выложим законченный мануал.
Заинтриговал?

Подключение Macbook Pro к 10G Ethernet сети

Время на прочтение2 мин
Количество просмотров33K
В предыдущей статье рассматривалась не очень дорогая возможность запустить 10G Ehternet сеть для задач каталогизации и обработки фото и видео материалов.
А вот подключить к такой сети современный Macbook Pro не очень просто. С интерфейсами у этих ноутбуков дело обстоит, скажем так, специфично.
К обычной гигабитной сети Macbook можно подключить через USB3 — Gigabit Ethernet переходник. Если этой производительности достаточно, получаем хорошее бюджетное решение. Но не в нашем случае.
Остается единственный скоростной интерфейс этого ноутбука — Thunderbolt.
Готовых переходников ThunderBolt — 10G Ethernet вроде бы нет. Но несколькими производителями выпускаются так называемые Thunderbolt Expansion Chassis. Коробочки с парой Thunderbolt интерфейсов и одним или двумя PCIe слотами.
А в слоты эти можно поставить много чего. В том числе подходящую 10G карту.
Ключевое слово — подходящую. Далеко не всякая 10G карты Thunderbolt совместима. Производители этих «коробочек» такие карты тестируют и публикуют список совместимых.
Плюсом можно считать тот факт, что если карта хотя бы у одного производителя Expansion Chassis указана как совместимая, она скорее всего будет работать в продукции любого производителя «коробочек».

ThunderBolt-20140508207-3.JPG
Читать дальше →

Разбор RAW в браузере: как мы это делали

Время на прочтение4 мин
Количество просмотров23K
Привет, Хабр.

Хочется поделиться радостью — мы закончили разбор проприетарных RAW форматов с камер Canon и Nikon для нашего сервиса Pics.io. Для тех, кто не в курсе: основная идея Pics.io заключается в том, чтобы дать людям возможность работать с RAW фотографиями прямо в браузере. Без установки каких-либо программ, плагинов и расширений – настоящий zero footprint.

Когда мы начинали работать, было понимание, что в ближайшие годы цифровая фотография переедет в «облако». Мы знали, что тренд мобильности будет усиливаться, а цены на облачные хранилища снижаться. Тогда web’у не хватало только одного кусочка мозаики — адекватной обработки снимков. Было множество онлайн редакторов, в большинстве своём написанных на Flash, которые не могли удовлетворить фотографов в силу ряда ограничений: они работали с 8-bit JPEG, PNG и имели ограничение на размер файла. Мы решили сделать редактор с поддержкой RAW.

На тот момент у нас было несколько прототипов, работающих с DNG, которые доказывали, что всё это можно сделать на JavaScript и WebGL. Но мы, к сожалению, не могли заставить всех людей мира конвертировать свои фотографии в DNG. Даже у Adobe это не получилось. Мы понимали, что была необходима поддержка «родных» форматов, и несколько месяцев назад мы взялись за самые распространенные проприетарные форматы от Canon и Nikon.
Читать дальше →

Распознавание номеров: от А до 9

Время на прочтение9 мин
Количество просмотров171K
Уже пару раз на Хабре возникали дискуссии на тему того, как сейчас работает распознавание номеров. Но статьи, где были бы показаны разные подходы к распознаванию номеров, на Хабре пока не было. Так что здесь попробуем разобраться, как все это работает. А потом, если статья вызовет интерес, продолжим и выложим работающую модель, которую можно будет поисследовать.

image
Читать дальше →

Sol 610: «живая» панорама Марса и Curiosity

Время на прочтение1 мин
Количество просмотров34K


Сейчас работающие на Марсе и орбите этой планеты устройства отсылают на Землю массу фотографий. И практически все эти фотографии, при желании, может получить обычный человек.

Андрей Бодров, фотограф из Эстонии, собрал детальную панораму из 138 фотографий, сделанных марсоходом Curiosity в Sol 610. Фотографии эти получались посредством одной из камер ровера, MAHLI.

В результате получилась «живая» панорама шириной в 30 тысяч пикселей.

Читать дальше →

Пятьдесят оттенков инфракрасного

Время на прочтение4 мин
Количество просмотров134K
Не знаю как вам, а мне всегда было интересно: как выглядел бы мир, если бы цветовые каналы RGB в глазу человека были чувствительны к другому диапазону длин волн? Порывшись по сусекам, я обнаружил инфракрасные фонарики (850 и 940нм), комплект ИК фильтров (680-1050нм), черно-белую цифровую камеру (без фильтров вообще), 3 объектива (4мм, 6мм и 50мм) расчитанные на фотография в ИК свете. Что-ж, попробуем посмотреть.

На тему ИК фотографии с удалением ИК фильтра на хабре уже писали — на этот раз у нас будет больше возможностей. Также фотографии с другими длинами волн в каналах RGB (чаще всего с захватом ИК области) — можно увидеть в постах с Марса и о космосе в целом.

Читать дальше →

Съёмка показаний счетчика на телефон с последующим распознаванием

Время на прочтение20 мин
Количество просмотров189K

Вступление


Так сложилось, что я живу в коттеджном поселке, где нет центрального отопления, а значит, каждый греет свою квартиру самостоятельно. Чаще всего для этих целей используются газовые котлы, метод достаточно дешевый, жаловаться не на что, но есть одна тонкость. Для корректной работы газового котла (внезапно) необходимо наличие газа в трубе.

Возможно, так ведут себя не все котлы, но наш отключается даже при кратковременном перебое с подачей газа и не включается обратно, если подача восстановится. Если кто-то есть дома, то это не проблема, нажал кнопку и котел греет дальше, но если вдруг так сложилось, что мы решили всей семьей поехать в отпуск, а на дворе зима, хорошая такая, чтоб -20°C, то последствия могут быть плачевными.

Решение простое — оставить ключи родственникам/друзьям/соседям, чтобы они могли приехать и включить котел, случись какая-нибудь неприятность. Хорошо, если есть сосед, который будет каждый день заходить и проверять, всё ли в порядке. А если нет? Или он тоже решит уехать куда-нибудь на выходные?

Итак, я решил наладить выкладывание показаний счётчика куда-нибудь в Интернет, чтоб я мог находясь где-нибудь в дальней поездке периодически проверять, тратится ли газ, а если вдруг перестанет тратиться, то срочно звонить родственникам/друзьям/соседям (или кому там я оставил ключи), чтобы приехали и нажали кнопку.

Конечно, после простого выкладывания показаний в Интернет я решил не останавливаться на достигнутом и замутил ещё распознавание показаний и графическое представление, об этом читайте в части 2 данного топика.
Читать дальше →

Эффект параллакса (3D) с помощью Lens Blur в Google Camera

Время на прочтение1 мин
Количество просмотров59K
В то время как Lytro и прочие выпускают камеры светового поля, компания Google делает магию программными способами. Например, в режиме Lens Blur программа Google Camera использует Z-буферизацию и сохраняет карту глубины (depth map), то есть информацию о расстоянии до объектов.


Depth map в режиме Lens Blur

Несколько дней назад на Github опубликована программка LensBlurDepthExtractor.js, которая извлекает depth map из фотографий, сделанных в Google Camera.
Читать дальше →

Расширение к браузеру для извлечения текста из изображений

Время на прочтение1 мин
Количество просмотров95K
Naptha — очень полезное расширение для Chrome, которое автоматически распознаёт текст на всех картинках, загружаемых в браузер. С помощью этого расширения можно редактировать текст на картинках, выделять, копировать и переводить его. Это незаменимое расширение для копирования текста с отсканированных документов, фотографий, постеров, диаграмм, графиков, скриншотов и даже комиксов.
Читать дальше →

Цифровая стабилизация изображения со стационарных камер — корреляционный подход

Время на прочтение5 мин
Количество просмотров27K

Введение


Данную статью я решил написать после прочтения статьи «Массивно-параллельная стабилизация изображения», в которой описывается алгоритм для стабилизации изображения с поворотных камер. Дело в том, что в свое время мной был реализован алгоритм для стабилизации изображения со стационарных камер, который используется в IP-видеосервере MagicBox и некоторых других продуктах компании Синезис, в которой я работаю по настоящее время. Алгоритм получился достаточно удачным по своим скоростным характеристикам. В частности, в нем очень эффективно реализован алгоритм поиска смещения текущего изображения относительно фона. Эта эффективность позволила задействовать основные его элементы (конечно с некоторыми модификациями) для сопровождения объектов, а также для проверки их на неподвижность.

Алгоритм стабилизации включает в себя следующие основные элементы: обнаружение смещения для текущего кадра, компенсация данного смещения и периодическое обновление фона, относительно которого происходит стабилизация. Ниже я подробно распишу каждый из них.

Рис. 1 Стабилизация изображения иногда очень полезна.

Читать дальше →

Ближайшие события

Новый алгоритм распознавания изображений от Google способен распознавать CAPTCHA с точностью 99,8%

Время на прочтение1 мин
Количество просмотров66K


Сегодня команда проекта Google Street View опубликовала интересную новость. Дело в том, что разработчики сервиса создали новый алгоритм распознавания изображений, для того, чтобы с бОльшей точностью распознавать номера домов и названия улиц, сфотографированные автомобилями Google.



И этот алгоритм оказался весьма эффективным в другом деле — в распознавании CAPTCHA. Причем капчу от Google собственный алгоритм компании распознает с небывалой эффективностью — 99,8%. Это значительно лучший результат, чем показывает даже человек. Сами знаете, сколько раз порой нужно набрать символы капчи, прежде чем система признает их верно распознанными.

Читать дальше →

FineReader 12: новое в интерфейсе и сложности конвертирования достижений в проценты

Время на прочтение6 мин
Количество просмотров21K
Мы строили-строили и, наконец, построили!

Как понятно из названия, мы недавно обрелизились. В связи с этим под катом постараемся простым русским языком объяснить, чем хорош FineReader 12, чтобы те, кому он нужен, могли понять, бежать уже сейчас в онлайн-магазин за новой версией или спокойно ждать пару лет появления счастливой тринадцатой.

Читать дальше →

Автоматическая очистка фона изображений

Время на прочтение2 мин
Количество просмотров80K


Разработчики из компании Bonanza потратили более двух лет на создание программы для автоматического удаления фона с изображений. Задача оказалась гораздо сложнее, чем думали поначалу. Как оказалось, автоматическое удаление фона — одна из классических проблем компьютерного зрения, известная ещё с 80-х годов.

Как это часто бывает, если бы разработчики понимали всю сложность задачи, они бы вообще не брались за её решение. Но потом оказалось, что назад пути нет, и всё-таки им удалось добиться определённого успеха. 11 апреля они запустили конвертер Bonanza Background Burner, который неплохо очищает фон на произвольных фотографиях, при небольшой помощи или вовсе без неё. Доступ через API пока бесплатен, но в будущем владельцы сервиса что-нибудь придумают.
Читать дальше →

Любите ли вы их так сильно, чтобы посмотреть, что у них внутри?

Время на прочтение4 мин
Количество просмотров11K
Детьми мы «препарируем» свои игрушки, чтобы посмотреть, как они устроены. Когда вырастаем, у многих из нас привычка копнуть глубже переходит в пристальное «рассматривание» себя и себе подобных, и мы становимся психологами, хирургами или, на худой конец, самоедами. Еще мы готовы вглядываться бесконечно в объекты своей любви и интереса…
Сегодня мы предлагаем вам соединить нашу страсть к сканерам и вашу исследовательскую активность. Надеемся, вам понравится.

Итак, это скоростной документный сканер ЭЛАР СКАМАКС.
Читать дальше →

Бот для аркады. Часть №2: подключаем OpenCV

Время на прочтение12 мин
Количество просмотров42K

Введение

Продолжаем управлять миром разрабатывать бота для игры. Предыдущий разговор остановился на том, что контакт установлен: мышь бегает, изображение получается. Пора выделять объекты, это требует использование множества различных функции по обработке изображений. Можно, конечно, изобрести велосипед и написать эти функции самостоятельно, но лучше воспользоваться готовыми наработками.

Для обработки изображений возьмем широкораспространенную библиотеку OpenCV. Она неродная (unmanaged) для .net, поэтому подключим ее через wrapper OpenCvSharp.

OpenCV нам нужна для того, чтобы, применяя различные преобразования к изображениями, выбрать такое преобразование, которое отделит фон и тени от объектов, а объекты друг от друга. К этой цели и будем сегодня двигаться.


Затрагиваемые темы: выбор библиотеки для обработки изображений, выбор wrapper-а для работы с OpenCV, основные функции OpenCV, выделение движущихся объектов, цветовая модель HSV.


Читать дальше →

Радиотелескоп

Время на прочтение3 мин
Количество просмотров83K
Мы привыкли видеть мир в оптическом диапазоне и слышать в звуковом. Всем известно, что летучая мышь видит в темноте благодаря ультразвуковому локатору. Существует множество приборов, расширяющих человеческие возможности восприятия – к этому относится вся измерительная аппаратура. Она отображает всевозможные физические процессы в графическом или звуковом виде, доступном человеку.


Читать дальше →

Curiosity сфотографировал загадочное яркое свечение на Марсе

Время на прочтение2 мин
Количество просмотров91K

Curiosity запечатлел аномально яркое свечение на поверхности Марса. На фотографиях видна вертикальная полоса яркого света, которая как бы вырывается из недр Красной планеты.

На изображение с навигационной камеры (Navcam) ясно видно яркое пятно в верхнем углу снимка. Объясняется скорей всего столкновением космических лучей с детектором света или блеск солнечных лучей на скалах.
Читать дальше →

Вклад авторов