Обновить
57.37

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

В Photoshop добавили поддержку 3D-печати и Perspective Warp

Время на прочтение2 мин
Количество просмотров14K


Компания Adobe сегодня сообщила о большом обновлении графического редактора Photoshop CC. Главное изменение — это поддержка 3D-печати. Нужно отметить и анонс потрясающего нового режима перспективной деформации фотографий (Perspective Warp).
Читать дальше →

Программу NameTag для распознавания лиц правозащитники назвали «жуткой»

Время на прочтение2 мин
Количество просмотров166K


Новое приложение для смартфонов NameTag позволит проверить любого прохожего в социальных сетях и на сайтах знакомств. Увидели девушку в баре, навели камеру — и узнали имя и фамилию, возраст и где учится. Ещё удобнее, если у вас очки Google Glass, тогда проверять профили ещё проще.
Читать дальше →

Pngquant — библиотека и утилита командной строки для сжатия png с потерями

Время на прочтение1 мин
Количество просмотров11K
Вышла новая версия (2.0.1) утилиты.

Утилита позволяет преобразовывать png с 24 и 32 битами на пиксель в png с палитрой (8 бит).

Разработчики утверждают, что утилита в некоторых случаях позволяет уменьшить размер файла аж на 70% от исходного, сохраняя при этом альфа прозрачность (при этом утверждают, что прозрачность обрабатывается в IE6 лучше, чем у 24-битных png — не то, чтобы это всерьёз кого-то заботило...).

Особенности:

— создание новой палитры с использованием алгоритмов векторного квантования
— уникальный дизеринг, добавляющий к картинкам меньше шума, чем стандартный алгоритм Флойда-Стейнберга
— легко интегрируется со скриптам и gui (ну ещё бы, это же командная строка)
— есть ускоренный режим работы, для обработки большого кол-ва изображений

Давайте проверим. Под катом — картинки (сюрприз), i.e. — трафик.
Читать дальше →

GPU NVIDIA позволят проводить операции на работающем сердце

Время на прочтение1 мин
Количество просмотров27K
Скоро для операции на сердце — не будет нужды его останавливать и вскрывать грудную клетку пациента. Операцию будет производить хирург с помощью манипуляторов, подведенных к сердцу через небольшие проколы в груди пациента. Микрокамеры в реальном времени оцифровывают бьющееся сердце, строя его трёхмерную модель, а специальные алгоритмы предсказывают следующее положение области интереса сердца, и манипулятор следует вслед за ней — хирург работает в сопровождающей системе координат, в которой сердце неподвижно. Такой огромный поток данных невозможно обработать на обычных процессорах, но по словам разработчиков — производительности видеокарт хватает для обеспечения нужной скорости обработки информации.

Камера Эйнштейна: как один фотограф изображает время

Время на прочтение20 мин
Количество просмотров169K
Адам Мадьяр — компьютерный гик, бросивший университет, фотограф-самоучка, Руб Голдберг высоких технологий, путешественник по миру и художник-концептуалист с растущим мировым признанием. Но никто не мог предположить, что он может быть еще и террористом, до того утра, пока он не спустился на станцию метро Юнион-Сквер в Нью-Йорке.

В то время Мадьяр был погружен в долговременный проект на стыке технологий и искусства под названием Stainless («Безупречные»), создавая изображения высокого разрешения из проезжающих поездов и пассажиров, используя сложное, написанное им самим программное обеспечение и доработанную промышленную фотокамеру. Техника сканирования, которую он разработал — объединение тысяч кадров шириной в пиксель в одно изображение — позволяет ему заставать пассажиров врасплох, пока они с шумом и лязгом летят сквозь темные тоннели метро, фиксируя их в призрачных изображениях, наполненных деталями, которые не может запечатлеть ни одна обычная камера.

image
Читать дальше →

Вычисление фрактальной размерности Минковского для плоского изображения

Время на прочтение10 мин
Количество просмотров100K
Доброго времени суток читатель. Сегодняшний пост будет посвящен вычислению приближенного значения фрактальной размерности плоского изображения, которая тесно связано с размерности Минковского. Это интересно как минимум по двум причинам. Во-первых оказывается, что размерность ограниченного множества в метрическом пространстве может быть не только целым числом, но и любым неотрицательным. Во-вторых значение размерности контура изображения (а это ограниченное множество в метрическом пространстве) является хорошим признаком. В рамках сегодняшнего поста не предусмотрено исследование робастности этого признака, но давайте рассмотрим показательный пример. Множество различных характеристик клеток опухолей молочной железы, полученное в результате анализа снимков тонкоигольной пункционной биопсии. Множество данных состоит из 30 признаков (поля таблицы) с пометкой злокачественная или доброкачественная опухоль, и одним из признаков является как раз фрактальная размерность ядер клеток опухоли. Под катом вас ждет объяснение смысла фрактальной размерности множества, по возможности доступным языком, алгоритм вычисления приближенного значения этой размерности, его реализация на c# и ряд примеров с картинками. Возможно вы открыли этот пост только из-за картинки справа, это изображение я позаимствовал из инстаграмма Jennifer Selter, и в конце мы вычислим фрактальную размерность, так сказать филейной части Дженифер. Хочется кстати вас попросить ответить на пару вопросов в конце поста.

Читать дальше →

Инженеры Google рассказали об успехах в распознавании номеров домов с фотографий StreetView

Время на прочтение2 мин
Количество просмотров33K
Команда инженеров Google, возглавляемая парнем с дружелюбной фамилией Гудфеллоу (Ian Goodfellow, закончил университет по CS в 2009 году и может похвастаться солидным списком научных публикаций), опубликовала на arxiv.org работу, в которой отчиталась о своих успехах в сборе информации, которым располагает база проекта Google Street View — в частности, об автоматическом распознавании номеров домов с таким же качеством, как бы это делал человек. Красноречивый факт — Google может получить все номера домов во Франции (точнее, там где проехал гугломобиль) за время менее часа.

Работа называется Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks и в ней речь идёт о использовании нейронных сетей для целей распознавания. Как очевидно, дело сильно осложняется множеством факторов: разные места расположения номера дома, цвет таблички, её всевозможные наклоны, качество как самой таблички, так и её фотографии, и целый ряд других.
Узнать подробности

Обучение OpenCV каскада Хаара

Время на прочтение8 мин
Количество просмотров200K
На хабре уже есть несколько статей и про то, что такое каскад Хаара (раз, два, три). Есть даже одна, где затронут процесс обучения, но в отношении описанной задачи. На тему обучения есть пара неплохих статей на английском (первая, вторая, третья), но, на мой взгляд, они путанные: либо рассказывают очень мало, либо слишком много и обо всём — выделить нужную мысль сложно.
image
В этой статье я попробую показать, как обучить каскад с нуля за несколько часов, натренировав на поиск простого предмета в видеопотоке (примером будет очаровательная сова с фотографии). Все обучающие выборки и программы будут приложены.
Зачем всё это нужно? Каскад Хаара это один из простейших способов распознавания классов объектов с большой скоростью работы. К ним относятся лица и руки людей, номера автомобилей, пешеходы. Детектором Хаара просто находить животных в кадре (кстати, удивительно, что я не видел ещё ни одной автоматической кормушки для синиц на raspberry pi). К тому же, готовые реализации OpenCV есть под большинство существующих систем (даже для blackfin'a встречал). Всё это делает Хаара одним из самых удобных методов, позволяющих решать задачи видеообработки даже людям, которые никогда не работали с обработкой видео.
Читать дальше →

Видеонаблюдение на Raspberry Pi

Время на прочтение3 мин
Количество просмотров155K
Доброе время суток!

В предновогоднюю ночь у меня возникла идея соорудить некое подобие видеонаблюдения. Все необходимое у меня имелось на руках:
  • Одноплатный компьютер Raspberry Pi Model B
  • Web-камера LOGITECH HD Webcam C270

Прочитав статью я решил немного развить идею автора.

Основное отличие моей идеи от идеи автора заключается в том, что у меня присутствует возможность просмотра событий в режиме реального времени без потери основной функции — видеозаписи.
Читать дальше →

Какого цвета Луна?

Время на прочтение5 мин
Количество просмотров172K
Вопрос, вынесенный в заголовок, кажется, очень странным. Ведь каждый видел Луну и знает ее цвет. Однако на просторах интернета периодически встречаются носители идеи о всемирном заговоре, скрывающем истинный цвет нашего естественного спутника. Рассуждения о цвете Луны являются частью необъятной темы о “лунном заговоре”. Некоторым кажется, что цементный цвет поверхности, который присутствует на снимках астронавтов программы Apollo, не соответствует действительности, и “на самом деле” цвет там другой.

Новое обострение теории заговора вызвали первые снимки китайского спускаемого аппарата Chang’e 3 и лунохода Yutu. На самых первых кадрах с поверхности, Луна оказалась больше похожей на Марс, чем на серебряно-серую равнину, со снимков 60-х и 70-х годов.



Обсуждать эту тему бросились не только многочисленные доморощенные разоблачители, но и некомпетентные журналисты некоторых популярных СМИ.

Попробуем разобраться, что там за секреты с этой Луной.
Читать дальше →

Служба Automator, загружающая изображения на Яндекс.Фотки

Время на прочтение2 мин
Количество просмотров7.3K
К созданию этой службы меня подтолкнул пост Скрипт Automator, загружающий изображения на Habrastorage, а точнее, вот этот комментарий.

Итак, в чем же сложность написания подобной службы? В том, что для загрузки изображений требуется OAuth токен, т.е. необходимо как-то его получить (и сохранить для последующего использования). Конечно же, можно создать собственное OAuth приложение и получить токен вручную. Но это не наш метод.

Читать дальше →

Восстановление лиц по отражению в зрачке

Время на прочтение2 мин
Количество просмотров59K


Учёные из университета Глазго и университета Йорка (Великобритания) опубликовали работу с описанием техники поиска «скрытых» лиц на фотографиях по отражениям в зрачке. Авторы исследования считают, что этот метод можно использовать для криминалистической экспертизы. Например, в зрачках на фотографии жертвы может оказаться лицо преступника. Кадры с фотоаппарата, изъятого в процессе расследования, тоже можно изучать для восстановления картины произошедшего.
Читать дальше →

Portable Network Javascript

Время на прочтение3 мин
Количество просмотров34K

Приукрасим забытое старое


Для начала — небольшая картинка в качестве эпиграфа. Продолжение — под катом.

image
Читать дальше →

Ближайшие события

NASA выложила в открытый доступ 17000 фотографий программы «Аполлон»

Время на прочтение1 мин
Количество просмотров119K


Судя по всему, у сторонников конспирологических теорий о рептилоидах фальшивых полетах человека на Луну в ближайшие годы появится очень много работы :) Дело в том, что NASA выложило в открытый доступ целых 17000 фотографий, сделанных в рамках программы «Аполлон» — всего цикла. В числе выложенных фото есть и очень известные снимки, и те, которые многие из нас увидят впервые.

Читать дальше →

Поиск чёрных дыр на домашнем компьютере

Время на прочтение1 мин
Количество просмотров25K


В центре почти каждой галактики находится чёрная дыра. Чем больше галактика — тем больше чёрная дыра и более заметен тот великолепный эффект, который она оказывает на окружающее пространство-время. Сверхмассивные чёрные дыры втягивают в себя материи в миллиарды раз больше по весу, чем наше Солнце, и случайно способствуют возникновению ярких излучателей энергии на свои границах. Обычно эти излучатели не транслируют в видимом диапазоне излучения, но их можно обнаружить с помощью радиотелескопов.
Читать дальше →

Глобальная карта ветров почти в режиме реального времени

Время на прочтение1 мин
Количество просмотров100K


Любой прогноз погоды привлекает внимание огромного количества людей. Не напрасно «погодные» сайты являются одними из наиболее посещаемых сайтов в мире. Для того, чтобы человек знал, какая погода ждет его в ближайшем будущем, производители мобильного и десктопного ПО создают приложения, показывающие температуру, скорость ветра, возможность выпадения осадков и многое другое.

Читать дальше →

Соревнования по распознаванию изображений ImageNet 2013

Время на прочтение3 мин
Количество просмотров15K
В декабре 2013 завершились ежегодные соревнования по распознаванию визуальных образов ImageNet Large Scale Visual Recognition Challenge 2013 (ILSVRC2013), спонсируемые проектом ImageNet , который представляет собой огромную базу изображений. В настоящее время в базе имеется более 14 миллионов изображений.
Участники соревнований решали три задачи, описанные под катом.
Читать дальше →

Изобретаем JPEG

Время на прочтение28 мин
Количество просмотров179K

Вы правильно поняли из названия, что это не совсем обычное описание алгоритма JPEG (формат файла я подробно описывал в статье «Декодирование JPEG для чайников»). В первую очередь, выбранный способ подачи материала предполагает, что мы ничего не знаем не только о JPEG, но и о преобразовании Фурье, и кодировании Хаффмана. И вообще, мало что помним из лекций. Просто взяли картинку и стали думать как же ее можно сжать. Поэтому я попытался доступно выразить только суть, но при которой у читателя будет выработано достаточно глубокое и, главное, интуитивное понимание алгоритма. Формулы и математические выкладки — по самому минимуму, только те, которые важны для понимания происходящего.

Знание алгоритма JPEG очень полезно не только для сжатия изображений. В нем используется теория из цифровой обработки сигналов, математического анализа, линейной алгебры, теории информации, в частности, преобразование Фурье, кодирование без потерь и др. Поэтому полученные знания могут пригодиться где угодно.

Если есть желание, то предлагаю пройти те же этапы самостоятельно параллельно со статьей. Проверить, насколько приведенные рассуждения подходят для разных изображений, попытаться внести свои модификации в алгоритм. Это очень интересно. В качестве инструмента могу порекомендовать замечательную связку Python + NumPy + Matplotlib + PIL(Pillow). Почти вся моя работа (в т. ч. графики и анимация), была произведена с помощью них.

Внимание, трафик! Много иллюстраций, графиков и анимаций (~ 10Мб). По иронии судьбы, в статье про JPEG всего 2 изображения с этим форматом из полусотни.
Читать дальше →

Поиск кропнутых дубликатов изображений с помощью перцептуальных хешей

Время на прочтение6 мин
Количество просмотров73K
В этой статье пойдет речь о том, как решалась небольшая задачка поиска дубликатов по фрагменту или кропу картинки.



Читать дальше →

Орел украл камеру у экологов, запечатлев свой полет и самого себя

Время на прочтение1 мин
Количество просмотров70K


Обычно при использовании какой-либо техники предусмотрены случаи порчи оборудования, выхода из строя с течением времени и прочее. Но никто не закладывает в бюджет исследований убытки от воровства техники животными. И напрасно — на днях стало известно о том, что орел украл у ученых, ведущих постоянную запись жизни австралийских крокодилов, живущих в соленой воде, камеру. Вероятно, птица решила, что камера — нечто вкусное, и унесла технику подальше от места происшествия, решив расклевать ее потом. Камера запечатлела и полет орла, и его разочарованный вид после того, как птица поняла, что поживиться не удастся.

Читать дальше →

Вклад авторов