Все потоки
Поиск
Написать публикацию
Обновить
46.7

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Генетический алгоритм для генерации лиц

Время на прочтение1 мин
Количество просмотров8.4K
Что будет, если генератор случайных фигур соединить с детектором лиц? Способен ли эволюционный алгоритм путём случайных мутаций сгенерировать человеческое лицо? Разработчик программы Pareidoloop отвечает на этот вопрос утвердительно (генератор протестирован только в Chrome 21).


(с) spiritedflow
Читать дальше →

Фото после каждого коммита (Win)

Время на прочтение1 мин
Количество просмотров2K
Приятного времени суток!

Ох, жуть как зацепила статья alizar Фотографируемся после каждого коммита (Linux, OSX). Но в силу особенностей своей ОС, предложенные решения мне, слегка, не подошли. Проведя немного времени в поисках и не получив искомого результата, было принято решение сделать что-то простенькое (just for fun, with Demonix) для решения данной задачи…
Читать дальше →

Восстановление расфокусированных и смазанных изображений. Практика

Время на прочтение10 мин
Количество просмотров358K
Не так давно я опубликовал на хабре первую часть статьи по восстановлению расфокусированных и смазанных изображений, где описывалась теоретическая часть. Эта тема, судя по комментариям, вызвала немало интереса и я решил продолжить это направление и показать вам какие же проблемы появляются при практической реализации казалось бы простых формул.

В дополнение к этому я написал демонстрационную программу, в которой реализованы основные алгоритмы по устранению расфокусировки и смаза. Программа выложена на GitHub вместе с исходниками и дистрибутивами.

Ниже показан результат обработки реального размытого изображения (не с синтетическим размытием). Исходное изображение было получено камерой Canon 500D с объективом EF 85mm/1.8. Фокусировка была выставлена вручную, чтобы получить размытие. Как видно, текст совершенно не читается, лишь угадывается диалоговое окно Windows 7.



И вот результат обработки:



Практически весь текст читается достаточно хорошо, хотя и появились некоторые характерные искажения.

Под катом подробное описание проблем деконволюции, способов их решения, а также множество примеров и сравнений. Осторожно, много картинок!
Читать дальше →

Фабрика картинок — как оно работает? Часть 1

Время на прочтение5 мин
Количество просмотров3.6K
Хочется рассказать немного о технической части своего проекта, возможно для критики а может кто-то почерпнет что-то для себя.
Читать дальше →

Super-resolution из единственной фотографии

Время на прочтение2 мин
Количество просмотров34K
В обработке изображений существует класс методов Super-resolution (SR), которые позволяют качественно увеличить разрешение исходного изображения, при этом происходит преодоление оптического предела объектива и/или физического разрешения цифрового сенсора, который записал изображение.

Алгоритмы SR используют два подхода для вычисления результирующего изображения: 1) на базе множества кадров одного объекта; 2) самообучающаяся система с базой образцов.


Читать дальше →

CCV: современная библиотека компьютерного зрения

Время на прочтение1 мин
Количество просмотров15K
Спустя два года разработки состоялся релиз библиотеки ccv 0.1, которая использует ряд современных алгоритмов компьютерного зрения.

Библиотека ccv написана на C и позиционируется как компактная, лёгкая альтернатива OpenCV, поэтому из неё старательно изъяты все несущественные функции. Таким образом, ccv предназначена не для экспериментов с разными алгоритмами, а для практического использования в конкретных приложениях.
Читать дальше →

Фотография атомной тени

Время на прочтение1 мин
Количество просмотров2.2K

Тень атома иттербия, фото до и после фильтрации

Учёные из Центра квантовой динамики при университете Гриффита (Брисбен, Австралия) сумели первыми в мире сфотографировать тень отдельного атома. Учёные приблизились к теоретическому пределу микроскопии, потому что отдельный атом — это минимальный объект, который можно разглядеть в видимом свете.
Читать дальше →

Просмотр RAW-файлов средствами Windows

Время на прочтение2 мин
Количество просмотров187K
Если говорить о программе для просмотра RAW-файлов под Windows 7, ранее я бы, без сомнений, посоветовал вам на infranView с установленными плагинами. Другие наверняка бы рекомендовали ACDSee.

«Продвинутые» для этого используют LightRoom либо Aperture — если речь идёт не о Windows, а о Mac OS. Эти пакеты, без сомнений, необходимы для пакетной обработки изображений, но вот для предварительного просмотра и навигации по твоей съёмке — не очень.

Однако, на сегодня оказывается, есть более «нативное» и приятное для работы под Windows решение:
Читать дальше →

JPEG сжатие картинки с альфа-каналом или SVG masks

Время на прочтение5 мин
Количество просмотров11K
Привет, Хабр! Недавняя статья про сжатие в png-8 с сохранение полупрозрачности, напомнила мне об одной технике, которая позволяет применять на сайтах изображения с альфа-каналом, при этом используя алгоритм сжатия с потерями — JPEG, что позволяет существенно сократить их объём.
Читать дальше →

Современные аналоговые компьютеры: есть будущее?

Время на прочтение5 мин
Количество просмотров35K
Большинство из нас связывает развитие информационных технологий с цифровой революцией. Появление микропроцессоров, конечно, вывело электронику на принципиально новый уровень. Уже гонки за обладание самым мощным суперкомьютером потеряли свой научный шарм — терафлопсы прямо зависят от количества денег и свободного места. Докупай серверов и увеличивай вычислительную емкость.

Еще со времен университета меня преследует мысль, которую мне хотелось бы закинуть на обсуждение хабрасообществу.

До цифровой эпохи развивалось направление аналоговых компьютеров.
Где они сейчас? Есть ли им применение?

Краткая история проекта OpenCV

Время на прочтение5 мин
Количество просмотров38K
Автор: Кирилл Корняков, лидер команды разработчиков в Itseez.

Привет, Хабр!

image

Этой записью мы открываем блог компании Itseez (от англ. it sees — «оно видит!»). Компания основана адептами компьютерного зрения, проработавшими в этой области более 13 лет, среди которых есть участники проекта OpenCV с первого дня его существования. Наша стратегия связана с разработкой технологий и продуктов в области компьютерного зрения под девизом ”Vision that works!”. Наши клиенты — Willow Garage, NVidia, Intel, Microsoft, несколько менее известных компаний и стартапов. На сегодняшний день коллектив Itseez — это команда из 40 инженеров и исследователей, многие сотрудники активно участвуют в образовательной деятельности: преподают в университете, публикуются в журналах и выступают на конференциях, а также проводят школы по компьютерному зрению.

На страницах блога мы бы хотели рассказывать о том, что интересного происходит в реальном и кибер-пространстве вокруг нас, а также в мире компьютерного зрения. Мы надеемся, что публикуемые материалы будут интересны людям, близким к машинному обучению, робототехнике, вычислительной фотографии, технологиям интеллектуального видеонаблюдения и дополненной реальности, а также к смежным направлениям Науки и Техники. Важной особенностью Itseez является то, что многие наши разработки являются open-source, поэтому мы постараемся подкреплять свои слова примерами реального кода.

Поскольку это первая запись в нашем блоге, хотелось бы поделиться чем-то интересным, поэтому мы расскажем о ключевом проекте компании — о разработке библиотеки алгоритмов компьютерного зрения OpenCV (о своем вкладе в ROS (Robot Operating System) и PCL (Point Cloud Library) мы пока умолчим). Подготовленный читатель, вероятно, удивится, задавшись вопросом: “Но ведь OpenCV разрабатывается Intel / Willow Garage!”, и будет прав, но лишь отчасти. Действительно, далеко не все знают, что большинство ведущих разработчиков OpenCV живут и трудятся в России, в городе Нижний Новгород, и являются сотрудниками компании Itseez. Поэтому, чтобы устранить недоразумения, первый пост мы решили посвятить краткому изложению истории OpenCV. Также, пользуясь случаем, в заключении мы поделимся некоторой инсайдерской информацией о будущем проекта.
Читать дальше →

Фотографируемся после каждого коммита (Linux, OSX)

Время на прочтение1 мин
Количество просмотров4K
Программа imagesnap (OSX) позволяет делать фотографии веб-камерой из командной строки. Например, она может автоматически фотографировать программиста после каждого коммита в репозиторий git, нужно всего лишь добавить следующий код в .git/hooks/post-commit.

#!/usr/bin/env ruby
file="~/.gitshots/#{Time.now.to_i}.jpg"
puts "Taking capture into #{file}!"
system "imagesnap -q -w 3 #{file}"
exit 0

Потом кадры собираются в видеоролик программой tlassemble.
Читать дальше →

Формирование высокоуровневых признаков с помощью широкомасштабного эксперимента по обучению без учителя

Время на прочтение5 мин
Количество просмотров25K
В статье Распознавание лиц человеческим мозгом: 19 фактов, о которых должны знать исследователи компьютерного зрения упоминался экспериментальный факт: в мозге примата имеются нейроны, селективно реагирующие на изображение морды лица (человека, обезьяны и т.п.), причем средняя задержка составляет около 120 мс. Из чего в комментарии я сделал дилетантский вывод о том, что зрительный образ обрабатывается прямым распространением сигнала, и количество слоёв нейронной сети — около 12.

Предлагаю новое экспериментальное подтверждение этого факта, опубликованное concretely нашим любимым Andrew Ng.
Читать дальше →

Ближайшие события

Krakako — плагин для Adobe Photoshop

Время на прочтение2 мин
Количество просмотров4.7K
Krakako 'click & share' plugin

С помощью данного плагина Вы сможете в один клик поделиться изображением с друзьями/коллегами/клиентами.

Читать дальше →

Четверть века исполнилось формату GIF

Время на прочтение2 мин
Количество просмотров2.3K
Ровно 25 лет назад 15 июня 1987 специалистами фирмы CompuServe, которая сейчас является подразделением AOL, был создан формат растровых изображений GIF (Graphic Interchange Format) специально для передачи в глобальных компьютерных сетях.

Формат GIF характеризуется следующими свойствами:
  • Размер картинки — от 1х1 до 65535х65535 пикселов.
  • Число цветов палитры — от 2 до 256.
  • Каждый цвет палитры имеет глубину 24 бита/пиксел (выбор из 16 миллионов цветов).
  • Карта прозрачности — 1-битная (полупрозрачных цветов нет).
  • Число повторов анимации — от 1 до 65535, а также бесконечное.
  • Время показа одного кадра анимации — от 1/100 секунды до 655 секунд.
  • Число кадров анимации — неограниченно.
  • Число невидимых текстовых комментариев и размер каждого комментария — неограниченны.


Технически способность создания компактных цветных картинок в формате GIF основана на алгоритме сжатия данных, который в 1977 году разработали израильские специалисты по теории информации Яков Зив (Jacob Ziv) и Авраам Лемпель (Abraham Lempel); алгоритм получил наименование LZ (Lempel-Ziv) по первым буквам фамилий его создателей. Позднее — в 1984 году — Терри Велч (Terry Welch), сотрудник фирмы Unisуs, улучшил реализацию алгоритма Зива-Лемпеля, и, таким образом, метод сжатия сейчас известен под названием LZW (Lempel-Ziv-Welch)
Узнать подробности

Японцы разработали виртуальных аватаров

Время на прочтение1 мин
Количество просмотров2.5K


Похоже на то, что многие любители анонимности и виртуальных превращений (включая зрелых мужчин, общающихся в чЯтиках в качестве 15-летних школьниц, причем без всякого на то злого умысла), вскоре получат еще один интересный инструмент. Не для работы, нет — для запутывания собеседников развлечений. Команда японских разработчиков создала специализированное ПО, позволяющее получить виртуального аватара, в точности повторяющего ваши движения и мимику.

Читать дальше →

Телеприставка Intel с распознаванием лиц

Время на прочтение1 мин
Количество просмотров2.1K


Компания Intel готовит к запуску собственный телевизионный сервис (приставка + подписка), ключевой функцией которого будет распознавание лиц зрителей, сидящих перед телевизором. Предполагается, что это позволит показывать таргетированную рекламу и давать более точные рекомендации по просмотру передач.

Система будет определять пол и возраст зрителя, так что мужчина никогда не увидит рекламу женских товаров, а детям вообще можно запретить просмотр рекламы на программном уровне.
Читать дальше →

Применение SURF для создания маркера дополненной реальности

Время на прочтение6 мин
Количество просмотров20K

Применение SURF для создания маркера дополненной реальности


Это продолжение топика о дополненной реальности. Вот здесь первая часть. В обсуждении топика юзером Inco были показаны интересные результаты его работы в направлении распознавании маркера дополненной реальности Видео.На тот момент времени не оказалось, но через пару месяцев мне стало интересно как всё это работает, насколько устойчив подход — и свободные часы нашлись. Представляю вам свою реализацию этой идеи, который вылился в доклад на вот этом событии.

Читать дальше →

Триангуляция против эффекта Доплера: битва технологий на футбольном поле

Время на прочтение3 мин
Количество просмотров3.6K

Триангуляция мяча по шести видеокамерам в системе Hawk-Eye, точность 3,6 миллиметра, 25% мяча должны быть видимы

Международный совет футбольных ассоциаций (IFAB) приступил к финальным тестам систем отслеживания мяча при пересечении линии ворот. 2 июля 2012 года на специальной встрече в Киеве совет IFAB должен вынести окончательный вердикт и официально внести изменения в футбольный устав, если одобрит одну (или обе) технологии.

Начало конкурса инициировала ФИФА в июле 2011 года, опубликовав технические спецификации. Первоначально для участия заявились 12 систем. В первых тестах осенью 2011 года участвовали восемь, а в финал вышли две: Hawk-Eye и Goalref.
Читать дальше →

Как работает приложение InstaCRT?

Время на прочтение1 мин
Количество просмотров2.4K
Эстетика ретро-фотографий, столь удачно продвинутая на рынок модным хипстерским приложением Instagram, не оставляет разработчиков равнодушными. И, судя по всему, привлечение пользователей к своим творениям не означает только лишь программирование и обычные приёмы маркетинга.

Некто Мартин Стром (Martin Ström), разработчик из Стокгольма, создал приложение InstaCRT для iOS, которое имеет одну функцию — наложение фильтра на изображение так, что создаётся впечатление картинки на старых ламповых чёрно-белых телевизорах.

Готовое фото выглядит так:



Однако, самое любопытное заключается не в этом, а в том, что находится «под капотом» InstaCRT. Приложение работает таким образом:
Узнать подробности

Вклад авторов