Обновить
59.92

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Укрощение строптивого (на самом деле, нет) FineReader

Время на прочтение7 мин
Количество просмотров46K

После короткого рассказа о том, как устроен ABBYY FineReader (aka «теоретическая часть»), самое время перейти к применению полученных знаний. И да, котиков под катом нет: всё очень серьёзно.

Как пользователю поучаствовать в обработке документа


Чтобы не изобретать велосипед, начну с простой и понятной схемы из Справки (см. рисунок справа).

Теперь, зная список всех операций, посмотрим на примерах – что может пойти не по плану и как с этим бороться.
Читать дальше →

Распознавание и автоматическое решение уравнений

Время на прочтение1 мин
Количество просмотров36K


Бесплатное приложение PhotoMath пригодится многим школьникам. При наведении камеры на уравнение программа распознаёт математические символы в формуле (работает OCR), производит вычисления — и выдаёт правильный ответ.

Идея настолько проста, что здесь даже нечего объяснять. Возникает только два вопроса: почему никто не сделал это раньше и почему этого не было, когда я учился в школе.
Читать дальше →

На пути к профессиональному использованию современных OCR. Understanding FineReader

Время на прочтение7 мин
Количество просмотров11K
Я занимаюсь разработкой технологий, используемых в продуктах распознавания текста компании ABBYY. Самым известным продуктом (а точнее – семейством продуктов), использующим эти технологии, является FineReader.

Что я понимаю под «технологиями»
Иногда все технологические модули (невидимые пользователю части программы) вместе называют «движком распознавания» («движок» — от английского «Engine»), что не совсем верно – они выполняют не только распознавание символов, но и кучу других действий, подробнее о которых ниже.


Чем занимается программа FineReader?


Сейчас любой из настольных вариантов FineReader может проделать все самостоятельно от получения изображения со сканера, камеры или из готового файла до выдачи результата обработки в файл или в указанное приложение, так, что человек остается «за кадром». Программа сама «распознаёт» всё что нужно (в кавычках, так как при этом программа определяет места расположения текста, таблиц, картинок, OCRит обнаруженные участки с изображённым текстом, формирует документ, который сохраняет в желаемом формате с указанными настройками)
Пара скриншотов




А чем занимается пользователь?


Читать дальше →

Оптические приборы вытесняют ведро Третьякова

Время на прочтение3 мин
Количество просмотров20K
Не смотря на сумасшедший темп развития технологий на планете, существуют такие консервативные области знания, где любая новация может появиться только спустя десятилетия пристальных сравнительных экспериментов. Одна из таких областей — метеорология. Плюсы и минусы такого положения на примере конкретного измерительного прибора — осадкомера — предлагаю пообсуждать под катом.

Подробнее

Imgur предлагает перейти на gifv: как gif, только легче, качественнее и без тормозов

Время на прочтение1 мин
Количество просмотров77K
Гифки сейчас повсюду — но сам формат, несмотря на свою художественную выразительность, остаётся архаичным — .gif был создан в 1989 году, он старше многих читателей этого поста — в результате имеем анимацию в небольших разрешениях, часто посредственного качества и почти всегда — огромного веса. Один из крупнейших картингохостингов мира Imgur устал тратиться на расширение серверов взялся исправить ситуацию, представив проект .gifv.


Пример привычной всем гифки

По сути, это просто контейнер для .mp4-видео, лишённого всех кнопок управления видео вроде паузы и промотки, проще говоря — зацикленное видео без звука.
Читать дальше →

Optical Character Recognition силами .NET

Время на прочтение4 мин
Количество просмотров9.4K
Для примера я создал на популярной площадке, которая отображает номера в виде картинок, объявление.

Читать дальше →

Что будет если смешать орехи, Arduino, OpenCV и Delphi. Часть 2

Время на прочтение4 мин
Количество просмотров15K
В первой части я пытался отбирать орехи без OpenCV, и был не прав.
Программируя на Делфи еще с института, начиная с версии 2, хоть и будучи довольно близко знакомым с другими ЯП, я все же начал искать заголовки именно для Делфи. И нашел.
Скомпилировав пример EdgeDetect, и увидев результаты, я осознал, что OpenCV инструмент действительно мощный, простой и быстрый. Спасибо хорошим людям за паскалевые заголовочные файлы к C интерфейсу этой замечательной библиотеки, ведь они дали мне возможность писать в среде привычного для меня RAD. Определившись с ЯП, я начал разрабатывать ПО с нуля, в данной статье описаны мои победы и злоключения, и прошу, не судите больно, это только вторая моя статья на хабре.
Читать дальше →

Что будет если смешать орехи, Arduino, OpenCV и Delphi. Часть 1

Время на прочтение4 мин
Количество просмотров19K
Привет, хабровчанин.

Писатель из меня не очень, на это неоднократно указывали мне учителя в школе после прочтения моих сочинений. Не то что что-бы суть не была изложена, меня упрекали в сухости и лаконичности повествования. Тогда мне это казалось придирками, ведь лаконичность — это замечательно. Но не для писателя. В этот раз я попытаюсь исправится, ведь с того времени прочитаны тонны сайфая. Такова преамбула, и не исключено, что осиливший этот текст до конца всплакнет кровавой слезой, но я предупредил.

Удосужилось мне счастливо жить в небольшом городке в центральной Украине. Причины сего мне не известны, но каждую осень колхозный рынок превращается в биржу по торговле грецким орехом, его везут со всей округи. Все покупают и продают как одетый так и раздетый орех. Ажиотаж затрагивает как профессиональных перекупщиков, так и пенсионеров, мне при этом почему-то вспоминаются голландские тюльпаны. Но история началась летом.

С моим кумом мы владеем небольшим компьютерным магазинчиком, где он продает, а я занимаюсь мелким ремонтом и программированием. В очередной раз приехав с недельного отдыха с палатками на берегу реки, загоревший и нарыбачившийся вдоволь я сидел и что-то паял в своем кабинете, который я лаского зову «склеп» по причине обилия мертвого железа и постоянной температуры окружающей среды.

— К тебе пришли.

Я вышел из склепа и познакомился с парнем немного старше меня по имени Андрей. На ладони у него были половинки ядер грецкого ореха, одно темно-коричневое, почти черное, другое — светлое, практически бежевое. Андрей предложил работу, нужно было программно отделять первые от вторых. Это была первая ошибка. Нет, не подумайте плохо, ошибка не в том, что он связался со мной, а в том что принес мне настолько разные примеры. Мне была дана полная свобода в плане платформ и реализаций. Хоть и было предложено использовать камеры, я их отбросил, ввиду, как мне тогда показалось, сложности реализации и ресурсоемкости такого подхода. В качестве сенсора был выбран датчик tcs3200 — преобразователь цвет->частота, такие часто используют в DIY проектах по сортировке чего-нибудь цветного. По даташиту датчик имел хорошие характеристики: имел по 16 фотодиодов каждого цвета(R/G/B) плюс отдельно 16 фотодиодов для белого цвета. Глубина чувствительности каждого канала была заметно выше 8 бит на канал, которые предлагает бытовая вебкамера. Первая версия устройства представляла собой картонную трубу от пищевой фольги с вырезанным окошком для датчика и подсветки. Данные с максимально-возможной скоростью передавались в виндовое приложение. Получалось около 600 замеров в секунду.
Читать дальше →

Метод ADI для непосредственного наблюдения экзопланет — как это работает

Время на прочтение5 мин
Количество просмотров13K
Telescope

[От переводчика] Наверное многие, когда речь заходит о поиске экзопланет, представляет себе человека, смотрящего в окуляр огромного телескопа. К сожалению, это так не работает. Даже для самых лучших современных телескопов наблюдение экзопланеты — сложная задача, так как сами планеты имеют маленький размер, а их излучение чрезвычайно сложно отличить от излучения звезды. Для этого применяют ряд интересных методов, один из которых — ADI (Angular Differential Imaging) — и будет рассмотрен в этой статье.
Читать дальше →

Шумоподавление путем объединения изображений на Java

Время на прочтение5 мин
Количество просмотров22K
Здраствуй, Хабр! Хочу поделиться кодом простой программы, которую я использую для уменьшения шума с цифровых фотограффий.

Примерно восемь лет назад, рассматривая фотографии, снятые на свой первый цифровой фотоаппарат, я обнаружил, что некоторые снимки с тусклым освещением имеют какую-то странную мутность, цветные пятна, не резкость. В то время я еще не знал, что такое шум, как он зависит от параметра ISO и был очень разочарован, что фотоаппарат такой «некачественный». Однако, я обратил внимание, что на одинаковых снимках эти цветные пятна выглядят несколько по разному, меняются от кадра к кадру. Время шло, я научился снимать на ручных настройках, узнал, что такое шум, как правильно выставить светочуствительность и т.д.

Спустя несколько лет, когда уже начал заниматься программированием, снова обратил внимание на то, что шум на изображениях не является статичным. В голове возникла идея: а что если взять, снять несколько абсолютно одинаковых изображений, а потом неким образом объединить их, устранив разность между снимками, т.е. шум?

Итак, ниже представлены 4 изображения, демонстрирующие некие фотографии одного и того-же обьекта, со случайным шумом на каждом снимке. В качестве объекта представлены красные круги, в качестве шума — белые.

пример снимков
Читать дальше →

Как бороться с репостами или пара слов о перцептивных хешах

Время на прочтение11 мин
Количество просмотров31K
В этой публикации речь пойдет о подходах к построению перцептивный хешей изображения и возможностях их использования (например, поиск дубликатов).

перцептивный хэш-алгоритмы описывают класс функций для генерации сравнимых хэшей. Они используют различные свойства изображения для построения индивидуального «отпечатка». В дальнейшем эти «отпечатки» можно сравнивать друг с другом.

Если хэши отличаются, значит, данные разные. Если хэши совпадают, то данные, скорее всего, одинаковые (поскольку существует вероятность коллизий, то одинаковые хэши не гарантируют совпадения данных). В этой статье речь пойдет о нескольких популярных методах построения перцептивный хешей изображения, а также о простом способе борьбы с коллизиями. Всем кому интересно, прошу под кат.
Читать дальше →

Поиск простого на сложном: tips & tricks

Время на прочтение5 мин
Количество просмотров20K
Достался мне тут довольно интересный проектик: на рентгенограммах сварных швов находить проволочные образцы стандартных размеров. Казалось бы, сколько уже было написано по поводу поиска паттернов на изображении, выработаны стандартные подходы и методики, но когда речь заходит о реальных задачах академические методы оказываются не настолько эффективны, как от них ожидается. Для затравочки, попробуйте найти здесь все семь проволочек:

image

Читать дальше →

Биометрическая система на мобильном телефоне

Время на прочтение6 мин
Количество просмотров22K
Я работаю в области биометрических технологий и хочу описать одно из решений, претендующее на то, чтобы в скором будущем прочно войти в наш обиход. Речь идет о биметрической системе аутентификации пользователя, которой можно пользоваться на любом современном смартфоне, и которая предназначена для удобного (!) и надежного разграничения доступа к различным мобильным сервисам, как банковским, медицинским, так и любым другим приложениям.

В последнее время все большее количество компаний используют возможности сети интернет для предоставления своих услуг. Как правило, архитектура таких приложений представляет собой использование технологии «тонкий клиент», которая подразумевает централизованное хранение данных клиента и предоставление доступа к ним только по специальному запросу. Клиент с помощью удаленного терминала (это может быть обычный ноутбук, планшет или смартфон) и специальной программы или стандартного веб-браузера может просматривать и изменять информацию на удаленном сервере.

Для обеспечения безопасности передаваемых данных, как правило, используется протокол SSL (Secure Sockets Layer). Кроме того, если система представляет собой приложение, доступ в него может быть защищен логином и паролем. Для повышения безопасности может использоваться ЭЦП (Электронно-Цифровая Подпись) – бинарная последовательность данных, формируемая криптографическим алгоритмом.

К сожалению, зачастую, клиенты хранят данные доступа прямо на ноутбуке или смартфоне, и при его утере или краже, доступ к сервисам легко могут получить третьи лица. Еще одним недостатком паролей или ЭЦП является невысокое удобство использования — необходимость помнить пароль или хранить файл ЭЦП на отдельном носителе. Именно поэтому сейчас на рынок обеспечения безопасности доступа начинают выходить биометрические технологии.
Читать дальше →

Ближайшие события

Как делают гигантские зеркала для телескопов

Время на прочтение3 мин
Количество просмотров72K


Пустыня Атакама в Чили — райское место для астрономов. Уникальная чистота воздуха, благоприятные атмосферные условия в течение года и крайне низкий уровень светового загрязнения делают этот негостеприимный район идеальным местом для строительства гигантских телескопов. Например, телескоп E-ELT, под который уже готовят строительную площадку. Однако это не единственный масштабный проект подобного рода. С 2005 года ведутся работы по созданию ещё одного впечатляющего астрономического инструмента, Гигантского Магелланова Телескопа (GMT). Так он будет выглядеть после окончания строительства в 2020 году:



В основе его оптической системы лежит отражающая поверхность из 7 огромных круглых зеркал. Каждое диаметром 8,4 м и весом 20 т. Само по себе изготовление таких зеркала, да ещё и с требуемой точностью, представляет настоящий инженерный шедевр. Как же создаются подобные изделия? Об этом — под катом.
Читать дальше →

Защита бумажных листов договора от подмены текста

Время на прочтение2 мин
Количество просмотров21K
По работе мне не приходилось сталкиваться с ситуацией когда одна из Сторон недобросовестно меняла бы страницы в многостраничном документе (договор, акт проверки) и потом пыталась как то использовать это для своей выгоды. Но такое возможно и морально я к этому готовлюсь.

Вообще, для договоров есть классические способы защиты от подмены листов, это:
— использование бланков с защитой (водяные знаки и т.п.)
— парафирование (подписание каждой стороной каждой страницы документа)
— визирование (штамп или подпись как правило одной стороны на каждом листе)
— прошивание

Но все эти способы требую каких то дополнительных затрат или усилий. Ну и что нормально для многомиллионного договора, не всегда уместно для договора на 20 тысяч. Поэтому, хотелось бы найти какое то современное решение этой проблемы, которое бы соответствовало духу времени.

Задача, защититься технологически от замены содержания листов, в многостраничном документе, где подписи ставятся только на последней странице.
И что бы это было быстрее и легче, чем пяти людям подписывать каждую страницу в документе на 20 листах, в пяти экземплярах.
Читать дальше →

Вряд ли когда-нибудь будет построен телескоп больше этого

Время на прочтение7 мин
Количество просмотров35K

1.Начало положено.


20 июня 2014 года была взорвана вершина Cerro Armazones — горы высотой 3060 метров в центральной части пустыни Атакама в Чили. Это был первый в серии подрывов, направленных на удаление 220 000 кубометров породы и создание плоской платформы размером 300х150 метров.

image

На платформе будет построено сооружение, которое превосходит размерами всё, что было до него – самый большой телескоп в мире.
Читать дальше →

Работа с графическими объектами в Android

Время на прочтение4 мин
Количество просмотров13K

Нажав кнопку «Далее», вы найдете перевод четырех небольших учебных материалов, посвященных различным техникам обработки и генерации изображений в Android; в трех из них имеется исходный код тестовых программ и справочный материал к нему. На наш взгляд, эти пособия могут оказаться полезными всем, кто занимается разработкой приложений и игр под Android.
Под катом находятся следующие статьи:
  • Пример кластеризованного шейдинга в Android
  • Знакомство с RenderScript. Учебное пособие
  • Знакомство с OpenCL для Android. Учебное пособие
  • Тесселяция для OpenGL ES 3.1 на Android
Читать дальше →

Новая технология Disney синтезирует «смотрибельное» видео из нескольких любительских записей

Время на прочтение1 мин
Количество просмотров32K


Сейчас очень многие устройства позволяют снимать видео, включая утюги смартфоны, игровые приставки, камкордеры и все прочее. Возможности таких устройств весьма хороши, но вот мало кто из владельцев гаджетов владеет профессиональными навыками оператора. Как результат — масса несмотрибельных любительских видео, где мало что можно разобрать.

При этом одно событие зачастую снимает несколько человек (корпоратив, семейная прогулка и т.п.), в результате чего имеем сразу несколько некачественных роликов. Компания Disney создала технологию, алгоритм, синтезирующий вполне смотрибельное качественное видео, один ролик, из нескольких любительских записей.

Читать дальше →

Увидеть незримое

Время на прочтение8 мин
Количество просмотров92K
Пару лет назад на Хабре проскакивало две статьи, в которых упоминался интересный алгоритм. Статьи, правда, были написаны нечитабильно. В стилистике «новости»(1, 2), но ссылка на сайт присутствовала, подробно можно было разобраться на месте (алгоритм за авторством MIT). А там была магия. Абсолютно волшебный алгоритм, позволяющий увидеть незримое. Оба автора на Хабре этого не заметили и сфокусировались на том, что алгоритм позволял увидеть пульс. Пропустив самое главное.



Алгоритм позволял усиливать движения, невидные глазу, показать вещи, которые никто никогда не видел живьём. Видео чуть выше – презентация c сайта MIT второй части алгоритма. Микросаккады, которые приведены начиная с 29ой секунды, раньше наблюдались только как отражения установленных на зрачках зеркалах. А тут они видны глазами.
Пару недель назад я опять натолкнулся на те статьи. Мне сразу стало любопытно: а что народ сделал за эти два года готового? Но… Пустота. Это определило развлечение на следующие полторы недели. Хочу сделать такой же алгоритм и разобраться, что с ним можно сделать и почему его до сих пор нет в каждом смартфоне, как минимум для измерения пульса.

В статье будет много матана, видео, картинок, немного кода и ответы на поставленные вопросы.
Читать дальше →

«Кассини» получил снимок «глаза Сатурна»

Время на прочтение1 мин
Количество просмотров37K


Атмосферные бури на Юпитере и Сатурне — очень интересные объекты для изучения. На Юпитере наиболее известным является «Большой вихрь», образование, в котрое можно поместить пару десятков Земель.

На Сатурне это шестигранный атмосферный шторм, который не так давно был снят на видео аппаратом «Кассини» с применением цветных фильтров.



Теперь Кассини, пролетая на расстоянии 2,2 миллионов километров от Сатурна, получил детальный снимок «глаза Сатурна» — центра того самого шестиугольного шторма. По оценкам специалистов, диаметр «глаза» составляет 2 тысячи километров.

Читать дальше →

Вклад авторов