Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

Mr_FatCat 23 июл 2018 в 10:31

Пакетная обработка фотографий в Blender

3 мин

18K

Обработка изображений * 3D-графика * Фототехника

Туториал

Всем привет!

Свободно-распространяемый 3D-редактор Blender обладает потрясающими возможностями по созданию трехмерной графики, но это далеко не все, что он умеет делать. В данном туториале я хочу показать как с помощью этой замечательной программы делать быструю и качественную пакетную обработку фотографий для последующего использования их в создании анимации вращения (облет объекта, демонстрация со всех сторон, фото-360).

В данном уроке мы не станем углубляться в детальные настройки и будем использовать предварительно созданный шаблон. Никаких специальных знаний потребоваться не должно, будет достаточно небольшого опыта в обработке изображений.

+29

Alexufo 23 июл 2018 в 10:29

Адаптивный Waveform для вашего аудиосервиса

6 мин

9.1K

JavaScript * PHP * Алгоритмы * Интерфейсы * Обработка изображений *

Туториал

Когда мне понадобилось для сайта одной радиопередачи наладить выкладку аудио архива, помимо админки нужен был еще и аудиоплеер. Радиопередача шла 40 минут плюс две музыкальные паузы. Использовать Waveform в таких длинных форматах особенно удобно, поэтому как и многие музыкальные сервисы, я решил использовать это решение в оформлении плеера.

При планируемом будущем редизайне сайта и, возможно, будущих мобильных приложений, растровый waveform тут просто клином упирался. Он не адаптивен, его крайне ресурсоемко редизайнить, если он в растре.

Читать дальше →

+15

ihormihal 20 июл 2018 в 09:51

Простой редактор изображений на VueJS

8 мин

13K

CSS * JavaScript * VueJS * Обработка изображений *

Из песочницы

Недавно мне выпала возможность написать сервис для интернет-магазина, который помогал бы оформить заказ на печать своих фото.

Сервис предполагал наличие «простого» редактора изображений, созданием которого, я бы хотел поделиться. А все потому, что среди обилия всевозможных плагинов я не нашел подходящего функционала, к тому же, нюансы CSS трансформаций, неожиданно стали для меня весьма нетривиальной задачей.

Читать дальше →

YuriPanchul 18 июл 2018 в 06:47

Российские и украинские команды взяли верх над европейцами на европейском финале интеловского конкурса InnovateFPGA

5 мин

14K

Обработка изображений * Машинное обучение * Высоконагруженные системы * Анализ и проектирование систем * FPGA *

Золото досталось России, серебро разделила Россия и Италия, бронза досталась Украине. Таковы результаты европейского финала престижного соревнования InnovateFPGA под эгидой Интела. Победители поедут в Калифорнию, где встретятся с финалистами из Америки и Азии. Надеюсь, теперь не нужно будет объяснять на Хабре, почему Verilog и ПЛИС/FPGA стратегически важны, несмотря на то, что «вакансий на джаву больше».

Студенты, которые сейчас делают проекты на ПЛИСах, через несколько лет будут делать массовые микросхемы для самоуправляемых автомобилей, ускорителей нейронных сетей, дополненной реальности и других приложений, в который обычный процессор не справляется. Именно поэтому Intel потратил 16.7 миллиардов долларов на покупку Altera и вход в рынок ПЛИС. А на днях Интел купил еще и компанию eASIC для дешевой конверсии дизайнов из ПЛИС в ASIC (в eASIC есть достаточно многочисленная российская команда).

Победа российских и украинских команд в интеловском конкурсе InnovateFPGA возникла не на пустом месте, а в результате работы конкретных людей в ЛЭТИ, ИТМО, КПИ и других местах, о которых уже были статьи на Хабре. Если продолжить эти начинания и расширить преподавание ПЛИС и языков описания аппаратуры во все технические вузы от Калининграда до Якутии, от Львова до Тбилиси и Астаны — то через пару десятилетий это может изменить расстановку сил в мировой электронной промышленности примерно так же, как работы Курчатова и Королева изменили расстановку сил в мировой атомной промышленности и освоении космоса.

+35

230

AmigoRRR 12 июл 2018 в 09:15

Презентация робота SpotMini от Boston Dynamics

3 мин

12K

Обработка изображений * Программирование микроконтроллеров * РобототехникаПрезентации

Это видео где Marc Raibert основатель Boston Dynamics рассказывает про роботов: BigDog, Spot, SpotMini, Atlas. На основании этого видео и других видео где выступал Marc, я опишу кратко технологии роботов и дальнейшие планы компании.

+21

saul 9 июл 2018 в 10:58

AI, практический курс. Обзор нейронных сетей для классификации изображений

8 мин

31K

Блог компании IntelМашинное обучение * Обработка изображений * Программирование *

Перевод

В данной статье приводится доступный теоретический обзор сверточных нейронных сетей (Convolutional Neural Network, CNN) и разъясняется их применение к задаче классификации изображений.

Читать дальше →

+20

N01Z3 5 июл 2018 в 11:05

kaggle: IEEE's Camera Model Identification

7 мин

6.6K

Блог компании Open Data ScienceУправление разработкой * Обработка изображений * Машинное обучение * Python *

В конце зимы этого года прошло соревнование IEEE's Signal Processing Society — Camera Model Identification. Я участвовал в этом командном соревновании в качестве ментора. Об альтернативном способе формирования команды, решении и втором этапе под катом.

Читать дальше →

+31

AndreyGaskov 4 июл 2018 в 07:47

Распознавание товаров на полках с помощью нейронных сетей на технологиях Keras и Tensorflow Object Detection API

18 мин

35K

Блог компании True EngineeringИскусственный интеллектМашинное обучение * Обработка изображений *

В статье мы расскажем о применении свёрточных нейронных сетей для решения практической бизнес-задачи восстановления реалограммы по фотографии полок с товарами. С помощью Tensorflow Object Detection API мы натренируем модель поиска/локализации. Улучшим качество поиска мелких товаров на фотографиях с большим разрешением с помощью плавающего окна и алгоритма подавления немаксимумов. На Keras реализуем классификатор товаров по брендам. Параллельно будем сравнивать подходы и результаты с решениями 4 летней давности. Все данные, использованные в статье, доступны для скачивания, а полностью рабочий код есть на GitHub и оформлен в виде tutorial.

Читать дальше →

+23

m1rko 3 июл 2018 в 12:20

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF

19 мин

12K

Алгоритмы * Обработка изображений * Работа с видео *

Перевод

Автор: Monty (monty@xiph.org, cmontgomery@mozilla.com). Опубликовано 28 июня 2018 года.

Если кто не читал предыдущую статью… AV1 — это новый универсальный видеокодек, разработанный Альянсом за открытые медиа (Alliance for Open Media). Альянс взял за основу кодек VPX от Google, Thor от Cisco и Daala от Mozilla/Xiph.Org. Кодек AV1 превосходит по производительности VP9 и HEVC, что делает его кодеком не завтрашнего, а послезавтрашнего дня. Формат AV1 свободен от любых роялти и навсегда останется таковым с разрешительной лицензией.

Эта статья задумывалась как вторая в серии статей, которые подробно описывают функциональность AV1 и новых технологий, которые лежат в его основе и впервые используются в продакшне. Предыдущая статья на Xiph.org объясняла функцию прогнозирования яркости Chroma from Luma (CfL). Сегодня мы расскажем об ограниченном направленном корректирующем фильтр (Constrained Directional Enhancement Filter). Если вы всегда задавались вопросом, что нужно для написания кодека, пристегните ремни и приготовьтесь к образованию!

Читать дальше →

+11

SAP 2 июл 2018 в 06:57

Машинное зрение для ритейла. Как прочитать ценники в магазине

7 мин

18K

Блог компании SAPBig Data * Машинное обучение * Обработка изображений *

Машинное зрение – очень актуальная тема в наши дни. Для решения задачи по распознаванию магазинных ценников с использованием нейронных сетей мы выбрали фреймворк TensorFlow.

В статье пойдет речь именно о том, как с его помощью локализовать и идентифицировать несколько объектов на одном магазинном ценнике, а также распознать его содержимое. Похожая задача распознавания ценников IKEA уже решалась на Хабре с применением классических инструментов обработки изображений, доступных в библиотеке OpenCV.

Отдельно хотелось бы отметить, что решение может работать как на платформе SAP HANA в связке с Tensorflow Serving, так и на SAP Cloud Platform.

Задача распознавания цены товара актуальна и для покупателей, которые хотят «шарить» цены друг с другом и выбирать магазин для покупок, и для ритейлеров — они хотят узнавать про цены конкурентов в режиме реального времени.

Хватит лирики – гоу в технику!

Читать дальше →

+16

AmigoRRR 30 июн 2018 в 09:10

Аппаратное кодирование видео потока на камере Logitech C920 и отправка его в ROS по wifi с задержкой менее 0.2 секунды

3 мин

8.2K

Работа с видео * Обработка изображений * Raspberry Pi * Робототехника

Туториал

В этой инструкции мы отправим аппаратно закодированный h264 видео поток камеры Logitech C920 переданный c BeagleBone Blue по wifi сети на ноутбук, а затем примем его в узел ROS gscam и произведем поиск и распознавание изображений карт таро и бутылки кетчупа по пути движения робота EduMIP.

+24

IlyaSimonov 28 июн 2018 в 07:05

Виртуальный зал Эрмитажа — первый шаг к будущему по Пелевину

4 мин

14K

Блог компании КРОКОбработка изображений * AR и VR

Мы застряли с оцифровкой зала Эрмитажа примерно на месяц. Изначально мы думали, что имеющиеся решения для переноса объектов в 3D (типа лазерных сканеров) будут отлично работать и вопрос исключительно технический. На деле оказалось, что эта область не очень-то проработана и подводных камней там море.

За проект попали на конференцию FMX по иммерсионным технологиям и графике. Российские разработчики попадают на эту конференцию с докладом впервые. Мы выступаем вместе с Пиксаром и ребятами, которые делали «Игру престолов». Не то чтобы мы такие крутые, как Пиксар, просто агрегировали всё лучшее, что было на рынке, лучшие практики по фотограмметрии и опытным путём всё это применяли. Оказалось, так ещё никто не делал.

Но давайте начнём с того, что может быть сложного в оцифровке зала со статуей. Делов-то на пару дней, правда?

Читать дальше →

+48

marks 26 июн 2018 в 08:21

Фотографии 19-го века удалось восстановить при помощи технологий 21-го века

3 мин

14K

ФототехникаОбработка изображений * История IT

Первая работоспособная технология фотографии называлась дагеротипия. Это фотографический процесс, основа которого — светочувствительность йодистого серебра. Технология пользовалась заслуженной популярностью в течение примерно 20 лет, пока на смену ей не пришли более практичные (а главное — дешевые) процессы.

Современные снимки по внешнему виду отличаются от дагеротипов. Последние больше напоминают отражение в зеркале. Причина этого то, что «картинка» получалась при помощи смеси серебра и ртути. Ее называли зеркалом с памятью. В зависимости от угла наклона пластинки к источнику света дагеротип может выглядеть и как позитив, и как негатив. Недостатком такого типа получения изображений была недолговечность результата.

+21

AmigoRRR 26 июн 2018 в 07:32

Обнаружение и распознавание объектов с камеры в ROS с помощью пакета find_object_2d

4 мин

15K

Искусственный интеллектРобототехникаОбработка изображений * Open source *

Туториал

Одним из преимуществ Robot Operating System (ROS) является то, что у него есть множество пакетов, которые можно использовать повторно в наших приложениях. В нашем случае мы хотим внедрить систему распознавания и обнаружения объектов. Пакет find_object_2d реализует SURF, SIFT, ORB, FAST и BRIEF детекторы функций и дескрипторы для обнаружения объектов. Используя графический интерфейс, предоставляемый этим пакетом, мы можем отметить объекты, которые мы хотим обнаружить, и сохранить их для будущего обнаружения. Узел детектора будет обнаруживать объекты в изображениях камеры и публиковать детали объекта через тему. Используя 3D-датчик, он может оценить глубину и ориентацию объекта.

В конце статьи, видео тестирования на примере алгоритмов ORB и SIFT.

Alexufo 25 июн 2018 в 11:31

Как нам удалось прочитать рукопись, найденную в 80-х возле третьего крематория в Аушвице-Биркенау

15 мин

73K

Алгоритмы * Научно-популярноеОбработка изображений * Периферия

Эта история для меня началась в 2015 году, когда я посмотрел передачу на Youtube с Павлом Поляном, посвященную 70-летию освобождения Аушвица-Биркенау. Он рассказывал о своей книге «Свитки из пепла», его новых переводах с оригиналов документов от непосредственных свидетелей холокоста — членов зондеркоммандо, о найденных им цензурированных первыми переводчиками местах, о состоянии рукописей и о технических проблемах чтения, с которыми он столкнулся.

Меня заинтересовал момент: каким же образом выглядит процесс перевода военных документов, насколько качественно они были оцифрованы, все ли было сделано для того, чтобы не ломать глаза переводчику. Когда я получил на анализ копии оцифрованных документов, я был удивлен нераскрытым потенциалом одной их них – Марселя Наджари. Ее часть в «свитках из пепла» занимала совсем малую главу, через несколько лет эта история раскрутилась до публикаций в мировых СМИ. Она интересна так же, как и страшна.

Читать дальше →

+252

341

saul 25 июн 2018 в 09:16

AI, практический курс. Предобработка и дополнение данных с изображениями

7 мин

14K

Блог компании IntelПрограммирование * Обработка изображений * Машинное обучение *

Перевод

Предобработка — это общий термин для всех манипуляций, производимых с данными перед передачей их модели, включая центрирование, нормализацию, сдвиг, вращение, обрезку и т. п. Как правило, предобработка требуется в двух случаях.

Очистка данных. Предположим, что на изображениях присутствуют некоторые артефакты. Чтобы облегчить обучение модели, артефакты необходимо удалить на этапе предобработки.
Дополнение данных. Иногда небольших наборов данных недостаточно для качественного глубокого обучения модели. Подход с дополнением данных весьма полезен при решении этой проблемы. Это процесс трансформации каждого образца данных различными способами и добавления к набору данных таких измененных образцов. Таким образом можно повысить эффективный размер набора данных.

Рассмотрим некоторые возможные методы трансформации при предобработке и их реализацию через Keras.

Читать дальше →

+18

morozovsk 17 июн 2018 в 19:32

Компьютерное зрение и машинное обучение в PHP используя библиотеку opencv

9 мин

35K

Open source * PHP * Машинное обучение * Обработка изображений * Программирование *

Туториал

Всем привет. Это моя юбилейная статья на Хабре. За почти 7 лет я написал 10 статей (включая эту), 8 из них — технические. Общее количество просмотров всех статей — около полумиллиона.
Основной вклад я внёс в два хаба: PHP и Серверное администрирование. Мне нравится работать на стыке этих двух областей, но сфера моих интересов гораздо шире.

Как и многие разработчики я часто пользуюсь результатами чужого труда (статьи на Хабре, код на гитхабе, ...), поэтому я всегда рад делиться с сообществом своими результатами в ответ. Написание статей — это не только возврат долга сообществу, но так же позволяет найти единомышленников, получить комментарии от профессионалов в узкой сфере и ещё больше углубить свои знания в исследуемой области.

Собственно эта статья об одном из таких моментов. В ней я опишу чем занимался почти всё своё свободное время за последние полгода. Кроме тех моментов, когда я ходил купаться в море через дорогу, смотрел сериалы или игрался в игры.

Читать дальше →

+38

R3EQ 16 июн 2018 в 21:32

Один день из жизни Орла за несколько секунд

2 мин

5.4K

Обработка изображений * Работа с видео *

В настоящее время в Интернете имеется множество сайтов, где можно посмотреть видео онлайн с камер видеонаблюдения, которые расположены в общественных местах тех или иных городов. В частности, в городе Орле установлено несколько таких камер. Одна из камер, которая располагается на одной из многоэтажек пер. Почтового, направленная на Детский парк, появилась самой первой. По крайней мере, на одном из сайтов весной в 2011 году я нашёл страницу, где можно было посмотреть видео с данной камеры «в прямом эфире» (онлайн). Однако организована данная трансляция была весьма интересно. Видео шло с очень низкой частотой кадров – 2 кадра в минуту. На самом же деле это было вовсе не видео, а изображение, которое обновлялось автоматически (точнее, обновлялась вся страница) каждые полминуты.

-8

vikto9494 16 июн 2018 в 21:10

Организация университетского курса по обработке сигналов

32 мин

5.8K

Машинное обучение * Обработка изображений * Учебный процесс в IT

Из песочницы

Педагогика интересовала меня очень давно и, много лет, я, будучи студентом, воспитанный, но в то же время изведенный и задерганный существующей организацией обучения думал о том, как бы её улучшить. В последнее время мне все чаще предоставляется случай проверить какие-нибудь из идей на практике. В частности, этой весной мне в политехе (СПБПУ) предоставилась возможность прочитать курс “Обработка сигналов”. Его организация, в особенности организация отчетности — первый эксперимент, результаты которого мне кажутся сколько-нибудь удачными, и в этой статье я хочу про организацию этого курса рассказать.

Читать дальше →

sim0nsays 15 июн 2018 в 06:50

Курс о Deep Learning на пальцах

2 мин

176K

РобототехникаОбработка изображений * Машинное обучение * Искусственный интеллект

Я все еще не до конца понял, как так получилось, но в прошлом году я слово за слово подписался прочитать курс по Deep Learning и вот, на удивление, прочитал. Обещал — выкладываю!

Курс не претендует на полноту, скорее это способ поиграться руками с основными областями, где deep learning устоялся как практический инструмент, и получить достаточную базу, чтобы свободно читать и понимать современные статьи.

Материалы курса были опробованы на студентах кафедры АФТИ Новосибирского Государственного Университета, поэтому есть шанс, что по ним действительно можно чему-то научиться.

Читать дальше →

+114

1 2 ...

70 71

73 74 ...

122 123

Обработка изображений *

Пакетная обработка фотографий в Blender

Адаптивный Waveform для вашего аудиосервиса

Простой редактор изображений на VueJS

Российские и украинские команды взяли верх над европейцами на европейском финале интеловского конкурса InnovateFPGA

Презентация робота SpotMini от Boston Dynamics

AI, практический курс. Обзор нейронных сетей для классификации изображений

kaggle: IEEE's Camera Model Identification

Распознавание товаров на полках с помощью нейронных сетей на технологиях Keras и Tensorflow Object Detection API

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF

Машинное зрение для ритейла. Как прочитать ценники в магазине

Аппаратное кодирование видео потока на камере Logitech C920 и отправка его в ROS по wifi с задержкой менее 0.2 секунды

Виртуальный зал Эрмитажа — первый шаг к будущему по Пелевину

Фотографии 19-го века удалось восстановить при помощи технологий 21-го века

Ближайшие события

Обнаружение и распознавание объектов с камеры в ROS с помощью пакета find_object_2d

Как нам удалось прочитать рукопись, найденную в 80-х возле третьего крематория в Аушвице-Биркенау

AI, практический курс. Предобработка и дополнение данных с изображениями

Компьютерное зрение и машинное обучение в PHP используя библиотеку opencv

Один день из жизни Орла за несколько секунд

Организация университетского курса по обработке сигналов

Курс о Deep Learning на пальцах

Вклад авторов