Pull to refresh
137.6

Image processing *

Working with photos and videos

Show first
Period
Level of difficulty

Хочу жить в такой же: как мы научились искать квартиры по фотографиям

Reading time9 min
Views5.9K

Привет, Хабр!

Меня зовут Александр Красных, я тимлид команды ранжирования и рекомендаций в Циан. Мы сделали фичу, которая позволяет найти по фото похожие квартиры. Для этого нужно уметь быстро находить среди миллионов фотографий изображения, визуально похожие по стилю на входную картинку-запрос. 

В статье поговорим о том, как мы решили задачу с помощью алгоритмов глубокого обучения, и расскажем, что там под капотом этой функции и как мы подружили EfficientNet с FAISS. В работе над статьей мне помогал Владимир Филипенко (@vovaf709): он изложил самые основы, чтобы текст мог понять и неспециалист.

Итак, начнём

Как создать панораму 360° на квадрокоптер DJI Mini 2

Reading time6 min
Views17K

На современных картах все больше появляется 360 аэроснимков, которые принято называть "Сферические панорамы". Почти каждый владелец БПЛА с камерой может создавать свою собственную сферу. Разбираем подробный способ создания 360 панорамы с помощью бюджетного дрона DJI Mini 2.

Читать далее

Панорамное решение ВКС для ультра компактных переговорных комнат

Reading time7 min
Views3.2K

Понятия переговорная комната и видеоконференцсвязь за последний год тесно сплелись друг с другом в одно целое.

Всё больше помещений выделяют под переговорные комнаты, и всё больше переговорных комнат оборудуют средствами для удалённых видео коммуникаций.
Учитывая, что планировка офиса многих небольших компаний не всегда позволяет выделить достаточно пространства под переговорные комнаты, такие переговорки, порой, занимают всего несколько квадратных метров.

Как правило, это часть коридора или общего офисного пространства, отделённое стеклянными или гипсокартонными перегородками.

Эти импровизированные переговорные комнаты получили название - Huddle Rooms. Такие "аквариумы" вмещают не больше 3-5 человек и имеют небольшой стол и телевизор. Из-за компактности переговорной комнаты и очень близкого расположения участников к ТВ, непросто подобрать оптимальную камеру ВКС, так как даже веб-камеры с углом обзора 90-120 градусов не всегда способны захватить крайних участников конференции.

На рынке появились панорамные камеры с обзором до 180 градусов, например Jabra Panacast, но они имеют весьма ограниченный функционал и посредственное качество.
Эта статья посвящается новому панорамному решению для ультра компактных переговорных комнат ProfAV Panorama 180. Это интеллектуальная USB-камера ВКС с множеством режимов отображения и отслеживания докладчиков, а также профессиональный спикерфон с объёмным звучанием и эхо/шумо-подавлением.

Сравним это решение с Jabra Panacast

Самые креативные капчи: DOOM, приседания, ползунки, резисторы, матан

Reading time1 min
Views12K
«Своими действиями или бездействием нанесите вред человеку, чтобы доказать, что вы не робот.»
— капча по Азимову

Капча с DOOM уже несколько дней одна из самых обсуждаемых тем на Reddit и HackerNews. А какие еще бывают креативные капчи?

Doom Captcha


image


Шуточная капча, в которой пользователю необходимо сыграть в мини-версию Doom для доказательства того, что он не робот. Её создал программист Мигель Ортеза, а ознакомиться с ней можно на GitHub.

IDDQD тоже работает.

Рынок тепловизоров развивается и на него выходит компания Owl

Reading time10 min
Views5.1K
image

Teledyne объявила о приобретении Flir Systems, занимающейся тепловизорами. Сумма сделки составила 8 миллиардов долларов наличными и акциями, и она дала четкий сигнал всем автопроизводителям: тепловидение набирает обороты.

Этот шаг со стороны Teledyne хоть и несколько внезапен, не должен вызывать удивления.

2020 год научил нас тому, что ни в беспилотных автомобилях (многие из которых сейчас тестируются на публичных дорогах), ни в ADAS-решениях пока нет систем «зрения», которые работали бы в любых погодных условиях, в любой местности, на протяжении всего дня и в темноте.

С одной стороны, разработчикам беспилотных автомобилей удалось собрать объемные логи о поездках беспилотных автомобилей с посадкой и высадкой пассажиров в солнечной Аризоне, тест-драйвах в Флориде и круизах по центру Сан-Франциско (как правило машины заезжали только в определенные районы и только в определенное время). С другой стороны, никто не показывает роликов, в которых машины-роботы ездят в условиях тумана, дождя, снега, метели, низкой освещенности и в полной темноте.

Именно поэтому на рынке сейчас есть большие возможности для компаний, занимающихся датчиками – включая тепловизоры.
Читать дальше →

Как мы распознаем средства индивидуальной защиты

Reading time7 min
Views7.9K
Наверное, вам всю жизнь было очень интересно, как натренировать нейронную сеть распознавать людей в касках и оранжевых жилетах! Нет? Но мы все равно расскажем.

Нас зовут Татьяна Воронова и Эльвира Дяминова. Мы занимаемся анализом данных в компании «Центр 2М», много работаем с самыми настоящими заводами и предприятиями. Из-за нарушений техники безопасности они терпят многомиллионные убытки, работники получают травмы, поэтому хорошо бы уметь детектировать такие нарушения системно и как можно раньше. Лучше всего – автоматически. Так у нас появляются задачи, связанные с распознаванием на видео средств индивидуальной защиты (СИЗ) и определением людей или техники в опасной зоне.

image

По большей части к нам приходят заказы на определение касок (точнее, их отсутствие) и спецодежды. Мы уже накопили опыт в выполнении подобных задач и теперь можем описать проблемы, с которыми столкнулись, и способы их решения.
Читать дальше →

Object Detection. Распознавай и властвуй. Часть 2

Reading time9 min
Views26K

В прошлом посте я начал разбираться в двухступенчатых Object Detection моделях и рассказал о самой базовой и, соответственно, первою из них – R-CNN. Сегодня мы рассмотрим другие модели этого семейства: Fast R-CNN и Faster R-CNN. Поехали!
Читать дальше →

Видео с облачным детектором объектов на Raspberry Pi

Reading time5 min
Views12K

Пролог


По сети сейчас гуляет видео — как автопилот Теслы видит дорогу.

У меня давно чесались руки транслировать видео, обогащенное детектором, да и в реальном времени.



Проблема в том, что транслировать видео я хочу с Raspberry, а производительность нейросетевого детектора на ней оставляет желать лучшего.
Читать дальше →

Сверточный слой: быстрая свертка по методу Шмуэля Винограда

Reading time8 min
Views11K

Введение


Данная статья является продолжением серии статей описывающей алгоритмы лежащие в основе
Synet — фреймворка для запуска предварительно обученных нейронных сетей на CPU.

В предыдущей статье я описал методы, основанные на матричном умножении. Эти методы с минимальными усилиями позволяют достичь во многих случаях более 80% от теоретического максимума. Казалось бы, ну куда тут можно еще дальше улучшать? Оказывается можно! Существуют математически методы, которые позволяют сократить число операций, необходимых для свертки. С одним из таких методов — алгоритму свертки по методу Винограда мы и ознакомимся в настоящей статье.

image

Шмуэль Виноград (Shmuel Winograd) 1936.01.04 — 2019.03.25 — выдающийся израильский и американский ученый в области компьютерных наук, создатель алгоритмов быстрого матричного умножения, свертки и преобразования Фурье.
Читать дальше →

Туристы помогают ученым оценить численность крупных хищников

Reading time3 min
Views1.6K


Гражданско-добровольный мониторинг животных с помощью выданных путешественникам GPS-трекеров и анализа их фотографий оказался намного дешевле, чем использование фото- и аудио- ловушек.
Читать дальше →

Получаем ссылки на профили Vk из выдачи SearchFace с помощью Python (но это не точно)

Reading time9 min
Views54K
Картинка для привлечения внимания:


Кадр из сериала Person Of Interest

Сегодня мы поговорим о лёгком распознавании лиц с помощью доступных инструментов.
Используются: Python 3.6, searchface.ru, внешний сервис для преобразования ссылок на фото в id (бот в телеграме, на текущий момент)


Итак, у нас есть сайт, который ищет по лицам.
Заглянем внутрь.
Читать дальше →

Как я познакомился с OpenCV или в поисках ColorChecker

Reading time4 min
Views3.9K
Я учусь в CS центре в Новосибирске уже второй год. До поступления у меня уже была работа в IT — я работал аналитиком в Яндексе, но мне хотелось развиваться дальше, узнать что-то за пределами текущих задач и, по совету коллеги, я поступил в CS центр. В этой статье я хочу рассказать о практике, которую проходил во время учебы.

В начале первого семестра нам предложили несколько проектов. Мое внимание сразу зацепилось за проект под названием «Метод оценки цвета зерна по фотографии». Эту тему предложили специалисты из Института цитологии и генетики СО РАН, но сам проект был больше связан с анализом и обработкой изображений, чем с биологией. Я выбрал его, потому что интересовался машинным обучением и распознаванием образов и мне хотелось попрактиковаться в этих областях.
Читать дальше →

Повышение качества склейки панорамы с помощью согласования графа проективных преобразований

Reading time8 min
Views5.2K

Привет, Хабр! Сегодня мы расскажем про один из способов повышения качества склейки панорамы. Существует широко используемый подход склейки панорамы плоских объектов, но поскольку данный подход не лишен недостатков, мы предлагаем свое улучшение.

Читать дальше →

Upcoming events

Посылка на луну

Reading time2 min
Views3.4K
Фонд Arch Mission в сотрудничестве с Microsoft, Вашингтонским университетом и компанией Twist Bioscience включит 10 000 изображений, текст 20 книг и другую информацию, закодированную на синтетических молекулах ДНК, в Lunar Library («Лунную библиотеку»).

Любой желающий может предложить свое изображение для кодирования в ДНК и отправки на Луну на сайте.

Читать дальше →

Хакатон от ABBYY

Reading time2 min
Views3.7K
В прошлый раз мы анонсировали конкурс идей (и он, кстати, продолжается, вы всё ещё можете выиграть iPhone X), а теперь приглашаем вас на хакатон по мобильным сервисам от ABBYY. Пройдёт 7-8 октября в ФизТехПарке. Направления самые разные. Крутое жюри. Призовой фонд 220 000 рублей. Заявки принимаются до 3 октября включительно на mobility.abbyy.com/hack
А подробности ниже.
Читать дальше →

Компьютерное зрение. Задайте вопрос эксперту Intel

Reading time2 min
Views7K
Далеко не все ответы можно найти в Интернет. Особенно если вопрос ваш относится к достаточно узкой или новой области — тут необходима консультация гуру, Владельца Тайного Знания. В традициях блога Intel — проведение блого-семинаров, построенных на вопросах читателей. На эти вопросы отвечают эксперты Intel, принимавшие непосредственное участие в создании технологий и продуктов — кому, как не им знать все детали?

В этом месяце место на трибуне предоставлено создателям библиотеки компьютерного зрения OpenCV (Open Source Computer Vision Library), бывшим сотрудникам компании Itseez, вошедшей в состав Intel — Вадиму Писаревскому и Анатолию Бакшееву. Итак, если у вас назрел вопрос об OpenCV, машинном зрении, распознавании образов и других смежных темах, но вы не знали, кому его задать — приглашаем вас в комментарии и личку. Вопросы принимаются до 24 сентября. Автор лучшего вопроса получит приз от Intel* — набор фирменных принадлежностей для уютного отдыха.
* — Приз доставляется из Москвы в пределах РФ

Под катом — краткая информация о наших экспертах.
Читать дальше →

О различении объектов по цвету

Reading time7 min
Views8.8K
Статья предназначена, в первую очередь, для людей ранее не работавших с цветом. Она описывает те нюансы, интересные моменты и подводные камни, которые я узнал, когда впервые начал работать с распознаванием цветов (задачи типа сличения цвета двух объектов, нахождения нужного объекта роботом по запросу человека и т.д.).

image

Читать дальше →

Подлинность ваших видео теперь неоспорима благодаря Prover

Reading time3 min
Views11K
Сегодня я напишу про интересный проект интересных людей. Иван Писарев и Илья Свирин показали себя в проекте Нордавинд, самостоятельно разработав аппаратно-программные, очень простые и очень навороченные решения для разных сфер, от здоровья до безопасности. И вот недавно у них появилась идея…



Четыре миллиарда людей по всему миру владеют гаджетами. Создаваемый ими видеоконтент давно перестал использоваться лишь в развлекательных целях – сегодня это необходимая часть медийной, финансовой, страховой, юридической и медицинской отраслей. Выдаваемые за правду “фейки” не раз приводили к скандалам, а то и трагедиям, поэтому потребность в подтверждении подлинности видео-файлов необычайно высока. Сервис Prover, подтверждающий достоверность видео с привязкой к конкретному времени и устройству, был создан именно с этой целью.
Читать дальше →

Материалы журналов Университета ИТМО: исследования в сфере обработки изображений и компьютерного моделирования

Reading time6 min
Views5.1K
В этом дайджесте мы собрали интересные статьи, вышедшие за последние 2 года в журналах Университета ИТМО. Все материалы находятся в открытом доступе и охватывают темы, связанные с обработкой изображений (от расчетов объективов до автоматической корректировки изображения) и компьютерным моделированием различных процессов: начиная от работы светодиодного светильника и заканчивая моделированием поведения датчика индукционного лага на глубоководном судне.

Читать дальше →

Обработка «видео 360», очистка изображения: алгоритм и его реализация на C#

Reading time5 min
Views22K
В последнее время, в связи с растущим трендом виртуальной реальности, все более актуальными становятся съемка/монтаж/обработка видео в формате «видео 360».

В данной статье я хочу рассказать об одном эксперименте по обработке «видео 360», который хорошо иллюстрирует некоторые особенности такого формата. Забегая вперед скажу, что эксперимент потребовал реализации несложного алгоритма и, конечно, без написания программы не обошлось.

image
Читать дальше →

Authors' contribution