Pull to refresh

Определение свободного парковочного места с помощью Computer Vision

Level of difficulty Medium
Reading time 8 min
Views 5.1K
Python *Data Mining *Machine learning *Artificial Intelligence
Sandbox

Всем привет! Это моя первая статья на Хабр (поэтому не судите строго).

Дело было так: смотрел я как-то в окно и увидел, как человек сидит в машине на парковке и ждет, когда освободится парковочное место. Бывает, что и я сижу в машине и жду, когда же можно будет припарковать своего верного коня. И тут я подумал, а почему бы не подключить Компьютерное Зрение для этого? Зачем я учился разработке нейросетей, если не могу заставить компьютер работать вместо меня?

Изначально идея заключалась в следующем: Модель на базе компьютерного зрения должна через веб-камеру, установленную дома, отслеживать освободившиеся места на парковке и информировать через telegram-бота если такое место появится. Работать будем на Python.

Итак, ТЗ для меня от меня сформулировано, теперь за дело!

Первое с чем необходимо было определиться, это решить, какую модель детектирования объектов использовать. Сначала мой выбор пал на Fast R-СNN. Модель показывала хорошее качество детектирования. Однако после нескольких дней прокрастинации обдумывания реализации я решил воспользоваться более современными и интересными методами и подключить детектор от YOLO (взял не самую новую 4 версию).

Читать далее
Total votes 22: ↑22 and ↓0 +22
Comments 29

OpenCV ищет студентов для Google Summer of Code-2021

Reading time 1 min
Views 1.9K
Algorithms *

Крупнейшая библиотека компьютерного зрения OpenCV присоединилась к программе Google Summer of Code-2021 и объявляет набор студентов, которые хотели бы попробовать свои силы и заодно помочь улучшить работу библиотеки. Детальную информацию об OpenCV и ее участии в GSoC можно найти здесь

Читать далее
Total votes 3: ↑3 and ↓0 +3
Comments 0

Уж-ж-жасы медицинских данных: трек от экспертов ML в медицине на ODS Data Fest 2021

Reading time 2 min
Views 1.1K
Цельс corporate blog Machine learning *Artificial Intelligence
image

Всем привет! Мы продолжаем делиться опытом в сфере ML в медицине, на этот раз в формате лайв.

Я и мои коллеги организуем трек Ужасы медицинских данных на одном из крупнейших DS-событий России и Европы – ODS Data Fest 2021. Приглашаем всех принять в нём участие. Слушайте доклады экспертов, задавайте вопросы, общайтесь в голосовом чате. Обязательно регистрируйтесь на сайте феста и заходите на страницу нашего трека 10-11 июня.

Читать дальше →
Total votes 3: ↑3 and ↓0 +3
Comments 2

Вебинар: Методы получения трехмерных моделей по изображениям

Reading time 1 min
Views 1.7K
Algorithms *Machine learning *AR and VR The future is here

19 августа в 16:30 в рамках цикла открытых технических вебинаров компании Xperience AI с докладом выступит Виктор Ерухимов, CEO компании Itseez3D, один из создателей библиотеки OpenCV и член совета директоров OpenCV Foundation.

Читать далее
Total votes 4: ↑4 and ↓0 +4
Comments 0

Вебинар “Enabling machine learning application on a mW power budget”

Reading time 1 min
Views 515
System Analysis and Design *C *Machine learning *Computer hardware IOT

21 октября в 16:30 в рамках цикла открытых технических семинаров компании Xperience AI с докладом выступит Франческо Пацци (Embedded Application and Algorithm Engineer, Greenwaves Technologies). Тема доклада - Enabling machine learning application on a mW power budget.

Франческо расскажет о том, как эволюция в области IoT и встраиваемых устройств повысила спрос на удалённые вычисления, которые позволяют уменьшить использование сети и учесть требования по производительности. Он поднимет такие вопросы, как ограничения существующих устройств по памяти, скорости и энергопотреблению при разработке приложений, а также расскажет, как подобные задачи решаются в процессорах Greenwaves Technologies.Семинар открытый, будет проходить на английском языке. Технические вебинары компании Xperience AI проходят регулярно в свободном доступе. Чтобы получить приглашение на это событие и получать их на будущие выступления, оставьте свой адрес в форме по ссылке.

Читать далее
Total votes 4: ↑4 and ↓0 +4
Comments 0

Открытый семинар «От COLMAP к NeRF: обзор методов трехмерной реконструкции объектов по изображениям»

Reading time 1 min
Views 793
Working with 3D-graphics *Machine learning *

Виктор Ерухимов, CEO компании Itseez3D, прочитает открытый семинар «От COLMAP к NeRF: обзор методов трехмерной реконструкции объектов по изображениям».

О спикере: Виктор Ерухимов, руководит созданием Avatar SDK — платформы, позволяющей генерировать 3D аватаров по селфи для мета-вселенных. Является членом совета директоров OpenCV Foundation и автором книги OpenVX Programming Guide.

На семинаре пойдет речь о создании 3D моделей объектов реального мира по их изображениям. Начнем с базовых принципов проективной геометрии, на которых работают классические системы 3D реконструкции, например, COLMAP. Затем поговорим про методы, основанные на машинном обучении, как параметрические (morphable models), так и непараметрические. Обсудим методы, позволяющие восстанавливать 3D форму и генерировать фотореалистичные изображения объектов и 3D сцен.

Зарегистрироваться на семинар можно по ссылке.

Вы можете посмотреть часть видео с прошедших семинаров в открытом доступе на нашем YouTube-канале.

Читать далее
Total votes 5: ↑5 and ↓0 +5
Comments 0

Открытый семинар «Light and Сolour»

Reading time 1 min
Views 279
Data Engineering *

Открытый семинар пройдёт 17 марта в 16:30 (мск). На семинаре поговорим о том, как представлен цвет в компьютерной графике: цветовые модели, стандарты кодирования и отображения, динамический диапазон, и как эти вещи связаны с физикой света и особенностями человеческого восприятия.

Читать далее
Total votes 4: ↑4 and ↓0 +4
Comments 0

Открытый семинар «VITON-HD: виртуальная примерка одежды с высоким разрешением»

Reading time 1 min
Views 396
Python *Machine learning *

 VITON-HD - статья про виртуальную примерку одежды (CVPR 2021). В статье предложена нормализация, помогающая скрыть недостатки деформации примеряемой одежды, увеличено разрешение генерируемого изображения с 256х128 до 1024х768 пикселей. В четверг 8 декабря в 16:30 по Москве Даниил Осокин разберёт предложенный в статье подход, расскажет о качестве генерируемых изображений и практическом применении. Зарегистрироваться на открытый семинар можно по ссылке. Этот и другие семинары доступны в записи на нашем Youtube канале.

Читать далее
Total votes 2: ↑0 and ↓2 -2
Comments 0

Приглашаем на очный семинар в Москве по компьютерному зрению 26 апреля

Reading time 3 min
Views 230
ЦИТМ Экспонента corporate blog Machine learning *Artificial Intelligence Systems engineering *

26 апреля, 10:00, Офлайн

Уважаемые коллеги!

Приглашаем вас на бесплатный семинар по компьютерному зрению, который состоится в нашем офисе в Москве 26 апреля в 10:00.

Семинар будет полезен специалистам, работающим в области автоматизации производства, робототехники и машинного зрения, а также всем, кому интересен анализ данных с использованием методов искусственного интеллекта.

Узнать подробнее
Total votes 6: ↑6 and ↓0 +6
Comments 0

GraphiCon’2009: набор статей продлится до 25 мая

Reading time 3 min
Views 525
Lumber room
С 5 по 9 октября в Москве на территории МГУ пройдёт конференция по компьютерной графике и машинному зрению GraphiCon’2009 (официальный сайт http://gc2009.graphicon.ru/). В 19-ый раз на конференцию соберутся признанные ученые мирового уровня и начинающие специалисты, чтобы обменяться опытом, представить свои достижения широкому кругу заинтересованных лиц и пообщаться в неформальной обстановке. GraphiCon является крупнейшей научной конференцией по графике и компьютерному зрению на территории России и стран СНГ. В 2008 году мероприятие посетило более 400 участников, включая представителей Италии, США, Германии, Нидерландов.

image

На конференции освещаются последние достижения в таких областях, как:
  • графика и мультимедиа;
  • обработка изображений и видео;
  • машинное зрение;
  • приложения CG (Computer Graphics) и CV (Computer Vision).
Подробный список находится в разделе Темы конференции.

На данный момент объявлен конкурсный отбор статей, который продлится до 25 мая. Статьи, написанные на английском языке, попадают на международную часть конференции, а русские статьи будут представлены в рамках «Школы молодых ученых». Допустимы следующие форматы материалов: полная статья (до 8 страниц), короткая статья (до 4 страниц) или тезисы к постеру. В 2009 году увеличено число принимаемых статей, и в случае не прохождения статьи по конкурсу как полный или короткий доклад, она может быть принята в качестве тезисов и вы сможете рассказать о ней на постерной сессии.
Читать дальше
Total votes 8: ↑7 and ↓1 +6
Comments 10

В поисках НЛО. Детект объектов на изображении

Reading time 6 min
Views 54K
Artificial Intelligence
Взлом captcha это, конечно, интересно и познавательно, но, по большому счёту, бесполезно. Это лишь частный случай задачи, которая возникает в одном из интересных направлений развития IT – распознавание образов (pattern recognition).



Сегодня мы рассмотрим алгоритм (точнее, более правильно считать это методикой, т.к. она объединяет в себе множество алгоритмов), который стоит на стыке таких областей, как Machine Learning и Computer Vision.

С помощью этого алгоритма мы будем искать НЛО (позарился на святое) на изображениях.

Уберите детей!
Total votes 92: ↑91 and ↓1 +90
Comments 37

Графикон 2010 — прием статей для конференции до 31 мая

Reading time 1 min
Views 728
Self Promo

Графикон 2010 — ведущая ежегодная международная конференция по компьютерной графике и машинному зрению в России.

Внимание! Приём статей для конференции продлён до 31 мая 2010 года.

Юбилейная 20-ая конференция Графикон пройдет 20-24 сентября 2010 на базе Санкт-Петербургского государственного университета информационных технологий, механики и оптики.

Официальный сайт — gc2010.graphicon.ru

Дополнительная информация:
  1. Стоимость участия — gc2010.graphicon.ru/ru/attendees/fees (вход для слушателей на конференцию бесплатный)
  2. Важные даты — gc2010.graphicon.ru/ru/importantdates
  3. Правила оформления статей — gc2010.graphicon.ru/ru/authors/paperformatting (статьи должны быть написаны на английском языке. Доклады на русском языке также принимаются, но они будут выделены в отдельные секции (аннотация на английском языке обязательна)
  4. Труды прошлогодней конференции в формате pdf — gc2009.graphicon.ru/en/proceedings
Total votes 9: ↑7 and ↓2 +5
Comments 0

Летняя школа Microsoft Research по компьютерному зрению

Reading time 2 min
Views 1.8K
IT-companies
С 28 июля по 3 августа 2011 года, в МГУ имени М.В. Ломоносова пройдёт Летняя школа Microsoft по компьютерному зрению (Microsoft Computer Vision Summer School). Школа спонсируется исследовательским подразделением компании Microsoft — Microsoft Research.

Впервые школа такого уровня проводится в России. Лекторы школы являются ведущими мировыми учеными в области компьютерного зрения и анализа изображений, задают тенденции и направления развития всей области. Например, Andrew Blake и Andrew Fitzgibbon внесли существенный вклад в технологию Kinect – настоящую революцию в области человеко-компьютерных интерфейсов.

Помимо курсов по математическим методам и алгоритмам компьютерного зрения, на школе вы узнаете о структуре области в целом, о правилах написания статей на ведущие научные конференции. Отдельная секция будет посвящена опыту создания стартапов в области компьютерного зрения. Вы получите возможность лично пообщаться с учредителями и руководителями нескольких российских стартапов. Ожидается присутствие представителей ИТ-Кластера Сколково, которые расскажут о возможностях, предоставляемых Сколково участникам проекта.

Условия участия и программа школы
Total votes 25: ↑15 and ↓10 +5
Comments 4

Лаборатория при МГУ решает главную проблему России

Reading time 1 min
Views 1.7K
Image processing *
Сотрудники Лаборатории компьютерной графики и мультимедиа МГУ имени М. В. Ломоносова сегодня опубликовали свое решение для распознавания дефектов дорожного полотна по видео.

UPD. Сделал копию, на случай если сайт ляжет под хабраэффектом.
UPD. И еще одна копия.
PS. Спасибо за инвайт от mihailolenin для участника проекта: semapt
Total votes 112: ↑108 and ↓4 +104
Comments 100

Поиск по изображениям — гугл и не только

Reading time 4 min
Views 38K
Image processing *
Сначала немного общих слов о том, как вообще можно организовывать поиск по изображениям.
В идеале нам бы хотелось иметь систему, которая может анализировать содержимое рисунка, определять, изображен там дом, озеро или кошка с котятами, ну и попутно запоминать разные характеристики обнаруженных объектов — такие как цвет, размер, взаимное размещение — а потом осуществлять поиск по этой информации. Но, к сожалению, на сегодняшний день это решительно невозможно. Как минимум, нет метода, который позволил бы сколько-нибудь надежно выделять объекты реального мира на картинках.
Поэтому любая система вынуждена анализировать менее интеллектуальные признаки, и этих признаков может быть несколько разных типов:
Читать дальше →
Total votes 41: ↑36 and ↓5 +31
Comments 23

Папоротники как метод распознавания образов

Reading time 5 min
Views 8.3K
Image processing *
        Доброго времени суток!
        Как известно, одной из важных задач, решаемых обработкой изображений (помимо сброса пары кг и укрывания дефектов кожи на аватарках), является поиск и распознавание нужных нам объектов на сцене. Но этот процесс весьма сложный и ресурсоемкий, что делает его неприменимым в системах реального времени. Сегодня мы и поговорим, нельзя ли каким-то образом решить эту проблему и ускорить процесс поиска нужного объекта на сцене, с минимальными потерями в точности (а может, и без них вовсе). И вообще, причем тут папоротники?
PS
Традиционно много картинок.
Читать дальше →
Total votes 36: ↑35 and ↓1 +34
Comments 11

Дополненная реальность — это просто

Reading time 3 min
Views 27K
AR and VR
Sandbox
Для кого эта статья?

Для людей, которые интересуются компьютерным зрением и дополненной реальностью применительно к мобильным устройствам, но не знающих, с чего начать.

Предисловие

Итак, мы студенты математико-механического факультета СПбГУ, которые на досуге решили ознакомиться с базовыми аспектами компьютерного зрения. Для закрепления теоретических основ решили делать что-то практическое. Посещение наших крайне интересных лекций натолкнуло на мысль о приложении, позволяющем скидывать бомбы на людей в дополненной реальности.

В качестве мобильной платформы был выбран Android, так как имелся небольшой опыт написания приложений под него, и Java мы знаем гораздо лучше, чем Objective-C. Для обработки изображений мы решили использовать известную библиотеку OpenCV.
Под катом история создания нашего простенького приложения.
Читать дальше →
Total votes 22: ↑15 and ↓7 +8
Comments 12

Оператор Local Binary Patterns в задаче классификации текстур

Reading time 3 min
Views 10K
Image processing *
Sandbox
Здравствуйте, уважаемые хабралюди!

В данной статье хотелось бы рассказать о сравнительно новом операторе, применяемом в задаче классификации текстур. Данная задача очень близка к задаче поиска, распознавания и классификации образов.

Оператор LBP может быть использован для поиска объекта на изображении (например лица), а также проверки этого объекта на принадлежность некоторому классу (верификация, распознавание эмоций, пола по лицу). Заинтересовавшихся милости прошу под кат.
Читать дальше →
Total votes 5: ↑5 and ↓0 +5
Comments 15

Фильтрация ложных соответствий между изображениями при помощи динамического графа соответствий

Reading time 5 min
Views 23K
Algorithms *Image processing *

Многие современные алгоритмы компьютерного зрения строятся на основе детектирования и сопоставления особых точек визуальных образов. По этой теме было написано немало статей на хабре(например SURF, SIFT). Но в большинстве работ не уделяется должного вниманию такому важному этапу, как фильтрация ложных соответствий между изображениями. Чаще всего для этих целей применяют RANSAC-метод и на этом останавливаются. Но это не единственный подход для решения данной задачи.
Данная статья посвящена одному из альтернативных способов фильтрации ложных соответствий.
Читать дальше →
Total votes 73: ↑73 and ↓0 +73
Comments 23