Добрый вечер, хабрасообщество!
Я уже писал о летней школе компьютерного зрения, проходившей прошлым летом в Чешском техническом университете в Праге в статье. В конце марта мне посчастливилось принять участие еще в одном однодневном мероприятии подобного рода, организованном той же группой The Center for Machine Perception из ЧТУ в Праге. В этот раз это была серия из 6 докладов в перерывами на обед и кофе-брейк. Основными темами мероприятия были алгоритмы компьютерного зрения и машинного обучения. Судя по большому числу докладов о Deep learning, это направление становится очень популярным трендом в решении задач компьютерного зрения. За подробностями прошу под кат. Осторожно, трафик!
Мероприятие проходило в очень красивом историческом здании факультета Электротехники в центре Праги.
В качестве лекторов как в летней школе были приглашенные ученые эксперты из различных университетов со всего мира, занимающиеся исследованиями в области компьютерного зрения. Был среди них также докторант из ЧТУ.
Половина докладов была посвящена машинному обучению, в том числе графическим моделям, глубокому обучению и картам признаков (feature maps).
Antonin Sulc рассказал о интересном направлении в компьютерном зрении — light fields и его применении на практике. Для начала он представил саму технологию, которая возникла благодаря разработке компактных light-field камер Lytro Illum. Такие камеры позволяют получить кроме информации о цвете также информацию об угле падения лучей в каждом пикселе. Простейшее применение таких камер — это смена фокусировки камеры с заднего плана на объекты на переднем плане и наоборот. Технология light-field применяется в structure-from motion, позволяет разделять изображение на несколько слоев (например, выделять отражающие и прозрачные поверхности на изображении) и эффективно оценивать глубину (строить depth map).
Докторант Giorgos Tolias из ЧТУ рассказал о своей разработке дескриптора признаков, позволяющего выполнять поиск изображений с использованием скетча, сделанного от руки, в качестве запроса.
Самым интересным на мой взгляд был доклад Янниса Авризиса, который рассказал о методах приближенного поиска при решении задач кластеризации в многомерном пространстве. Он описал проблему поиска в многомерном пространстве, показал в каких задачах компьютерного зрения решается эта проблема (поиск изображений, оценка позиции съемки кадра, Bag of words и кластеризация). Также были представлены различные методы приближенного поиска такие как бинарные коды, квантизация (vector, product quantization) и кластеризация (k-means и различные его модификации, Gaussian mixturesб ranked retrieval и inverted-quantized k-means). Все методы были представлены с подробным математическим объяснением и показаны наглядно графически в виде схем.
Ознакомиться с целой программой и скачать презентации можно по ссылке: cmp.felk.cvut.cz/cmp/events/colloquium-2016.03.31.
После окончания основной части желающие совершили небольшую экскурсию в рабочие кабинеты центра CMP.
В начале нам показали онлайн систему поиска подобных изображений для заданного фрагмента изображения. Пользователь может выделить рамкой на изображении объект интереса (например, купол собора) и в ответ получает все релевантные изображения, которые могут содержать этот объект с той же самой перспективы, с различных точек обзора, в различных масштабах и даже более детальные.
Здесь ссылка на статью о проекте для тех, кто желает узнать больше о проекте: cmp.felk.cvut.cz/~chum/papers/mikulik_sisap13.pdf.
В итоге, день выдался насыщенным и познавательным. Надеюсь, что в будущем еще удастся посетить другие подобные мероприятия. Данное мероприятие — Pattern Recognition and Computer Vision Colloquium — проводится раз в полгода, в предыдущий раз оно проводилось в ноябре 2015. Такие мероприятия позволяют познакомиться я экспертами и узнать о новых тенденциях и технологиях в области компьютерного зрения.
Всем желаю удачи и ждите новых обзоров!
Я уже писал о летней школе компьютерного зрения, проходившей прошлым летом в Чешском техническом университете в Праге в статье. В конце марта мне посчастливилось принять участие еще в одном однодневном мероприятии подобного рода, организованном той же группой The Center for Machine Perception из ЧТУ в Праге. В этот раз это была серия из 6 докладов в перерывами на обед и кофе-брейк. Основными темами мероприятия были алгоритмы компьютерного зрения и машинного обучения. Судя по большому числу докладов о Deep learning, это направление становится очень популярным трендом в решении задач компьютерного зрения. За подробностями прошу под кат. Осторожно, трафик!
Мероприятие проходило в очень красивом историческом здании факультета Электротехники в центре Праги.
В качестве лекторов как в летней школе были приглашенные ученые эксперты из различных университетов со всего мира, занимающиеся исследованиями в области компьютерного зрения. Был среди них также докторант из ЧТУ.
Половина докладов была посвящена машинному обучению, в том числе графическим моделям, глубокому обучению и картам признаков (feature maps).
Antonin Sulc рассказал о интересном направлении в компьютерном зрении — light fields и его применении на практике. Для начала он представил саму технологию, которая возникла благодаря разработке компактных light-field камер Lytro Illum. Такие камеры позволяют получить кроме информации о цвете также информацию об угле падения лучей в каждом пикселе. Простейшее применение таких камер — это смена фокусировки камеры с заднего плана на объекты на переднем плане и наоборот. Технология light-field применяется в structure-from motion, позволяет разделять изображение на несколько слоев (например, выделять отражающие и прозрачные поверхности на изображении) и эффективно оценивать глубину (строить depth map).
Докторант Giorgos Tolias из ЧТУ рассказал о своей разработке дескриптора признаков, позволяющего выполнять поиск изображений с использованием скетча, сделанного от руки, в качестве запроса.
Самым интересным на мой взгляд был доклад Янниса Авризиса, который рассказал о методах приближенного поиска при решении задач кластеризации в многомерном пространстве. Он описал проблему поиска в многомерном пространстве, показал в каких задачах компьютерного зрения решается эта проблема (поиск изображений, оценка позиции съемки кадра, Bag of words и кластеризация). Также были представлены различные методы приближенного поиска такие как бинарные коды, квантизация (vector, product quantization) и кластеризация (k-means и различные его модификации, Gaussian mixturesб ranked retrieval и inverted-quantized k-means). Все методы были представлены с подробным математическим объяснением и показаны наглядно графически в виде схем.
Ознакомиться с целой программой и скачать презентации можно по ссылке: cmp.felk.cvut.cz/cmp/events/colloquium-2016.03.31.
После окончания основной части желающие совершили небольшую экскурсию в рабочие кабинеты центра CMP.
В начале нам показали онлайн систему поиска подобных изображений для заданного фрагмента изображения. Пользователь может выделить рамкой на изображении объект интереса (например, купол собора) и в ответ получает все релевантные изображения, которые могут содержать этот объект с той же самой перспективы, с различных точек обзора, в различных масштабах и даже более детальные.
Здесь ссылка на статью о проекте для тех, кто желает узнать больше о проекте: cmp.felk.cvut.cz/~chum/papers/mikulik_sisap13.pdf.
В итоге, день выдался насыщенным и познавательным. Надеюсь, что в будущем еще удастся посетить другие подобные мероприятия. Данное мероприятие — Pattern Recognition and Computer Vision Colloquium — проводится раз в полгода, в предыдущий раз оно проводилось в ноябре 2015. Такие мероприятия позволяют познакомиться я экспертами и узнать о новых тенденциях и технологиях в области компьютерного зрения.
Всем желаю удачи и ждите новых обзоров!