Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Всем любителям компьютерного зрения хорошо известна библиотека OpenCV, однако это совсем не значит, что все ею довольны. Поэтому периодически возникают альтернативные проекты, пытающиеся сделать работу с компьютерным зрением проще и приятней. Одним из таких проектов является библиотека Community Computer Vision (CCV). Разработанная небольшой группой китайских программистов, библиотека ставит в приоритет простой и ясный интерфейс. Кроме того, проект рассчитан на практические задачи, поэтому разработчики сосредоточились на наиболее важных и современных алгоритмах.
Одним из таких алгоритмов является глубокая свёрточная нейронная сеть (Deep Convolutional Neural Networks). Представленная Алексом Крижевски (Alex Krizhevsky) в 2012 году архитектура объединяет работы Яна Лекуна (Yann LeCun) по свёрточным нейронным сетям (1990г.) и принципы глубокого обучения, разработанные Джефри Хинтоном (Geoffrey Hinton) в 2006-м. На нескольких значимых тестах DCNN показала непревзойдённые результаты, значительно опередив известные ранее алгоритмы.
Несмотря на большой интерес к свёрточным сетям в последние годы, работа с ними часто затруднена из-за большого количества ресурсоёмких операций (и конкретно операции свётки) и, как следствие, крайне медленного обучения. Поэтому с самого появления CNN остро стоит вопрос увеличения производительности за счёт ипользования низкоуровневых оптимизаций (чаще всего с использованием GPU). На данный момент известно не так много реализаций, ориентированных на скорость работы, и самыми известными из них являются Caffe из университета Беркли и OverFeat из NYU.
Ребята из CCV добавили свою реализацию, практически не уступающую по производительности указанным выше, но эргономично вписывающуюся в общий API библиотеки для работы над разноплановыми задачами компьютерного зрения. Заинтересованные читатели могут найти более подробную информацию на странице проекта.
Библиотека компьютерного зрения CCV 0.6 с новым классификатором изображений