Pull to refresh
469
0
Мальцев Антон @ZlodeiBaal

Computer Vision, Machine Learning

Send message
51ого где-то 40 батч, 101 где-то 16 батч. Но с чистым песне том давно в последний раз работал. +-20% оценка
Можно любую. Более того, DIGITS можно поверх любой более-менее адекватной современной версии caffe зацепить. Просто перед стартом указать переменную в папку где Caffe.
Конечно, после этого DetectNet и прочие свистелки-перделки перестают работать, но графички потерь и всё такое он кажет.
Но стабильность системы во многом определяется границами её работы;)
У меня как бы весь пост про то, начиная с какой точки перестанет работать всё;)
Тут даже искать точку долго не пришлось. По этим же фотографиям google более-менее адекватную подборку выдаёт тегов.

P.S. А демка крутая, да.
Спасибо! Проморгал. Но, по другим снимкам, честно говоря, не очень работает:
a vase with flowers in it
a little girl laying in the grass
a large clock tower towering over the city of london
a group of stuffed animals
Даже по одним таким названиям, кажется, я знаю, что у них за обучающая выборка была:)
Я думаю, что они вообще все фото которые с геолокацией нашли — используют.
У них только про HOG написано.
Если честно, меня немного его качество работы тоже удивило. С другой стороны на этом вот снимке dlib раза в 3-4 меньше лиц чем Google находит — https://hsto.org/files/68e/849/43e/68e84943e36c498a89f4532c374eaf95.jpg
Проверял. Почти все фото мои с фотоаппарата который о таком не знает.
Ручками не то в C# не то в Python за 10 строчек.
Ребята молодцы, конечно. Даже не смотря на то, что MegaFace — конкурс подверженный дикому оверфиту. Классно, что получилось так выехать на DNN|CNN-волне. Плюс реально хороший алгоритм.
Другое дело, что сейчас алгоритмы такого плана становятся всё проще и проще. Могу поспорить, что года через 2-3 такой уровень уже будет в оупен сорсе доступен. Поэтому главное, чтобы уровень развития сохранялся, ресёрч продолжался. И чтобы команда не зацикливалась на одном месте.
А что это «Cognitive Technologies» занимается разработками Камаза? Их турнули оттуда за раздолбайство. Вроде Яндыкс уже занимается.
То что я видел у интела до сих пор — было на редкость убого. Но по крайней мере они стали это направление направленно развивать — что, конечно, очень хорошо.
На новых не работал. Видел тесты NVIDIA, что они просто разрывают всех по производительности. Но реально не читал про опыт использования. И сам не тестировал.
А там опубликована статья? Ссылочкой не поделитесь? Я переодически табличку по VOC2012 отслеживаю — http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?cls=mean&challengeid=11&compid=6&submid=8822#KEY_RRR-ResNet152-COCO-MultiScale
Но там по тем сеткам, где архитектура открыта она какая-то мутная. То марковские модели впилят, то какие-то карты фич полу-вручную разгребают.
В DetectNet вычислений на верхнем уровне практически нет, как я понимаю. А для свёрточной сети объём вычислений будет прямо пропорционален площади. Ускорения тут скорее от железа будут зависить. Вроде NVIDIA сделало нативную поддержку ядер 3*3. Но каких-то тестов не от NVIDIA не видел.
Я думаю, что на 950 максимум раза в 2 упадёт. А так должна работать.
Кстати, тут есть любопытный вопрос. Если YOLO заапдейтить верхушку вот таким образом (назвается SSD). То у него качество распознавания раза в 1.2 вырастает. Но этот апдейт, по сути, просто напросто Residual Connection.
Возникает логичный вопрос: где сетки для детектирования на базе полноценного ResNet??? Они должны хорошо работать. Почему никто на базе ResNet не пересобрал Faster-RCNN? Или всё это уже давно сделано в недрах крупных компаний, просто не публикуются результаты?

Чет мне кажется, что Faster тоже полетит, если у него в качестве feature extractor будет использоваться GoogLeNet вместо VGG-16...

Как я понял YOLO на VGG16 всё же даёт ~50 fps. По крайней мере вот эти ребята недавно эксперементировали вроде. А. Вы чуть выше это тоже упомянули. Но 100fps я не видел сам:)
так что не думаю, что Faster прямо таки в 10 раз ускориться. Но раза в 2 может.

У NVIDIA. Считайте что они захватили рынок. Нет, какая-то поддержка ATI есть. Но обычно кривая и бажная. В Theano вроде есть, в TensorFlow. Но ATI реагирует на желания пользователей лишь после того как на них прореагирует NVIDIA. Или даже позже.
А так, даже Intel прикрутил для своей IntelPHI какой-то форк Caffe. Но вот стоит ли этим пользоваться? Не думаю.
1080, так что да, это не очень репредентативно для простых устройств
Я не знаю. Думаю, что есть просто собираемые фреймворки/экземплы. Но вряд ли это то, что NVIDIA и прочие игроки хотят на базовом уровне поддерживать.
Так уже же! https://habrahabr.ru/company/recognitor/blog/312472/
Или заголовок не настолько жёлтым вышел?
Модель как использовать там в конце написано.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity