Кстати, на финальной гифке скорость распознавания невысокая еще из-за того, что у меня дома только компьютер "с алиэкспресса" из 2012 года + запущен скринкастинг, похожие DL модели из Open Model Zoo на свежих ноутах спокойно успевают обрабатывать поток с веб-камеры около 30 FPS.
Если пишете на питоне, то я вот тут студентам в режиме туториала рассказываю как запустить и какой код что делает (правда немного гнусаво): https://vk.com/video-2139021_456239080.
Ну, ограничивать пользователям доступ к функционалу это очень негативно влияет на отношение к компании, как пример недоверие к умным телевизорам и всевозможным обновлениям. А вот вотермарка более мягкий способ, он не воспринимается так негативно.
Был в Польше, Болгарии, Италии, всегда удивляло как это они могут организовать безопасность без рамок металлоискателя, после этого возвращаешься в Россию и чувствуешь себя каким-то террористом.
Если бы у всех была одинаковая возможность голосовать, то это было бы подозретельно. Но с правилами хабра могло получиться так, что пост просто не попал к тем, кто может плюсовать статьи.
При конвертации моделей в OpenVINO можно все оптимизации выключить, это делается добавлением ключей конвертации: https://docs.openvinotoolkit.org/latest/openvino_docs_MO_DG_prepare_model_Model_Optimization_Techniques.html
Если хочется отлаживаться по слоям в любом фреймворке, то можно просто делать копию промежуточного тензора и сделать его выходным, тогда на выходе можно получить значения после каждого слоя. Через DL Workbench посмотреть значения по-моему нельзя, только время выполнения каждого слоя.
Идея поста — познакомить с тем, что вообще есть проблема оптимизации инференса и как можно ее решить с помощью DL Workbench, причем не на словах, а действительно попробовать запустить Workbench и потестить производительность, выбрать наилучшие параметры. Для AWS точно также запускается DL Workbench из Docker и определяется оптимальный размер пачки / количество реквестов, которые потом нужно будет использовать в вашем проекте.
Интеграция с вашим приложением может быть выполнена различным образом, на уровне C++ или Python кода, либо же создание REST-сервиса, тут всем подходят разные варианты. Для небольших приложений думаю подойдет создание Deployment Package.
Если это интересно читателям, то можно сделать и такой эксперимент.
Но вот только apple его запатентовала и делать так никому не дает, поэтому только usb-c
Потому что это устаревший список за 2019 год. CVAT к тому моменту еще не вышел в мир.
Так там 10 попыток всего
Кстати, на финальной гифке скорость распознавания невысокая еще из-за того, что у меня дома только компьютер "с алиэкспресса" из 2012 года + запущен скринкастинг, похожие DL модели из Open Model Zoo на свежих ноутах спокойно успевают обрабатывать поток с веб-камеры около 30 FPS.
Если пишете на питоне, то я вот тут студентам в режиме туториала рассказываю как запустить и какой код что делает (правда немного гнусаво): https://vk.com/video-2139021_456239080.
А в репозитории https://github.com/itlab-vision/CV-SUMMER-CAMP-2021 материалы текущей летней школы по компьютерному зрению, там много текстовых материалов.
Спасибо за статью! Очень интересная!
Да, конечно)
До шумоподавления: https://drive.google.com/file/d/1naVSVktruNvI8eDlH0oCKaQmXg7qAh9q/view?usp=sharing
После шумоподавления: https://drive.google.com/file/d/1j91y9I2T-acYIQiO1TqWvxZCP-4RmQbm/view?usp=sharing
Ну, ограничивать пользователям доступ к функционалу это очень негативно влияет на отношение к компании, как пример недоверие к умным телевизорам и всевозможным обновлениям. А вот вотермарка более мягкий способ, он не воспринимается так негативно.
Можно попробовать на недельку добавлять надпись fakercloud.com на аватары, если конечно это не будет противоречить правилам fakercloud.
Когда в соседнем интеле/хуавее зарплата в 5 раз выше чем в универе, не больно то кто и горит желанием остаться в универе.
Оффтоп: интересная инфа — RTX 3070 зарабатывает больше учителя математики в Нижнем Новгороде.

Давайте еще в каждый подъезд рамки поставим.
Был в Польше, Болгарии, Италии, всегда удивляло как это они могут организовать безопасность без рамок металлоискателя, после этого возвращаешься в Россию и чувствуешь себя каким-то террористом.
Если бы у всех была одинаковая возможность голосовать, то это было бы подозретельно. Но с правилами хабра могло получиться так, что пост просто не попал к тем, кто может плюсовать статьи.
В пакете OpenVINO от Intel лежит OpenCV, собранная с поддержкой инференса IR моделей, нужно только активировать Inference Engine как бекенд.
По ссылке презентация про OpenVINO курса ко современнолму компьютерному зрению, который разработан в ННГУ, может она будет полезна.
При конвертации моделей в OpenVINO можно все оптимизации выключить, это делается добавлением ключей конвертации: https://docs.openvinotoolkit.org/latest/openvino_docs_MO_DG_prepare_model_Model_Optimization_Techniques.html
Если хочется отлаживаться по слоям в любом фреймворке, то можно просто делать копию промежуточного тензора и сделать его выходным, тогда на выходе можно получить значения после каждого слоя. Через DL Workbench посмотреть значения по-моему нельзя, только время выполнения каждого слоя.
Вторая часть уже готова, в ней будет про INT8 и Throughput mode. А вот третья часть не планировалась пока, можно попробовать.
Идея поста — познакомить с тем, что вообще есть проблема оптимизации инференса и как можно ее решить с помощью DL Workbench, причем не на словах, а действительно попробовать запустить Workbench и потестить производительность, выбрать наилучшие параметры. Для AWS точно также запускается DL Workbench из Docker и определяется оптимальный размер пачки / количество реквестов, которые потом нужно будет использовать в вашем проекте.
Интеграция с вашим приложением может быть выполнена различным образом, на уровне C++ или Python кода, либо же создание REST-сервиса, тут всем подходят разные варианты. Для небольших приложений думаю подойдет создание Deployment Package.
Если это интересно читателям, то можно сделать и такой эксперимент.
Есть два метода оптимизации, которые нужно бы попробовать перед тем, как пытаться делать вещи из статьи:
Что-то мне подсказывает что оно будет столько же, но при этом все лаконично и в пару строчек
Вот только с видеоконференциями во времена Windows XP было все плохо, да и при висте не очень. Big Blue Button разве что
А можете какой-нибудь посоветовать такой учебник? Было бы очень круто, а то сейчас выпускают море шлака
Есть ли что-то аналогичное с Travis CI, а то бесплатная часть заканчивается очень быстро?