Как стать автором
Обновить
43
0
Дмитрий Пагин @pagin

ML and CV Developer

Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT

Время на прочтение 8 мин
Количество просмотров 4.5K
Высокая производительность *Программирование *Серверная оптимизация *Машинное обучение *Искусственный интеллект

Low-precision inference в TensorRT сегодня - мастхэв, бест практис и прочие иностранные. Сконвертить из TensorFlow легко, запустить легко, использовать fp16 легко. Да и КПД выше, чем у pruning или distillation. На первый взгляд всё работает идеально. Но на самом деле всё ли так гладко? Рассказываем, как мы в TrafficData споткнулись об fp16, встали и написали статью.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 7

Джедайская техника уменьшения сверточных сетей — pruning

Время на прочтение 6 мин
Количество просмотров 8.5K
Высокая производительность *Python *Программирование *Машинное обучение *Искусственный интеллект

image


Перед тобой снова задача детектирования объектов. Приоритет — скорость работы при приемлемой точности. Берешь архитектуру YOLOv3 и дообучаешь. Точность(mAp75) больше 0.95. Но скорость прогона всё еще низкая. Черт.


Сегодня обойдём стороной квантизацию. А под катом рассмотрим Model Pruning — обрезание избыточных частей сети для ускорения Inference без потери точности. Наглядно — откуда, сколько и как можно вырезать. Разберем, как сделать это вручную и где можно автоматизировать. В конце — репозиторий на keras.

Читать дальше →
Всего голосов 24: ↑24 и ↓0 +24
Комментарии 9

Путь к бесконтактному детектору лжи, или Как устроить себе хакатон на максималках

Время на прочтение 4 мин
Количество просмотров 6.1K
Программирование *Хакатоны Машинное обучение *Исследования и прогнозы в IT *Искусственный интеллект

image


Когда-то Стив Джобс и Стив Возняк закрылись в гараже и выкатили первый Mac. Было бы классно, если всегда можно было закрыть программистов в гараже и получить MVP с большим потенциалом. Однако, если добавить к программистам пару людей, готовых оценивать пользовательский опыт и искать что-то инновационное, то шансы на успех растут.


У нашей команды из 5 человек появилась определённая идея, ради которой мы решили слегка захватить мир похакатонить.

Читать дальше →
Всего голосов 22: ↑17 и ↓5 +12
Комментарии 25

Почему не стоит выкидывать Radeon, если ты увлекся машинным обучением?

Время на прочтение 4 мин
Количество просмотров 55K
Высокая производительность *Python *Машинное обучение *Исследования и прогнозы в IT *Искусственный интеллект

image


Свою рабочую станцию мне выдалось собирать, будучи студентом. Достаточно логично, что я отдавал предпочтение вычислительным решениям AMD. потому что это дешево выгодно по соотношению цена/качество. Я долго подбирал компоненты, в итоге уложился в 40к с комплектом из FX-8320 и RX-460 2GB. Сначала этот комплект казался идеальным! Мы с соседом по комнате слегка майнили Monero и мой набор показывал 650h/s против 550h/s на наборе из i5-85xx и Nvidia 1050Ti. Правда, от моего набора в комнате бывало слегка жарковато по ночам, но это решилось, когда я приобрел башенный кулер к CPU.

Читать дальше →
Всего голосов 52: ↑51 и ↓1 +50
Комментарии 40

Почему хватит считать нейронные сети черным ящиком?

Время на прочтение 3 мин
Количество просмотров 28K
Python *Визуализация данных *Машинное обучение *Искусственный интеллект
Из песочницы
image

Если вы достаточно долго увлекаетесь нейросетевыми технологиями, то наверняка встречались с мнением, кратко заключенным в риторическом вопросе: «Как ты объяснишь человеку, когда нейросеть считает, что у него рак?». И если в лучшем случае такие мысли заставят тебя сомневаться в использовании нейросетей в достаточно ответственных сферах, то в худшем случае ты можешь и потерять весь свой интерес.

Читать дальше →
Всего голосов 75: ↑69 и ↓6 +63
Комментарии 46

Информация

В рейтинге
Не участвует
Откуда
Пермь, Пермский край, Россия
Дата рождения
Зарегистрирован
Активность