Комментарии / Профиль pagin / Хабр

Дмитрий Пагин@pagin

ML and CV Developer

Подписчики

pagin 9 сен 2024 в 06:36

Я стабильно 5-10 раз в год прохожу собесы, хотя и чувствую себя комфортно на своем месте работы. ТУПО ДЛЯ ТОГО, ЧТОБЫ ПОНИМАТЬ, ЧТО Я МОГУ ИХ ПРОЙТИ. И каждый раз замечаю, как отличается подготовка от реальных рабочих задач.

Да, конечно, давайте повернем матрицу и развернём строку, вчера это делал через rotate/revert. А всмысле это вам не подходит, если вы тут же в резюме просите знание numpy/LINQ?

Вы хотите System Design Твиттера - да давайте, тут только часа 2 надо для поверхностного разбора. А всмысле мы сейчас будем считать, сколько бит в теле запроса на список пользователей? Я бы просто привлёк техлида, чтобы такие вещи вместе посчитать - никто не делает System Design в соло. Сами же говорите про навыки делегирования в Резюме.

Нет, окей, я всё это подучу, стану супер-разработчиком/лидом в вакууме. Только ведь оно так противоречит и вашему резюме, и практике. Или вы переживаете, что все с проекта сбегут и останусь я один? Ну тогда я к вам не очень хочу.

При этом, отмечу, что собесы я прохожу и офферы получаю в 10-30% случаев - это реально. И не так страшен этот ваш LeetCode (немного лицемерю - сложные задачи правда страшно, но на реальных собесах их не встречал). Мне противно от послевкусия, что все проводят собесы так, как проводят конкуренты/рынок, а не так, как это было бы полезно и эффективно.

В своей команде на собесе 2 части - первая на Soft (соответствие культуре компании, коммуникации и тд), вторая на Hard(просто тестовое и потом 30 минут посмотреть, как человек умеет думать. Без задачек с LeetCode и тд). Вроде работает, на текучку не жалуемся.

Но в целом, хочу сказать, что собеседующих можно понять - всё это сложный процесс и не всегда понимаешь, а что мы делаем не так

Топ 10 ИИ-фреймворков, или Сказ о том, как AMD проиграла рынок NVIDIA

pagin 6 сен 2024 в 06:16

6 лет назад был такой PlaidML - а-ля бэкенд для TF, позволяющий работать на GPU AMD. Он был поприветливее ROCm и прочих. Писал тогда статью про него - https://habr.com/ru/articles/420989/.
Запускалось оно с пол-оборота, но производительность была раза в 2 ниже, чем на сравнимых по цене GPU от Nvidia. Не рассматривали его, оно сейчас живое? На гитхабе глянул их проект - вроде обновлялись год назад.

Страх и ненависть в телевизоре: как 3 разработчика взяли целую кучу нейросетей и научили их находить буквально ВСЁ

pagin 22 авг 2024 в 11:11

А почему не CLIP/DINO/Yolo-world? Для задачи "Определить всё" явно лучше. Ну и как бы получается one-stage. И учить не нужно - берем из коробки.

Кунг-фу спикера: словесные трюки, вербальная дрессировка и другие приемы речевой борьбы

pagin 8 авг 2024 в 11:22

Отличные примеры с приложением к практике, спасибо! Очень напомнило книгу Непряхина "Я манипулирую тобой". Если еще не читали - попробуйте, вам точно понравится. Единственное, чего не хватило - разбора разных вариантов ухода от манипуляций. Есть несколько вариантов выхода - вскрытие, слом сценария, встречная манипуляция и тд. Они немного разный эффект имеют и к разным ситуациям применимы. Есть очень клёвые выходы через сломанный сценарий - очень люблю читать вариации на эту тему

Профессиональное выгорание. Как управлять эмоциями, чтобы его избежать?

pagin 1 авг 2024 в 04:16

Спасибо за статью! Со многим согласен, но по ощущению статья вышла однобокой - не хватает моментов про индивидуальность людей (психотипы, если угодно). Для одних людей нормально заглушать эмоции и переходить в рациональное русло, для других - это лишь ведёт к накоплению и последующему взрыву.
Т.е. нельзя использовать общий подход к управлению эмоциями, закрывая глаза на индивидуальные особенности.

За референс могу привести "Как пасти котов" Рейнвотера, где открыто говорится, что индивидуальность очень важна и разным людям подходят разные методики

Как разивать системное мышление?

pagin 28 мар 2024 в 03:42

Рекомендую первые главы книги Константинова "Стратегическое Мышление", там наиболее понятный для меня набор видов мышления. С представленной здесь классификацией не совсем согласен (и не понял, на какой литературе она построена? Питер Сенге?). Процессное мышление - что-то вообще новое для меня.

Ощущение, что всё смешалось - кони, люди. Одни виды мышления судя по статье становятся навыками другого - странно для меня. Нужно определять, по какому признаку мы производим классификацию видов мышления. Это уже не к вашему комментарию, а к статье в целом

Искусственный интеллект на Python с использованием TensorFlow и Keras

pagin 31 окт 2023 в 03:44

Статья для новичков, наверное, полезная. Но есть одна важная ошибка, которой не стоит их учить - pip install keras и дальше импорт из него. keras сейчас полностью мигрировал внутрь tf и правильно вызывать tf.keras и импорты слоёв делать тоже оттуда

Neural Network Optimization: океан в капле

pagin 17 мар 2023 в 07:52

Большое спасибо за статью, очень люблю эту тематику. Иногда полезно почитать такие общие статьи для повторения и актуализации информации в голове.
Дополню насчет float32 -> float16. К сожалению, на практике после такой конвертации теряется довольно важная часть точности. Она может слабо выражаться в метриках, но иногда после такого сети непригодны для моментальной отправки в прод. Не рекламируюсь ни в коем случае, но вот в своей статье описывал, к чему это иногда ведет -https://habr.com/ru/post/558406/. Желательно даже при таком квантовании использовать Quantization Aware Training, который, благо, реализуется в 1 строчку в TF или PyTorch.
Ну и насчет скорости работы - смотря что считать большим ускорением. У нас получилось около 2х к скорости обработки. Учитывая относительную простоту float32 -> float16 получается очень высокий КПД.
А вот при квантовании float32 -> int8 нужно потратить довольно много усилий, чтобы это заработало с достаточной точностью. Знаю, что такое часто делают для мобилок в различных GANах и дифьюзерах, т.к. визуальный результат клиента удовлетворяет. А вот если стоит задача детекции, классификации и тд, где наша метрика точности более осязаема - возникают большие проблемы. Ну и тут сложнее с Quantization Aware Training - методики вроде как есть, но это уже не одна строчка и часто ломаются оптимизаторы. Если вы знакомы с хорошими методиками Quantization Aware Training для int8, то поделитесь. Я уже полгода не смотрел новых работ по этой теме

И насчет Pruning - там тоже есть 2 варианта: Post Training и During Training. Первый вариант на моей практике был не очень полезным, без потери точности получалось вырезать лишь малую часть. А вот второй вариант пока руки не дошли попробовать. Подскажите, может был опыт? Очень интересны практические результаты

Технология компьютерного зрения с функциями бесконтактного контроля температуры и режима ношения средств защиты

pagin 18 фев 2022 в 11:49

Намного интереснее, как вы решайте задачу в крайних случаях - например в забитых автобусах?

Распознавание номерных знаков. Как все ускорить

pagin 24 дек 2021 в 06:06

Не пробовали вместо YOLOv5+CRAFT использовать одну WPOD-NET? Будет значительно быстрее и сразу отнормировано

Нечего надеть? Computer Vision в помощь

pagin 29 июл 2021 в 14:27

Попробуйте добавить center_loss - он без перевода в сферические координаты. Должно дать значимый буст в точности работы. Всё таки метрик лернинг на чистом CE не совсем ту задачу решает. Линейное разделение не гарантирует скученность векторов

-1

Нечего надеть? Computer Vision в помощь

pagin 29 июл 2021 в 10:52

Мы решили экспериментировать дальше. Вытащили из обученной сети результирующие векторы по всем нашим изображениям, затем искали ближайшие векторы к картинке-запросу.

Правильно ли я понимаю, что вы взяли вектора с предпоследнего слоя классифицирующей сети? Использовали какие-то доп лоссы - sphere-loss или cosine-loss для компактного сбора векторов в гиперпространстве?

ML в облаке: как я попробовал Yandex DataSphere и почему его так непросто сравнить с Google Colab

pagin 6 июл 2021 в 03:15

А вы везунчик! Я ни разу не получал в простом Colab что-то из T4/P100. Так или иначе, для Pro выделение мощных GPU в приоритете и происходит чаще(о чем написано в официальной документации). В любом случае, несколько коробит такая ситуация, когда скорость обучения твоей сети зависит от воли случая. А про 4vCPU не знал, спасибо за замечание!

ML в облаке: как я попробовал Yandex DataSphere и почему его так непросто сравнить с Google Colab

pagin 30 июн 2021 в 15:07

Круто, что у тебя есть такой опыт. Думаю, радужность, моего отзыва следуют как раз из недостаточно сложной задачи и окружения. Единственной проблемой для меня стал неподдерживаемый SEPARABLECONV2D, который потратил сравнимо меньше моих нервов. Значит, есть причина ещё раз задуматься о применимости DataSphere для больших проектов

ML в облаке: как я попробовал Yandex DataSphere и почему его так непросто сравнить с Google Colab

pagin 30 июн 2021 в 08:15

А как в Saturn Cloud остальные моменты? Pricing подпиской? На что больше похож в целом — Colab или DataSphere?

Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT

pagin 22 мая 2021 в 04:28

Про формат входных данных хорошее замечание, тоже наблюдали. Насчёт запуска Yolov3 - не знаю, в чем проблема. Мы на этой же версии Trt и yolov3 конвертится без проблем. Опять же, только если проблема в слое Upsample.

Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT

pagin 21 мая 2021 в 13:35

Хорошие вопросы! Добавил UDP2 с ответами на них

Quantization Aware Training. Или как правильно использовать fp16 inference в TensorRT

pagin 21 мая 2021 в 11:45

Спасибо за вопрос.
TensorRT для float16 inference использует Tensor cores. Да, тут важно говорить как ускорение для 1 потока в 2 раза за счет float16 вычислений, так и про увеличение пропускной способности памяти с особенностями вычислений в tensor cores.
Наш опыт такой — при работе в 1 потоке мы получаем ускорение 2х. Однако, если говорить про многопоточную обработку, то ситуация интереснее. Во float32 на TF мы можем обрабатывать параллельно 2.5 потока видео 30 fps. При переходе на float16 в TensorRT производительность вырастает до 8 потоков 30 fps. Т.е. фактически при полной утилизации tensor cores мы получили увеличение производительности в 3.2 раза — несколько меньше теоретически максимальной. Скорее всего, это связано с тем, что мы обрабатываем потоки с батчем = 1, чтобы не увеличивать latency прихода данных по каждому кадр.

Джедайская техника уменьшения сверточных сетей — pruning

pagin 3 янв 2020 в 05:41

Чекнул. Да, интересное решение, как-то упустил его из виду. Спасибо)

Задача — детектирование автомобилей в одной плоскости. За счёт отсутствия перекрытий и одного масштаба задача сильно упрощается и получается высокий mAp75

Джедайская техника уменьшения сверточных сетей — pruning

pagin 27 дек 2019 в 10:38

Да, читал. Я в ожидании pretrained SpineNet)
Здесь YOLOv3 описан как хороший вариант для бейзлайна по доступности и простоте)

2 3