Комментарии / Профиль Arseny_Info / Хабр

Как стать автором

Арсений Кравченко @Arseny_Info

machine learning engineer

Профиль Публикации 10Комментарии 415Закладки 51

Хватит клепать псевдопрограммистов, или «Горшочек — не в IT!»

Arseny_Info 12 авг 2021 в 21:30

Это не проблема. Человек, который научился решать NLP задачи с помощью LSTM, легко и быстро освоит и трансформеры, и сверточные сети, и любой близкий инструмент.

0

Посмотреть

Выявление самозванцев среди программистов

Arseny_Info 6 авг 2021 в 21:27

При найме грузчиков тоже не надо ставить себя выше нанимаемых

0

Посмотреть

Разработка большого проекта за 6 месяцев: как не облажаться

Arseny_Info 24 июн 2021 в 22:44

> Отказ от тестов был вынужденным, потому что дедлайны горят

Leopards Ate My Face When I Voted For The Leopards Eating People's Faces Party

0

Посмотреть

ABBYY NeoML 2.0: Python и многое другое

Arseny_Info 23 июн 2021 в 15:03

Совпадение ответов — недостаточный критерий качества. Например, я однажды тоже намерял, что торч в N раз медленнее, чем onnxruntime, а потом обнаружил, что с настойкой трединга накосячил.

А где можно почитать про ONNX? neoml.readthedocs.io/en/latest/search.html?q=onnx ничего не находит.

0

Посмотреть

ABBYY NeoML 2.0: Python и многое другое

Arseny_Info 23 июн 2021 в 13:44

Сравнение на Mobilenet + CPU выглядит подозрительным: я верю, что вы крутые, но не может pytorch отставать в 10-20 раз. Допускаю, что тест не вполне корректный.

Было бы интересно еще увидеть сравнение по скорости инференса с openvino/tensorrt/onnxruntime.

Наконец, есть вопрос — как у вас дела с конвертерами? Например, можно ли натренировать модель на торче, сконвертить в onnx и инферить на neoml?

+1

Посмотреть

Я 8 лет работал сисадмином в провинции — но ушел в Devops, когда меня снова попросили чинить клавиатуры

Arseny_Info 2 июн 2021 в 12:24

Докер все равно нужен, даже если все на AWS.

0

Посмотреть

Как проходит собеседование Python-разработчика: вопросы для джуниоров и мидлов

Arseny_Info 1 мая 2021 в 13:18

Вообще да, в питоне почти везде dict под капотом, в т.ч. для методов:

In [1]: class Foo:
   ...:     def bar(self, x):
   ...:         """I am first"""
   ...:         print(x)
   ...:
   ...:     def bar(self, x, y):
   ...:         """I am second"""
   ...:         print(x, y)
   ...:
   ...: Foo.__dict__['bar'].__doc__
Out[1]: 'I am second'

+3

Посмотреть

Как проходит собеседование Python-разработчика: вопросы для джуниоров и мидлов

Arseny_Info 30 апр 2021 в 16:41

Вопрос про множественное наследование напомнил другую ситуацию на собеседовании, рассказываю со слов коллеги.
Вопрос интервьювера: Что будет, если написать такой код?

class Foo:
    def bar(self, x):
        print(x)

    def bar(self, x, y):
        print(x, y)

Foo().bar(x)

Коллега ответил (и по-моему идеально): не пройдет код ревью.

+8

Посмотреть

Фронтендер пишет нейронки. Уровень сложности «хочу на ручки»

Arseny_Info 6 янв 2021 в 14:23

В unsupervised learning у нас обычно есть просто какие-то данные, и мы ищем в них структуру — например, кластера или какое-то более компактное представление.
В reinforcement learning сценарий предполагает, что есть агент, который взаимодействует со средой и получает какое-то вознаграждение; модель стремится выбирать такие действия, которые максимизируют вознаграждение.

+2

Посмотреть

Фронтендер пишет нейронки. Уровень сложности «хочу на ручки»

Arseny_Info 6 янв 2021 в 13:28

Собственно, существует две больших группы методов обучения нейронной сети. Обучение с учителем и обучение без учителя.

Скорее это две группы методов машинного обучения (а нейросети — это подмножество ML). Как раз сети обычно учат в supervised/self-supervised парадигме, а под unsupervised часто имеют в виду кластеризацию и другие менее модные методы.

Пример с погодой, который мы рассмотрели выше, относится к группе методов обучения с подкреплением (без учителя).

Unsupervised learning и reinforcement learning — две сильно разные вещи.

Наконец, стоит отметить, что подбирать веса для нейросети генетическим алгоритмом — неоптимально (не говоря уже о том, что для этого и Tensorflow не нужен). Почти любая неигрушечная модель слишком сложна для этого, потому обычно используются какие-то вариации на тему SGD.

+1

Посмотреть

Cyberpunk 2077 вызвал эпилептические припадки у первых игроков

Arseny_Info 9 дек 2020 в 19:54

Не все вспышки одинаково опасны для эпилептиков

0

Посмотреть

Cyberpunk 2077 вызвал эпилептические припадки у первых игроков

Arseny_Info 9 дек 2020 в 19:52

Действительно, зачем разрешать этому биомусору играть? И уж точно эти людишки недостойны того, чтобы в игре позволяли пропускать опасные для них сцены или делали опцию «ослабить визуальные эффекты». /s

+1

Посмотреть

Шесть степеней свободы: 3D object detection и не только

Arseny_Info 29 окт 2020 в 15:31

Если сравнивать с 3d-датасетами, то полно :) Качество может действительно быть неидеальным. Ну и набора объектов конкретно для вашей задачи может не найтись, это нормально — почти все неакадемические задачи в итоге требуют собственную разметку.

0

Посмотреть

Как запихать нейронку в кофеварку

Arseny_Info 28 окт 2020 в 11:49

Python

+1

Посмотреть

Как запихать нейронку в кофеварку

Arseny_Info 27 окт 2020 в 21:20

Спасибо, крутой гайд!
Добавлю дата поинт насчет onnx-runtime: с простыми сетями из коробки завелось на серверном CPU и на CUDA, все хорошо; быстрее, чем traced модель из Pytorch, а процедура выкатывания в прод аналогичная, все очень просто.

+2

Посмотреть

Scala мертва?

Arseny_Info 23 сен 2020 в 00:13

Смотря какой data science. Какие-нибудь терабайты логов парсить на скале со спарком явно удобнее, чем питоном.

0

Посмотреть

Технология видео поиска «Video Color»

Arseny_Info 29 авг 2020 в 21:30

Вы изобретаете велосипед. Для поиска похожих изображений не нужно руками считать статистики цветов, нужно использовать или pHash, или representations из специально обученных нейросетей. Для эффективного поиска по векторам — всякие Annoy и Faiss.

Более того, алгоритмы сразу с инфраструктурой доступны, например, в github.com/jina-ai/jina

0

Посмотреть

Как мы отказались от нейросетей, а затем вернули их в прогноз осадков Яндекс.Погоды

Arseny_Info 9 июн 2020 в 11:31

А какие лоссы используются для инпейнтинга границ?

0

Посмотреть

Create ML в iOS

Arseny_Info 5 мар 2020 в 08:06

Модели, обученные на imagenet, выдают удивительно хорошие вектора для большинства задач. Конечно, можно делать свой feature extractor и добиться лучшего качества, но если ваша задача не слишком специфическая, я бы не заморачивался. Заниматься этим стоит только если у вас есть действительно много данных для обучения, а метрики итоговой модели вас не устраивают.

+1

Посмотреть

Google объявил о закрытии App Maker в 2021 году

Arseny_Info 29 янв 2020 в 07:18

Как его продать? Там наверняка используется куча внутренних гугловских технологий, и оторвать продукт от инфраструктуры, не переписав все заново, будет невозможно.

+1

Посмотреть

2

3 4 ...