Комментарии / Профиль EdT / Хабр

Tyantov Eduard @EdT

Машинное обучение

Профиль Публикации 5Комментарии 14Закладки

Саморазвитие: как я не усидел на двух стульях и нашел третий

EdT 26 фев 2020 в 23:15

Headspace
Есть еще waking up и 10% happier

Посмотреть

Саморазвитие: как я не усидел на двух стульях и нашел третий

EdT 5 фев 2020 в 13:58

Это индивидуально, и многие находят для себя эффективный тип музыки. Для меня идеально — тишина, т.к. в любом случае звуки отвлекают и снижают производительность. Для работы в случае шума использую звуки природы www.noisli.com (шум ветра).

Посмотреть

Саморазвитие: как я не усидел на двух стульях и нашел третий

EdT 5 фев 2020 в 11:45

По поводу первой части — комментов нет, это специфика, и она мне незнакома.
15-20 лет горизонт нынче слишком далекий, чтобы быть в чем-то уверенным, стараюсь сохранять открытость и постоянно учиться.
Эффективность будет снижаться разумеется (есть даже концепция 80,000 часов отведенных на карьеру), но опыт и широта взглядов при должном умении постоянно познавать новое должны оставаться ценными.
План отхода — капитал, который будет все больше значить по мере автоматизации труда.

> Как вы считаете, с точки зрения руководителя, стоит ли повышать сотрудника который очень хорошо справляется со своей работой?
Развивать своих сотрудников (говорю про IT) — очень важная часть работы руководителя.

>Есть ли у вас собственный проект в котором вы являетесь СЕО или вы больше исполнитель?
не-а

Посмотреть

Саморазвитие: как я не усидел на двух стульях и нашел третий

EdT 5 фев 2020 в 11:39

Согласен с вами.
Я так сделал изначально, потому что у меня в моменты усталости начала срабатывать автоматика на новости/фейсбук, после этого паттерн сломан. Потом я заметил, что иногда я более сознательно хочу что-то почитать, но в процессе ввода пароля и комментирования строк, иногда понимаешь, что это не то, что нужно в этот момент, и закрываешь.

Посмотреть

Саморазвитие: как я не усидел на двух стульях и нашел третий

EdT 5 фев 2020 в 11:37

Я не артикулировал позицию напрямую, но разумеется я не согласен, что экспертность самое важное. Но тем не менее гораздо эффективнее управляется, если ты понимаешь детали происходящего, тогда ты сможешь почелленжить в нужных местах, лучше направить и определить приоритеты.

Посмотреть

С бородой, в тёмных очках и в профиль: трудные ситуации для компьютерного зрения

EdT 22 июл 2019 в 18:37

Можно и так, и так. Смотря как проект хранит у себя фотки. В Облаке@Mail.ru по файлам, т.к. детект и рикогнишен спарены в backend'е.

Посмотреть

С бородой, в тёмных очках и в профиль: трудные ситуации для компьютерного зрения

EdT 22 июл 2019 в 16:50

Привет,
Миграция. Можно сделать совместимым вектора разных моделей, если примешивать вовремя обучения embedding из предыдущей версии модели использовать во время обучения новой (Harmonic regularization). Но мы так не делаем, т.к. качество, разумеется, страдает у новой модели.
Мы версионируем свои модели, и при выпуске новой модели (это редкое событие на самом деле) делаем влоб: репарс всего. Логика репарса на стороне клиента.
Пороги. Там, где мы сами рекомендовали конкретные значения, то выдаем новыми. Мы их подбираем на основе распределения на выборках, поэтому просто запускаем скрипт подбора еще раз.

Посмотреть

Опыт моделеварения от команды Computer Vision Mail.ru

EdT 22 июл 2019 в 14:17

1. Если использовать softmax + crossentropy, то это обеспечивает нам только лишь разделимость пространства, нет никакого сигнала для «сжимания кластера». Можно глянуть как это выглядит с и без center loss в оригинальной статье

Почему это важно? а) мы фитимся на данные, на тесте/проде могут быть произвольные данные, и в таком случае чем компактнее наши классы в метрическом пространстве, тем меньше вероятность ошибки или пограничного случая на новых данных. б) на самом деле улучшается разделимость, т.к. граница прочищается

2) С косинусом есть проблема у оригинального SphereFace (AngularSoftmax), лосс которого модифицировали, чтобы он был монотонным,

. И из-за перегибов куча проблем со сходимостью, с которыми надо бороться с помощью различных прогревов.
ArcFace этим не страдает, т.к. в рамках Пи косинус монотонный, а смещение лишь на пол радианы

Посмотреть

Опыт моделеварения от команды Computer Vision Mail.ru

EdT 22 июл 2019 в 13:56

Хай, не доводилось

Посмотреть

Опыт моделеварения от команды Computer Vision Mail.ru

EdT 19 июл 2019 в 18:54

Смотри, есть два случая высоконагруженные сервисы и нет.

Для высоконагруженных надо оптимизировать все что можно. В частности
1) есть не только операции на GPU есть рисайзы, пре-процессинг, пост-процессинг. Все эти операции разумеется будут быстрее на С++, чем на питоне. Их не унести все на GPU и они бывают бутылочным горлышком
2) Плюс на высоких нагрузках питон не выдаст тебе столько запросов в секунду. У нас много бекендов на питоне, и в итоге из-за производительности мы их переписываем либо на Go, либо на C++.

Для низконагруженных — подход с докерами и питоном хорош, и мы используем его для экспериментов и не нагруженных моделей. Например, 9may.mail.ru сделан на питоне, но там нагрузки не 5000 запросов/с, как на моделей для Облака@. Для ускорения экспериментов планируем развивать этот подход с KubeFlow

Посмотреть

Опыт моделеварения от команды Computer Vision Mail.ru

EdT 19 июл 2019 в 18:36

Хай.
1) Размерность обычно 128 или 512, это не так много, проблем не возникало
2) Не понял почему смешиваем. Мы просто кластеризуем с ужесточенным порогом (относительно обычного при принятии решения «один человек на этих двух фотках или нет»), чтобы кластер с большой вероятностью был не фолзовый. Поэтому мы наоборот откидываем шум, но также и реальные фотки пользователя, которые по мере улучшения модели перестанут откидываться.

Посмотреть

Достижения в глубоком обучении за последний год

EdT 22 сен 2017 в 09:02

Это показывает насколько сильно они в это вкладываются. Думаю Andrew Ng там все нормально выстроил, учитывая что у Baidu самый лучший speech recognition считается, то результаты там есть также.
Фейсбук все публикует и опенсорсит, а то, что происходит в Байду менее известно.
Вон тот же KungPeng из Алибабы, никто про него не знал, и они не рассказывали пока не внедрили в 100 продуктов.

Посмотреть

Artisto: опыт запуска нейросетей в production

EdT 1 сен 2017 в 11:51

У человека есть лимит в распознавании, если модель превышает его, то толку от человека больше нет, разметил выборку вначале и все. В принципе модели может быть достаточно слабых сигналов (что человек заболел через год раком, например), при большом кол-ве данных будет достаточно. Современный тренд использование unsupervised обучения, так что отсутствие специалистов, кажется, не проблемой.

Сам участвовал в конкурсах по распознаванию узи и томографии — человеческих ошибок там тьма, сеть явно лучше работает.

Посмотреть

Artisto: опыт запуска нейросетей в production

EdT 1 сен 2017 в 11:46

Технические детали www.slideshare.net/Eduardyantov/artisto-app-highload-71242406 в аппендиксе с 60 слайда. Использовали торч, карты nvidia 1080, titanx, платформы micro под 4 карты.
torch, caffe, tensorflow хороши для инференса в проде. caffe считается самым быстрым, его еще можно ускорить если заюзать nvidia tensorrt

Посмотреть