Как стать автором
Обновить
442.34
Альфа-Банк
Лучший мобильный банк по версии Markswebb

Не принимай оффер в Data Science, пока…

Время на прочтение20 мин
Количество просмотров16K

...не получишь ответы на эти 10 вопросов.

Переход на мою текущую позицию занял около четырёх месяцев: с мая по сентябрь я проходил HR, будущего руководителя, его команду, руководителя руководителя и руководителя руководителя руководителя. Почти всё это время я задавал вопросы, чтобы понять подходит мне эта позиция или нет. В итоге, когда ответы меня удовлетворили и мне пообещали не мешать работать — я согласился на предложение, и сейчас я Head of Machine Learning Laboratory в Альфа-Банке. 

Но мой кейс не такой распространённый — чаще всего собеседования затягиваются «всего» до 5 часов в виде увлекательного квеста проверки хард и софт скиллов. Но и на собеседование ещё надо попасть — ведь отклик на позицию не гарантирует приглашение на интервью или даже формального ответа на заявку, потому что желающих обычно порядка 100 человек на одно место даже с учётом огромного количества предложений от всевозможных работодателей.

Как вы понимаете, нанимающая сторона на рынке вакансий Data Science проводит очень тщательный отбор в свою команду. К сожалению, дата сайентист не может поступать аналогичным образом и прособеседовать своего работодателя, но может задать интересующие его вопросы после интервью и найти много полезной информации самостоятельно в сети. В этой статье расскажу о 10 ключевых вопросах, на которые крайне желательно получить ответ до вашего трудоустройства. Ведь от них будет зависеть не только как вы проведёте несколько часов на собеседовании, но и как скоро будете искать новую работу, когда поймёте, что надо было вопросы всё-таки задавать.

Простым перечислением не ограничусь — попытаюсь донести, почему считаю их крайне важными. Более того, под капотом вы сможете узнать мои ответы на эти вопросы.

Вопрос №1. Данные: объем, глубина истории, доступность?

По определению, работа дата сайентиста тесно связана с данными, поэтому первый вопрос, который стоит задать, к ним и относится. Качество процессов по их сбору и хранению определяет не только качество моделей для бизнеса, но и то, насколько ваша работа будет интересной и востребованной.

Сложные модели требуют большого объема данных для обучения. Сейчас практически каждый дата сайентист хочет обучать deep learning модели. Однако, разработка нейронных сетей с нуля, а не файнтюнинг предобученных моделей, требует большого объёма накопленных данных. Следовательно, если в компании данных не накопилось в достаточном количестве, то, скорее всего, вам будет целесообразнее обучать что-то из класса линейных или деревянные моделей. В крайних случаях, данных может быть настолько мало, что компании нужно принимать решения на основе мнений экспертов.

Глубина истории данных может стать стоп-фактором для моделирования. Нередко качественную валидацию и тестирование моделей невозможно провести без выборки, отложенной по времени. В кредитном скоринге и вовсе требуется 3 года исторических данных для разработки стабильных моделей.

В некоторых областях о пользователях, в принципе, невозможно собрать богатый набор признаков. Например, в крупных магазинах электроники клиенты совершают несколько покупок в год, в лучшем случае, потому что редкому потребителю требуется больше одного телефона и телевизора в год.

Данные могут быть недоступны для моделирования. Например, они могут лежат на источнике и не реплицироваться в отдельную базу данных для аналитиков. В итоге, к источнику доступ вам не дадут, исходя из соображений безопасности и предложат подождать лучших времен. В редких случаях, вы можете и не дождаться этого момента в компании 👇.

Давным-давно, когда Сбер ещё назывался Сбербанком, туда устроился на работу один дата сайентист. За пару-тройку недель он прошел онбординг, но был необходим ещё один доступ для решения задачи. Как положено, он оформил заявку. Ждал месяц, ждал два, ждал три и, наконец, дождался ответа на свою заявку: «К сожалению, форма вашей заявки устарела, оформите заявку в новом формате для получения необходимого доступа». Как вы могли догадаться, наш герой не смог успешно решить задачу, но зато успешно сменил место работы. 
Нескучный Data Science

Как определить все ли ОК с данными? Из открытых источников вы можете узнать количество клиентов компании, дату её основания, основные продукты и предоставляемые услуги. Таким образом у вас появится некое представление об объеме и глубине хранимых данных. На собеседовании вы можете расспросить подробнее про доступность данных, как давно их начали собирать, какой объем уже накоплен и какие ключевые источники уже доступны для моделирования.

А как у нас?

Больше 9 млн активных клиентов и больше 100 ТБ накопленных данных транзакций, логов приложения, кредитных историй, социальных связей, тестов звонков, чеков ОФД, обращения в службу поддержки, чатов, отзывов и пр.

Вопрос №2. Железо: сервера для моделирования, продакшена и ПК?

В дополнении к накопленным данным требуется инфраструктура для работы с ними. Может быть вам удасться построить модели на личном ноутбуке, но развернуть на нём промышленное использование построенных моделей едва ли удастся.

Однажды я видел прод, развернутый на ноуте. По странному стечению обстоятельств, он был недоступен по вечерам, в выходные дни и в период отпуска разработчика.

Мощные сервера для моделирования позволяют вам обучать около-SOTA модели на всём многообразие данных, что есть в компании. Вы, конечно, можете писать очень оптимальный код, использовать батчевые методы подгрузки данных и продолжать работать на слабом железе или даже личном ноутбуке. Более того, вы можете арендовать вычислительные мощности и согласовать перенос данных в облако с безопасниками.

Вы вообще можете много чего ещё, но наличие инфраструктуры для построения моделей позволит вам продуктивно тратить время на область вашей ключевой экспертизы.

Среда исполнения моделей c выделенной командой MLOPs существенно упрощает процесс применения ваших моделей для конечных пользователей:

  1. Вы знаете куда именно вы их будете деплоить.

  2. Бизнес-пользователь знает как интегрировать ваши модели в свои процессы принятия решений.

  3. За отказоустойчивость железа отвечает отдельная команда и вам не придётся беспокоиться об исполнении моделей в новогодние праздники.

Рабочий MacBook Pro 14/16 универсальная вещь, которая позволяет работать с одного устройства, как из дома, так и из офиса. macOS включает не только все удобные и необходимые инструменты для разработчика, но и поддерживает главный пакет программ офисного работника MS Office.

В далеком 2016-м году первые свои три зарплаты я потратил на покупку MacBook Pro 16. До этого момента работал на ноутбуке 2011-го года выпуска с 4 Gb RAM и Ubuntu, вдохнувшим в него немного жизни. Как вы могли догадаться, Data Science, с оставшимися от винды ресурсами, не был совместим.
Нескучный Data Science

А как у нас?

Среда разработки моделей: 1500+ CPU, 30+ Nvidia Tesla, 25TB RAM 

Среда исполнения моделей: 1500+ CPU, 14 Nvidia Tesla, 26TB RAM

Дата сайентисты работают на MacBook Pro 14/16 дюймов.

Данные лежат в едином хранилище на Hadoop. Среды разработки и исполнения моделей имеют прямой доступ к Hadoop.

Вопрос №3. Масштаб влияния Data Science на core-бизнес?

Ваша ценность для любой коммерческой компании напрямую зависит от масштаба влияния на её ключевые метрики — счастье клиентов и прибыль акционеров. Если ваша деятельность согласуется с этими целями, то вы хорошо выполняете свою работу, если нет, то плохо.

Попытайтесь оценить потенциальный финансовый эффект от тех задач, которые вы будете решать. Начните со знакомства с основной деятельности компании и методами её оптимизации средствами Data Science. Спросите на собеседовании, что уже внедрено в продакшн и насколько развита простая аналитика в компании. В редких случаях вам может повезти и вы будете канибализировать её эффект.

Задачи анализа данных, направленные на оптимизацию ключевых процессов бизнеса, всегда будут в фокусе внимания. Модели будут быстро двигаться в продакшн, А/Б-тесты не будут откладываться. Вы всегда сможете эскалировать проблему — с желанием заработать акционерам денег сложно спорить и бесполезно бороться. На этапе, когда модели начнут приносить деньги, компания будет готова инвестировать даже в ресёрч.

Если вы учились в техническом вузе, то Data Science без business value, это как пары по философии или ОБЖ — бизнес инвестирует в них свои силы по остаточному принципу, и справедливо считает эту активность бесполезной. Если придётся сокращать перегруженное расписание, то одним из первых порежут именно это направление.

А как у нас?

Вопрос №4. Какой сейчас уровень развития Data Science в компании?

Зависимость объема бизнес эффекта от инструментов анализа данных.
Зависимость объема бизнес эффекта от инструментов анализа данных.

Определитесь, хотите ли вы быть лидером и тащить Data Science с нуля через тернии в бизнес, или хотите быть седьмым гребцом слева на золотой галере и учиться у матёрых специалистов? Стадия развития Data Science в компании определит в какой именно точке на прямой между этими крайностями вы окажетесь.

Узнайте, что уже успели сделать до вас. Как ни странно, исследование нужно начать с поиска простой аналитической культуры. В компании нет аналитиков? Их работа станет частью ваших обязанностей. В компании нет моделирования? Вам придётся начать с простых линейных моделей и градиентных бустингов.

Исключением могут быть случаи, когда core-бизнес основан на Deep Learning. Любая успешная коммерчески ориентированная компания будет стараться двигаться по непрерывному пути «Аналитика → ML → DL» ввиду размера финансового эффекта от каждого из этапов эволюции.

  • 🥇 Аналитические правила позволяют достичь максимального 💸💸💸 эффекта за минимальное время. Вам не потребуется закупать отдельные серверы для разработки и исполнения моделей, мониторить стабильность моделей и даже нанимать дата сайентистов. Качественная аналитика позволит в моменте начать приносить пользу бизнесу и найти потенциальные зоны применения ML. В дальнейшем, разработанные правила могут стать хорошими признаками для ML-моделей. 

  • 🥈 Классический ML лучше применять после построения аналитической культуры в продукте/компании. Без такой культуры сложно будет трезво оценивать пользу от ML-моделей. Объективная потребность в моделях появляется при значительном повышении точности на десятке-сотне признаков относительно одного-двух аналитических правил. Хотите оценить реальный вклад машинного обучения в решение задачи? Сравнивайте метрики качества моделей с сильными аналитическими бейзлайнами. Узнайте какое значение метрики даёт среднее/медиана за предыдущий период в задаче регрессии или самый популярный элемент — в задаче рекомендаций. В итоге, чистый эффект 💸💸 от применения ML = эффект от ML-моделей – эффект от аналитических правил.

  • 🥉 Глубокое обучение лучше применять если у вас уже внедрен ML или вы планируете работать с картинками, звуком или текстом. Развитие DL в компании всегда требует серьезных инвестиций в железо и разметку данных. Стоит помнить, что не всегда удается побить нейронными сетями классический ML. Так, например, команда Тинькофф побила BERT логрегом в задаче классификации на 117 классов. Более того, в некоторых задачах можно ограничиться и вовсе регулярками, например, в соревновании по выделение брендов они показали себя лучше BERTа. Чистый эффект 💸 от применения DL = эффект от DL-моделей – эффект от ML-моделей.

Последовательное развитие по пути «Аналитика → ML → DL» позволяет получить максимум эффекта за минимальное время. Более того, этот путь закладывает сильные бейзлайны для каждого следующего этапа. Обратите внимание на оценку чистого эффекта — она позволяет принимать правильные управленческие решение бизнесу.

А как у нас?
  • Функция Data Science централизовалась относительно недавно — в начале 2021-го года. Следовательно, у нас ещё очень много низко-висящих фруктов.

  • Однако, кредитный скоринг ушёл далеко вперед. Уже в 2017-м году мы перешли с логистической регрессии на градиентный бустинг. Первые нейронные сети были внедрены в кредитный скоринг в 2020-м году. Нейронные сети стали основным классом моделей кредитного скоринга в 2022-м году.

  • В Лаборатории больше 95% задач решаются при помощи нейронных сетей. Другими словами, мы решаем задачи постоптимизаций моделей после более простых моделей или работаем с данными, где они являются SOTA-решениями.

Вопрос №5. Чем именно занимаются дата сайентисты в компании?

Каждая компания вкладывает свой уникальный набор хардовых и софтовых навыков в роль дата сайентиста. Есть десяток различных ролей в Data Science:

  • Data Analyst;

  • Analyst;

  • Business Analyst;

  • ML/DLCV/NLP Engineer;

  • ML/DL/CV/NLP Researcher;

  • Data Engineer;

  • MLOPs/Devops.

И это неполный список.

Существуют роли, где вам нужно быть мастером на все руки, но не первоклассным. Другие же роли, напротив, предполагают узкую направленность с глубокой экспертизой. Получается, вам предстоит выбрать комбинацию лучше всего коррелирующую с вашими целями.

Источник: Яндекс Академия(https://www.youtube.com/watch?v=lDkTNURDIaY)
Источник: Яндекс Академия(https://www.youtube.com/watch?v=lDkTNURDIaY)

Поделюсь своим видением основных задач дата сайентиста.

  • Коммуникация с продуктовой командой. Регулярное общение на нетехническом языке, презентация разработанных моделей и совместный поиск оптимизации продукта средствами ML.

  • Постановка задач в терминах ML. Определение типа задачи, класса моделей и выбор целевой метрики.

  • Сбор данных и постановка задач на разметку. Данные DS собирают или самостоятельно или совместно с DE. В случаях, когда целевая переменная не отсутствует, ставят задачи на её разметку асессорам.

  • Построение моделей и вывод в продакшн. После получения значимого результата, DS оборачивает модели в DAG или в REST API сервис, и встраивают их в среду исполнения моделей.

  • Мониторинг и обновление модели. Работа не заканчивается после постановки модели в продакшн. Команда мониторинга наблюдает за стабильностью модельных метрик, а дата сайентист улучшает и обновляет модели.

А как у нас?

👆Data Scientist ставит задачи смежным подразделениям по внедрению, мониторингу, подготовке и добавлению источников данных.

В департаменте анализа данных существуют отдельные команды, централизующие функции поддержки DS'ов:

  • MLOP'с, чтобы поддерживать инфраструктуру моделирования.

  • Data Engineer, чтобы помогать в поиске лучших источников данных и подготовки признаков для моделей.

  • Команда мониторинга, чтобы оперативно узнать, что с моделями в продакшне или со входным распределением что-то пошло не так.

  • Наконец, команда внешних и внутренних источников данных, чтобы иметь все необходимые источники в едином хранилище.

Вопрос №6. Какой бэкграунд у вашего потенциального руководителя?

Найдите резюме потенциального руководителя в LinkedIn и следы его активности в публичном пространстве. Обратите особое внимание на его личные хард DS-скиллы, результаты работы его команды и опыт монетизации данных.

ИМХО, бэкграунд работы руками необходим любому руководителю в DS.

Формирование сильной команды — главная задача любого руководителя. Как можно отличить на собеседовании тех, кто разбирается в области, от тех, кто просто складно научился формулировать мысли? Поможет ли HR в таком случае? Может быть нужно пригласить синьора? А кто наймет этого самого синьора?

Более того, чем выше эта беда забралась по вертикали, тем больше масштаб проблемы. По возможности постарайтесь найти и резюме руководителя вашего будущего руководителя.

Принятие технических решений самостоятельно. В случаях, когда руководитель не разбирается в деталях, даже для решения элементарных вопросов требуются коллегиальные советы и прочие коллективные меры митигации личных рисков. В итоге, из-за отсутствия экспертизы сам руководитель будет тормозить решение вопросов и генерировать большое количество встреч.

Иногда командой дата сайентистов может руководить даже project manager. Знаете, это жалкое зрелище. И это не субъективное мнение. Из личного опыта, в ходе общения с таким руководителем, невозможно было узнать абсолютно ничего про основные артефакты работы команды.Всегда требовалась отдельная встреча с перегруженной командой. Зато в такой команде есть ежедневный часовой стендап, работа идёт четко по спринтам, идеально заполнена Jira и выполнены все Agile-обряды. Остаётся загадкой ответ на вопрос «Когда команда успевает работать?»

Отсутствие микроменеджмента, как обязательного элемента контроля. Представьте, что как руководитель, вы отвечаете за результат, но не вдупляете что происходит:

  • Что именно делает ваша команда?

  • Сколько времени требуется для решения каждой из задач?

  • В правильном ли направлении вы движетесь?

  • Вообще, тех ли людей вы наняли?

Что вы будете делать?

Конечно, добавите элементы контроля, чтобы прикрыть себя. В итоге, чем больше вы не в теме, тем меньше доверяете команде и тем больше одушняете её работу.

Источник: https://joyreactor.cc/post/3791945
Источник: https://joyreactor.cc/post/3791945

Находиться на одной волне с командой и развивать команду. Практически невозможно заинтересовать человека без хард бэкграунда красотой решения технических задач. В следствии чего, вы не будете обсуждать детали ваших решений на внутренних встречах команды, а ограничитесь лишь сухими отчетами. В результате, важный компонент обмена опытом будет исключен. Кстати, как думаете, возможно ли ожидать вам своевременное продвижение по карьерной лестнице и одновременно справедливое относительно остальной команды, без осознания ваших достижений, провалов и сложности лично ваших задач? В заключение отмечу, что понимание особенностей вашей работы, правильная интерпретация ваших достижений и неудач добавляет уверенности в защите вашей точки зрения в сложных ситуациях.

Опыт успешной монетизации данных защищает команду от потенциально невыполнимых и ненужных задач. Замечательно, если руководитель имеет опыт успешной монетизации данных в сфере основной коммерческой деятельности компании. Однако, если такого опыта нет, то ваше подразделение скорее всего будет выполнять сервисную функцию. Другими словами, если у вас нет стратегии по нанесению пользы компании, то вам её составят. Будет здорово, если коллега из бизнес-подразделения, составляющий такую стратегию будет обладать редким опытом развития ML-продуктов.

"Ко мне пришел менеджер и попросил поковырять задачу X. Копался в данных два месяца. Показал менеджеру, ему результат показался интересным, но мы еще не придумали как это применять" - собирательный образ результата работы DSа в компаниях не знающих как монетизировать данные.

Обратите внимание, что это необходимое условие, а вовсе не критерий. Другими словами, софт-скиллы тоже важны. Однако, преимущества, которые дает бэкраунд работы руками, уже не получится приобрести будучи руководителем, в отличии от софт-скиллов, которые руководитель ежедневно итак прокачивает в фоновом режиме.

А как у нас?

Профиль в LinkedIn позволит вам подробно познакомиться с опытом руководителя Лаборатории.

Вопрос №7. Как часто вам будут мешать работать?

Обилие бесполезных встреч, бюрократии и микроменеджмента может превратить даже самую интересную работу в имитацию деятельности.

Узнайте на собеседовании сколько часов в неделю у вас будут отнимать всевозможные стендапы, синки, планерки, ретро и прочие обязательные обряды. Спросите сколько времени уйдёт на получение всех необходимых доступов и прохождения курсов по всяким видам безопасности. Последнее даст представление о влиянии бюрократии на рабочие процессы в команде. Знаете, я просмотрел тысячи резюме, но ни в одном не нашел пункта про просиживание штанов на стендапе.

Фокус внимания на вашей основной деятельность — это фундамент успеха. Бесполезные встречи, регулярные ad-hoc задачи, отсутствие необходимых доступов, вечно тормозящий компьютер, неудобный интерфейс — все эти атрибуты тормозят ваш карьерные рост и, как следствие, развитие компании. Набор этих факторов, которые по отдельности кажутся безобидными, следствие общей низкой культуры работы и производительности труда в компании.

Однажды один заказчик моделей настаивал на очень плотном взаимодействии и буквально требовал участие дата сайентиста во всех обязательных обрядах. Культивация проджект менеджмента привела эту команду к 13 часам обязательных встреч в неделю. В итоге, любопытство взяло надо мной верх и я лично посетил все эти встречи в течении целой недели. Однако, за 13 часов, и даже за прошедшие 2 года, я так и не понял зачем так неэффективно тратить время команды.
Нескучный Data Science

А как у нас?
  • Две обязательные встречи в неделю. Одна техническая для каждого из направлений. Вторая общая — для обмена опытом внутри команды. Других регулярных обязательных встреч нет.

  • Работаем полностью в удаленном формате с начала пандемии. При этом в офисе есть свободные места для желающих.

  • Онбординг можно пройти за один рабочий день.

  • Часть команды совмещает работу с учебой и даже защищает дипломы на основе выполнения задач.

Вопрос №8. Способствует ли компания карьерному росту?

  • Узнайте, существует ли формальный набор правил или матрица компетенций, основываясь на которой, происходит переход с одного грейда на другой.

  • Далее, проанализируйте карьерные пути DS-ов из этой команды на LinkedIn, чтобы сопоставить слова нанимающего менеджера с реальностью.

  • В качестве приятного бонуса, вы узнаете как обстоят дела с текучкой в этой компании.

Существует неформализируемый набор принципов развития команды, на который стоит обратить более пристальное внимание. В моём представлении, свобода, ответственность и признание — это три кита 🐳 развития команды. Наличие этих принципов взаимодействия с командой говорит о том, что компания заинтересована в вашем карьерном росте. Далее, расскажу почему я в этом искренне убежден.

🐳 Свобода. Ваша команда должна воспринимать работу, как своё хобби, а не повинность. 

👉 Не устанавливайте жесткие рамки — они убьют напрочь вовлеченность и творческий потенциал. Думаю, вы видели толпу у метро в час пик - если вам нужно без причины приезжать в офис к 9 утра, то в 6 вечера вы будете из него убегать.

👉 Доверяйте своей команде и позволяйте допускать мелкие ошибки — не будьте ссыклом микроменеджером. Ваша команда, как и модели машинного обучения, тоже должна учиться на ошибках. Не забирайте обучающую выборку, давайте исправлять свои ошибки, если не хотите взрастить беспомощность. 

👉 Прощайтесь с теми, кто злоупотребляет этим принципом, вместо введения дополнительных контролей для всей команды. 

🐳 Ответственность — важный принцип, который живет в тесной связке со свободой.

👉 Конечная цель работы дата сайентиста — оптимизация бизнес-процессов компании за счет машинного обучения. Бизнес получит эффект, а ДС карьерный рост только когда его модель в продакшене начнёт приносить пользу компании. Получается, намного эффективнее иногда выполнить непрофильную работу вместо чтения статей с arxiv.

Примеры более важных задач: поставить задачи смежным командам, пропушить коллег, проэскалировать, если не получается решить проблему на своем уровне, выполнить технически не совсем вашу задачу, например, нарисовать интерфейс, разработать сервис или даже обучить аналитиков пользоваться специализированными инструментами, начать подготовительные работы к следующей задаче. Не стесняйтесь занимать роль лидера при решении своей задачи — это забустит и вашу команду и смежные, а вам принесет еще одну классную строчку в резюме. 

👉 Хороший руководитель поможет вам и даст ровно столько ответственности, сколько вы сможете унести.

🐳 Признание личного вклада хорошо прокачивает вовлеченность команды. Похвалы недостаточно, признавайте вклад команды на деле.  

👉 Не экранируйте свою команду. Поверьте моему опыту, практически каждый начинающий дата сайентист способен рассказывать о результатах своей работы на рабочей встрече продуктовой команде, на большой встрече руководителю департамента, и внешней аудитории на конференции. Необходимо лишь выделить время на прогоны выступлений и подстраховывать первое время, присутствуя на встречах. Руководитель экранирующий команду способствует замедлению развития софт скиллов. 

👉 Развивайте линейные связи между командами. Большинство вопросов эффективнее решаются на линейном уровне. Во-первых, это ускоряет процесс принятия решений, так как не приходится ждать пока у большого руководителя найдется время в календаре. Во-вторых, обычно знаний разработчика достаточно, и нередко глубокое погружение излишне для руководителя. 

👉 Раскручивайте бренд команды совместно с ней. Работа в сильной команде — отличная строчка в резюме линейного сотрудника. Создание звездной команды — шикарная строчку в резюме руководителя.
  Нескучный Data Science

А как у нас?
  • 👆 Три 🐳 работают для дата сайентистов любого уровня, позволяют растить лидеров в Лаборатории и применяются, начиная с уровня стажера. 

  • Карьерный рост происходит по следующему алгоритму: дата сайентист заполняет уникальную для Лаборатории матрицу компетенций, руководитель Лаборатории и DS Team Lead защищают повышение на круглом столе, который проходит раз в квартал.

Вопрос №9. Будете ли вы заниматься исследованиями или катить модели в продакшн?

Работа в коммерческой компании сильно отличается от академической. В первом случае, вас ценят за вклад в оптимизацию процессов компании, во втором — за уровень цитируемости ваших публикаций в научных журналах. Обидно, но это практически взаимоисключающие достижения, ведь они требуют фокуса внимания на разных вещах.

Небольшому количеству компаний требуется ресёрч в области анализа данных. Но есть исключения:

  • Первое — компании, у которых основной продукт базируется на анализе данных.

  • Второе исключение — компании, где DS уже впитал всё лучшее из общедоступного, принеся огромную пользу компании, и теперь для нового шага требуется инвестировать в ресёрч.

Если в компании всё-таки есть рёсерч, то обязательно уточните, что компания вкладывает в это понятие. Исследования в практически-ориентированном анализе данных и в академии сильно отличаются.

  • Постановка задач в новом бизнес-процессе в терминах комплекса моделей машинного обучения считается исследованием.

  • Переход с простой аналитики принятии решений на модельный тоже можно отнести к этой области.

  • Добавление новых данных для усиления действующих моделей также считается исследованием, но уже направленное на анализ самого источника. 

А как у нас?

У нас следующая политика по отношению к академическим исследованиям:

  • Исследования своевременны когда вы уже выжали максимум для бизнеса за счёт общедоступных инструментов, и для совершения следующего шага вам требуется сделать прорыв в области.

  • В момент, когда построение моделей становится рутиной и не требует особого вклада от разработчика мы начинаем их оборачивать в сервисы, позволяющие обучать модели в автоматическом режиме. Далее, интегрируем сервисы в общий конвейер построения моделей. Наконец, начинаем развивать мозги сервиса, проводя исследования.

Лаборатория по определению ассоциируется с исследованиями, но в нашей команде нет ресёрча в классическом представление — мы не пишем статьи в цитируемые журналы и не выступаем на научных конференциях. Сейчас мы начинаем разработку одного из ключевых сервисов, после чего перейдем к исследованиям.
Нескучный Data Science

Вопрос №10. Будете ли вы выполнять функцию сервиса или лидера?

  • Команде ставят непрерывный поток задач внешний заказчик? Вы будете выполнять сервисную функцию.

  • Ваша команда регулярно успешно продает бизнесу свои идеи и ищет совместно новые точки роста компании? Вы будете выполнять функцию лидера.

Эти две роли задают базис в соответствующем пространстве, и обычно вас ждет некая их комбинация, а не вырожденный случай.

Сервисная функция в благоприятном сценарии обычно включает в себя размеренный темп работы, отсутствие дополнительной отвественности за результат и выполнение задач исключительно из области вашей ключевой компетенции. Роль будет вам комфортна, если вы не зацикливаетесь на развитии вашей карьеры и получаете удовольствие от жизни не только за счет вашей работы.

К сожалению, в неблагоприятном сценарии эта роль включает в себя все функции из отрицания благоприятного сценария и может дополняться жестким прессингом по срокам со стороны заказчика и требованиями построения космических кораблей ещё в прошлом месяце. Уточните на собеседовании при помощи косвенных вопросов, свойствен ли второй сценарий вашей позиции. Следите внимательно за языком тела во время ответа на вопрос!

Функция лидера требует огромной личной энергии, взятия на себя дополнительной ответственности, самоотдачи, выполнения не только ваших прямых обязанностей, умения убеждать, быстро деливерить результат, фокусироваться на цели и не сдаваться в сложных ситуациях. Она идеальна вам подходит в ментальном плане, если вы рассматриваете вашу работу в качестве хобби или вы входите в кружок карьеристов.

Считаете любую переработку недопустимой для вашей размеренной жизни? Желаете фармить Kaggle параллельно с вашей работой? Мечтаете читать arxiv и обучать с SOTA-модели, но собеситесь не на ресерч позицию? Скорее всего, на этой позиции будет сложно не только вам, но и команде работать с вами.

На самом деле, можно ограничиться одним вопросом - насколько вы готовы разменивать самоотдачу на быстрый карьерный рост и готова ли компания этому способствовать, не привязывая ваши достижения к выслуге лет.

А как у нас?

Если вы читали ответы на предыдущие вопросы, то на этот вопрос ответ будет очевидным.

  • Все задачи рождаются внутри команды или в результате плотного взаимодействия с командой продукта.

  • Лаборатория не только внедрила первые нейронные сети в Альфа-Банке, но и предварительно убедила бизнес в их эффективности и стабильности.

  • Мы активно заменяем внешние решения на внутреннюю разработку. В результате, приносим существенную экономию и лучшее качество решений компании.

  • Область глубокого обучения требует существенного опыта в ней для правильной поставки задач.

💬 А про зарплату ничего не хочешь сказать?

🤦 К сожалению, сейчас нередко всё, кроме размера вашей зарплаты, считается
полным булшитом и публично высмеивается. 

🤔 Однако, компенсация вашего труда складывается из опыта выполнения
релевантных для рынка проектов, навыков, полученных от ваших менторов,
ценностей, повышающих вашу продуктивность, и, конечно, комфортных бытовых условий труда, которые эта зарплата даёт. Разберем эти факторы подробнее.👇

Релевантный опыт. Карьерный путь лучше выстраивать с учётом долгосрочных
перспектив.

  • Востребованный рынком проект и каждая задача, успешная на практике, бустит вашу карьеру.

  • Каждая бесполезная встреча, каждая не дошедшая до продакшена, априорно нереализуемая или не приносящая пользы модель, оставляет вас примерно на том же месте.

  • Подбор гиперпараметров моделей без понимания бизнес-составляющей, повышает вероятность того, что вашу роль в будущем автоматизирует AutoML. 🤖

Вы не будете работать на одном месте всю свою жизнь. Помните, что каждая компания ищет дата сайентистов чтобы повысить уровень автоматизации своих бизнес-процессов. В результате, каждый нанимающий вас менеджер, будет ценить опыт выполнения релевантных и практически полезных проектов, а всё остальное обычно отходит на второй план.

💪 Сильная команда. Работа в команде с высоким уровнем компетенций
позволит быстрее перенять лучшие практики, благодаря чему вы будете гораздо
качественнее и эффективнее решать задачи. Чувство дружеского локтя не позволит вам останавливаться и поможет вырасти вместе с командой. Руководитель даст вам ровно столько отвественности, сколько вы можете унести, а команда поможет преодолеть новые вызовы. 

👋 Близкие ценности. Работа в команде единомышленников обычно
воспринимается как хобби. В такой команде не применяется бюрократия для
вашего контроля. Линейные связи устанавливаются нативным образом без участия
руководителей. Отсутствие чинопочитания приводит к тому, что вас уважают за
ваши профессиональные навыки, а не лакейские заслуги. Честность и открытость
помогают распространять информацию между всеми членами команды, что
уменьшает вероятность недопонимания в сложных ситуациях, повышает
вовлеченность и позволяет быстро принимать решения.

💰Достойная зарплата. Достойный уровень оплаты труда и прозрачный карьерный рост позволяют не размывать фокус каждого члена команды, разбавляя его периодическим поиском альтернатив. Напротив — помогают сконцентрироваться на достижении общих целей. Более того, признание и поощрение за индивидуальные достижения увеличивает их количество.

🤔 Получается, что нужно оптимизировать фонд оплаты труда за счет развития нематериальной компенсации?

«Если вы требуете от кого-нибудь, чтобы он отдал свое время и энергию для дела, то позаботьтесь, чтобы он не испытывал финансовых трудностей»

Генри Форд

А как у вас?

Все вакансии публикуем с открытыми вилками в канале Нескучный Data Science Jobs и в ODS.

Наподследок

По возможности, будьте крайне избирательными при выборе места работы, ведь вам предстоит там проводить 5 дней в неделю. Помните, именно вы отвечаете за скорость развития вашей карьеры, а работодатель решает свои задачи.

Ищите работу и хотите знать ответы на десять важных вопросов из описания вакансии? Подписывайтесь на Телеграм-канал Нескучный Data Science Jobs. Подробное описание позиций поможет сократить не только время соискателя, но и время нанимающих менеджеров. Нанимаете и готовы ответить на десять вопросов? Буду рад разместить ваши вакансии в канале бесплатно.

Если хотите узнать больше про команду Лаборатории машинного обучения — также подписывайтесь на телеграмм-канал Нескучный Data Science. Там вы сможете узнать подробнее как устроена работа дата сайентистов в команде, подчерпнуть частичку нашего опыта, узнавать о наших успехах и неудачах, не пропустить анонсы наших публичных мероприятий и новые статьи на хабре.

На этом всё.

💬 Напишите в комментариях на что лично вы обращаете особое внимание при выборе места работы и какой ваш личный топ вопросов работодателю.


Рекомендуем почитать:

Также подписывайтесь на Телеграм-канал Alfa Digital — там мы постим новости, опросы, видео с митапов, краткие выжимки из статей, иногда шутим.

Теги:
Хабы:
Всего голосов 25: ↑24 и ↓1+23
Комментарии0

Публикации

Информация

Сайт
digital.alfabank.ru
Дата регистрации
Дата основания
1990
Численность
свыше 10 000 человек
Местоположение
Россия
Представитель
София Никитина