Как стать автором
Обновить
88.67

Собеседовали 25 джунов в Data Science: кого стоит брать и почему?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.4K

Введение

Привет, чемпион! Меня зовут Артём, я работаю в Сбере и преподаю в Вышке. Сегодня поговорим о текущей ситуации с наймом джунов в Data Science. Для начала немного личной истории.

Несколько лет назад, только начиная свой путь в Data Science, я наткнулся на анонс большого и насыщенного курса «Введение в соревновательный Data Science». Сомневался, стоит ли покупать: хотелось скорее устроиться на работу, чем получить золотую медаль на Kaggle. В итоге купил и не прогадал — на собеседовании отлично пригодились знания по отбору признаков. Но интереснее другое: спустя пару недель автор курса, Алерон Миленкин, заметил мою 300-дневную серию на Stepik и позвал пообщаться. Так мы встретились в офисе Додо, поговорили про рынок труда в DS, и съели пару додстеров. Тогда я понял главное: нетворкинг решает почти всё — именно благодаря ему я позже нашёл работу и начал преподавать.

Мы с Алероном регулярно сотрудничали, и, кстати, планируем расширять взаимодействие (следите за анонсами!). Но перейдём к главному.

Сейчас часто звучит мнение, что джуны никому не нужны: требования выросли, конкуренция огромная. Я решил посмотреть на ситуацию изнутри и поделиться опытом по итогам 25 собеседований и анализа порядка 200 резюме. HR, конечно, отсмотрели раза в 3 больше. Важный совет: если ищете работу, всегда старайтесь выйти напрямую на команду. Одно личное общение заменит вам 10-20 откликов на Job-платформах. Развивайте нетворкинг: ходите на Летние Школы, активно участвуйте в чатах курсов и следите за вакансиями!

Примеры вакансий в DS-чатах
Примеры вакансий в DS-чатах

Еще одно наблюдение: требования вакансий обычно выше реальных нужд команд. Например, в одной команде указали технологию, о которой не слышал даже тимлид. Если подходите хотя бы на 50%, смело откликайтесь

Отбор и требования

Наш отбор включал три этапа:

  • Техническое интервью (примерно час). Основные темы: классический ML (3/4 времени), немного SQL и теория вероятностей (по одной небольшой задаче, просто чтобы понимать, писал ли человек когда-то SQL запросы и знает ли что такое условная вероятность). Бонусом мы могли задать вопросы по NLP, если кандидат говорил, что знает эти темы, это было как дополнительный бонус для кандидата.

  • Тестовое задание: решение задачи бинарной классификации для несбалансированной выборки, предварительно предобработав данные и отобрав признаки в Jupyter-ноутбук.

  • Поведенческое интервью: неформальный разговор с тимлидом для проверки мотивации, интересующих задач, и навыков общения, то, как человек даёт и принимает обратную связь.

Типы кандидатов

Мы условно выделили 4 типа кандидатов:

  1. «Накидыватели пуха» (накрутчики опыта). Эти ребята преувеличивают или придумывают опыт, иногда даже образование. Один кандидат указал вуз, в котором только мечтал учиться. Обычно мы старались отсеивать таких еще на этапе резюме, но несколько раз им всё-таки удавалось попасть на собеседование. Их легко вычислить на собеседовании, особенно когда они явно пользуются ChatGPT: даже через веб-камеру видно, как человек набирает что-то на клавиатуре, а затем ждёт ответ. Это самая слабая категория кандидатов, так как, например, человек с двумя годами заявляемого опыта, не знал о простейшем методе отбора признаков через корреляцию с таргетом (нас интересовало, знает ли он о Feature Selection хоть что-то), другой с тремя годами «опыта» говорил, что задача предсказания вероятности покупки — это задача регрессии. Причем у него, если верить его резюме, были периоды, когда он работал одновременно бэкендером, аналитиком данных, Data Scientist'ом и еще параллельно учился.

    Есть дискуссионный вопрос: накручивать ли опыт или нет?
    Решать, конечно, вам, но компетентный и мотивированный интервьюер быстро поймет, что к чему. С другой стороны, такая ситуация встречается далеко не всегда и вас могут взять/не взять просто по формальным признакам, к числу которых как раз относится наличие опыта.
    Мое мнение: накрутка опыта вредна и порождает «рынок лимонов» по Джорджу Акерлофу, когда «плохие» кандидаты получают незаслуженно много внимания HR и команд.

    Рынок "Лимонов" Джорджа Акерлофа: продавец «плохой» машины имеет возможность продать её за более высокую от справедливого уровня цену и это стимулирует приток на рынок таких продавцов
    Рынок "Лимонов" Джорджа Акерлофа: продавец «плохой» машины имеет возможность продать её за более высокую от справедливого уровня цену и это стимулирует приток на рынок таких продавцов
  2. Выпускники онлайн-школ. Хорошо отвечают на базовые вопросы и неплохо пишут код. Но при более глубоких вопросах (например, «как повысить Precision без переобучения» или объяснить, как учится дерево) теряются. То есть они в среднем слабо понимают то, что есть "под капотом" у ML-моделей. Причем уровень у всех очень ровный, часто можно достаточно точно спрогнозировать, на какие вопросы ответят, а с какими возникнут сложности. 

    Если в резюме только онлайн-школы и учебные проекты, скорее всего, кандидата отсеем. Но если есть хакатоны, пет-проекты или хорошие вузы, обязательно пообщаемся.

  3. Выпускники сильных вузов, преимущественно математической, технической или естественно-научной направленности (физфаки, мехматы, химфаков и т.д.). У них большой потенциал, мощная фундаментальная подготовка и высокая мотивация, но часто есть пробелы в DS, хотя те темы, которые они знают, они понимают очень глубоко. Также заметны проблемы с самопрезентацией, от чего впечатление об их знаниях хуже, чем оно есть на самом деле. Однако после нашей обратной связи некоторые успешно прошли собеседования в другие команды Сбера. Вывод: отказ в одной команде не означает отказ в другой, стоит пробовать дальше, в любом случае, вы получите хороший опыт.

  4. Выпускники профильных вузов (например, ФКН ВШЭ или ВМК МГУ) и/или кандидаты с опытом. Отличные знания и уверенные ответы почти на все вопросы. В таких случаях мы обычно в течение первых 10-15 минут понимали уровень кандидата. И тут уже мы становились в позицию соискателей и уже нам нужно "продать" вакансию: кандидаты вели переговоры сразу с несколькими командами или компаниями. Часто возникали проблемы с мотивацией или слишком высокими ожиданиями по зарплате, а тестовые задания могли выполнять посредственно.

Промежуточный итог

За 1,5 месяца поиска мы столкнулись с дилеммой: или брать кандидата с недостаточными знаниями, или рисковать, предлагая оффер сильному кандидату, который может отказаться. Из 25 собеседований к четвертому типу относилось 6 человек: трое отказались, двое слабо выполнили тестовые задания, а один просто не прислал решение. Как привлечь кандидатов с хорошими навыками и высокой лояльностью?

Сотрудничество с вузами

Я обратился за помощью к Елене Кантонистовой, академическому руководителю магистратуры «Искусственный интеллект» ФКН ВШЭ с просьбой посоветовать кого-то из её студентов. Ранее я проходил большое число её курсов, а вокруг магистратуры сложилось большое и живое сообщество людей, в жизни которого я стараюсь принимать участие. Она предложила выступить перед студентами, заканчивающими первый год магистратуры и рассказать им про Сбер и нашу команду. После выступления, в течение пары дней получили три отклика, один из кандидатов идеально подошел, был близок по навыкам к соискателям из четвертого типа: хороший уровень знаний, высокая мотивация и отсутствие параллельных переговоров. Мы успешно закрыли вакансию и не идя на компромисс между навыками и мотивацией и взять того человека, по которому не было вопросов. 

Важно: если вы уже работаете, делитесь своей экспертизой! Это очень выгодно для всех. В крупных корпорациях вроде Сбера/Яндекса/etc вы конкурируете с другими командами за сильных стажеров, поэтому личный контакт и участие в жизни студентов особенно ценны. Сбербанк, например, в этом плане вообще отдельный рынок труда.

С другой стороны, если вы хотите пойти учиться на DS/DA/DE и выбираете программу обучения, обратите внимание на магистратуру — это реальный шанс получить хороший нетворкинг и лучший уровень подготовки, а с дипломом хорошего ВУЗа, вам будет существенно проще проходить пресловутый HR-фильтр. Да, вам придется учиться интенсивнее и дольше, но работу вы сможете искать уже после 1 курса. И она требует начальной подготовки, здесь в отличие от курсов есть вступительные испытания и дороже, но обычно есть скидки при хорошей сдаче экзаменов и льготный кредит с господдержкой. 

Вместо заключения

🔥 Таков наш опыт поиска джуна. Надеюсь, он был полезным. Если что, у меня есть готовый пайплайн курсов, которые сам проходил, с радостью поделюсь им на Stepik. Верьте в себя, учитесь, развивайте связи и активно проходите собеседования — у вас точно всё получится!

✔️ Присоединяйтесь к нашему Telegram-сообществу @datafeeling, там мы делимся не только новыми инструментами, но и кейсами, инсайтами и рассказываем, как всё это применимо к реальным задачам.

Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
+1
Комментарии4

Публикации

Информация

Сайт
t.me
Дата регистрации
Дата основания
Численность
2–10 человек
Местоположение
Россия