Cобеседование на позицию стажера в Яндекс на аналитика данных

Всем привет! Целью данного поста является:

  1. Поделиться личным опытом.

  2. Помочь другим кандидатам при подготовке к собеседованию в Яндекс

Часть 1. Подача заявки и Я.Контест

После прохождения десятка курсов на степике, я понял, что хочется применить этот опыт где-то и решил подать заявку на стажировку в Яндекс на позицию стажёра по направлению "Аналитик данных". Зашёл на сайт, заполнил анкету, через час получил ссылку на тестовое задание в Яндекс Контест. Увидел, что даётся 6 часов на решение задач и принял решение выделить утро субботы на прохождение теста.

UPD: условия задач удалены по просьбе

Тест оказался не очень сложным, было 6 задач. 2 из них на математическую статистику (задачи A и B), 2 стандартные задачи на Питоне (C и D), 1 задача на базовые знание библиотеки Pandas (E) и задача на логику и аналитическое мышление.С последними двумя задачами я справился за полчаса, с первой задачей по матстату ещё минут за 10, на вторую задачу было потрачено 20 минут, и осталось целых 5 часов на 2 задачи на питоне. На каждую я потратил минут по 30, но в одной задаче не прошёл несколько тестов (скорее всего, условие мною было проинтерпретировано неверно), а в другой выдавал memory limit. В итоге, оптимизировать код и дорешать задачи до конца не вышло. Ещё раз проверил 4 прошлые задачи и отправил решения.На следующий день мне приходит письмо счастья от рекрутера о том, что со мной готовы провести техническое интервью и предложили выбрать время, также предупредили, что оно займёт около часа. 

Часть 2. Первое интервью

Интересный момент, что получилось провести интервью только через неделю, тк то у меня не получалось, то интервьюера. Мы созвонились в зуме, он представился, сказал, что возглавляет отдел аналитики Яндекс.Маркета, начал общение сразу на "ты", позднее мне рекрутер сказал, что в Яндексе так принято. Интервьюер, назовём его Сергей, рассказал как будет устроено интервью: 10 минут я должен рассказать о себе, потом ТЗ (задача на питоне) и задачи на теорвер.Я вкратце рассказал о себе, своем проекте про алгоритмы кластеризации, которым я занимаюсь в институте. Он позадавал пару стандартных вопросов из разряда: "Почему Яндекс?", "Какие качества мне стоит развивать?", "Что было моим успехом?" .Далее была ТЗ: вывести список уникальных слов, считываемых из файла. Я код написал, в целом, ему важна была идея и знания синтаксиса. Всё подводные камни я разгадал у этой задачи, но не сразу. Вот сами камни:

  1. Если файл пустой

  2. Английский и русский язык (что будет?)

  3. Отделение знаков препинания

  4. Первые слова в предложении

Сергей сказал (в конце интервью), что я с задачей справился и что были ребята, которые не до всех пунктов могли додуматься(я был польщён). Далее были задачи по теорверу:

  1. Бросаем монетку 10 раз. Какова вероятность, что выпадет 10 орлов? [(1/2)^10] 

  2. Бросаем монетку 10 раз. Какова вероятность, что выпадет 9 орлов? [10*(1/2)^10]

  3. В ящике есть 4 вида носков. Носков бесконечно много. Сколько нужно изьятий, чтобы получить пару? [5]

Далее, задача на математику: "У Аркадия много жён. У него есть коллекция кактусов, которые он решил раздать всем жёнам. Первой жёне отдал 1000 кактусов и 10% от остатка. Второй жене 2000 кактусов и 10% от остатка. И так далее… Каждая жена получила поровну. Сколько жён у Аркадия?Ход решения я тоже рассказал. Чтобы не ждать, пока я посчитаю, он мне сказал, сколько всего было кактусов и я дал ответ. [81000 всего кактусов, 9000 каждой жене]. Последней была задачка на проверку аналитических способностей:20 детям в детском садике задали вопрос: живут ли их родители вместе? На что 2 ребёнка ответили, что не живут. На следующий день в местной газете выходит статья с заголовком: "10% семей в нашем городе в разводе". Почему данное утверждение неверно? Всего есть 6 ключевых пунктов, до 2х последних я, к сожалению, не додумался:

  1. Дети могут быть из одной семьи

  2. Разный возраст детей, и, соответственно, разные группы, то-то более осознанный, кто-то ещё не понимает вопроса.

  3. Месторасположение садика, может выборка была только в благополучном/неблагополучном районе.

  4. У ребёнка может быть один родитель или у ребёнка может быть мачеха/отчим, отсюда неверные результаты.

  5. Дети врут.

  6. Есть семьи, где дети не ходят в садик.

После этой задачи Сергей рассказал мне как я в целом отвечал и рассказал, чем занимается отдел аналитики.У них есть 2 типа задач:

  1. Визуализация данных, представление менеджерам отчётов, в частности, работа в Tableau, то есть создание дашбордов.

  2. Прогонка данных из одного сервиса в другой

Я позадавал вопросы и Сергей сказал, что назначит через рекрутера ещё одно интервью, где мне подробнее расскажут про задачи.

После интервью создалось приятное впечатление о интервьюере и о возможных задачах и в целом от общения.

Часть 3. Второе интервью

Через неделю мне назначили ещё одно интервью, где уже был Сергей и девушка из отдела планирования Яндекс Маркета, назовём ещё Светлана.Светлана представилась, рассказала чем занимается их отдел, как он связан с отделом аналитики, наговорила кучу умных слов (мне, как студенту 3го курса МФТИ, не вся информация была понятна и как человеку, который никогда не сталкивался с подобными вещами), от которых я остался под впечатлением. Далее, Светлана спросила, как я понял задачи, про которые мне рассказал Сергей. В целом, я рассказал очень кратко, тк получил мало информации на первом интервью. Потом, она задавала классические для интервью вопросы: "Какая у тебя суперспособность?", "Как ты определяешь приоритет задач?", "Сколько времени я смогу уделять стажировке?" спросила ещё, собираюсь ли я в магистратуру(видимо, для того, чтобы понять, может ли компания в дальнейшем на меня рассчитывать), но не идти туда я не могу, тк там военная кафедра. Спросила ещё какие языки программирования я знаю, я сказал, что Python. Меня спросили про sql, но на тот момент я его не знал (после интервью сразу пошёл осваивать, не повторяйте моих ошибок). После этого Сергей дал ещё 2 задачки на аналитику, даже скорее на продуктовую аналитику, здесь было немного тяжело, потому что продуктовой аналитики нас не учили и я отвечал исходя из логических соображений. 1ая задача:"Кто является конкурентом у Яндекс Маркета?". Я назвал только 3/4 основных пунктов - онлайн магазины(dns, ozon, wb, перекрёсток, авито и тд по списку) и офлайн магазины (любой ларёк является также конкурентом) и реклама на сайтах. До чего я не догадался, так это до социальных сетей, тк сейчас это направление растёт и там уже довольно много покупок/продаж.Вторая задача была аналогичной, только вопрос был про Яндекс.Бразуер. Дополнительным был вопрос о том, какую метрику используют в Яндекс Браузере. Я подумал, что количество кликов на рекламу, но позже сообразил (с подсказкой), что это время, проведённое пользователем в браузере.Далее, меня спросили, чем бы я хотел заниматься из возможных задач. Я сказал, что визуализацией дашбордов в Tableau, ещё задали пару простеньких вопросов на аналитику. После этого интервью закончилось и Сергей сказал, что дальнейшую информацию передаст через рекрутера.

Часть 4. Решение

На следующий день от рекрутера приходит письмо:

"К сожалению, твоих навыков пока не достаточно и команда не готова тебя брать. На данный момент я не могу тебе ничего предложить, но мы будем рады если ты вернешься к нам позже.По рекомендациям: хорошо бы прокачать sql, питон, продуктовую аналитику".

Конечно же, я расстроился, потому что казалось, что на тот момент для предложенной мне задачи моих навыков хватало, но увы.

Часть 5. Заключение

Пройдусь по каждому пункту.

1) Задачи на Яндекс Контесте - 9/10

Несложные, интересные задачи, но непонятен момент с проверкой некоторых задач на оптимальность кода. Действительно ли аналитик должен придумывать самый оптимальный по времени и памяти код или аналитик нужен для других целей?

2) Общение с рекрутером - 10/10

Рекрутер довольно развернуто и оперативно отвечал на все вопросы по почте, после 1го интервью сразу перешел в телеграм для удобства

3) Первое интервью - 10/10

Первое интервью мне очень понравилось. Задачи, подсказки от Сергея, лёгкое и приятное общение.

4) Второе интервью - 5/10

Было слишком много стандартных вопросов, словесная нагрузка в начале интервью от Светланы. Считаю, что можно было кратко и менее нагружено представиться и рассказать, чем занимается отдел. Непростые вопросы на аналитику, сейчас поясню. Должен ли человек, который подаёт на позицию стажёра "Аналитик данных" знать продуктовую аналитику? Наверное, да. Должен ли человек до приглашения на работу вникнуть во все тонкости процесса, не будучи знакомым с ним изнутри? Наверное, нет.

5) Выводы

К сожалению, я получил только фидбек, только написанный в части 4. Проанализировав 2 интервью, я сделал вывод о том, что нужно подтянуть sql. Насчёт продуктовой аналитики я не знаю, в каждой компании свои процессы и заранее вникать в особенности ее работы, наверное, тяжело и затратно по времени. Я согласен, что если ты работаешь уже внутри, то ты обязан знать все подробности, но до этого - вряд ли.

Попробую ли я ещё раз? Думаю, да. Через полгода, может раньше. Несмотря на отказ. Мне нравятся сервисы, которые делает компания и я активно ими пользуюсь. Поэтому было бы интересно поучаствовать в их улучшении.

Буду рад, если этот пост поможет кому-то подготовиться и попасть в Яндекс.

Также буду рад, если получу рекомендации/здравую критику о вышеизложенном и советы для дальнейшей подготовки.

Реклама
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее

Комментарии 49

    +25
    Похоже в яндекс на позиции стажеров берут только миддлов с опытом работы в яндексе
      +4

      Идеальный кандидат должен ещё иметь ипотеку при содействии того же Яндекса.

      –8

      Судя по тому, что ты все разболтал и слил тестовые и детали бесед без их согласия, уже не возьмут. В Яндексе итак не все хорошо с утечками в последнее время.

        +12

        Если вопросы к собеседованию можно "слить", то это плохие вопросы, и собеседование дурацкое.

          –8

          Следующий шаг.
          О, мне дали доступ к конфиденциальной информации. Можно их слить. Ведь тут дурацкая система безопасности.

            +9

            Вопросы к собеседованию это не конфиденциальная информация, а автор статьи — не сотрудник и бумаг о неразглашении не подписывал.

          0
          Большинство этих задач типовые, поэтому «сливом» это назвать сложно.
          –1
          а светить задачи разрешили?)
            +6

            А разве я что-то подписывал? С чего ты решил, что это задачи на стажёра на аналитика? Это просто задачи с Яндекс. Контеста + они меняются там каждый месяц

              –4
              мог и не подписывать, просто в письме со ссылкой могли быть маленьким шрифтом условия, что третьим лицам такое не надо видеть. Обычно бывает.
                +1

                Встречал необходимость подписывать хоть какое-то NDA только когда звали работать в сербский отдел ubisoft. Но там хотя бы понятно почему. Правда в итоге я до этапа где действительно требовалось доступ под NDA не дошел.

            0

            [удаленный коммент]

              0
              1) про футбол интересная задачка. Я бы запилил декартово дерево (имхо, самое простое для реализации руками случайно сбалансированное дерево поиска), с количеством потомков для каждой ноды, тогда порядковая статистика за логарифм считается.
              2) в первой задаче — вроде 0 с ходу
              3) последнюю не стал смотреть, остальные вроде просто
                0

                В первой задаче ответ 4, формула полной вероятность + матожидание

                  0
                  там вроде вопрос был, насколько дольше ждать удовольствия первому, чем второму. А вероятность получить удовольствие у них одинаковая на каждом шагу, так что матожидание тоже одинаковое, так что 0.
                  0

                  2) вообще нет. Рассмотрим количество последовательностей не содержащих нужное событие длины n. Чтобы последовательность не содержала 01, нужно, чтобы она имела вид 1..10...0. Один раз написав 0, мы не можем больше писать 1. Таких последовательностей n+1. Чтобы она не содержала 11, я могу строить произвольную последовательность из пар 01 и 00 и гарантированно не иметь 11. Итого оценка снизу уже экспоненциальная: 2^(n/2).


                  1) рабочее решение, но на собеседовании на доске могут возникнуть проблемы. Есть более простое. Давайте заведем 2 массива: a длины n, где будем хранить отображение id в разницу мячей. И заведем массив b длины 40m, что тоже укладывается в ограничения, куда мы сложим частичные суммы количества людей имеющих разницу не более i. Заметим, что мы перемещаем игрока каждый раз на расстояние не более 20, то бишь на каждый матч для 10 игроков надо прибавить/вычесть 1 из <= 20 ячеек и выдать b[a[0] + 20m]. Ну и понятно массив a нужно обновлять. И по скорости и по простоте кода такое решение сильно выигрывает

                    0
                    1) да, у вас оптимальнее
                    2) объясню свое решение, ваше не понял) у нас есть поток событий — успех/неудача, 0/1 с равной вероятностью, у обоих. Теперь найдем вероятность получить удовольствие. Для первого — это переход 1 -> 1, для второго — 0 -> 1, т.е для первого события вероятность получить удовольствие 0, для второго и последующих — 1/4 для обоих. Так как нам требуется разницу матожиданий найти, то очевидно, что разница матожиданий для одинаковых потоков событий равна 0
                      0
                      хотя вроде не на 20, разница мячей может любой быть
                    +2

                    Жесть какая, два интервью для стажера)
                    Не особо понимаю смысла того, что решение не проверяется после отправки.

                      0

                      Решение специально не проверяется, чтобы я не смог узнать правильный ответ

                        0
                        в целом согласен, жесть полная, и даже для не-стажера
                        +4

                        Расстраивает, что получая около математическое образование приходится так биться за релевантную работу. Если автор пошёл бы на обычную вакансию банковского программиста после третьей задачи он уже был принят и никакого второго интервью не было. Единственная оговорка — неполный рабочий день, большинство не устроит. Радует то что в банках и не только, как подснежники после снега начали создаваться отделы по data mining, хоть какая то конкуренция. Может это уменьшит аппетиты hr яндекса.

                          +4
                          Так вот для чего нужны были олимпиады по математике в школе — подготовка к первому интервью на позицию стажёра в яндекс
                            0

                            А что в этом такого? Навык решения олимпиадных задач неплохо расширяет кругозор программиста и реально полезен в повседневных задачах.

                            0
                            20 детям в детском садике задали вопрос: живут ли их родители вместе? На что 2 ребёнка ответили, что не живут. На следующий день в местной газете выходит статья с заголовком: «10% семей в нашем городе в разводе». Почему данное утверждение неверно?

                            Не до конца понял, почему утверждение про 10% семей обязательно неверное. По приведенной информации, вроде, нельзя однозначно сказать.
                              0
                              Потому что выборка нерепрезентативна.
                              Но технически вы правы, может быть и так, что утверждение окажется верным. Вопрос следовало сформулировать иначе: «Почему выводы сотрудников газеты некорректны».
                                0

                                Да, именно так, в статье немного не так написал, в целом, данное утверждение может оказаться и верным

                              0
                              Да????
                              Вряд ли аналитики из Яндекса смогут ответить на вопрос: «Почему необходимо использовать хотя бы две независимые точки (системы обработки информации), чтобы получить релевантное отражение действительности».
                              Хотя сами этот закон используют, пригласили на второе собеседование второго сотрудника.
                                +9
                                Каждый раз, когда читаю эти истории — задаюсь одним и тем же вопросом: как так получается, что набирают на работу одних олимпиадников, а на выходе лепят дерьмо на палочке? Что это — вина быдла у руля, которое никто не тестировал и не набирал? Или нежелание гениев работать над обыденными задачами? Но эффект потрясающий, конечно. Десять академиков собираются вместе и делают колченогую табуретку.
                                  +1
                                  олимпиадники переобучены на своих задачах, как какая-нибудь нейросеть?
                                  +6
                                  >6 часовые задачи|тесты
                                  >два затяжных собеса, с вопросами типа «Какая у тебя суперспособность?», «Как ты определяешь приоритет задач?», «Сколько времени я смогу уделять стажировке?»
                                  И это на должность стажера для:
                                  1. Визуализация данных, представление менеджерам отчётов, в частности, работа в Tableau, то есть создание дашбордов.
                                  2. Прогонка данных из одного сервиса в другой


                                  Хахаха
                                    +1
                                    Да это HR мутят воду. HR, которых просто некому осадить. С технической стороны дела, человек подходит. А отвечать на тупорылые вопросы девочки, которая вообще далека от того, чем будет сотрудник заниматься, — задача зачастую непосильная. HRов учат по заграничным (американским чаще всего) методичкам, которые к нашим реалиям просто не подходят, менталитет другой. Ну не учат у нас продавать себя, как работника. У нас учат (а может уже и не учат), просто выполнять работу.
                                    0
                                    Значит приоритет отдают не по уровню прокаченности навыков. Отсеивание за незнание SQL скорее похоже на отговорку, если человек показал, что может быстро ориентироваться в задачах. А может наоборот не показал. В одну компанию крупную взяли человека, с которым лично работал и навыки его сводились к чтению руководства и исправлению простейшей проблемы через неделю, в лучшем случае. И такой был принят не один. Компания с словом газ в названии. И это не единичный случай когда туда брали сотрудников очень некомпетентных мягко говоря. Поэтому можно предположить, что берут не за навыки, а за другие качества
                                      0
                                      мне кажется, действительно за sql зарубили. Прямо даже написали, подтянуть sql. SQL для аналитика данных — мастхэв.
                                      А в компании со словом газ в названии берут за красивое резюме и красивый опыт работы, оценить же все равно не могут, критериев не знают. В трудовой же не пишут, что простейшие проблемы неделю исправлял, и сам он этого не скажет. Но зато условному инженеру по газу там наоборот, на собесе душу вынут и во вторичный рот заглянут
                                        0

                                        JFYI, вторичный это тот, который с зубами.

                                      +2
                                      «Какая у тебя суперспособность?»

                                      что здесь отвечали успешные кандидаты?
                                        +1
                                        «говорить правду на собеседовании», конечно же
                                          0
                                          Гнобить HR силой мысли и заставлять их работать, а не задавать странные вопросы, на которые не может быть адекватного ответа.
                                          0
                                          Самое важное что я вынес из этой статьи — КДПВ. Яндекс, похоже, решил отказаться от ублюдского дизайна когда людей рисуют инопланетяне, которые их никогда не видели. Спасибо, Яндекс!
                                            +3
                                            Яндекс ищет миддла на зарплату стажера, хех
                                              0

                                              Не очень красиво выкладывать тестовые задания в полном объёме...


                                              Ну и визуализировать в табло что-то без SQL было бы тяжеловато =)


                                              Удачи в поисках.

                                                0
                                                Ну вот, теперь Яндексу нужно продумывать новые тестовые задания:)
                                                  0
                                                  Довольно познавательно. Только мне кажется задания они изменят в ближайшее время.
                                                    –3
                                                    Хм, а если это тестовые задачи нынешнего года, хорошо ли было показывать их здесь в открытом доступе?
                                                      0
                                                      Из рекомендаций ещё- подтянуть Продуктовую аналитику, думаю надо обратить внимание. Аналитик — это тот, кто видит картину со стороны, целиком. Им нужны люди с чем то Новым, что бы они привнесли в компанию. Тем, кто хочет успешно пройти в компанию — надо что-то новенькое и оригинальное придумать о Продукте. И, конечно, знание азов именно этой стези, придётся показать. Это столпы, на которых строится развитие.
                                                        +1
                                                        Вопрос только зачем.
                                                        Yandex точно не компания мечты.
                                                        Скорее наоборот то что надо избегать всеми способами.

                                                        Платят три копейки.
                                                        Для опытного разработчика так вообще помойка.
                                                          0
                                                          Наверняка же помимо самого собеседования смотрят еще и на твои достижения (в Яндексе, например, любят олимпиадников), интересы, резюме в целом. Это тоже стоит учитывать, возможно, именно этого не хватило?
                                                            +1

                                                            1) Почему ближайшие конкуренты Яндекс.Маркета — это онлайн и оффлайн магазины? Я.маркет — это ведь не магазин, а агрегатор. Как пользователя мою потребностью Я.Маркет решает, когда мне нужно сравнить цены в разных магазинах. Тут ближайшие прямые конкуренты Е-Каталог, Пульс цен и подобные агрегаторы.


                                                            2) В вопросе про детей и СМИ почему утверждается, что всего 6 пунктов? ещё куча вариантов, причем самых простых и очевидных для нашей родины :)
                                                            Если представить как признаки:
                                                            1) "совместное проживание": 0 — нет или 1 — да
                                                            2) "семейное положение" (немного сложнее): 0 — никогда не были в браке, 1 — разведены, 2 — в браке
                                                            Вами рассмотрены варианты относительно:
                                                            [1, 2] — "совместное проживание" = 1 следует -> "семейное положение" = 2
                                                            [0, 1] — "совместное проживание" = 0 следует -> "семейное положение" = 1


                                                            Теперь поехали перебирать остальные варианты:
                                                            1) [0, 0] — родитель могут и не жить вместе, но это не значит, что они в разводе, они могли никогда и не быть в браке
                                                            2) [0, 2] — родители могут и не жить вместе по каким-либо причинам, но при этом они состоят в законном браке
                                                            3) [1, 0] — родители оставшихся 18 детей хоть и живут вместе, но никогда не были в законном браке
                                                            4) [1, 1] — родители оставшихся 18 детей хоть и живут вместе, но разведены


                                                            Может это всё быть на практике? Да легко :)

                                                              +1

                                                              Честно, как студент МФТИ, я не понимаю ответа на этот вопрос


                                                              Далее, меня спросили, чем бы я хотел заниматься из возможных задач. Я сказал, что визуализацией дашбордов в Tableau

                                                              Неужели после кучи интересных курсов рисовать таблички — это то, чего хочется? :)
                                                              Я слышал, что от подобных стажировок люди плевались, потому что зачастую там довольно мало реальной умственной деятельности. Может быть, оно и к лучшему, что не срослось

                                                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                              Самое читаемое