Об опыте прохождения курса от Яндекс "Инженер данных с нуля", что подвинуло, как учился, какие претензии, стоит ли он своих денег. В общем - мысли в слух!

Декабрь 2025, предпраздничные дни. Постоянный серфинг об аналитике, работе с данными, программировании и т.п., что сопровождающий мою работу и интересы, выводит в очередной раз на курсы Яндекса. Стоит сделать небольшое отступление и рассказать о себе. В ИТ очень давно, помню что такое перфокарты, и после большого периода жизни в продажах и управлении, опять завернул в аналитику, с чего и начинал: прогнозирование, модельное поведение и т.п. Но пытаясь вернуться, столкнулся с непонятными требованиями HR к позиции, что и заставило обратить внимание на курсы: чему они такому учат, что человек с опытом более 30 лет не устраивает!
Свое негодование специалистами HR и современным уровнем найма сотрудников оставлю за рамками этой статьи и вернусь к сути - инженер данных.
Пройдя бесплатные пару блоков буквально за минуты уже готов был забыть про курс, не видя в нем ничего принципиально нового. Если ты занимаешься данными, то знать базы - это обязательно! Знать языки - обязательно! Знать инструменты контроля процессов, виртуализации, и т.п. - обязательно! Ну и скажите, что может курс дать нового опытному человеку? Правильно! Обновить мозги и систематизировать имеющуюся информацию. Это я и ожидал от курса.
Звонок от Яндекса - почему бы вам не продолжить учебу? Дадим хорошую скидку! Новогодний подарок! Так, в двадцатых числах декабря 2025 начал обучение.
Сразу решил перейти на "самостоятельное" обучение, потому как ждать, пока тебе откроют новый блок по расписанию не интересно.

Для внутренних коммуникаций с преподавателями, студентами и кураторами используется Pachka. Там мы и начали знакомится. Состав учеников меня удивил (снимаю шляпу перед маркетологами). Убедить людей, которые занимались вышиванием (утрирую), что через год они станут инженерами данных - мягко говоря заслуживает почтения!
Чем больше проходишь блоков, тем очевиднее становится ситуация: это набор разных курсов, с разными принципами тестирования и конфигурацией инструментов. По сути, накидали для объема все в один для увеличения часов и стоимости.
Все бы ничего, но автоматические тесты стали выбешивать! В них очень много ошибок и очень мало информации, как можно тест пройти. Но что сделано одним, то может быть сломано другим! Так что процесс прохождения вылился в то, что если ты упираешься в ошибку, открываешь сам код теста и смотришь его стру��туру. Пишешь мок-ответку и идешь дальше.

Первые блоки - пролетают легко. Это база. Тратить время на них не хотелось и я обратился к Яндексу с вопросом: проходил у вас курсы по PostgreSQL, по базам, по Datalense, можно ли их как-то зачесть в программе? Нет! А можно эти курсы перенести на мой аккаунт, чтоб они отображались как пройденные в едином месте? Нет!
Пытаясь пройти тесты честно, ты теряешь уйму времени на попытку разобраться в ошибках других, ждешь, пока тебе ответят в поддержке или твой куратор. Преподаватель тоже тормозит. По классике: поддержка говорит - вам к куратору. Куратор отправляет к преподавателю и так по кругу несколько раз, пока всех не соберешь в кучу.
На середине пути, когда в очередной раз убил кучу времени на обход ошибки в тестах и ожидании помощи, оставил такой сообщение своим сокурсникам:
количество заявленного времени и фактическая сложность в работе - не совпадают! Чем дальше по программе пойдете - тем будет больше разрыв. Пример - тема на 50 часов проходится за день, а вот тема на 10 - выдала неделю и даже больше.
чем дальше по темам - больше ошибок в программе, в задачах и т.п. - это затягивает процесс обучения.
на фидбек от поддержки, если возникнут сложности в теме - закладывайте минимум день. Моя статистика - 2. За это время удается "обойти" проблему, но очень выбешивает и сбивает с ритма обучения.
Да, линейка прогресса вашего обучения в верху профиля для курса - не совпадает с заявленным временем тем. Тоже в копилку "демотиваторов"
Но скажу доброе слово о преподавателе, которого мне назначили на вторую часть программы. Парень опытный, из нашей сферы, поэтому хорошо понимает проблемы и не "делает мозг" лишними вопросами - все четко и по делу! Что не скажешь про куратора. Это молодая девочка, с явными проблемами в коммуникациях и попытками показать свою значимость людям, которые в два раза опытнее и старше её. Когда начала учить как нужно везти переписку - я прямо взорвался! Яндекс!! Вы контролируйте софт-скилы ваших сотрудников!
Меня до конца курса не покидала мысль, что я первый, кто его проходит! Громадное количество ляпов, ошибок, несостыковок. Через какое-то время я уже устал рапортовать в суппорт и куратору. Разговорившись с преподавателем узнал, что мне еще повезло очень, потому как в начале создания курса проблем было даже не в разы, а десятки раз больше!

С безопасностью тоже есть вопросы, но они дают бэкдор, когда можно посмотреть сколько по факту людей учится на курсе в текущий момент + получить доступ к сданным работам. Как аналитик, собрал данные, посмотрел качество кода и ужаснулся! Если такие инженеры данных будут работать в компаниях, то что вы ожидаете от бизнеса???
Анализируя программу и уровень, я понял для себя, что курс - это как ПТУ. Вроде начнешь говорить правильными терминами, но без базы высшего образования, это не более чем навыки работы с инструментом. И тут только время и опыт сможет помочь. А если ты прошел институт, есть степень, то разобраться в инструментах, тем более с применением новых технологий, сможешь быстро. Поэтому, как и в качалке, база - наше все!
В статье встретил такой комментарий, с которым полностью соглашусь:
Инженер - это не тот, кто на основе справочника ремонтирует( собирает программу) , а тот, кто обладая определенным образом мышления, знаниями и навыками может формализовать и решить проблему(задачу) , создать что-то новое, а не копировать известное. Этому нельзя научить за 12 месяцев.
Многие в отзывах к курсу отмечают сложность его прохождения в параллель с основной работой. Если вы в теме, то вполне его пройти. Но это тогда не курс по новым знаниям, а квалификационный экзамен и тут сделаю отметку о неадекватной стоимости его, о чем в конце статьи. А вот если до этого, вы окучивали грядки, то разобраться будет довольно сложно. Особенно вторая половина. Там большой акцент на задачах девопсов. Признаюсь, я с ними не так плотно сталкивался и не понимаю, зачем мне настройки кубернетиса как аналитику, да еще и детали helm развертывания, но выскажу благодарность за такой шанс окунуться глубже и отдать респект DevOps-ам!

Вот пример распределен��я времени: тема облачных сервисов -14ч. Прочитать их было довольно быстро, а вот выполнить курсовую - мне пришлось затратить 20 часов. К сравнению, выпускной проект занял 4 часа, правда я не стал заморачиваться с Kafka и взял данные из S3.
Еще один нюанс - это инструменты, которыми ты пользуешься. Как уже сказал - от блока к блоку их состав меняется, вводя больше смуты в процесс. На последних блоках ты вынужден работать с облачными сервисами Яндекса, на что тебе выдается грант в 5000р. Выполнив все настройки и получив оценку стоимости, я сразу обратился к куратору с вопросом, что денег не хватит!! Меня заверили - не переживай!

И вот когда я пишу эту статью, параллельно решаю проблему, что удалить облако не могу из-за задолженности! Предвидя ситуацию, привязал виртуальную карту с нулевым лимитом, что и советую всем, кто будет на курсе. Потребление видите на картинке: буквально за неделю ваш грант улетучится. Хотя заверяют: "у нас много студентов и мы отслеживаем, какое количество средств требуется для прохождения спринтов". Напомню - это только для упражнений по курсу!

Почему в курсе нет ClickHouse я не понял . Видел отзывы, что народ хотел еще Datalens - он появился. Но так как и то и другое я осваивал на своем опыте и проходил доп.курсы, а с DL, по сути, был клиентом-испытателем, то вопрос остался риторическим.
�� курсу прилагается еще карьерный трек. Он экстерном не проходится и начнется через неделю. Ну а с темой "Инженером данных" мы заканчиваем статистической справкой:
- фактическое обучения 2 месяца
- абсолютное - 80 часов
- заявленное - 11 месяцев
- из тем, можно обозначить DataLake, Pre-processing, Database. Другие (Analytics, Classification, Statistics, Evaluation) - без внимания.
Как рекомендация: не ведитесь на слово "с нуля" в названии курса! Опыт нужен, если не хотите все 11 месяцев по 8 часов учить теорию и практиковать кодинг!
P.S. Стоимость курса разбил на помесячные платежи (14,400р). Вот думаю адекватная его цена где-то 30т и будет.
P.P.S. Попалась на глаза такая зарубежная статистика. Не хочу поднимать тему различий в навыках и задачах Data Engineer, Data Scientist, но взгляните на программу того же Яндекс.Практикум - "Специалист по Data Science" и найдите разницу.
Упрекнули, что в статье (в начальной версии) отсутствует вывод. По мне, вывод тут каждый делает сам - нужны ли курсы в том виде, в котором они предоставляются и как такие курсы влияют на рынок. Но для ленивых:
курс требует доработки и существенной реструктуризации. Бизнес процесс требует изменения. Присутствует "синий океан", где с правильным подходом и ресурсами больших корпорация (Яндекс, Сбер, кто держит свои курсы) можно стать большой акулой!
Но эти детали уже за деньги! Надо же окупить курс!
P.P.P.S. Ну и надеюсь самый пост-скриптум (обновляю, после публикации). Оказывается, что получить сертификат, если ты сдал курс экстерном, ты можешь только после окончания обучения когорты, которая в моем случае будет в конце 2026 года (через 8 месяцев еще!). Вопрос конечно решаю, но это еще один пункт о несогласованности процессов и структуры. Бизнес-аналитик в действии, а что вы хотели!? Вот так, такая пальцем находим проблемы в бизнесе!

