IgorKalchenko 27 мая в 10:00

Как я учился на аналитика данных

Простой

5 мин

7.7K

Блог компании МТСКарьера в IT-индустрииУчебный процесс в ITData Engineering*

Привет! Меня зовут Игорь Кальченко, я ML-разработчик в МТС AdTech. Больше полугода назад я окончил Школу аналитиков данных МТС. Это были насыщенные и интересные 10 месяцев, о которых я расскажу в этом тексте. Дисклеймер: это опыт одного выпускника программы, и он может расходиться с другими оценками, я не претендую на истину в последней инстанции.

Как я пришел к мысли стать аналитиком

Мое знакомство с программированием началось еще в университете, когда я изучал гуманитарные науки и решил попробовать свои силы в IT-сфере. Прошел ряд курсов и программ по backend-разработке, аналитике, ML и в какой-то момент узнал про существование Школы аналитиков данных МТС.

На момент поступления я знал, что это фундаментальный корпоративный курс по машинному обучению и аналитике, который готовит ML-разработчиков с актуальным стеком навыков для МТС и для индустрии в целом. Поступить туда можно было с любым бэкграундом, достаточно только пройти отбор.

Вступительные выглядели как комплексный тест по программированию на Python и математике уровня первых курсов университета. В основном проверялось наличие какой-то базы по тем модулям, которые нам предстояло проходить в будущем.

Когда я подавал заявку, больших ожиданий от Школы у меня не было. Хотелось не вылететь в первые пару недель. Я прекрасно понимал, что если мои знания в области разработки были на достаточно хорошем уровне, то университетской базы по математике мне остро не хватало. При этом все время до поступления и после у меня было очень много энтузиазма и желания разобраться в новой и интересной сфере — вероятно, именно за счет этого и получилось сократить разрыв в знаниях и по итогу не только поступить в Школу, но и закончить ее, попав на стажировку и впоследствии на работу в МТС.

Из чего состояла программа

Курс содержал блоки:

SQL и Python;
математика (~~страшно, очень страшно, если бы мы знали, что это такое, но мы не знаем, что это такое~~ линал, матстат, теорвер, регрессия, оптимизация, EDA);
ML (классический ML, временные ряды, А/Б-тесты);
BigData (Spark, MLOps, System Design);
рекомендательные системы;
нейронные сети.

Учеба. Как это было

Курс сформирован прикольно. Два раза в неделю лекции, частые домашние задания для закрепления. Система мотивации: баллы за обучение, которые можно обменивать на мерч или нематериальные бонусы — раннюю стажировку, интересные встречки и все в этом роде.

Много интересных подходов к ML, домашки варьировались от простых тестов до соревнований по нейронным сетям на Kaggle. Был небольшой reading club, где студенты пробовали преподавать — рассказывали сокурсникам об интересных темах. Там же проходили очные и онлайн‑встречи, квизы, челленджи и вообще много всего.

За время обучения у нас было где‑то 70 лекций, 43 домашних задания, 3 соревнования Kaggle, а еще много разных активностей. Суммируя опыт: учиться сложно, но вам понравится.

У многих преподавателей я заметил заинтересованность в том, чтобы студенты не только закрывали модули, но и приходили работать в их команды. Для этого они рассказывали про свои проекты, про особенности задач — это прям хорошо поддерживало мотивацию во время курса.

За весь курс очень запомнилась динамика. Темы быстро сменяли одна другую: буквально пару недель назад мы изучали классический ML, а теперь сдаем первые домашние задания по рекомендательным системам, а через месяц предстоит начать изучать нейронные сети и участвовать в полноценных соревнованиях по Computer Vision на Kaggle. Это было очень интенсивно и продуктивно, так как подготовило базу для реальной работы, где также нередко приходится нырять в абсолютно новые темы и задачи.

Как устроено комьюнити

После завершения нас привлекли в качестве тьюторов курировать новые группы студентов, что способствует нетворкингу и связям между выпускниками и студентами. Также благодаря Школе я узнал про многие интересные проекты, например ODS (Open Data Science) с его собственными курсами, мероприятиями и комьюнити.

Связи остаются не только со студентами, но и с преподавателями. Даже после выпуска спокойно можно написать преподавателю с рабочим вопросом по изучавшейся теме и с большой вероятностью получить исчерпывающий ответ. У меня так было, когда потребовалась специфическая информация про Spark.

Стоит написать про педсостав. Первое, что меня удивило, — это вовлеченность преподавателей в процесс. Хотя большая их часть занимала позиции от сеньоров и тимлидов до CDS (Chief Data Scientist) и явно имела немало работы помимо Школы, преподаватели вкладывались в учеников. Все ДЗ проверяли подробно и с комментариями (нас было 100+ студентов), доработки приветствовали и возвращали с фидбэком, чаты по темам были активны, всегда можно было поспрашивать вопросики, если оные возникали. В конце с нами поделились статистикой: преподаватели проверили 2 387 работ, в основном ноутбуки с кодом, проекты, соревнования и немного частично автоматизируемых тестов. Я проходил ряд курсов до Школы, но такую всеобщую заинтересованность встречал редко.

Помимо студентов и преподавателей мы много работали с менеджерами курса. Тоже хочется отметить их заинтересованность: каждый кейс рассматривали индивидуально, собирали много фидбэка, было ощущение, что каждый студент им важен.

Есть ли жизнь после Школы

Есть стажировка и менторство. Шанс пройти отбор предоставляется всем, кто окончил программу и выполнил требования. Я попал в первую, немногочисленную, волну еще во время обучения.

Стажировка гармонично дополнила мое обучение в Школе. С первых дней меня закрепили за проектом и погрузили в реальные рабочие задачи. Ощущалось как полноценная работа со взрослыми задачами, проектами и ответственностью.

Боялся вылететь, но повезло: дали крутого ментора из ведущих ML-разработчиков команды. По ощущениям, именно благодаря его грамотному менторству я углубил знания из Школы, прокачал самостоятельность, научился решать более комплексные, нетипичные задачи и по итогу перешел из стажеров в штат.

Что из курса пригодилось

Как уже писал, я в команде AdTech, где занимаюсь ML-решениями для рекламного бизнеса МТС. В основном работаю с классическим ML: создаю и улучшаю модели классификации на основе бустингов, исследую векторные фичи и ANN-алгоритмы.

За полгода вывел в прод несколько новых моделей, одну из которых мы с коллегами написали почти с нуля. Также были небольшие AdHoc-проекты, облегчающие работу с большими данными.

Большая часть этого стала возможна благодаря двум вещам:

Школе;
грамотно выстроенным стажировке и адаптации новых сотрудников.

Про стажировку писал выше, а что до Школы — она выступила прочным фундаментом, где надстроились практические знания. Она дала широкий набор теоретических и практических навыков, каждый из которых можно извлекать и развивать. Так, мне очень пригодился курс по введению в ~~депрессию~~ регрессию: практически все, что там разбиралось, напрямую связано с моими текущими задачами.

За стажировку я на практике прочувствовал, что большие данные — это большие требования к оптимизации. Мне удается их выполнять, потому что я выучил, как работают базы данных и инструменты для работы с ними. Помог модуль BigData: познакомил с HDFS, Hadoop и Spark. Думаю, без обучения мне было бы менее комфортно в полноценной BigData-архитектуре команды, где я работаю.

Курс по линалу научил разбираться в векторах и искать в них решения задач. В принципе весь матаппарат, изученный за время Школы, здорово показал, что происходит под капотом кода. А библиотеки для EDA помогли лучше изучать данные и находить в них аномалии, сказывающиеся на качестве моделей.

Суммирую в табличке, что мы изучали и что из этого мне пригодилось в работе:

Стек Школы аналитиков данных МТС
Технология	Пригодилась
Pandas	+
Spark	+
SQL	+
PyTorch
Git	+
Kafka	+
FastAPI
Flask
Скрапинг (Beautiful Soup)
EDA (Plotly, matplotlib)	+
RecSys (RecTools)
OLS
Регрессия	+
Матстат	+
Теорвер	+
LLM
Docker	+
А/Б-тесты	+

Подытоживая: Школа предоставляет обширный набор мощных инструментов для работы в ML/DS/аналитике, каждый из которых можно доставать под конкретные задачи и качать до бесконечности.

~~Переходите на темную сторону~~ Приходите в Школу аналитиков данных МТС: у нас весело и много мемов.

Хабы:

Как я учился на аналитика данных

Как я пришел к мысли стать аналитиком

Из чего состояла программа

Учеба. Как это было

Как устроено комьюнити

Есть ли жизнь после Школы

Что из курса пригодилось

Полезные ссылки

Превращаем магию в технологию: как волонтеры МТС знакомили детей с цифровым миром

FreeIPA: как обнаружить атаку злоумышленника на любом этапе Кill Сhain. Часть 2

Изоляция с помощью глобальных акторов в Swift Concurrency: варианты на примере @MainActor

Обходим подводные камни работы с UDA в коде на Lua для ScyllaDB: дружим Java-драйвер и пустые значения

Информация