Как стать автором
Обновить
2401.71
МТС
Про жизнь и развитие в IT

Как я учился на аналитика данных

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров7.7K

Привет! Меня зовут Игорь Кальченко, я ML-разработчик в МТС AdTech. Больше полугода назад я окончил Школу аналитиков данных МТС. Это были насыщенные и интересные 10 месяцев, о которых я расскажу в этом тексте. Дисклеймер: это опыт одного выпускника программы, и он может расходиться с другими оценками, я не претендую на истину в последней инстанции.

Как я пришел к мысли стать аналитиком

Мое знакомство с программированием началось еще в университете, когда я изучал гуманитарные науки и решил попробовать свои силы в IT-сфере. Прошел ряд курсов и программ по backend-разработке, аналитике, ML и в какой-то момент узнал про существование Школы аналитиков данных МТС.

На момент поступления я знал, что это фундаментальный корпоративный курс по машинному обучению и аналитике, который готовит ML-разработчиков с актуальным стеком навыков для МТС и для индустрии в целом. Поступить туда можно было с любым бэкграундом, достаточно только пройти отбор.

Вступительные выглядели как комплексный тест по программированию на Python и математике уровня первых курсов университета. В основном проверялось наличие какой-то базы по тем модулям, которые нам предстояло проходить в будущем.

Когда я подавал заявку, больших ожиданий от Школы у меня не было. Хотелось не вылететь в первые пару недель. Я прекрасно понимал, что если мои знания в области разработки были на достаточно хорошем уровне, то университетской базы по математике мне остро не хватало. При этом все время до поступления и после у меня было очень много энтузиазма и желания разобраться в новой и интересной сфере — вероятно, именно за счет этого и получилось сократить разрыв в знаниях и по итогу не только поступить в Школу, но и закончить ее, попав на стажировку и впоследствии на работу в МТС.

Из чего состояла программа

Курс содержал блоки:

  • SQL и Python;

  • математика (страшно, очень страшно, если бы мы знали, что это такое, но мы не знаем, что это такое линал, матстат, теорвер, регрессия, оптимизация, EDA);

  • ML (классический ML, временные ряды, А/Б-тесты);

  • BigData (Spark, MLOps, System Design);

  • рекомендательные системы;

  • нейронные сети.

Учеба. Как это было

Курс сформирован прикольно. Два раза в неделю лекции, частые домашние задания для закрепления. Система мотивации: баллы за обучение, которые можно обменивать на мерч или нематериальные бонусы — раннюю стажировку, интересные встречки и все в этом роде.

Много интересных подходов к ML, домашки варьировались от простых тестов до соревнований по нейронным сетям на Kaggle. Был небольшой reading club, где студенты пробовали преподавать — рассказывали сокурсникам об интересных темах. Там же проходили очные и онлайн‑встречи, квизы, челленджи и вообще много всего.

За время обучения у нас было где‑то 70 лекций, 43 домашних задания, 3 соревнования Kaggle, а еще много разных активностей. Суммируя опыт: учиться сложно, но вам понравится.

У многих преподавателей я заметил заинтересованность в том, чтобы студенты не только закрывали модули, но и приходили работать в их команды. Для этого они рассказывали про свои проекты, про особенности задач — это прям хорошо поддерживало мотивацию во время курса.

За весь курс очень запомнилась динамика. Темы быстро сменяли одна другую: буквально пару недель назад мы изучали классический ML, а теперь сдаем первые домашние задания по рекомендательным системам, а через месяц предстоит начать изучать нейронные сети и участвовать в полноценных соревнованиях по Computer Vision на Kaggle. Это было очень интенсивно и продуктивно, так как подготовило базу для реальной работы, где также нередко приходится нырять в абсолютно новые темы и задачи.

Как устроено комьюнити

После завершения нас привлекли в качестве тьюторов курировать новые группы студентов, что способствует нетворкингу и связям между выпускниками и студентами. Также благодаря Школе я узнал про многие интересные проекты, например ODS (Open Data Science) с его собственными курсами, мероприятиями и комьюнити.

Связи остаются не только со студентами, но и с преподавателями. Даже после выпуска спокойно можно написать преподавателю с рабочим вопросом по изучавшейся теме и с большой вероятностью получить исчерпывающий ответ. У меня так было, когда потребовалась специфическая информация про Spark.

Стоит написать про педсостав. Первое, что меня удивило, — это вовлеченность преподавателей в процесс. Хотя большая их часть занимала позиции от сеньоров и тимлидов до CDS (Chief Data Scientist) и явно имела немало работы помимо Школы, преподаватели вкладывались в учеников. Все ДЗ проверяли подробно и с комментариями (нас было 100+ студентов), доработки приветствовали и возвращали с фидбэком, чаты по темам были активны, всегда можно было поспрашивать вопросики, если оные возникали. В конце с нами поделились статистикой: преподаватели проверили 2 387 работ, в основном ноутбуки с кодом, проекты, соревнования и немного частично автоматизируемых тестов. Я проходил ряд курсов до Школы, но такую всеобщую заинтересованность встречал редко.

Помимо студентов и преподавателей мы много работали с менеджерами курса. Тоже хочется отметить их заинтересованность: каждый кейс рассматривали индивидуально, собирали много фидбэка, было ощущение, что каждый студент им важен.

Есть ли жизнь после Школы

Есть стажировка и менторство. Шанс пройти отбор предоставляется всем, кто окончил программу и выполнил требования. Я попал в первую, немногочисленную, волну еще во время обучения.

Стажировка гармонично дополнила мое обучение в Школе. С первых дней меня закрепили за проектом и погрузили в реальные рабочие задачи. Ощущалось как полноценная работа со взрослыми задачами, проектами и ответственностью.

Боялся вылететь, но повезло: дали крутого ментора из ведущих ML-разработчиков команды. По ощущениям, именно благодаря его грамотному менторству я углубил знания из Школы, прокачал самостоятельность, научился решать более комплексные, нетипичные задачи и по итогу перешел из стажеров в штат.

Что из курса пригодилось

Как уже писал, я в команде AdTech, где занимаюсь ML-решениями для рекламного бизнеса МТС. В основном работаю с классическим ML: создаю и улучшаю модели классификации на основе бустингов, исследую векторные фичи и ANN-алгоритмы.

За полгода вывел в прод несколько новых моделей, одну из которых мы с коллегами написали почти с нуля. Также были небольшие AdHoc-проекты, облегчающие работу с большими данными.

Большая часть этого стала возможна благодаря двум вещам:

  1. Школе;

  2. грамотно выстроенным стажировке и адаптации новых сотрудников.

Про стажировку писал выше, а что до Школы — она выступила прочным фундаментом, где надстроились практические знания. Она дала широкий набор теоретических и практических навыков, каждый из которых можно извлекать и развивать. Так, мне очень пригодился курс по введению в депрессию регрессию: практически все, что там разбиралось, напрямую связано с моими текущими задачами.

За стажировку я на практике прочувствовал, что большие данные — это большие требования к оптимизации. Мне удается их выполнять, потому что я выучил, как работают базы данных и инструменты для работы с ними. Помог модуль BigData: познакомил с HDFS, Hadoop и Spark. Думаю, без обучения мне было бы менее комфортно в полноценной BigData-архитектуре команды, где я работаю.

Курс по линалу научил разбираться в векторах и искать в них решения задач. В принципе весь матаппарат, изученный за время Школы, здорово показал, что происходит под капотом кода. А библиотеки для EDA помогли лучше изучать данные и находить в них аномалии, сказывающиеся на качестве моделей.

Суммирую в табличке, что мы изучали и что из этого мне пригодилось в работе:

Стек Школы аналитиков данных МТС

Технология

Пригодилась

Pandas

+

Spark

+

SQL

+

PyTorch

 

Git

+

Kafka

+

FastAPI

 

Flask

 

Скрапинг (Beautiful Soup)

 

EDA (Plotly, matplotlib)

+

RecSys (RecTools)

 

OLS

 

Регрессия

+

Матстат

+

Теорвер

+

LLM

 

Docker

+

А/Б-тесты

+

Подытоживая: Школа предоставляет обширный набор мощных инструментов для работы в ML/DS/аналитике, каждый из которых можно доставать под конкретные задачи и качать до бесконечности.

Переходите на темную сторону Приходите в Школу аналитиков данных МТС: у нас весело и много мемов.

Теги:
Хабы:
+20
Комментарии3

Полезные ссылки

Превращаем магию в технологию: как волонтеры МТС знакомили детей с цифровым миром

Время на прочтение4 мин
Количество просмотров328
Всего голосов 7: ↑5 и ↓2+6
Комментарии3

FreeIPA: как обнаружить атаку злоумышленника на любом этапе Кill Сhain. Часть 2

Время на прочтение14 мин
Количество просмотров1.4K
Всего голосов 9: ↑9 и ↓0+14
Комментарии2

Изоляция с помощью глобальных акторов в Swift Concurrency: варианты на примере @MainActor

Время на прочтение7 мин
Количество просмотров627
Всего голосов 6: ↑6 и ↓0+12
Комментарии0

Обходим подводные камни работы с UDA в коде на Lua для ScyllaDB: дружим Java-драйвер и пустые значения

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров737
Всего голосов 6: ↑6 и ↓0+11
Комментарии0

Информация

Сайт
www.mts.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия