Привет! Меня зовут Роман Ленц, в Первой грузовой компании (ПГК) я занимаюсь анализом данных и машинным обучением в рамках проекта «Цифровой вагон», подробнее о котором рассказано здесь. Еще 3 года назад я работал инженером-конструктором в зарубежной строительной компании. Почему я решил кардинально поменять свою карьерную траекторию, почему выбрал именно Data Science, и как я к этому пришёл? Поделюсь опытом, который, возможно, окажется полезным для молодых специалистов, ищущих «работу мечты». Тем, кто задумался о смене профессии, думаю, информация тоже будет полезна.
Я получил высшее образование за границей. После окончания вуза устроился на работу в московское представительство иностранной строительной компании. Мы занимались проектированием объектов по всему миру, но на российском рынке количество заказов постепенно снижалось: стоимость услуг была слишком высокой для местных клиентов. Стало очевидно, что скоро придется искать другую работу. Именно тогда я задумался о том, чтобы сменить карьерную траекторию.
Не скажу, что выбрал Data Science совсем случайно. Как у инженера у меня был сильный математический бэкграунд, я был знаком с основами некоторых языков программирования, разбирался в работе с данными. Меня привлекали области, где можно применить эти навыки и знания, поэтому направление Data Science показалось мне интересным вариантом для более глубокого погружения.
Определившись, я стал постепенно вспоминать основы математики, линейной алгебры, статистики, теории вероятности. Параллельно начал проходить профильные курсы на крупных онлайн-платформах – DataCamp, Stepik, Яндекс.Практикум и других.
Вот несколько практических советов, которые, как мне кажется, помогли совершить переход в новую для меня область деятельности. Конечно, мотивация, вера в себя, стремление к поставленной цели – это, наверное, хорошо, но без конкретных действий не добиться конечного результата. Итак, поехали!
Участие в хакатонах по машинному обучению
От знаний к практике. Участвуя в хакатонах, я учился применять все полученные знания на онлайн курсах на решении прикладных задач. Самая популярная площадка для проведения соревнований по машинному обучению, которой мне приходилось пользоваться в поисках проводимых мероприятий, – Kaggle.com, но вообще-то подобных площадок довольно много. Есть и российские аналоги, например, ребята из Boosters.pro организовывают и проводят крутые чемпионаты для крупных российских компаний.
Хакатоны дают выход на реальные задачи от реальных компаний, в том числе лидеров рынка. Компании часто бывают заинтересованы не только в перспективных и интересных решениях от участников, но и в найме персонала, поэтому есть шанс сразу же после завершения соревнований получить приглашение на собеседование или оффер. Кроме того, благодаря участию в решении таких задач вы не просто «прокачиваете» свои навыки, но и начинаете лучше понимать, что нужно и важно для компаний конкретных отраслей. Если это банк, то ожидайте задачи на кредитный скоринг, для тяжелой промышленности — это оптимизационные задачи, а в ритейле - прогнозирование спроса и промо. Это будет вашим преимуществом во время собеседований.
Другой важный плюс хакатонов – общение и погружение в профессиональную среду. На специализированных площадках можно не просто найти объявления о предстоящих мероприятиях, но и партнеров для участия в них. Конечно, топовые участники не горят желанием заполучить в свою команду новичка. Вам в любом случае придется начинать с чистого листа и делать себе имя в этой среде с нуля, но за это время вы успеете обзавестись разными контактами, которые могут пригодиться в будущем. Более того, после окончания чемпионатов участники делятся своими решениями, где всегда можно найти много нового для себя, как в написании кода, так и самого подхода к решению задачи.
Работа с ментором
Мне повезло: у меня был опытный приятель из Data Science, который на определенном этапе стал моим ментором. Он много рассказывал о специфике работы, из чего она состоит, какие проекты реализовываются и какие компании активно внедряют машинное обучение в свои процессы. Кстати, в хакатонах мы тоже иногда участвовали в паре. Я мог не знать некоторые нюансы, но благодаря совместной работе получал огромный опыт.
Если такого друга-ментора у вас нет, отчаиваться не стоит. У Data Scientists и всех причастных к этой сфере разработчиков есть свое довольно живое комьюнити на 60 тысяч человек в Slack, которое так и называется – Open Data Science. Здесь есть и те, кто только интересуется этой сферой и делает первые шаги, и уже продвинутые специалисты. Смотрите здесь анонсы мероприятий, связанных с машинным обучением, актуальные вакансии, обсуждайте свои задачи или проекты, узнавайте об очных или онлайн митапах, которые проводятся время от времени. На сайте сообщества можно посмотреть открытые обучающие курсы, соревнования и различные проекты, в которых можно принять участие.
Практика и прокачка soft skills
Еще одним важным аспектом перехода в DS являются те soft skills, на «прокачивание» которых будущий специалист должен обратить особое внимание. Понятно, что в части базовых навыков важны математическая подготовка, знание алгоритмов машинного обучения, статистики и теория вероятности. Но не менее важный навык – умение общаться с заказчиком, услышать его потребности, убедить его, не нагружая сложными математическими формулировками.
Почему важно уметь разговаривать на бизнес-языке? Часто бывает, что можно потратить много времени на разработку суперсложной модели, которая не будет работать в реальной жизни. Ведь зачастую задачу можно решить не только с помощью сложных алгоритмов машинного обучения, нейронных сетей, но и при помощи простых эвристик, которые основаны на определённой бизнес-логике. И часто ожидаемый результат можно получить без использования сложных алгоритмов. Именно этот навык общения на бизнес-языке, приобретенный мной «в прошлой жизни», оказался крайне полезен и в новой профессии.
В числе других важных soft skills, которые кажутся мне важными, – умение строить работу в команде. Налаживание правильного взаимодействия в коллективе и эффективный процесс распределения задач и ролей – навык, ценность которого трудно преувеличить.
Добавил бы я к этому и умение быстро принимать решения. Этот навык тоже пришел ко мне в годы работы в строительной отрасли. Срок любого проекта ограничен и запросы от заказчика часто меняются, это надо всегда иметь ввиду. Поэтому умение быстро понять и оценить потребность бизнеса – важная компетенция для любого DS специалиста.
Ходите на интервью
Хотелось бы добавить ещё один важный этап - интервью, который многие игнорируют или зачастую просто боятся. При самостоятельном освоении материала по машинному обучению, статистике, больших данных и т.д., а особенно при прочтении различных статей на форумах, вам часто будет приходить в голову мысль: «А почему так много нужно знать?». Именно большой поток информации при прохождении курсов может отпугнуть тех, кто хочет войти в DS. Но нужно понимать, что есть довольно большой разброс желаемых требований к кандидатам в зависимости от того, чем компания занимается и её уровня технологической «зрелости». В одной компании вам нужно знать всё о компьютерном зрении и NLP, а в другой достаточно будет знать основы классического машинного обучения и немного статистики. Поэтому ходите на интервью как можно чаще и практикуйтесь. Только так вы сможете понять, что от вас ожидают работодатели и где стоит подтянуть свои знания. В этой сфере всё стремительно меняется, нужно всегда быть в теме лучших практик на рынке, и об этом вы больше всего узнаете от ваших потенциальных работодателей.
Буду рад, если кому-то помог решиться на первые шаги в Data Science. Верьте в себя и не бойтесь круто изменить судьбу.