Интерес к Data Science продолжает расти, рынку нужны хорошие специалисты. Но порог входа в профессию довольно высок, новичков часто останавливают мифы и стереотипы о сфере — «долго, сложно, без физмат-образования лучше не соваться». Собрали самые частые вопросы и опасения тех, кто начинает карьеру в Data Science и попросили специалистов на них ответить.
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Вопрос про математику неоднозначный. Глубокое знание математики не является ни необходимым, ни достаточным условием. Конечно, тому, кто её знает, будет легче. Но все необходимые знания даются либо на занятиях, либо в дополнительных материалах.
Здесь как в спорте. Есть люди, которые могут без подготовки пробежать марафон. Остальным будет тяжелее, но при достаточной подготовке и они пробегут. Математическая база — это круто, но не критически необходимо.
Дарья Мухина, продуктовый аналитик Skyeng, консультант курсов аналитики Нетологии
Кажется, что сейчас глубокую математическую базу можно заменить умением гуглить. В интернете огромное количество видео и статей, где можно получить доступно изложенную информацию — и не нужно лезть в университетские учебники. Главное знать, что тебе нужно.
Сейчас важнее навык применять знания в реальной задаче, а не просто обладать ими.
Елена Герасимова, руководитель направления Data Science в Нетологии
Понятие «профильное техническое или математическое образование» уходит в прошлое. Уверенного в своих умениях и доменных знаниях специалиста из «гуманитарного» вуза не будут сравнивать с выпускником МФТИ по знанию математики — сравнивают по полезности бизнесу для решения задач.
Уже известны десятки рабочих алгоритмов и библиотек, которые способны всю математическую часть брать на себя без участия человека.
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Конечно, проще всего входить в сферу DS тем людям, у которых есть опыт обучения или работы по технической специальности.
Хотя разделение на «технарей» и «гуманитариев» очень условно, для Data Scientist нужна математика не 8 класса, а повыше. Можно изучить всё самому, но если человек окончил технический вуз — скорее всего, у него уже есть необходимая база. Тем, у кого есть опыт программирования и понимание алгоритмов — также будет проще. Если человеку очень тяжело дается Python, ему придется сложнее — ведь дальше начнут рассказывать про теорию вероятности, потом про нейронные сети.
Опыт обучения на физтехе или работы на инженерных специальностях значительно упрощает освоение DS. Однако нужно помнить, что есть еще огромное количество около-DS специализаций, в которые можно прийти без глубоких знаний математики. Не обязательно быть именно Data Scientist’ом, с хорошим пониманием бизнеса можно стать отличным BI-аналитиком.
Алексей Кузьмин, руководитель разработки в ДомКлик, Data Scientist, преподаватель курсов по машинному обучению Нетологии
Всё зависит от задачи. Это действительно сложный выбор, готового рецепта нет. Я бы взял разработчика — для задач моей компании такой профиль ближе.
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
А у нас аналитики — больше математики. Но в целом всё действительно зависит от задачи. Если у работодателя высоконагруженный банковский сервис, то ему скорее нужен разработчик, который быстро закроет большое количество технических задач и чем-то поможет с DS и моделями. Если у компании проект, который уже настроен и слаженно работает, то для его поддержки могут подойти младшие сотрудники.
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Конечно! Высокие места на Kaggle — это отличный проект в портфолио. Иногда платформу критикуют за «идеализированные» условия. Конечно, никакой вины платформы в этом нет. Обычно, когда дата сайентисту или аналитику ставят задачу, она начинается не с построения крутых моделей, а с менеджерской работы, подготовки данных и инструментов. Где взять нужные данные? Чем все это обработать? Какие в данных неочевидные проблемы? Этой части на Kaggle обычно нет.
Когда сделали модель, наступает еще один этап — внедрение. Помимо того, что система должна работать в проде, нужно доказать ее ценность для бизнеса, научить коллег ей пользоваться и, возможно, «продать» заказчику.
Поэтому иногда сотрудник строит крутые модели, но в реальных условиях испытывает трудности с первой и третьей частью работы. Если же человек имеет хорошие коммуникативные навыки, у него отличные способности к программированию и вдобавок строит точные модели — цены ему нет. В Kaggle вы отточите построение моделей, но вам потребуется много прикладных навыков, чтобы применить это в реальных проектах.
Алексей Кузьмин, руководитель разработки в ДомКлик, Data Scientist, преподаватель курсов по машинному обучению Нетологии
Все очень сильно зависит от задач и от профиля компании. Если это стартап на 5 человек, то может пригодиться аналитик, который умеет заниматься кадрами — просто потому, что у стартапа на кадры людей нет. Если же это большая, серьезная, крупная компания с проектами, которые длятся годами, в которых одни и те же люди делают одни и те же задачи, то понадобится узкий специалист, который знает только одно конкретное направление и больше ничего.
Отдельным плюсом идут софт скиллы по коммуникабельности, стрессоустойчивости, работоспособности, умении разобраться в прикладной области.
Полезно, когда специалист имеет навыки работы с бизнесом, — тогда ему проще понять запросы и задачи компании, он может погрузиться в проблему и предложить какое-то альтернативное решение.
Кроме того, сейчас на рынке огромный дефицит специалистов с навыками, смежными с DS. Например, мы очень долго искали себе Product Owner с пониманием DS, чтобы он мог создавать продукты, которые бы базировались на искусственном интеллекте.
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Совет банальный — ходить на собеседования. Часто написанное в вакансии отличается от реальных запросов работодателя. Собеседование дает возможность узнать над каким проектом планируется работа, какими инструментами надо будет пользоваться и с какими людьми работать. Мой совет — воспринимать текст вакансии как ориентир, а не истину в конечной инстанции.
Адекватные работодатели понимают, что если ты работал с Google Cloud, а у них используется Azure, то это не проблема — специалист быстро переучится. Есть гораздо более важные вещи: чем конкретно придется заниматься, как устроены процессы в команде — это можно выяснить только на личной встрече. В вакансиях такие подробности не указывают.
Елена Герасимова, руководитель направления Data Science в Нетологии
Удалённая работа на подобных позициях в крупных ИТ-компаниях — это действительно скорее исключение. Тем не менее, немало зарубежных компаний с российскими представительствами готовы ради экономии на зарплатах и релокации на удаленный формат при выполнении поставленных задач.
Удаленных сотрудников также часто ищут стартапы — если принципиальна именно удаленка, стоит поискать такие вакансии.
В целом считаю, что работа в офисе для аналитиков и Data Scientist предпочтительнее — не работая в офисе, вы лишаете себя возможности учиться у коллег прямо на рабочем месте, общаться с командой, оперативно решать возникающие вопросы (ну и пользоваться преимуществами хорошего офиса: спортзалом, обедами, сменой обстановки).
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
У нас были ребята, которые после 30 переходили с промышленных профессий в разработчики: получалось, что в отделе все на 5-8 лет младше — но это мелочи.
Конечно, если человек перейдет в DS в 65 лет — то да, наверно, ему будет тяжеловато. А так существует огромное количество кейсов, когда люди переходили в DS из совсем отдаленных областей, например, медицины, в возрасте 30-40 лет.
Еще важный момент — при переходе в новую сферу надо быть готовым к понижению зарплаты. Если у специалиста семья и трое детей, то будет напряжно. Вообще, положительных примеров очень много, а уровень зарплаты растет параллельно новому опыту.
Елена Герасимова, руководитель направления Data Science в Нетологии
При переходе в DS во взрослом возрасте крайне важны настрой и готовность поступиться какими-то своими наработанными принципами и принять правила игры, которые предусмотрены в этой среде. У нас недавно выпустился с отличием студент с тремя детьми: он на время обучения взял отпуск по уходу, а жена в этот период работала. Он очень хочет быть дата сайентистом, очень талантливый выпускник и его мотивация сильнее окружающих обстоятельств.
Дарья Мухина, продуктовый аналитик Skyeng, консультант курсов аналитики Нетологии
Для любого человека вопрос о зарплате на собеседовании — это стрессовый вопрос. Считаю, пытаться как-то шутить на эту тему или увиливать — рискованно. Лучше всего перед беседой провести мини-исследование, выгрузить вакансии, где указана вилка: верхний порог, нижний порог. Понять сколько вам, условно, нужно денег для жизни, затем еще раз просмотреть зарплатные вилки на уровне джуна — и назвать ту сумму, которая в них впишется, но не будет ниже вашего прожиточного уровня.
«Какая нужна математика? Если нет матбазы, я безнадежен?»
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Вопрос про математику неоднозначный. Глубокое знание математики не является ни необходимым, ни достаточным условием. Конечно, тому, кто её знает, будет легче. Но все необходимые знания даются либо на занятиях, либо в дополнительных материалах.
Здесь как в спорте. Есть люди, которые могут без подготовки пробежать марафон. Остальным будет тяжелее, но при достаточной подготовке и они пробегут. Математическая база — это круто, но не критически необходимо.
Дарья Мухина, продуктовый аналитик Skyeng, консультант курсов аналитики Нетологии
Кажется, что сейчас глубокую математическую базу можно заменить умением гуглить. В интернете огромное количество видео и статей, где можно получить доступно изложенную информацию — и не нужно лезть в университетские учебники. Главное знать, что тебе нужно.
Сейчас важнее навык применять знания в реальной задаче, а не просто обладать ими.
Елена Герасимова, руководитель направления Data Science в Нетологии
Понятие «профильное техническое или математическое образование» уходит в прошлое. Уверенного в своих умениях и доменных знаниях специалиста из «гуманитарного» вуза не будут сравнивать с выпускником МФТИ по знанию математики — сравнивают по полезности бизнесу для решения задач.
Уже известны десятки рабочих алгоритмов и библиотек, которые способны всю математическую часть брать на себя без участия человека.
«Хорошо, а каким бэкграундом проще войти в сферу DS? Очевидно, это математика, а что еще поможет?»
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Конечно, проще всего входить в сферу DS тем людям, у которых есть опыт обучения или работы по технической специальности.
Хотя разделение на «технарей» и «гуманитариев» очень условно, для Data Scientist нужна математика не 8 класса, а повыше. Можно изучить всё самому, но если человек окончил технический вуз — скорее всего, у него уже есть необходимая база. Тем, у кого есть опыт программирования и понимание алгоритмов — также будет проще. Если человеку очень тяжело дается Python, ему придется сложнее — ведь дальше начнут рассказывать про теорию вероятности, потом про нейронные сети.
Опыт обучения на физтехе или работы на инженерных специальностях значительно упрощает освоение DS. Однако нужно помнить, что есть еще огромное количество около-DS специализаций, в которые можно прийти без глубоких знаний математики. Не обязательно быть именно Data Scientist’ом, с хорошим пониманием бизнеса можно стать отличным BI-аналитиком.
«А кто всё же предпочтительнее для работодателя: человек со знанием Python и бэкграундом разработчика или выпускник с сильной математикой?»
Алексей Кузьмин, руководитель разработки в ДомКлик, Data Scientist, преподаватель курсов по машинному обучению Нетологии
Всё зависит от задачи. Это действительно сложный выбор, готового рецепта нет. Я бы взял разработчика — для задач моей компании такой профиль ближе.
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
А у нас аналитики — больше математики. Но в целом всё действительно зависит от задачи. Если у работодателя высоконагруженный банковский сервис, то ему скорее нужен разработчик, который быстро закроет большое количество технических задач и чем-то поможет с DS и моделями. Если у компании проект, который уже настроен и слаженно работает, то для его поддержки могут подойти младшие сотрудники.
«Стоит ли Kaggle рассматривать как подспорье для входа в DS? Смотрят ли работодатели на Kaggle-мастеров?»
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Конечно! Высокие места на Kaggle — это отличный проект в портфолио. Иногда платформу критикуют за «идеализированные» условия. Конечно, никакой вины платформы в этом нет. Обычно, когда дата сайентисту или аналитику ставят задачу, она начинается не с построения крутых моделей, а с менеджерской работы, подготовки данных и инструментов. Где взять нужные данные? Чем все это обработать? Какие в данных неочевидные проблемы? Этой части на Kaggle обычно нет.
Когда сделали модель, наступает еще один этап — внедрение. Помимо того, что система должна работать в проде, нужно доказать ее ценность для бизнеса, научить коллег ей пользоваться и, возможно, «продать» заказчику.
Поэтому иногда сотрудник строит крутые модели, но в реальных условиях испытывает трудности с первой и третьей частью работы. Если же человек имеет хорошие коммуникативные навыки, у него отличные способности к программированию и вдобавок строит точные модели — цены ему нет. В Kaggle вы отточите построение моделей, но вам потребуется много прикладных навыков, чтобы применить это в реальных проектах.
«Какие компетенции, кроме технических, нужны начинающему специалисту, чтобы работодатель его заметил среди общего потока?»
Алексей Кузьмин, руководитель разработки в ДомКлик, Data Scientist, преподаватель курсов по машинному обучению Нетологии
Все очень сильно зависит от задач и от профиля компании. Если это стартап на 5 человек, то может пригодиться аналитик, который умеет заниматься кадрами — просто потому, что у стартапа на кадры людей нет. Если же это большая, серьезная, крупная компания с проектами, которые длятся годами, в которых одни и те же люди делают одни и те же задачи, то понадобится узкий специалист, который знает только одно конкретное направление и больше ничего.
Отдельным плюсом идут софт скиллы по коммуникабельности, стрессоустойчивости, работоспособности, умении разобраться в прикладной области.
Полезно, когда специалист имеет навыки работы с бизнесом, — тогда ему проще понять запросы и задачи компании, он может погрузиться в проблему и предложить какое-то альтернативное решение.
Кроме того, сейчас на рынке огромный дефицит специалистов с навыками, смежными с DS. Например, мы очень долго искали себе Product Owner с пониманием DS, чтобы он мог создавать продукты, которые бы базировались на искусственном интеллекте.
«Как ориентироваться в вакансиях и не боятся, если указаны новые для тебя инструменты? Что нужно, чтобы пойти и начать работать в профессии?»
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
Совет банальный — ходить на собеседования. Часто написанное в вакансии отличается от реальных запросов работодателя. Собеседование дает возможность узнать над каким проектом планируется работа, какими инструментами надо будет пользоваться и с какими людьми работать. Мой совет — воспринимать текст вакансии как ориентир, а не истину в конечной инстанции.
Адекватные работодатели понимают, что если ты работал с Google Cloud, а у них используется Azure, то это не проблема — специалист быстро переучится. Есть гораздо более важные вещи: чем конкретно придется заниматься, как устроены процессы в команде — это можно выяснить только на личной встрече. В вакансиях такие подробности не указывают.
«Правда ли, что на рынке DS нет удаленной работы?»
Елена Герасимова, руководитель направления Data Science в Нетологии
Удалённая работа на подобных позициях в крупных ИТ-компаниях — это действительно скорее исключение. Тем не менее, немало зарубежных компаний с российскими представительствами готовы ради экономии на зарплатах и релокации на удаленный формат при выполнении поставленных задач.
Удаленных сотрудников также часто ищут стартапы — если принципиальна именно удаленка, стоит поискать такие вакансии.
В целом считаю, что работа в офисе для аналитиков и Data Scientist предпочтительнее — не работая в офисе, вы лишаете себя возможности учиться у коллег прямо на рабочем месте, общаться с командой, оперативно решать возникающие вопросы (ну и пользоваться преимуществами хорошего офиса: спортзалом, обедами, сменой обстановки).
«А что если я в 40 лет стану джуниор-сайентистом? Какие у меня перспективы? Куда мне и как двигаться?»
Константин Башевой, аналитик-разработчик в Яндексе и преподаватель курса «Python для анализа данных»
У нас были ребята, которые после 30 переходили с промышленных профессий в разработчики: получалось, что в отделе все на 5-8 лет младше — но это мелочи.
Конечно, если человек перейдет в DS в 65 лет — то да, наверно, ему будет тяжеловато. А так существует огромное количество кейсов, когда люди переходили в DS из совсем отдаленных областей, например, медицины, в возрасте 30-40 лет.
Еще важный момент — при переходе в новую сферу надо быть готовым к понижению зарплаты. Если у специалиста семья и трое детей, то будет напряжно. Вообще, положительных примеров очень много, а уровень зарплаты растет параллельно новому опыту.
Елена Герасимова, руководитель направления Data Science в Нетологии
При переходе в DS во взрослом возрасте крайне важны настрой и готовность поступиться какими-то своими наработанными принципами и принять правила игры, которые предусмотрены в этой среде. У нас недавно выпустился с отличием студент с тремя детьми: он на время обучения взял отпуск по уходу, а жена в этот период работала. Он очень хочет быть дата сайентистом, очень талантливый выпускник и его мотивация сильнее окружающих обстоятельств.
«Как начинающему специалисту отвечать на вопросы о зарплате на собеседовании? Как себя оценить?»
Дарья Мухина, продуктовый аналитик Skyeng, консультант курсов аналитики Нетологии
Для любого человека вопрос о зарплате на собеседовании — это стрессовый вопрос. Считаю, пытаться как-то шутить на эту тему или увиливать — рискованно. Лучше всего перед беседой провести мини-исследование, выгрузить вакансии, где указана вилка: верхний порог, нижний порог. Понять сколько вам, условно, нужно денег для жизни, затем еще раз просмотреть зарплатные вилки на уровне джуна — и назвать ту сумму, которая в них впишется, но не будет ниже вашего прожиточного уровня.
От редакции
- Профессия «Data Scientist»
- Онлайн-курс «Big Data»
- Онлайн-курс «Машинное обучение»
- Онлайн-курс «Python для работы с данными»