У нас в SkillFactory, как в школе, которая специализируется на обучении дата-сайентистов и дата-аналитиков, внимательно подходят к вопросу восприятия самой профессии как самими студентами, так и их нанимателями. О требованиях к профессии Data Analyst и путанице в вакансиях мы уже рассказывали в этом материале, а теперь хотим поделиться с вами переводом статьи руководителя отдела интеллектуального принятия решений в Google, в которой она рассказывает о перспективах должности Data Scientist. О рисках компании при найме Data Scientist из-за разного понимания должности или из-за неопытных HR и о том, как обезопасить вас от ошибок в резюме.
Data Science — это пузырь? Вы удивитесь, как часто мне задают этот вопрос. Мой ответ?
Наверное, нет, но должность Data Scientist — может быть.
Позвольте объясниться до того, как сюда прибудет толпа с вилами.
Data Scientist и определение науки о данных
Есть множество мнений, но я предпочитаю следующее определение: «Наука о данных — это дисциплина, позволяющая сделать данные полезными». Если вам не нравится мое определение, возможно, вам понравится четкое определение Харлана Харриса:
Наука о данных определяется тем, что делает Data Scientist и то, что он делает, очень хорошо освещено… Но вот кто такие Data Scientist, возможно, более фундаментальный вопрос.
Хорошо. Кто мы тогда? Что ж, это зависит от того, в каком клубе вы состоите. И именно здесь идея о пузыре становится актуальной.
И против ИЛИ
Для некоторых людей должность подразумевает полную компетенцию по трем специализациям (статистика, сбор данных, машинное обучение). Для других она означает, что навыки одного сочетаются с навыками других людей. Такое разное понимание должности может навредить вам при найме.
Вариант первый. Только достойные!
Есть те, кто мечтает лишить «подражателей» их должностей и ограничить священную профессию элитой, разбирающейся во всем, что касается данных.
Каково это, когда такие люди собеседуют? Они хотят видеть во мне породистого статистика, со знанием машинного обучения, имеющего черный пояс по аналитике и портфолио прикладных проектов. Они хотят знать, была ли моя аспирантура модной. Они хотят проверить, каким я была лидером и как решала задачи бизнеса. О, и мне лучше владеть навыками общения. А как насчет луны на палочке? Если бы я не занималась данными с восьми лет, я была бы просто напугана. А пока это забавный маленький клуб, к которому у меня глубоко противоречивые чувства.
Позвольте мне называть это, как есть: клуб И. Участники должны быть компетентными статистиками, экспертами в машинном обучении и аналитиками с ювелирными навыками кодирования. Обратите внимание, что попасть в этот клуб довольно сложно; не многие люди являются экспертами по всем вопросам в данных. Удовлетворить мировые потребности в специалистах этими людьми никогда не получится. Уныло, но такова природа спроса и предложения.
Вариант второй. Двери открыты для всех!
Альтернативный и гораздо более многолюдный клуб — клуб ИЛИ. Он состоит из людей, которые переименовали свои должности, например, аналитик или статистик, до обобщающего термина. Звучит лучше, увеличивает занятость в науке о данных, расширяет сообщество, приносит разнообразные навыки. Выигрывают все. Правильно? Ну, почти.
Что мне нравится: подчеркивается командный, спортивный характер науки о данных и такой подход дает возможность большему количеству людей участвовать в работе с данными. Отлично! И некоторые области науки о данных не так уж и сложны. Data mining, то есть сбор данных — это то, в чем люди более квалифицированы, чем думают. Если вы думали, что для сбора данных требуется докторская степень, у меня хорошие новости. Все, что вам нужно, это понимание как заглянуть в наборы данных, умеренная скромность и здравый смысл.
А как насчет обратной стороны? Наука о данных известна высокими требованиями и длительным погружением в обучение. Сердечно сочувствую бедным сбитым с толку менеджерам по найму, которые думают, что они заманивают универсального специалиста, но привлекают кого-то гораздо менее квалифицированного. Ложная реклама наносит ущерб.
Совет: если вы хотите полной уверенности в том, что не преувеличиваете в резюме, должность аналитик данных — самый безопасный вариант.
Ложная реклама
Буду честной — каждый раз, когда я становилась «Data Scientist», я выполняла ту же самую работу, что и раньше, на должностях, которые назывались иначе. Когда «эффективные менеджеры» в очередной раз меняли название должности — мои обязанности не менялись ни в малейшей степени.
Я не исключение. В моем кругу общения много бывших статистиков, инженеров по поддержке принятия решений, количественных аналитиков, профессоров математики, специалистов по большим данным, экспертов по бизнес-аналитике, ведущих аналитиков, ученых-исследователей, инженеров-программистов, докторов наук... всех гордых современных ученых.
Когда я стала Data Scientist, мои обязанности нисколько не изменились.
Друзья, я не осуждаю. Хорошо управлять личным брендом. Но хочется указать на то, что определение науки о данных, основанное на понятии «Data Scientist», — не очень точно, учитывая, насколько разношерстную толпу привлекает название. Взяв предел, мы получаем набор слов, тщательно составленных, чтобы сказать как можно меньше. Это отражается на том, как видят Data Scientist. Недавно я почувствовала скачок давления, когда менеджер по найму в области науки о данных опубликовал что-то вроде «Есть докторская степень? Тогда вы, вероятно, Data Scientist». Перефразировано, чтобы защитить невиновных.
Использование названий должностей для определения науки о данных — опасная игра.
Известные специалисты по анализу данных уже знают, что они ищут, и могут найти хорошего, кхм, Data Scientist, даже если в названии вакансии указано космический пришелец. Меня беспокоят не столь опытные менеджеры по найму. Многие компании, начинающие заниматься наукой о данных, не имеют опыта, который мог бы им помочь. Их план? Нанять Data Scientist, и все будет хорошо.
Предостережение для тех, кто платит
Поставьте себя на место нового менеджера по найму: вы много прочитали и решили, что вам нужны навыки в статистике, сборе данных и машинном обученим для вашего проекта. Вы можете нанять трех человек. А теперь посмотрим на кандидатов: 10 резюме с надписью «Data Scientist».
Если это люди клуба И, вы можете выбрать любые три резюме. У каждого кандидата есть нужные вам навыки. К сожалению, этот клуб невелик (читайте: очень дорого нанимать), поэтому велика вероятность, что эти 10 человек не члены клуба И.
Менеджеру по найму может быть сложно определить, в какой части науки о данных кандидат действительно хорош.
Если это люди ИЛИ (что более вероятно в сегодняшних условиях), вы должны тщательно опросить их, чтобы выяснить, в чем они на самом деле квалифицированы. Вам нужны три разных набора навыков. У людей перед вами может быть только один, но у них также есть все стимулы убедить вас в том, что они универсалы. Они могут иметь минимум знаний обо всех трех областях (статистика, сбор данных, машинное обучение). Это может быть опасным как для вашего проекта, так и для найма. Вам нужно выяснить, в чем они на самом деле хороши, а это может быть сложно, если вы не являетесь опытным специалистом по обработке данных с разнообразным опытом.
Результат? Ошибки при приеме на работу. Модные словечки в резюме — не гарантия реальных навыков.
Я видела, как многие команды случайно получали несколько аналитиков, занимающихся сбором данных, вместо разносторонней группы. Но это проблема не только науки о данных. Оказалось, что модные словечки в резюме не обязательно сопровождаются гарантиями навыков. Чем горячее модное слово, тем больше оно распространяется.
Это конец аналитика данных?
Я лично отношусь к названиям должностей с недоверием. Важно соответствие навыков всем потребностям компании. Если должность не является хорошим индикатором, то квалифицированные менеджеры по найму научатся искать в резюме что-то еще.
Задумавшись, я даже могу предвидеть историю клуба ИЛИ. Должность может просто выйти из моды, но я не из тех, кто следует за ней.
Так Data Science — это пузырь или нет?
Больше данных в мире означает больший спрос на три основных вида деятельности в области науки о данных — статистический вывод, машинное обучение, аналитика/сбор данных, поэтому эти навыки останутся очень актуальными, несмотря на их названия, которые могут измениться. Извлечением ценности из данных всегда можно заработать себе на жизнь.
С другой стороны, команды, которые были наняты на хайпе и никогда не учились концентрироваться на том, что ценно для бизнеса, могут обнаружить, что их время уходит.
Несколько лет назад мой друг, технический директор, который работает в сфере технологий, жаловался на своих бесполезных специалистов по анализу данных. «Я думаю, вы могли бы нанимать специалистов по анализу данных, как наркобарон покупает тигра для своего поместья», — сказала я ему. «Ты не знаешь, чего хочешь от тигра, но у всех других наркобаронов он есть».
Я не знаю настоящих наркобаронов (или тигров), поэтому не знаю, что у них в поместьях. Но вы меня поняли.
Хотя Data Science и звучит как пузырь, на самом деле я настроена оптимистично. Растущий объем данных означает растущие возможности. Все это требует хорошего управления. Мой друг, например, в конечном итоге решил множество своих проблем, осознав с помощью аналитиков данных, что часть его организации нуждается в обучении. С тех пор его команды стали вдумчивее относиться к тому, как распределять работу. Начались великие дела. Обучение людей, принимающих решения тому, как использовать науку о данных, спасло положение!
Убедитесь, что люди, принимающие решения, обладают необходимыми навыками для работы. Если пузырь существует, это может быть его корнем.
Задача сегодняшних лидеров в области науки о данных — помочь принимающим решения людям пройти подобное обучение. Так появится больше людей, способных указывать на технический талант Data Scientist в ценных направлениях. Читайте далее здесь. Как только специалисты по обработке данных приносят пользу, их содержание становится необходимостью, а не вопросом моды. Сможем ли мы справиться с проблемами до того, как должность Data Scientist потеряет популярность, и не начнется ребрендинг?
На наших курсах, мы постоянно анализируем рынок и даем студентам те реальные навыки, которые позволят им в течение долгого времени оставаться профессионально востребованными. А чтобы полученные навыки еще и правильно представить — работаем с резюме и портфолио выпускника.
- Обучение профессии Data Science с нуля (12 месяцев)
- Онлайн-буткемп по Data Analytics (5 недель)
- Онлайн-буткемп по Data Science (14 недель)
Eще курсы
- Профессия аналитика с любым стартовым уровнем (18 месяцев)
- Курс по аналитике данных (6 месяцев)
- Курс по Machine Learning (12 недель)
- Курс «Математика и Machine Learning для Data Science» (20 недель)
- Продвинутый курс «Machine Learning Pro + Deep Learning» (20 недель)
- Профессия Веб-разработчик (8 месяцев)
- Курс «Python для веб-разработки» (9 месяцев)
- Курс по DevOps (12 месяцев)
- Профессия Java-разработчик с нуля (18 месяцев)
- Курс по JavaScript (12 месяцев)
- Профессия UX-дизайнер с нуля (9 месяцев)
- Профессия Web-дизайнер (7 месяцев)