Не становитесь Data Scientist

Автор оригинала: Chris
  • Перевод
Когда у меня просят совет о том как попасть в data science, я советую стать разработчиком программного обеспечения. Это мое мнение. Я бы хотел услышать контраргументы в комментариях.

Все вокруг, даже ваша бабушка, хотят стать data scientist. Может быть data science это самая сексуальная профессия 21 века, но это не значит, что нужно игнорировать отличную, высокооплачиваемую профессию разработчика.

Часто недавние выпускники и люди, меняющие профессию, спрашивают меня как попасть в data science. Я советую им стать разработчиками вместо этого.

Имея опыт в обеих сферах, я попытаюсь убедить вас, что я прав.

Вакансий на должность разработчика больше


Вакансий на должность разработчика на порядок больше, чем вакансий на должность data scientist.

Ниже представлена пара скриншотов с результатами запросов на вакансии “data scientist” и “software engineer”.

image

google: data scientist usa indeed

image

google: software engineer usa indeed

7616 вакансий в data science по сравнению с 53893 вакансиями в сфере разработки ПО. Это данные по Америке, но я думаю в других странах будет похожий результат.

Согласно Glassdoor, data scientists зарабатывают больше, но у меня есть неподтвержденная гипотеза, что в data science в среднем больше сеньоров.

image

image

Источник: www.glassdoor.ca

Если вам предлагают зарплату в размере 1 миллиона долларов в Open AI, берите.

Нет споров на тему того, что такое data science


У руководства часто нет понимания того, что такое data science. Также учитывая правила бизнеса, у руководства не всегда есть возможность строго следовать определениям ролей.

Это значит, что обязанности data scientist будут отличаться в зависимости от компании.

image

В то время как идеальный перечень ролей для разработчиков и data scientist существует, ему вряд ли будут следовать на практике. Особенно это касается стартапов, которые все еще выстраивают свою инфраструктуру.

Нанятые сотрудники работают над проблемами, которые нужно решить компании в данный момент, а не выполняют “роль”, для которой их нанимали.

Мои коллеги говорят, что многие data scientists в итоге пишут бэкенд как обычные разработчики. Я знаю других “data scientists”, которые рассчитывают финансы в excel. Это просто смешно.

Это суровая реальность, которая явно не совпадает с вашими ожиданиями, если вы выросли на соревнованиях Kaggle.

Data science обособлен


Многим компаниям не нужно так много data scientists как разработчиков. Другие компании нанимают своих первых data scientists прямо сейчас.

По этой причине многие data scientists в итоге работают одни, даже если сидят за тем же столом, что и разработчики.

Из-за этого трудно получить фидбек и мнение со стороны. Разработчики либо не понимают предиктивное моделирование, либо слишком заняты работой над другими проблемами.

Одно из преимуществ работы разработчиком в том, что ты всегда можешь сказать коллегам: “Мне кажется мы должны выполнить ABC с помощью XYZ. Что вы об этом думаете?”.

Приготовьтесь вести этот диалог с самим собой… или резиновой уточкой.

Data science это исследования


Приготовьтесь к неловким беседам с начальством, объясняя почему нельзя использовать то, на что вы потратили 2 недели.

Разработчики работают над решенными проблемами, а data scientists над нерешенными. В этом их принципиальное отличие.

Не беря в учет баги и зависимости, в большинстве случаев в разработке вы знаете выйдет ли что-нибудь хорошее из проекта еще до того как приступили к работе. Про машинное обучение нельзя сказать того же. Ты не узнаешь эффективна ли модель пока не построишь ее.

Компании не готовы к искусственному интеллекту


Даже во времена, когда каждая IT компания это компания с искусственным интеллектом, у большинства из них нет инфраструктуры для поддержки ИИ или даже необходимости в нем.

Глава data science отдела в успешном и быстро растущем стартапе недавно поделился со мной советом за чашкой кофе.

Сначала ты выясняешь в чем проблема, затем строишь инфраструктуру, потом приносишь все это data scientists. Это небыстрый процесс. (Я перефразировал)

Другая первоклассная data scientist в известной компании пожаловалась мне, что ее заставляли использовать модели искусственного интеллекта с большими данными на ноутбуке, а не в облаке.

Если вас взяли на работу и не дали вам конкретной проблемы для решения или компания просто еще не готова к data science, вам придется постараться, чтобы доказать свою ценность.

Разработка ПО дает более широкие знания


Стать джуном в разработке все равно, что получить магистра в сфере технологий. Вы узнаете всего понемногу.

Вы выучите базы данных, облачную технологию, развертывание, безопасность, способы написания чистого кода.

Вы узнаете как управлять процессом разработки, наблюдая за скрам мастером, сеньором или продукт менеджером.

Вы познакомитесь с менторством благодаря код ревью.

Если вы устроитесь в компанию со слаженной командой разработчиков, вы гарантированно быстро разовьете свои навыки и обзаведетесь хорошим бэкграундом в области разработки ПО.

Разработка ПО более гибкая


За счет более всестороннего опыта с технологиями разработка ПО дает больше возможностей дать заднюю, если вы решили, что нужны перемены.

DevOps, работа с безопасностью, фронтенд, бэкенд, распределенные системы, бизнес-аналитика, инженерия данных, data science.

Я знаю множество разработчиков, перекочевавших в data science. Если вы просмотрите описание вакансий в сфере data science, то заметите что они сплошь состоят из основных навыков разработчика.

  • Опыт с SQL и Python, R или SAS
  • Знакомство с AWS
  • Знакомство c Linux
  • Знакомство с экспериментальным дизайном для бизнес экспериментов
  • Знакомство с DevOps системами, такими как GtLab

Если вы можете создать проект от начала до конца, вы можете сделать больше чем построить модель для Kaggel. Вы можете взять эту модель, запустить ее в производство, добавить авторизацию и Stripe и начать взимать плату с пользователей. Вот вам и стартап.

Я бы никогда не стал спорить с тем, что из data science некуда уйти. Принятие решений на основе данных это killer skill. Но чем больше мы будем зависеть от данных, тем востребованней будет этот навык в каждой профессии.

Машинное обучение станет инструментом разработчиков


Чем более общедоступным и легким в использовании становится искусственный интеллект, тем чаще разработчики будут использовать его для решения своих проблем.

Я могу научить разработчика строить Sklearn классификаторы за один вечер. Значит ли это, что он сможет построить новый AlphaGo? Нет. Но это даст альтернативу тяжеловесному коду для ввода данных пользователя, построенному на условиях.

У data scientists есть особые знания статистики и интуиция касательно работы модели. Но у DevOps-ов и инженеров по безопасности тоже есть специализированные знания.

Опытный разработчик может примерять на себя любую роль быстрее, чем новичок будет ее осваивать.

Я не думаю, что нас ждет полное слияние data science и разработки. Однако есть ощущение, что data science может легко стать одной из областей разработки.

Искусственный интеллект не заменит разработчиков


Как бы глупо это не звучало, я стал заниматься разработкой в 2014 году, потому что думал, что ИИ сделает все другие профессии ненужными.

Не считая отдельных сфер, ничего особо не изменилось, люди продолжают делать свою работу. Внедрение технологий это медленный процесс, а искусственный интеллект более узко-направленный, чем медиа пытается заставить вас думать.

В вопросе автоматизации разработки ПО машинное обучение и рядом не стоит с другими профессиями. До тех пор пока у нас есть стартапы, которые создают что-то вроде ИИ для автодополнения кода, написание кода сложно считать профессией. Профессия заключается в решении проблем с использованием технологий.

Оригинальность, вот что останется ценным и высокооплачиваемым навыком.

Заключение


Во-первых, написанное субъективно. Во-вторых, я понимаю, что дал общую оценку data scientists, специалистам по машинному обучению и исследователям искусственного интеллекта. Но я думаю эти аргументы все равно стоит учитывать, это же ваша карьера.

Не воспринимайте слишком серьезно. Я бы предпочел, чтобы вы поисследовали эту тему и сделали свои собственные выводы. Это часть работы data scientist, в конце концов :).

Если уж на то пошло, нам платят за решение проблем.



image
Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя онлайн-курсы SkillFactory:


Читать еще


SkillFactory
Онлайн-школа по программированию

Похожие публикации

Комментарии 7

    +5
    А зачем отговаривать человека? Может ему просто нравится тема и хочется этим заниматься.
      +7
      7616 вакансий в data science по сравнению с 538893 вакансиями в сфере разработки ПО

      Мне кажется, что Data science — это все таки более узкий термин, чем Software Engineer. Например, входят ли в эти цифры Frontend и Backend Software Engineer специалисты, и можно ли их объединять?
        +3
        Исследования это же круто! Как поднялась рука это в минус записать???
          +12
            –2
            ЧЯДНТ?
            18709 Data Scientist jobs available on Indeed.com. Apply to Data Scientist, Junior Data Scientist, Entry Level Scientist and more!… United States. 3 days ago ...
              +2
              В 2015 перешел из разработки в ДЛ.

              На мой взгляд, пункт «Data science это исследования» — жизненный до нельзя.
              В профессии не уживаются те, кто не способен жить без позитивного подкрепления. Т.е. надо быть готовым к тому, что в отличие от разработки, четкого успешного конца у большей части задач не будет. Знаю много людей, для кого это неприемлемо и такие люди тут могут не то, что выгореть, а вообще спалиться в пепел.

              А еще статья построена так, будто обязательно становиться ДС первой же профессией. В реальности, большая часть успешных переходов как раз из разработчиков и я даже считаю, что практическом ДС без бекграунда хотя бы в пару лет разработки делать просто нечего. Иначе будут постоянно возникать совершенно не ДС проблемы, отвлекать и жрать не то, что часы, а недели. И опять же, имея эту профессию первой, проблема из первого абзаца будет убивать. Если есть опыт и уверенность в себе, то уже не так страшно.

              Ну и надо быть готовым, что джун в ДС будет обводить квадратики до очков в -6 :)
                0
                как дата саентист могу сказать про свой опыт: за год написал примерно 500 строк кода и 3 или 4 тетради на 96 листов. Ни с модными пайтоновскими инструментами типа Sklearn, Tensorflow, ни с SQL дела не имею совсем (это не значит, что не знаю). Для таких вещей у нас есть специальные маги — дата инженеры и разработчики. То есть если нужны такие-то данные, то я не пишу километровые sql а с уважением прошу коллег и получаю csv для дальнейших забав. Когда в тетрадках придумал модели, накидываю прототип на коленке в среде по своему выбору, например, в matlab/octave и презентую выводы. Чтобы это ушло в прод подключаются разработчики чтобы закодить как надо и волшебники-сисадмины чтобы вывалить в azure или типа того. Такой вот фреймворк в отдельно взятом случае. Я не обобщаю, но привожу пример как бывает у дата саентистов. К тому что в дата сайнсе рулит не технические скиллы по технологиям, a математика, тащем-та (ИМХО!). Но да, в разных местах под дата сайнсом подразумевается разное и, по моим наблюдениям, в большинстве случаев упор именно на разработку и технологии (кубернетсы, бешеные пайплайны со всякими кафками и спарками), а из математики какая-нибудь простенькая регрессия внутри всего этого и ок. Не осуждаю, показываю что иногда и по другому бывает.

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                Самое читаемое