В чем разница между Data Analytics и статистикой

Автор оригинала: Cassie Kozyrkov
  • Перевод
Разбираемся в ценности двух совершенно разных профессий.

image

Статистика и аналитика это два раздела дата сайнс, у которых было много предшественников. Люди до сих пор спорят о том, где проходит граница между ними. На практике современные программы обучения, которые содержат в названиях эти термины, разбирают совершенно разные задачи. Аналитики специализируются на изучении ваших данных, а статистики уделяют больше внимания выводам, которые можно сделать на основе этих данных.

Disclaimer: Эта статья о типичных выпускниках учебных программ, в которых преподают только статистику или только аналитику. Я не хочу задеть тех, кто каким-то образом смог освоить и то и другое. На самом деле лучшие датасаентисты должны иметь отличные знания и в статистике, и в аналитике (и в машинном обучении само собой). Вы удивитесь, но такие специалисты встречаются, правда очень редко.

Человеческие поисковые системы


Когда вы располагаете всеми фактами касательно вашей деятельности, единственная квалификация, которая вам нужна, это здравый смысл. Он позволяет вам задавать вопросы о данных и отвечать на них. Просто поищите ответ.

Хотите прямо сейчас увидеть базовую аналитику в действии? Попробуйте загуглить прогноз погоды. Каждый раз, когда вы пользуетесь поисковой системой, вы занимаетесь базовой аналитикой. Вы получаете данные о погоде и смотрите на них.

image

Даже дети без труда могут найти факты в интернете. Мы наблюдаем демократизацию дата сайнс. Хотите знать, холоднее ли сегодня в Нью-Йорке, чем в Рейкьявике? Вы можете почти мгновенно удовлетворить свое любопытство. Это так просто, что мы даже больше не называем этот процесс аналитикой, хотя по сути это она и есть. А теперь представьте, что вам нужно было бы получить эту информацию сто лет назад. (Вот именно.)
Когда вы пользуетесь поисковой системой, вы занимаетесь базовой аналитикой
Если все, что вы делаете на работе это предоставляете отчеты о фактах, то вы выполняете роль человеческой поисковой системы. Главное, чтобы ваш босс не узнал, что может самостоятельно найти ответы и исключить из цепочки посредника. Зачастую все эти модные аналитические инструменты позволяют вам находить информацию легко и быстро, как гугл поиск.

Искатели вдохновения


Если вы думаете, что это значит, что все аналитики бездельники, вы просто не встречали настоящих экспертов. Отвечать на конкретный вопрос, располагая данными, гораздо легче, чем вдохновлять людей и решать какие вопросы стоит задавать в первую очередь.

Я написала целую статью о том, что делают эксперты в аналитике, но если кратко, они берут огромный, неисследованный пласт данных и роются в нем в поиске вдохновляющих идей.
“У тебя есть интернет, найди там что-нибудь полезное.”
Вы должны уметь быстро кодить и понимать, что ваши руководители могут счесть вдохновляющим. Также вам нужна сильная воля, воля на уровне исследователя, который ищет новый континент для добычи полезных ископаемых, но пока не знает, что находится на этой новой земле. Чем больше набор данных и чем меньше вы знаете о типах фактов, которые вы можете в нем потенциально обнаружить, тем сложнее не потерять время впустую, копаясь в нем. Прежде чем найти что-то стоящее, вам придется каждый раз справляться с провалами, вы не будете находить ровным счетом ничего полезного. Чтобы смириться с этим, вам понадобится непоколебимое любопытство и эмоциональная устойчивость.

image

Программы обучения аналитике обычно обеспечивают своих студентов навыками для просмотра огромных наборов данных. В программах обучения статистике чаще всего этот навык считают необязательным.

Бросаясь в пучину неизвестного


Еще веселее, когда вам нужно бороться с неполной информацией. Если вы не уверены, что ваши данные охватывают интересующий вас вопрос, проявите особую осторожность, когда будете делать выводы. Именно поэтому хорошие аналитики вообще не делают выводы.

Если аналитики понимают, что не обладают всеми фактами и ищут в потемках, они пытаются быть образцами непредвзятости. Ваше сознание должно быть открытым. Это критически важно, если вы не хотите столкнуться с предвзятостью восприятия — из 20 историй вы заметите только ту, что подтверждает мысль, в которую вы верите.
Начинающие думают, что цель поисковой аналитики отвечать на вопросы, но на самом деле их нужно задавать.
В этом вопросе программы обучения разнятся. В каждом курсе статистики вас учат не делать глупых выводов в условиях неопределенности. Аналитические курсы лишь поверхностно затрагивают тему математических выводов и эпистемологических нюансов.

Если вы совершите прыжок веры в вопросе данных, подобно Икару, ничем хорошим это не закончится. (Совет для аналитиков: если хотите избегать сферу статистики, просто боритесь с желанием делать выводы. Готово! Вы восхитительны.)
Аналитика помогает вам сформулировать гипотезы. Это улучшает качество ваших вопросов.
Статистика помогает вам проверить гипотезы. Это улучшает качество ваших ответов.
Многие думают, что цель поисковой аналитики отвечать на вопросы. Это распространенная ошибка. На самом деле их нужно задавать. Исследование данных аналитиками позволяет вам задавать правильные вопросы. Паттерны, которые обнаружат аналитики, не стоит воспринимать серьезно, до тех пор пока они не будут доказаны статистически на основе новых данных. Аналитика помогает вам сформулировать гипотезы, статистика помогает вам проверить их.

Аналитик добывает информацию в конкретном наборе данных.
Статистик помогает понять стоит ли воспринимать эту информацию как феномен, применимый и за пределами этого набора данных.
Я наблюдала за тем как другие сотрудники унижали аналитиков, полагая, что они лучше, потому что пользуются более точными уравнениями. Во-первых эксперты-аналитики используют такие же уравнения, но для другой цели. Во-вторых, информация может выглядеть иначе под разными углами.

Я видела много провалов в дата сайнс, вызванных непониманием функции аналитика. Эффективность вашей организации зависит от авангарда аналитиков. Инвестируйте в них и цените их, если не хотите искать в неправильном месте. Обращайтесь к статистикам с целью тщательного изучения идей, которые вы получите от аналитиков.

Вам нужно и то и другое


Выбирать между хорошими вопросами и хорошими ответами больно и старомодно. Если вы можете себе это позволить, работайте и с аналитиками, и со статистиками. Тогда ваша жизнь станет проще. К сожалению, платить нужно не только персоналу. Чтобы вклад ваших экспертов по работе с данными был ощутим, нужно обилие данных и культура их разделения. Если у вас будет (хотя бы) 2 набора данных, вы сможете найти вдохновляющие идеи и сформировать теории, основанные не только на одном лишь воображении. Затем смело переходите к проверке.
Неправильное понимание различий приводит к множеству ненужных нападок со стороны статистиков и множеству некорректных мнений, которые аналитики продают как готовый продукт.
Люди, обладающие большим количеством данных, не привыкли разделять данные. Сто лет назад такой принцип не был жизнеспособным в условиях голода. Никто не хотел разделять данные, потому что их было слишком сложно собрать. В ходе истории граница между аналитиками и статистиками постепенно стиралась, породив их вражду. Мы застряли в этой ситуации, потому что забыли переосмыслить ее. Устаревшие предрассудки приводят к множеству ненужных нападок со стороны статистиков и множеству некорректных мнений, которые аналитики продают как готовый продукт. Если у вас много данных и вы хотите извлечь из них пользу, у вас есть возможность получить и вдохновляющие идеи, и точные результаты. Зачем лишать себя этого? Разделяйте данные!
Если вы можете себе это позволить, работайте и с аналитиками, и со статистиками. Тогда ваша жизнь станет проще.
Рано или поздно вы поймете, что разделение данных позволяет аналитикам и статистикам множить свои силы и улучшать результаты. Тогда для вас станет загадкой почему это не практикуют все вокруг.

Перевод: Диана Шеремьёва

image

Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя платные онлайн-курсы SkillFactory:



Читать еще


SkillFactory
Онлайн-школа по программированию

Комментарии 1

    0

    Если вы так же как и я не поняли разделения и противопоставления, Кейси сама начинает свои статьи с тезиса, что настоящих сайентистов настолько мало, что она придумала делить их на подвиды по исполняемым функциям. И идеальный сайентист в её представлении это аналитик+статистик+ML/AI экспертиз.
    Разумно, но вообще не принято, особенно в русскоязычном комьюнити.

    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

    Самое читаемое