Pull to refresh

Comments 21

Кстати, логичный результат - в отделе инноваций скорее всего работа не является рутинной, а в остальных отделах - наоборот. Люди устают делать одно и то же.

Вот я тоже тут же обосновала такую особенность данных! Хотя датасет делала нейросеть (может, она тоже вложила этот смысл в данные?..) А может быть это чисто рационализация. Но интересный момент!) Сразу можно рекомендаций "учебных" написать - мол делайте работу менее рутинной.

Это какой-то восторженный идиотизм при анализе данных полученных на генераторе случайных чисел.

Мы просто шутим) Мне жаль, что вас это так остро трогает. Мы в хабе, посвященном визуализации данных, а не его анализа. Так что не вижу никакой проблемы)

Это фейковые данные - это в начале статьи написано. Какие ещё выводы? - это даже не учебное пособие.

Учебные выводы, конечно же) Кроме того, они даны в условии этой учебной задачи. Делать их не надо. Их надо объяснить далекому от темы человеку.

За обзор некоторых инструментов спасибо. Но если по сути задачи, то разве не очевидно, что кастомизация мельчайших деталей не будет доступна в большинстве BI-инструментов? На мой взгляд, у них цель немного другая: покрыть 99% потребностей в визуализации. Для всего остального есть D3.js, ggplot2 и тд и тп

Вот пример кода на R с использованием ggplot2:

library(ggplot2)

url <- 'https://docs.google.com/spreadsheets/d/1rJL_v0OVTvZpvrCbNJHdSAemrIkcDdBfsoQlrJvEt34/edit?gid=0#gid=0'
df <- readr::read_csv(gsheet::construct_download_url(url))

ggplot(df, aes(x=Years_At_Company, y=Performance_Rating)) +
  geom_point(aes(size=Absences)) +
  geom_smooth(aes(color=Department), method='lm', se=F) +
  facet_wrap(~ Department) +
  theme_minimal()

Он не отрисовывает в точности как в примере из статьи, но дальше там можно продолжать настраивать положения заголовков, параметры подписей осей, шрифты, параметры сетки, цвета линии трендов и даже модель для линии трендов (не обязательно линейную).

Если хочется добавить сопроводительный текст, то можно обернуть это все в R Markdown.

Скрытый текст

О, спасибо за пример на ggplot2! Вышло вполне неплохо. Да, я про языки программирования отдельно отметила внизу статьи. Просто изначально эта задачка планировалась именно для студентов на тему работы с презентацией данными (то есть финальный шаг обработки данных), да и у них на ноутбуках с собой вряд ли были бы языки программирования. К тому же, тонкая настройка графиков кодом без готовых шаблонов занимает много времени. В D3.JS одни оси часа два можно настраивать... библиотеки попроще тоже часто ограничены в функционале. Вот недавно Observable выкатил свои дашборды - может быть там можно настраивать красиво и графики и тексты и общее форматирование. Но это надо пробовать. И да, это опять же не для студентов, увы.

Такие задачи нельзя решать на фейковых данных.

Если вы учитесь, то формулируется задача, в стилистике "влияние факторов на целевой показатель" и всё это в безликих величинах, а то как написали вы - этого делать нельзя.

Пропущен этап подготовки данных - данные нужно подготовить для анализа. Для анализа существуют хорошо протестированные программы и уж точно нельзя делать выводов на основании графиков.

Сейчас у вас кликабельный заголовок, какие-то рассуждения и faker данные. И вывод, что 5 инструментов поломалось на этой задаче. Это не так, всех этих программ не знаю, но уже эксель легко справится с такой задачей, даже если формулы нужно написать руками в ячейки.

Мне кажется, мы про разное. Это задачка на дата-сторителлинг. И в условии задачи уже есть выводы, которые надо показать. Задание состоит в том – КАК это сделать, чтобы они были понятны условному HR-директору.

Сами выводы делать не нужно, этап сбора данных, подготовки и анализа – тут пропущены. Это последний этап – презентация данных стейкхолдеру.

Мы в хабе Визуализация данных, поэтому про анализ тут и нет. Я понимаю ваше желание видеть всю цепочку данных от и до, но это пока не цель. Я сама жду, когда заказчик пришлет мне настоящие данные, чтобы пример стал интереснее.

Если сможете решить эту задачку в екселе – пожалуйста, приложите решение (визуально похожее на то, что получилось в 5 разделе). Мне правда нужно. Буду благодарна. Ссылка на датасет – в конце статьи.

Кстати, если вы специалист по екселю, не подскажете, как шифровать данные цветом в скаттерплоте? Наткнулась на это ограничение неприятное.

Нельзя писать «с увеличением падают», по крайней мере по-русски, это подразумевает динамику - вот есть сотрудник, со временем его стаж растёт а эффективность падает. А динамика может быть получена только в динамике, везде всегда всеми. Эти же данные - мгновенный снимок. Лучше писать «с большим менее», это как раз подразумевает снэпшот.

Многие грешат, типа «эволюция звёздных скоплений» без слова «кажущаяся», что никого не оправдывает.

В данном случае мгновенно всплывают

  • связь эффективности с возрастом

  • связь эффективности с переходом на лучшую работу

  • динамика качества образования

Я понимаю, задача модельная, но вдруг идёт тренировка по манипулированию данными?

Как Notion прославилась, смотрел альтернативы, заинтересовала Silverbullet (не подошла - редактор глючным показался), там отсылка на концепт End-User Programming - так это, оказывается, активно обсуждается прямо сейчас и прямо относится к

Еще, например, многие языки программирования могут неплохо в быстрые графики

Языки могут неплохо во всё, а как раз для такого специально придумана Julia. И тут, собственно, моя мысль - при помощи Julia можно легко показать прекрасную интерактивную диаграмму другим пользователям Julia. То же самое относится к Python и даже JavaScript в варианте Node - Deno - Bun. А general public остаётся не у дел, мысль в том, что везде, как всегда, всё чаще и всё больше.

Кстати, других практически значимых языков я не знаю, ну может быть Racket. Разве 3.5 - многие?

О спасибо за уточнение, такие нюансы непросто считывать.

Ну в данном задании не нужно делать анализ данных, вывод, который нужно «презентовать» зрителю дан в условии.

Нужно именно при помощи графических средств этот вывод подать так – чтобы понял даже условный HR-директор.

К сожалению, быстрые графики для решения этой задачки не подходят. Я работала с несколькими датавиз библиотеками в python, делала дашбордики в JS. Конечно, D3.JS бы справился, но это заняло бы слишком много времени и у него высокий порог вхождения.  Яне рассматриваю настолько сложные инструменты.

В остальных библиотеках очень плохое базовое оформление и его обычно не поменять.

Про Julia не слышала, спасибо ха наводку. А кому-то вне Julia можно показывать графики? Потому что, конечно, в первую очередь они нам нужны для решения коммуникационной задачки от специалиста к неспециалисту. От инженера к гуманитарию или управленцу высокого уровня. Сейчас гуглю примеры, пока что схода с классическими датавиз библиотеками python по визуалу и форматированию.

Увы, увы, для дженерал публики вся и задачка. Потому и сложно.

А кому-то вне Julia можно показывать графики?

Можно, но это будет просто график. Julia создана для случая когда нет задачи по быстрому войти в АйТи и доить безграмотное стадо. Соответственно, нет задачи создавать приложение, хотя над этим работают, пусть и без особого энтузиазма.

А делать картинки, особенно по научным расчётам и аналитике данных - это предполагаемое применение.

Julia сейчас моя любимая игрушка, уже убедила - без неё или любой альтернативы типа Racket или (даже) Python - гуманитарий и тем более управленец - они нужны как скрипач.

Это грубо.

По-вашему, директора и предприниматели, получающие 1млн в месяц своими навыками и умом – это безграмотное стадо? Художники, врачи и учителя – безграмотное стадо?

У них всех могут быть проблемы с вашими графиками, если они не разбираются в конкретно вашей профессиональной сфере. Это не повод считать их тупыми. Просто никто не обязан за 15 минут понять то, что вы изучали 5 лет и готовили две недели.

Julia – наверняка неплохой продукт, но пока что отличий от других аналогичных продуктов не вижу. Я вижу, что у вас к ней личная симпатия, но продукт должен решать задачи. А задачи бывают разные.

Это грубо.

Нет, это просто не нежно. Зато правда,

а правда всегда горькая

Это не я, это один деятель на YouTube пропагандирует. Но не говорит почему, я думаю потому, что сладкая правда в предметы обсуждения не попадает.

По-вашему, директора и предприниматели, получающие 1млн в месяц своими навыками и умом – это безграмотное стадо? Художники, врачи и учителя – безграмотное стадо?

Да, конечно. Многие и в определённом смысле. Большинство ли, спросите Вы? Закон 20/80 не ответит ли? Как я их оцениваю сам и советую другим?

По плодам их узнаете их.

Это тоже не я...

Это не повод считать их тупыми.

Вот этого я не говорил. Тупость - совершенно конкретное свойство слабо и коррелирует с другими. Кажется, что-то с шапкой. То ли горит, то ли пока подгорает…

Просто никто не обязан

Никто никогда ничему нигде не обязан, но. Точно цифру не помню, примерно 80% населения страны не только не поинтересовались миром когда с этим проблем не было, но и не оформили загранпаспорт. Это хуже чем тупость в том же смысле, в каком ошибка хуже преступления.

Я вижу прямую аналогию с колоссальной мощью и возможностями которые у каждого находятся буквально на расстоянии вытянутой руки и которые почему-то мало кого интересуют. Хотя людей просто обязаны интересовать, настаивает здравый смысл. И если бы я один был при этом мнении, то W^X политики в мобильные ОС не пихали бы, а так, на всякий случай наверно, пихают не покладая рук.

Julia – наверняка неплохой продукт,

Пока не знаю но надеюсь, зато уж точно очень интересный. Сделано с любовью и для себя, что делает его весьма необычным, как минимум.

отличий от других аналогичных продуктов не вижу

других аналогичных - с натяжкой два, Python и Racket.

Я понимаю

Всем хочется жить в мире где учителя учат а не оболванивают, врачи лечат а не здравозахоранивают, бизнесмены обслуживают клиентов а не давят административный ресурс… так что можно ко всем относиться с уважением и далее со всеми остановками. Но

Платон мне друг…

Типа.

gnuplot - визуализатор на все случаи жизни, практически

по возможностям, пожалуй, побогаче, чем ggplot2 и matplotlib, не говоря уже про всякие tableau, figma, excel etc.

минусы:

* данные не обрабатывает, только рисует

* с языком придётся поразбираться, несложно, но время займёт

* совершенно немодный

Ооо, спасибо за наводку, не слышала о таком!

А как у него с оформлением? Вижу примеры в интернете, пока все тот же matplotlib на минималках. Можете что-то особо заковыристое и аккуратно оформленное показать на нем? (или повторить в нем финальную картинку из примера?)

Жаль, что погружение долгое, но все равно хорошо, что появляются интересные альтернативы!

примеры: https://gnuplot.sourceforge.net/demo_6.0/

на оформление люди особо внимания не обращают, поэтому выглядит простенько, но возможности подставить шрифты, цвета и т.д. есть

когда-то давно я писал https://habr.com/ru/articles/253285/

правда, исходники, похоже уже утрачены

Спасибо за материалы! Но да, для дата-сторителлингу нужна все-таки более точная настройка графиков 8(

Спасибо за материал, очень интересно и подробно!

Sign up to leave a comment.

Articles