Comments 21
Кстати, логичный результат - в отделе инноваций скорее всего работа не является рутинной, а в остальных отделах - наоборот. Люди устают делать одно и то же.
Вот я тоже тут же обосновала такую особенность данных! Хотя датасет делала нейросеть (может, она тоже вложила этот смысл в данные?..) А может быть это чисто рационализация. Но интересный момент!) Сразу можно рекомендаций "учебных" написать - мол делайте работу менее рутинной.
Это фейковые данные - это в начале статьи написано. Какие ещё выводы? - это даже не учебное пособие.
За обзор некоторых инструментов спасибо. Но если по сути задачи, то разве не очевидно, что кастомизация мельчайших деталей не будет доступна в большинстве BI-инструментов? На мой взгляд, у них цель немного другая: покрыть 99% потребностей в визуализации. Для всего остального есть D3.js, ggplot2 и тд и тп
Вот пример кода на R с использованием ggplot2:
library(ggplot2)
url <- 'https://docs.google.com/spreadsheets/d/1rJL_v0OVTvZpvrCbNJHdSAemrIkcDdBfsoQlrJvEt34/edit?gid=0#gid=0'
df <- readr::read_csv(gsheet::construct_download_url(url))
ggplot(df, aes(x=Years_At_Company, y=Performance_Rating)) +
geom_point(aes(size=Absences)) +
geom_smooth(aes(color=Department), method='lm', se=F) +
facet_wrap(~ Department) +
theme_minimal()
Он не отрисовывает в точности как в примере из статьи, но дальше там можно продолжать настраивать положения заголовков, параметры подписей осей, шрифты, параметры сетки, цвета линии трендов и даже модель для линии трендов (не обязательно линейную).
Если хочется добавить сопроводительный текст, то можно обернуть это все в R Markdown.
Скрытый текст

О, спасибо за пример на ggplot2! Вышло вполне неплохо. Да, я про языки программирования отдельно отметила внизу статьи. Просто изначально эта задачка планировалась именно для студентов на тему работы с презентацией данными (то есть финальный шаг обработки данных), да и у них на ноутбуках с собой вряд ли были бы языки программирования. К тому же, тонкая настройка графиков кодом без готовых шаблонов занимает много времени. В D3.JS одни оси часа два можно настраивать... библиотеки попроще тоже часто ограничены в функционале. Вот недавно Observable выкатил свои дашборды - может быть там можно настраивать красиво и графики и тексты и общее форматирование. Но это надо пробовать. И да, это опять же не для студентов, увы.
Такие задачи нельзя решать на фейковых данных.
Если вы учитесь, то формулируется задача, в стилистике "влияние факторов на целевой показатель" и всё это в безликих величинах, а то как написали вы - этого делать нельзя.
Пропущен этап подготовки данных - данные нужно подготовить для анализа. Для анализа существуют хорошо протестированные программы и уж точно нельзя делать выводов на основании графиков.
Сейчас у вас кликабельный заголовок, какие-то рассуждения и faker данные. И вывод, что 5 инструментов поломалось на этой задаче. Это не так, всех этих программ не знаю, но уже эксель легко справится с такой задачей, даже если формулы нужно написать руками в ячейки.
Мне кажется, мы про разное. Это задачка на дата-сторителлинг. И в условии задачи уже есть выводы, которые надо показать. Задание состоит в том – КАК это сделать, чтобы они были понятны условному HR-директору.
Сами выводы делать не нужно, этап сбора данных, подготовки и анализа – тут пропущены. Это последний этап – презентация данных стейкхолдеру.
Мы в хабе Визуализация данных, поэтому про анализ тут и нет. Я понимаю ваше желание видеть всю цепочку данных от и до, но это пока не цель. Я сама жду, когда заказчик пришлет мне настоящие данные, чтобы пример стал интереснее.
Если сможете решить эту задачку в екселе – пожалуйста, приложите решение (визуально похожее на то, что получилось в 5 разделе). Мне правда нужно. Буду благодарна. Ссылка на датасет – в конце статьи.
Кстати, если вы специалист по екселю, не подскажете, как шифровать данные цветом в скаттерплоте? Наткнулась на это ограничение неприятное.
Нельзя писать «с увеличением падают», по крайней мере по-русски, это подразумевает динамику - вот есть сотрудник, со временем его стаж растёт а эффективность падает. А динамика может быть получена только в динамике, везде всегда всеми. Эти же данные - мгновенный снимок. Лучше писать «с большим менее», это как раз подразумевает снэпшот.
Многие грешат, типа «эволюция звёздных скоплений» без слова «кажущаяся», что никого не оправдывает.
В данном случае мгновенно всплывают
связь эффективности с возрастом
связь эффективности с переходом на лучшую работу
динамика качества образования
Я понимаю, задача модельная, но вдруг идёт тренировка по манипулированию данными?
Как Notion прославилась, смотрел альтернативы, заинтересовала Silverbullet (не подошла - редактор глючным показался), там отсылка на концепт End-User Programming - так это, оказывается, активно обсуждается прямо сейчас и прямо относится к
Еще, например, многие языки программирования могут неплохо в быстрые графики
Языки могут неплохо во всё, а как раз для такого специально придумана Julia. И тут, собственно, моя мысль - при помощи Julia можно легко показать прекрасную интерактивную диаграмму другим пользователям Julia. То же самое относится к Python и даже JavaScript в варианте Node - Deno - Bun. А general public остаётся не у дел, мысль в том, что везде, как всегда, всё чаще и всё больше.
Кстати, других практически значимых языков я не знаю, ну может быть Racket. Разве 3.5 - многие?
О спасибо за уточнение, такие нюансы непросто считывать.
Ну в данном задании не нужно делать анализ данных, вывод, который нужно «презентовать» зрителю дан в условии.
Нужно именно при помощи графических средств этот вывод подать так – чтобы понял даже условный HR-директор.
К сожалению, быстрые графики для решения этой задачки не подходят. Я работала с несколькими датавиз библиотеками в python, делала дашбордики в JS. Конечно, D3.JS бы справился, но это заняло бы слишком много времени и у него высокий порог вхождения. Яне рассматриваю настолько сложные инструменты.
В остальных библиотеках очень плохое базовое оформление и его обычно не поменять.
Про Julia не слышала, спасибо ха наводку. А кому-то вне Julia можно показывать графики? Потому что, конечно, в первую очередь они нам нужны для решения коммуникационной задачки от специалиста к неспециалисту. От инженера к гуманитарию или управленцу высокого уровня. Сейчас гуглю примеры, пока что схода с классическими датавиз библиотеками python по визуалу и форматированию.
Увы, увы, для дженерал публики вся и задачка. Потому и сложно.
А кому-то вне Julia можно показывать графики?
Можно, но это будет просто график. Julia создана для случая когда нет задачи по быстрому войти в АйТи и доить безграмотное стадо. Соответственно, нет задачи создавать приложение, хотя над этим работают, пусть и без особого энтузиазма.
А делать картинки, особенно по научным расчётам и аналитике данных - это предполагаемое применение.
Julia сейчас моя любимая игрушка, уже убедила - без неё или любой альтернативы типа Racket или (даже) Python - гуманитарий и тем более управленец - они нужны как скрипач.
Это грубо.
По-вашему, директора и предприниматели, получающие 1млн в месяц своими навыками и умом – это безграмотное стадо? Художники, врачи и учителя – безграмотное стадо?
У них всех могут быть проблемы с вашими графиками, если они не разбираются в конкретно вашей профессиональной сфере. Это не повод считать их тупыми. Просто никто не обязан за 15 минут понять то, что вы изучали 5 лет и готовили две недели.
Julia – наверняка неплохой продукт, но пока что отличий от других аналогичных продуктов не вижу. Я вижу, что у вас к ней личная симпатия, но продукт должен решать задачи. А задачи бывают разные.
Это грубо.
Нет, это просто не нежно. Зато правда,
а правда всегда горькая
Это не я, это один деятель на YouTube пропагандирует. Но не говорит почему, я думаю потому, что сладкая правда в предметы обсуждения не попадает.
По-вашему, директора и предприниматели, получающие 1млн в месяц своими навыками и умом – это безграмотное стадо? Художники, врачи и учителя – безграмотное стадо?
Да, конечно. Многие и в определённом смысле. Большинство ли, спросите Вы? Закон 20/80 не ответит ли? Как я их оцениваю сам и советую другим?
По плодам их узнаете их.
Это тоже не я...
Это не повод считать их тупыми.
Вот этого я не говорил. Тупость - совершенно конкретное свойство слабо и коррелирует с другими. Кажется, что-то с шапкой. То ли горит, то ли пока подгорает…
Просто никто не обязан
Никто никогда ничему нигде не обязан, но. Точно цифру не помню, примерно 80% населения страны не только не поинтересовались миром когда с этим проблем не было, но и не оформили загранпаспорт. Это хуже чем тупость в том же смысле, в каком ошибка хуже преступления.
Я вижу прямую аналогию с колоссальной мощью и возможностями которые у каждого находятся буквально на расстоянии вытянутой руки и которые почему-то мало кого интересуют. Хотя людей просто обязаны интересовать, настаивает здравый смысл. И если бы я один был при этом мнении, то W^X политики в мобильные ОС не пихали бы, а так, на всякий случай наверно, пихают не покладая рук.
Julia – наверняка неплохой продукт,
Пока не знаю но надеюсь, зато уж точно очень интересный. Сделано с любовью и для себя, что делает его весьма необычным, как минимум.
отличий от других аналогичных продуктов не вижу
других аналогичных - с натяжкой два, Python и Racket.
Я понимаю
Всем хочется жить в мире где учителя учат а не оболванивают, врачи лечат а не здравозахоранивают, бизнесмены обслуживают клиентов а не давят административный ресурс… так что можно ко всем относиться с уважением и далее со всеми остановками. Но
Платон мне друг…
Типа.
gnuplot - визуализатор на все случаи жизни, практически
по возможностям, пожалуй, побогаче, чем ggplot2 и matplotlib, не говоря уже про всякие tableau, figma, excel etc.
минусы:
* данные не обрабатывает, только рисует
* с языком придётся поразбираться, несложно, но время займёт
* совершенно немодный
Ооо, спасибо за наводку, не слышала о таком!
А как у него с оформлением? Вижу примеры в интернете, пока все тот же matplotlib на минималках. Можете что-то особо заковыристое и аккуратно оформленное показать на нем? (или повторить в нем финальную картинку из примера?)
Жаль, что погружение долгое, но все равно хорошо, что появляются интересные альтернативы!
примеры: https://gnuplot.sourceforge.net/demo_6.0/
на оформление люди особо внимания не обращают, поэтому выглядит простенько, но возможности подставить шрифты, цвета и т.д. есть
когда-то давно я писал https://habr.com/ru/articles/253285/
правда, исходники, похоже уже утрачены
Спасибо за материал, очень интересно и подробно!
Задачка, которая сломала 5 датавиз-инструментов