Вы правы, с цветами и правда стоит поработать, тут я поспешил. А насчет структуры — тут зависит от задачи: если надо, чтобы читатель сравнил на графике столбцы в начале и в конце, то да, линии могут понадобиться (хотя я бы не оставлял всю сетку, а оставил только одну линию, которая покажет разницу между нужными мне столбцами).
Если цель — показать динамику каждого из слоев, то, пожалуй, да — area chart не всегда будет достаточно информативен. Мы чаще используем его, чтобы показать вклад одного слоя (в данном случае — «эпизодического») в общую картину.
Да, если строго подходить к определениям, вы правы. Просто в русскоязычных источниках и переводах вертикальные bar chart'ы часто называют гистограммами
Увы, подробно альтернативы мы не изучали, так как решение использовать Zeppelin было скорее стихийным, нежели запланированным. Дело в том, что у меня уже был опыт работы с ним (в связке с Impala), и мы в отделе немного поэкспериментировали с ним как со средой для запуска Python-скриптов. Ну и обнаружили пару способов упростить часть нашей рутины)
Конечно, на рынке есть более продвинутые коммерческие решения для подобных задач, с более богатой функциональностью. Но, как мне кажется, лаконичные опенсорсные решения могут быть полезны небольшим игровым студиям.
Насколько могу судить, у нас довольно стабильно работает, функциональности под наши задачи хватает. Попробуйте ради интереса глянуть снова, вполне возможно стало лучше с тех пор.
Ну да, вы правы, тут уже вопрос цели и того, кто будет пользоваться. Spark идет «из коробки», про написание интерпретаторов под другие языки ответил ниже.
Вопрос и впрямь непростой)
По моему мнению, основные преимущества над Jupyter — это быстрая встроенная визуализация и возможность адаптировать ноутбук для пользователей, не связанных с аналитикой: набросать инструменты ввода встроенными командами, скрыть все блоки кода, переключить на вид отображения, в котором сложно что-либо сломать.
По поводу минусов — все же Jupyter как «IDE для питона» дает куда больше — хотя бы ту же автоподстановку.
Как не врать с помощью статистики: основы визуализации данных
Как не врать с помощью статистики: основы визуализации данных
Как не врать с помощью статистики: основы визуализации данных
Да, если строго подходить к определениям, вы правы. Просто в русскоязычных источниках и переводах вертикальные bar chart'ы часто называют гистограммами
Как не врать с помощью статистики: основы визуализации данных
Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin
Конечно, на рынке есть более продвинутые коммерческие решения для подобных задач, с более богатой функциональностью. Но, как мне кажется, лаконичные опенсорсные решения могут быть полезны небольшим игровым студиям.
Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin
Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin
Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin
Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin
По моему мнению, основные преимущества над Jupyter — это быстрая встроенная визуализация и возможность адаптировать ноутбук для пользователей, не связанных с аналитикой: набросать инструменты ввода встроенными командами, скрыть все блоки кода, переключить на вид отображения, в котором сложно что-либо сломать.
По поводу минусов — все же Jupyter как «IDE для питона» дает куда больше — хотя бы ту же автоподстановку.