Comments 13
К слову, с ноября Битрикс24 стал использовать Superset для внутреннего инструмента - своей BI-аналитики как альтернативы ранее использовавшимся интеграциям с Power BI и средствами от Google и Яндекс. С учетом относительно широкого распространения Битрикс24 среди (в частности) малого и среднего бизнеса - идет популяризация этого инструмента)
Я не очень понял в Apache нет привычной модели данных? Измерения?Атрибуты? ETL? Поддержка нескольких источников данных? Всё грузится одним датасетом через SQL-запрос и потом на этом датасете вычисляются определённые агрегаты, так?
В Superset, можно сказать, что нет модели данных. ETL в нем тоже нет. Несколько источников данных есть, но не вижу особого смысла, если есть общее хранилище данных.
Датасет не один, а под каждым графиком или таблицей свой датасет. Далее все это компонуется в дашборд. Таким образом, один дашборд может быть по нескольким датасетам.
P.S. SQL запрос внутри Superset лучше не делать, а подсовывать ему готовое представление (view), тогда запросы в базу при применении фильтров будут оптимальны.
Да. Именно поэтому это НЕ bi инструмент а просто рисовалка
Есть информация что при количестве пользователей больше 100 суперсет начинает работать из-под палки и его надо дорабатывать (чем сейчас разрабы в компании и заняты)
FYI
Суперсет - питон, бэкенд у него достаточно прост, свою базу использует только для хранения чартов, дэшбордов и юзеров - там нечему особо тупить. Если тупит какой-то определённый датасурс, значит проблема в нём (или в запросах к нему), а не в суперсете. Если правда тупит сам суперсет, можно только посоветовать апнуть машину с питоном/базой, или масштабировать - делается это как с любым приложением на питоне.
К сожалению лично я не знаю что там тупит, но в банке уже 3 месяца как экстренно собралась команда питон-разрабов с разных проектов и перепиливает весь бэкенд походу
Уверен, что это было обдуманное решение :)
Если проблемой является сам суперсет, то вроде бы для него предусмотрена схема работы в кластере Installing on Kubernetes | Superset (apache.org) c балансировщиком нагрузки. Думаю все-таки проблема в источнике данных, хотя информации мало.
У SuperSet коробочные графики не полноценные (а другие попробуй найди или уговори владельца платформы затащить их к вам). Разнообразие присутствует, которое по факту очень ситуативное, а вот базовые представления хромают. Только 1 график с колонками позволяет задать по оси x что-то отличное от датавремени. Визуально (шрифты итп) графики разного типа стилистически не однородны. Если у тебя ограничения в настройке стиля ждешь что он хотя бы сделан с умом. Если кто знает где есть библиотека графиков оставьте плз ссылки, попробую уговорить наше IT их к нам протащить.
Что нужно для внедрения Apache Superset