Как стать автором
Обновить

Комментарии 8

А вы пробовали реализовать интеграцию с какими то таблицами (гугл таблицы, ексель и т.п.)?
И если пробовали - то получилось или нет?

Наши пользователи (финансисты) постоянно работают с Екселем, и для них возможность работать с кубами прямо в Екселе очень важна. И когда я смотрел на альтернативы SSAS / PowerBI - не смог найти ничего подходящего.

Интеграцию с Гугл таблицами и Ексель реализовывать не пробовал.
Excel выступает как хранилище данных и как слой доступа к данным одновременно. Если ваши пользователи заносят данные в Ексель, то в таком случае экосистема Microsoft будет лучшим выбором. Потому что пользователю не придется изучать ещё один интерфейс или сервис.
Cube больше решение для построения системы аналитики, поэтому и называется headless (без головы, проще говоря без пользовательского интерфейса)

Нет, наши пользователи не заносят данные в ексель. Ексель только как интерфейс.

Но они очень любят в екселе создать табличку на основе куба, а в соседних ячейках посчитать что то дополнительно, используя данные и куба, и, иногда, вручную введённые данные.

А через некоторое время снова открыть файл, обновить данные куба и посмотреть, что поменялось в рассчитанных ими цифрах.

И для вот такого сценария работы вообще не могу найти никакой альтернативы екселю...

На мой взгляд, альтернатив нет. Майкрософт встроила эти технологии в свой собственный продукт (Excel), но никакой другой вендор этого больше сделать не сможет. Поэтому заявленный уход MS с российского рынка - это очень плохая новость для тех аналитиков, которые успели оценить преимущества этой схемы. Остаётся только надеяться на то, что за кадром майкрософт не будет блокировать функционал.

Вы правильно написали, что это вендор. При построении системы нужно учитывать тот фактор, что вендор может оказаться от исполнения обязательств или прекратить поддержку.
Поэтому лично я чаще выбираю open-source, чтобы минимизировать риски. Конечно, это не серебряная пуля, учитывая недавние случаи с npm пакетами с вредоносными изменениями.
Одно из свойств систем — адаптироваться под внешнюю среду, сохраняя поведение и функциональность. Как инженеры, мы должны строить системы принимая это во внимание

Так как Power BI работает не напрямую с источником данных, а создает “набор данных” для кеширования и оптимизации запросов это работает дольше даже на небольших наборах данных.

не хочу топить за майкрософт и рекламировать power bi т.к. за рекламу мне они к сожалению не платят (просто создаю дашборды на pbi уже лет 5 где-то). Но тезис выше странный. Любое кеширование в in-memory всегда быстрее формирует отчёт и это справедливо для любого размера данных влезающих в оперпамять, у вас это звучит как будто pbi тупит на малых данных в кэше.

Кстати, на случай если не в курсе: PBI имеет возможность подключения в режиме Direct Query к источникам вообще не храня в себе данные и транслируя запросы с дашбордов в тот же OLAP, MS SQL или даже SAP HANA

А еще любопытный факт : тот самый режим импорта который вы помянули, позволяет заливать одновременно 100500 разных источников (от монги до спарка, от SAP до Vertica) в один дашборд и построить не один уровень кэширования а в несколько слоёв по каждый уровень требуемой агрегации, и его оптимизатор крайне быстро решает - к какому слою кэша направить запрос с клика пользователя на визуале.

И еще один любопытный факт - самый самый нижний слой данных этой закэшированной пирамиды может быть угадайте чем? Direct Query Mode, что позволяет детальный срез на самом атомарном уровне гранулярности (в который юзер например попал через Drill Down или Drill Trough) отправить на исполнение напрямую в СУБД!

Это называется в PBI - композитная модель и появилась она в pbi не вчера а в 2018м, т.е. технология зрелая

https://radacad.com/power-bi-fast-and-furious-with-aggregations

А вот тут видосик где рассказывается как крутить наборы данных петабайтного масштаба в Azure с помощью агрегирования в Power BI

https://youtu.be/OUf-kSWhcOM

Конечно в Data Science / Machine learning решения open source давно обогнали все проприоритарное, но вот на BI арене всё это пока на зачаточном уровне ещё.

Подпишусь под каждым словом!

Доброго дня, я не пойму как работает эта open source система, из того что увидел не опенсорс. Штука прикольная но из статьи не совсем понял как она работает. Если встроенный интерфейс работает только в режиме разработчика, то как это всё обрабатывать. Если бы было нужно отдавать готовые таблицы, описанные в файлах js. то получается это просто еще один слой над sql? Ну вот связал я с БД в которой реализована звезда Кимбала, выбрал нужные таблицы измерений и фактов. Но она даже выбрать измерения одновременно из нескольких таблиц измерений и таблицы фактов не даёт. можно брать только из одного куба. Мне что в кубы надо запросом собрать денормализованную таблицу(MOLAP),что бы потом крутить вертеть. Подскажите, есть ли какие либо опенсорс проекты которые могли бы работать с ROLAP просто генерируя запросы в соответствии со схемой БД.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории