Comments 7
В 200х эта тема была очень на слуху и активно развивалась, но последнее 10 лет или даже больше как-то интерес упал. Статья по стилю как раз напомнила мне те годы. Я недавно как раз вспоминал про это и поиском на хабре хотел найти свежие статьи и в общем-то убедился, что так и есть, тема давно ушла. Но вот почему она ушла, в чем причина обзоров не видел.
То ли сама концепция этих кубов как исчерпывающей модели для анализа не совсем актуальна или еще что-то.
По моим ощущениям простым суммированием всех со всеми не обойдешься, аналитические агрегации нудные в реале в идею куба просто не укладываются. Например у меня на работе используют BI на основе ROLAP и никаких кубов.
В общем ясности пока нет.
Я разрабатываю BI систему, знаю что они сейчас в топе трендов. Просто конкретно olap спецификации запросов к БД утратили актуальность. Сейчас агрегационые запросы для аналитики выглядят так - ставится какая-нибудь столбовая БД типа cassandra, click house, druid и просто пишутся запросы group by. Провайдер БД представляет различные агрегационые операторы, начиная от расчета квантилей до исполнения касстомного скрипта.
Бурение
Поворот
В коллекцию бессмертных перлов.
Понятно почему не указано, что это перевод. Это жанр плохого пересказа неумелого сокращения переведенного обзора.
Что-то прям ерунда какая-то с иерархиями. Причём дважды.
Во-первых - а где собственно иерархия-то? если не считать наименований полей, то я в упор не вижу никакого отличия между иерархическими и обычными атрибутами.
Во-вторых, заполнение. SQL-запрос на наполнение куба как-то намякивает, что в таблице TimeDim для каждой записи хранятся и дата, и месяц, и год, и все по отдельности, в разных полях одной записи... нормализация тихо плачет в уголочке.
Подскажите, а на какой СУБД можно прям вместо create table - create cube сделать? Прям заинтересовало.
И кажется я знаю почему кубы перестали быть популярными - потому что в обычных СУБД - где есть JOIN и нет CREATE cube - надо было делать запросы на 1000+ строк SQL чтобы такую модель данных покрутить. А народ обленился.
Сам я не так давно сделал инструмент для создания и поддержки таких запросов, которые как раз и основаны на OLAP методологии.
К сожалению мне не дают в open source его выложить, но видео-обзором никто делиться на запрещал.
https://www.youtube.com/playlist?list=PLCxvGZsc-aLnk79wFLUzdaO6_4eitiMym
Ммм, странно зачем усложнять? Это же обычные SQL запросы. Хочешь данные максимально раскрутить велком ту пандас. Если данные большие, срежь их SQLкой и гони в новомодный polars. К чему усложнять?
Впервые слышу, чтобы к кубам писали SQL-запросы.К OLAP-кубам пишут MDX-запросы, к табуляркам ещё можно DAX,но чтобы SQL, нигде такого не встречал.
Многомерный анализ данных: исследование многомерных кубов и SQL OLAP-запросов