Sivchenko_translate20 ноя 2023 в 13:31

Как был создан потоковый SQL-движок

10 мин

9.7K

Программирование * SQL * Хранение данных *

Перевод

Комментарии 43

Tzimie 20 ноя 2023 в 14:55

Очень интересно. Но что-то мне говорит, что в реальном мире это не так радужно

Каков overhead предвычислений тысяч кверей, если мы не знаем, какие понадобятся?

Ivan22 20 ноя 2023 в 15:25

ну все кунгфу и заключается в нахождении баланса и сдерживании роста количества этих "кверей", иначе да - разрастутся до тысяч. И там проблема уже не перформанс будет- а то что никто не знает обо всех этих сотнях кверей и их логике, и соответственно при требовании нового расчета вместо того чтобы понять что можно использовать уже имеющийся "квери", будут появлятся новые, дублирующие - что в итоге заканчивается все одинаково, ситуацией "проще это всё выкинуть и с нуля написать"

Tzimie 20 ноя 2023 в 15:34

Но для online OLAP должно зайти

Ivan22 20 ноя 2023 в 16:09

ну я не встречал еще ни одной online OLAP базы. Видимо не так-то это просто

rcrvk 21 ноя 2023 в 04:02

Clickhouse позиционирует себя как OLAP)

Ivan22 21 ноя 2023 в 10:59

а где там онлайн??? Что там есть сохраненные запросы которые сами обновляются в реал-тайме???? (Да и с аналитическими запросами там все очень плохо - хуже чем у любой класической субд), так что ни онлайна, ни олапа. Просто фактически быстрый кэш для уже рассчитанных витрин.

Так-то такой онлайн как тут описано - это только кафка-стримс

Ivan22 20 ноя 2023 в 15:16

инкрементальный апдейт материализованых представлений. Существует в природе уже лет 20, и примерно столько же лет нормально не работает

Ivan22 20 ноя 2023 в 15:19

вообще процес построения инкрементального обновления витрин давно известен, прост и используется чуть больше чем везде (где это нужно). Все эти запросы хранятся уже расчитанные в таблицах, а для обновления надо просто выбрать ключ обновления, например день, кастомер, продукт и т.д. и обновлять только изменившиеся данные (при изменениях в сорсах), что на порядки быстрее чем полный пересчет и в 99% случаев вполне рабочий вариант

Tzimie 20 ноя 2023 в 15:35

А это своя СУБД или надстройка над существующей?

ncix 20 ноя 2023 в 15:37

До боли напоминает "регистры" в 1С

alexhott 20 ноя 2023 в 16:06

Под каждый запрос храни Многа Многа. А где потоки в SQL, я так и не нашел.

mikegordan 20 ноя 2023 в 16:27

Мне платят 19000$ в месяц за то что я первый начал шилить и внедрять стриминговые движки в РФ, в сложный сайтах у которых JOIN происходит на клиенте или partical join в api gateway - отклик повысился в разы, "скачки" сайтов при загрузки сведены к нулю, а продажи подросли в разы.

Стриминговые движки это будущие для больших данных. Всем советую начать изучать сейчас, это будущие. А все кто игнорирует это останутся просто "программистами".

Politura 20 ноя 2023 в 16:48

А можно тогда чуть подробностей про самое главное, что в статье не упомянуто почему- то: это типа расширения материализованных вьюх, или вообще обновляются запросы которые сейчас в кэше? Как определяется какие запросы обновляемые, какие нет?

mikegordan 20 ноя 2023 в 19:05

отвечу после пересоздания очередного аккаунта на хабре. Заминусовали, появились ограничения.

НЛО прилетело и опубликовало эту надпись здесь

ptr128 20 ноя 2023 в 18:26

А если агрегатная функция не дифференцируема по своему определению? Например, нам нужно не количество людей, а их медианный возраст.

BogdanPetrov 20 ноя 2023 в 19:31

Судя по документации, не поддерживается: https://docs.epsio.io/sql-support/built-in-functions/

Aquahawk 21 ноя 2023 в 11:40

Для того чтобы вычислять медиану есть и потоковые подходы, в том же кликхаусе они и применяются по умолчанию и это очень многих устраивает.

ptr128 21 ноя 2023 в 11:54

Для точного вычисления медианы я потоковых подходов не знаю. По ссылке речь о приблизительном вычислении. Для нормального распределения, при незначительной дисперсии и отсутствии сезонной составляющей, такой подход может быть приемлем. Но уже для логнормального распределения такой подход может давать существенные искажения.

Пример:

Aquahawk 21 ноя 2023 в 12:19

Да, всё так, но много кого такие данные утраивают

ptr128 21 ноя 2023 в 12:23

И у меня есть данные, где устраивает. Но так как такие данные, нередко, в тех же записях, но других колонках, где не устраивает - пользуемся ClickHouse. Который даже точную медиану считает очень быстро. За что его разработчикам премного благодарен )

Aquahawk 21 ноя 2023 в 12:26

то что клик великолепен, тут даже вопросов нет, используем и в продакшне и дома даже у меня показания датчиков умного дома в клике лежат.

RekGRpth 21 ноя 2023 в 04:02

Описание похоже на timescaledb

akakoychenko 21 ноя 2023 в 07:44

Почитал доки. И опыт говорит, что лучше это в проде не использовать. Почему так думаю: пару лет назад я руководил продуктом, где мы создали свой потоково-аггрегационный костыль, чтобы на лету считать аггрегаты над 15ТБ базой в постгресе, куда за день вставлялось 2 млрд строк. Работало не то, чтобы очевидно - при вызове data api на модификацию данных динамически генерировался огромный SQL запрос, который и вставлял сырые данные, и обновлял аггрегаты одной транзакцией. Понятно, что data api старались дергать большими батчами, и понятно, что ряд операторов (например, argmax) не реализовывали из-за страха перед вычислительной сложностью или объёмом состояния, ибо эта штуковина блокировала всю систему. Но, зато, работало, как часы.

Потом же, захотелось чего-то более гибкого. Чтобы и операторы можно было с O(N) сложностью внедрять, и, чтобы любой джун-говнокодер мог свой аггрегат написать и не увалить систему, когда там окажется O(N^2).

Так что, когда один умный чел посмотрел на все это, и сказал, мол, не страдайте херней, и берите debezium, то это выглядело, как священный грааль. Слить с него в кафку, а там уже, в параллель ставь хоть 100 аггрегаторов, каждый со своим хранилищем и в своём контейнере. И, главное, все это гарантированно консистентно (сливать в кафку с data api была плохая идея, ведь была вероятность, что из-за нештатной ситуации состояние кафки и бд рассинхронизируются).

Попробовали. На тестовой базе все круто. На проде под указанной выше нагрузкой debezium тупо не работает стабильно. Сколько девопсы не плясали с бубном, как мы не пытались его зашардировать и в много инстансов работать заставить. Поговорил с другими счастливыми пользователями - проблема не только у меня. А решение ведь куда более проверенное временем, чем этот стартапчик, основанный год назад.

Более того, ок, предположим, что они сотворили чудо, и научились парсить WAL стабильно. Чтобы не улететь по памяти, или не получить неконтролируемое отставание от риалтайма, надо вывести кучу ручек для обслуживающего девопса, чтобы он мог тонко это все настроить и, главное, задать стратегию работы с проблемными представлениями, ибо с их портфелем поддерживаемых операторов устроить комбинаторный взрыв очень легко. В доке как-то это все не просматривается (да и не пишется за один год)

Мне могут возразить, что я наваливаю кейсы серьёзного хайлоада, а это решение для тех, у кого сотня юзеров в день. Но прикол в том, что им эта приблуда и не нужна. Даже, если они уже выросли с того, чтобы дергать оперативную базу на аггрегации на каждый чих. И с делания этого на реплике выросли тоже, можно near real-time лить в clickhouse/Redshift, и дергать уже их. Да, не О(1), но грубая сила скоростных olap движков свое дело сделает. А вот, когда уже и этого не хватит, то привет все радости жизни из предыдущего абзаца

Politura 21 ноя 2023 в 16:48

Работало не то, чтобы очевидно - при вызове data api на модификацию данных динамически генерировался огромный SQL запрос, который и вставлял сырые данные, и обновлял аггрегаты одной транзакцией.

А чем не устроил вариант с триггерами на таблицах для обновления этих агрегатов? Тоже было-бы одной транзакцией и выглядело-бы не слишком страшно.

akakoychenko 21 ноя 2023 в 17:02

Хороший вопрос. Не факт, что вспомню прямо все причины сейчас.

Но, кажется, основной причиной была моя личная непереносимость наличия исполняемого кода в БД. SQL запросы на 1000 строк норм, но вот наличие в БД исполняемой логики уже нет. Очень не люблю размазывание логики между репозиторием и БД. Да, оно синхронизируется на этапе миграции, но слишком много нюансов возникает. Команде было бы сложно продать мне наличие триггеров или хранимок;)

Кроме этого, там была масса плюшек уровня целостной системы. Например, data api после обработки батча получал в ответ скрипта итоговые значения всех обновленных аггрегатов, и сразу же плевался ими в кафку, что позволяло системе быть реактивной и масштабируемой. Или, там была очень интересная система управления дневными партициями, чтобы при удалении партиции не считать все заново, а лишь переагрегировать агрегаты дней. Можно было принудительно забутстрапить новый агрегат из аналитического хранилища. Кажется, ещё что-то было из приколов, которые требовали больше контроля наружу

Politura 21 ноя 2023 в 18:32

Понятно, спасибо. С одной стороны согласен, помню когда-то давно работал с одним большим проектом, где вся бизнес логика была в хранимках, это было больно по многим причинам.

С другой стороны, агрегаты можно рассматривать не как бизнес-логику, а как денормализацию данных. То есть это все те-же данные, просто представленные в ином виде. В таком случае триггеры будут вполне оправданы, если не увлекаться и не тащить в них бизнес-логику. Ну и все также можно генерить запросы, которые будут и менять данные, и забирать данные из агрегатов все одним запросом.

Ivan22 21 ноя 2023 в 19:39

рассчет агрегатов это и есть логика, а триггеры очень сложны для отладки. Ну и перформанс у них не ахти, батч режим-то не применишь, чтобы не каждый инсерт отрабатывать, а сразу большую пачку. Ну и триггеры с апдейтами - лучший способ получения дедлоков!

asmm 22 ноя 2023 в 16:38

батч режим-то не применишь, чтобы не каждый инсерт отрабатывать, а сразу большую пачку

В postgresql AFTER STATEMENT триггеры

Примерчик в конце
https://www.postgresql.org/docs/current/plpgsql-trigger.html

даст большую фору логике в приложении

Ivan22 23 ноя 2023 в 12:25

это все в теории работает, на практике серьезная логика на триггерах - это верный путь к "проще это все выкинуть и переписать с нуля" всего за пару лет.

p.s. а в тут так всеми хваленом кликхаусе что с триггерами??

domix32 21 ноя 2023 в 09:28

например, SELECT count(*) FROM humans . Обычному SQL-движку <...>
требовалось бы заново пересматривать все отдельные экземпляры humans при каждом выполнении такого запроса.

что-то мне кажется, что это неправда. Звёздные запросы по-идее должны сразу поле size у столбца забирать, а не пробегать по записям. Вот был бы там какой-нибудь DISTINCT, тогда б было понятно.

Ivan22 21 ноя 2023 в 11:05

когда кажется - надо смотреть в план запроса. А в плане мы увидим full scan. Se la vi.

gnomeby 21 ноя 2023 в 11:38

Зависит от движка DB, в некоторые метрики изначально встроены.

Ivan22 21 ноя 2023 в 12:07

это в какие же?

gnomeby 21 ноя 2023 в 12:13

MyISAM. В InnoDB есть примерный подсчёт, иногда точный не нужен.

gnomeby 21 ноя 2023 в 11:44

Есть ещё ksqldb https://ksqldb.io/. Однако опыт использования показал 3 вещи:

Иногда ты упираешься в тупик и дальше никак
Непонятно как это работает и будет ли работать быстро всегда. Вернее лично ты можешь разобраться, но если ты уволишься не факт, что твоя работа будет легко подтянута.
Некоторые вещи лучше сделать на атомарных счётчиках в Redis. А некоторые специальными движками в ClickHouse.

ogregor 21 ноя 2023 в 12:18

Вот кстати то же прочитал про него книгу. И задумался о применении в качестве узла в системе SQRS для запросов. Или все таки он не подходит для больших нагрузок на чтение из его таблиц?

gnomeby 21 ноя 2023 в 12:19

на проде не испытывали, не прошел R&D.

sneg2015 21 ноя 2023 в 13:58

Не совсем понял. В начале где добавляли Еву к Адаму. Сперва удалили 1. Потом сказали что нужно к результату прибавить 1 и получили 2 человека. Вопрос если 1 удалили, где тогда содержалась удаленная единица чтобы к ней прибавить 1? Получилось, что мы к none прибавили 1 и получили 2 ?

KuzCode 25 ноя 2023 в 05:36

Тут `2: +1` двойка это количество людей, а +1 это что то типо булевой переменной true

sneg2015 25 ноя 2023 в 09:18

Спасибо. Разобрался. Но получается что если просто нужно прибавить 1, то придется выполнить 3 действия. Отменить предыдущее, создать новый ключ, добавить его. Не совсем понятно, почему это будет работать быстрее.

HADGEHOGs 22 ноя 2023 в 10:35

Человек изобрел регистры накоплений 1С. Мои поздравления.

CrazysAlien 4 сен 2025 в 18:47

Берём 1с компоненту Бухгалтерский Учёт (в терминах версии 7.7, но вы поняли, что в последующих всё также ;)
Заносим несколько хозяйственных операций - дебет+субконто, кредит+субконто , сумма, количество, произвольное содержание.
Делаем любой из стандартных отчётов - оборотная ведомость, анализ счёта, карточка счёта... да любой подходящий (правда это уже в конфигурации должно быть описано, но допустим ;)
Ой, что это он показывает и откуда берёт!? Как уже всё посчитано - начальное сальдо, обороты приход, расход, аналитика, конечное сальдо! Как само, средствами платформы считается и хранится если не меняется и само пересчитывается когда меняется!? Даже если в прошлых периодах поменяли, то в актуальном остатке это будет учтено тоже "само"!

THIS MAGIC !!! :)
зы... ой, а каак онии ээтоо сдеелааалиии!? ;)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий