Статьи / Профиль Kilor / Хабр

Все потоки

Боровиков Кирилл@Kilor

Архитектура ИС: PostgreSQL, Node.js и highload

625

Подписчики

ПрофильСтатьи182Посты6НовостиКомментарии723

Kilor 7 окт 2024 в 13:51

PostgreSQL Antipatterns: валим «слона» — highload на ровном месте

Простой

7 мин

34K

Блог компании ТензорPostgreSQL * Базы данных * Node.JS * Высоконагруженные системы *

Кейс

Сегодняшняя тема посвящена нелегким взаимоотношениям клиентского приложения и сервера PostgreSQL: как на ровном месте, неудачной архитектурой приложения, можно обеспечить себе хронические проблемы производительности.

Рассмотрим классические ситуации, когда разработчики начинают жаловаться на производительность БД - а виновата-то и не она!

Читать далее

+23

Kilor 30 сен 2024 в 14:05

PostgreSQL Antipatterns: устраняем вложенные интервалы

Простой

5 мин

13K

Блог компании ТензорАлгоритмы * Базы данных * SQL * PostgreSQL *

Кейс

Недавно попался на глаза запрос, которым хотели отобрать в таблице (очевидно, для последующего удаления) все id записей интервалов, которые полностью перекрыты каким-то другим интервалом того же owner'а.

Но self-JOIN показал себя не лучшим образом...

Как сделать эффективнее?

+33

Kilor 23 сен 2024 в 13:25

SQL HowTo: Black and White (Puzzle Hunt 2010)

Простой

7 мин

2.8K

Блог компании ТензорАлгоритмы * SQL * PostgreSQL * Занимательные задачки

Мнение

Некоторые головоломки можно решать на SQL just for fun, а часть получается выразить на этом декларативном языке даже эффективнее других, императивных.

Попробовать сделать более наглядное решение, а заодно познакомить с некоторыми нетривиальными возможностями PostgreSQL меня натолкнул пост о решении на Python задачи Black and White.

Читать далее

+20

Kilor 12 сен 2024 в 12:45

SQL HowTo: загадка Эйнштейна, или снова Джиндош

Средний

7 мин

6.4K

Блог компании ТензорНенормальное программирование * PostgreSQL * SQL * Алгоритмы *

Мнение

Пару дней назад был опубликован пост с решением на MySQL загадки Джиндоша (она же загадка Эйнштейна).

Предложенное решение показалось мне "неспортивным" - помимо необходимости жестко учитывать в структуре запроса количество исходных элементов ("джойнить" нужные таблицы нужное количество раз), так еще и условия в запросе приходилось многократно дублировать.

Поэтому я попробовал решить эту задачу "в общем виде", используя возможности PostgreSQL, и вот что из этого получилось.

Читать далее

+25

Kilor 11 сен 2024 в 09:25

Курс «PostgreSQL для начинающих»: #4 — Анализ запросов (ч.2 — узлы получения данных)

Средний

12 мин

32K

Блог компании ТензорБазы данных * SQL * Анализ и проектирование систем * PostgreSQL *

Туториал

Продолжаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В первой части лекции мы узнали, что такое план выполнения запроса, как и зачем его читать (и почему это совсем непросто), и о каких проблемах с производительностью базы он может сигнализировать. В этой - разберем, что такое Seq Scan, Bitmap Heap Scan, Index Scan и почему Index Only Scan бывает нехорош.

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись (часть 1, часть 2) и слайды.

Читать далее

+23

Kilor 2 апр 2024 в 09:50

Курс «PostgreSQL для начинающих»: #4 — Анализ запросов (ч.1 — как и зачем читать планы)

Средний

16 мин

96K

Блог компании ТензорБазы данных * SQL * Анализ и проектирование систем * PostgreSQL *

Туториал

Продолжаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В этой лекции мы узнаем, что такое план выполнения запроса, как и зачем его читать (и почему это совсем непросто), и о каких проблемах с производительностью базы он может сигнализировать. Разберем, что такое Seq Scan, Bitmap Heap Scan, Index Scan и почему Index Only Scan бывает нехорош, чем отличается Materialize от Memoize, а Gather Merge от "просто" Gather.

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись (часть 1, часть 2) и слайды.

Читать далее

+37

Kilor 15 мар 2024 в 06:00

SQL HowTo: один индекс на два диапазона

Средний

3 мин

5.5K

Блог компании ТензорPostgreSQL * SQL * Базы данных * Высоконагруженные системы *

Туториал

В прошлой статье я показал, как условие с парой однотипных неравенств, плохо поддающееся индексации с помощью btree, можно переделать на эффективно gist-индексируемое в PostgreSQL условие относительно диапазонных типов, а наш сервис анализа планов запросов explain.tensor.ru подскажет, как именно это сделать.

Но что делать, если неравенств у нас не два, а целых четыре, да еще и с разными типами участвующих полей? Например, для целей бизнеса это может быть задачей вроде "найди мне все продажи за декабрь на сумму 10-20K", что на SQL будет выглядеть примерно так:

dt >= '2023-12-01'::date AND dt <= '2023-12-31'::date AND

sum >= 10000::numeric AND sum <= 20000::numeric

Читать далее

+21

Kilor 11 мар 2024 в 12:00

Бьемся с индексацией парных неравенств в PostgreSQL

Средний

6 мин

6.5K

Блог компании ТензорБазы данных * SQL * PostgreSQL * Высоконагруженные системы *

Туториал

Я уже не раз писал, что условия с несколькими неравенствами (<, <=, >=, >) обычно плохо подходят для индексирования "классическим" btree, вызывают "тормоза", и необходимо придумывать различные нетривиальные подходы в PostgreSQL, чтобы добиться хорошей производительности подобного запроса.

В этой статье мы не только рассмотрим способы решения подобных задач "в общем виде", но и покажем, как нам удалось автоматизировать их решение в рамках функционала рекомендаций индексов нашего сервиса анализа планов explain.tensor.ru и его новых возможностях.

Читать далее

+18

Kilor 10 янв 2024 в 12:30

Курс «PostgreSQL для начинающих»: #3 — Сложные SELECT

Средний

12 мин

87K

Блог компании ТензорPostgreSQL * SQL * Базы данных *

Мнение

Продолжаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В этой лекции углубимся в расширенные возможности команды SELECT : как можно "сложить" и "вычесть" выборки (UNION/INTERSECT/EXCEPT), или запомнить и использовать в рекурсивных запросах (CTE), что дают оконные функции (WINDOW) и соединения (JOIN).

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись и слайды.

Читать далее

+34

Kilor 25 дек 2023 в 08:32

PostgreSQL в «Тензоре» — публикации за год (#4)

Простой

2 мин

3.6K

Блог компании ТензорВысоконагруженные системы * Базы данных * SQL * PostgreSQL *

Обзор

Под занавес уходящего года предлагаю традиционно вспомнить, про какие интересные возможности и особенности работы с PostgreSQL мы рассказали в нашем блоге.

Если не видели дайджест за прошлый год — время наверстать упущенное!

Читать далее

+5

Kilor 20 дек 2023 в 13:50

SQL HowTo: итоги по строкам и столбцам «в одно действие»

Средний

4 мин

20K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Туториал

Немного отвлечемся от простых SELECT и посмотрим на реальной бизнес-задаче построения различных "тепловых карт" и "шахматок", как знание возможностей SQL может облегчить жизнь и разработчику, и его базе.

Читать далее

+27

Kilor 19 дек 2023 в 05:30

Курс «PostgreSQL для начинающих»: #2 — Простые SELECT

Простой

14 мин

66K

Блог компании ТензорБазы данных * SQL * PostgreSQL *

Мнение

Продолжаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

Сегодня поговорим о самых простых, но важных, возможностях команды SELECT, наиболее часто используемой при работе с базами данных - формировании выборок (VALUES), их ограничении (LIMIT/OFFSET/FETCH), фильтрации (WHERE/HAVING), сортировке (ORDER BY), уникализации (DISTINCT) и группировке (GROUP BY).

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись и слайды.

Читать далее

+13

Kilor 12 дек 2023 в 05:30

Курс «PostgreSQL для начинающих»: #1 — Основы SQL

Простой

13 мин

181K

Блог компании ТензорPostgreSQL * SQL * Базы данных *

Мнение

Этим постом я запускаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В программе: рассказ об основах SQL, возможностях простых и сложных SELECT, анализ производительности запросов, разбор [не]эффективного применения индексов и особенностей работы транзакций и блокировок в этой СУБД.

Курс не претендует на лавры "войти в айти", поэтому подразумевает наличие у слушателя опыта программирования или работы с другими СУБД, и, главное, желания самостоятельно изучать тему работы с PostgreSQL глубже.

Для тех, кому комфортнее смотреть и слушать, а не читать - доступна видеозапись и слайды.

Читать далее

+33

Kilor 28 ноя 2023 в 07:20

SQL HowTo: TOP-N на субинтервалах

Простой

3 мин

6K

Блог компании ТензорБазы данных * SQL * PostgreSQL * Высоконагруженные системы *

Кейс

Периодически сталкиваюсь с однотипными задачами вида "показать TOP-N позиций на каждом из вложенных интервалов некоторого периода".

Это может быть "5 лучших по успеваемости студентов в каждом семестре за последний учебный год", или "помесячная динамика позиции 10 наиболее продающихся товаров", или, как у нас в сервисе визуализации PostgreSQL-планов explain.tensor.ru, "3 наиболее активных страны за каждый день":

Читать далее

+11

Kilor 2 ноя 2023 в 06:45

PostgreSQL Antipatterns: ходим по JSON-граблям

Простой

3 мин

20K

Блог компании ТензорБазы данных * SQL * PostgreSQL * Высоконагруженные системы *

Кейс

Недавно попался на глаза примерно такой кусок запроса, и тут прекрасно примерно все:

• множество чтений из CTE (хоть и единственной записи, но все же);

• извлечение по каждому ключу текста с раскастовкой в jsonb;

• извлечение каждого отдельного json-ключа в каждое отдельное одноименное поле;

• "ручное" преобразование текстового представления массива в json в текстовое представление PostgreSQL.

А как - правильно?

Читать далее

+26

Kilor 13 сен 2023 в 06:35

SQL HowTo: ближайший общий предок в дереве (LCA)

Средний

5 мин

5K

Блог компании ТензорБазы данных * Алгоритмы * SQL * PostgreSQL *

Туториал

В иерархических структурах регулярно возникает потребность определить ближайшего общего предка в дереве, он же наименьший общий предок (Lowest (Least) Common Ancestor).

Правда, "классические" алгоритмы для решения этой задачи работают лишь с парой узлов (раз, два, три, четыре), а мы, используя всю мощь PostgreSQL, будем решать задачу сразу для нескольких узлов.

Читать далее

+13

Kilor 31 июл 2023 в 15:06

Всегда ли хорош Index Only Scan?

Средний

5 мин

20K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Кейс

Среди применяемых в PostgreSQL методов доступа к данным Index Only Scan стоит особняком, считаясь у многих разработчиков "волшебной пилюлей" для ускорения работы запроса - мол, "Index Scan - плохо, Index Only Scan - хорошо, как только получим его в плане - все станет замечательно".

Как минимум, это утверждение неверно. Как максимум, при определенных условиях может вызвать проблемы чуть ли не на ровном месте.

Читать далее

+25

Kilor 25 мая 2023 в 06:25

Кэш в JavaScript: не все Map'ы одинаково полезны

Простой

2 мин

7.6K

Блог компании ТензорNode.JS * Программирование * JavaScript * Высоконагруженные системы *

Кейс

При разработке приложений регулярно возникает задача кэширования каких-то данных, которые из хранилища должны читаться много чаще, чем писаться. Давайте рассмотрим на примере простого теста, когда и на каком механизме эффективнее организовать его для JavaScript-приложения - на Map или на Object.

Читать далее

+13

Kilor 11 мая 2023 в 14:40

SQL HowTo: замена в строке по набору

Простой

2 мин

7.9K

Блог компании ТензорSQL * Программирование * PostgreSQL * Ненормальное программирование *

Туториал

Решим сегодня простую, казалось бы, задачу: как на PostgreSQL можно в строке провести замены по набору пар строк. То есть в исходной строке 'abcdaaabbbcccdcba' заменить, например, 'а' -> 'x', 'bb' -> 'y', 'ccc' -> 'z' и получить 'xbcdxxxybzdcbx'.

Фактически, мы попробуем создать аналог str_replace или strtr.

Читать далее

+9

Kilor 21 фев 2023 в 05:35

SQL HowTo: крупицы золота в реестре

Сложный

7 мин

11K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Алгоритмы *

Туториал

В большинстве учетных систем, типа нашего СБИС, рано или поздно возникает проблема быстрого отображения реестра, в который по просьбам бизнес‑пользователей накручено несколько комбинируемых фильтров с очень редкой выборкой, ну никак не ложащихся в вашу красивую структуру базы данных и индексов базовой таблицы реестра — что‑нибудь типа "список продаж покупателям, чей день рождения выпадает на 29 февраля".

Универсального способа сделать «хорошо» тут нет, но я расскажу про модель запроса, которая позволит вам дать пользователю быстрый отклик, но при этом весьма эффективно с точки зрения PostgreSQL.

Читать далее

+18

3

4 5 ...