Articles / Profile of Kilor / Habr

Боровиков Кирилл@Kilor

Архитектура ИС: PostgreSQL, Node.js и highload

ProfileArticles172Posts6NewsComments710

@Kilor Dec 20 2023 at 13:50

SQL HowTo: итоги по строкам и столбцам «в одно действие»

Medium

4 min

20K

Тензор corporate blogHigh performance * PostgreSQL * SQL * Database Administration *

Tutorial

Немного отвлечемся от простых SELECT и посмотрим на реальной бизнес-задаче построения различных "тепловых карт" и "шахматок", как знание возможностей SQL может облегчить жизнь и разработчику, и его базе.

Читать далее

+27

@Kilor Dec 19 2023 at 05:30

Курс «PostgreSQL для начинающих»: #2 — Простые SELECT

Easy

14 min

59K

Тензор corporate blogDatabase Administration * SQL * PostgreSQL *

Opinion

Продолжаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

Сегодня поговорим о самых простых, но важных, возможностях команды SELECT, наиболее часто используемой при работе с базами данных - формировании выборок (VALUES), их ограничении (LIMIT/OFFSET/FETCH), фильтрации (WHERE/HAVING), сортировке (ORDER BY), уникализации (DISTINCT) и группировке (GROUP BY).

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись и слайды.

Читать далее

+13

@Kilor Dec 12 2023 at 05:30

Курс «PostgreSQL для начинающих»: #1 — Основы SQL

Easy

13 min

158K

Тензор corporate blogDatabase Administration * SQL * PostgreSQL *

Opinion

Этим постом я запускаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В программе: рассказ об основах SQL, возможностях простых и сложных SELECT, анализ производительности запросов, разбор [не]эффективного применения индексов и особенностей работы транзакций и блокировок в этой СУБД.

Курс не претендует на лавры "войти в айти", поэтому подразумевает наличие у слушателя опыта программирования или работы с другими СУБД, и, главное, желания самостоятельно изучать тему работы с PostgreSQL глубже.

Для тех, кому комфортнее смотреть и слушать, а не читать - доступна видеозапись и слайды.

Читать далее

+33

@Kilor Nov 28 2023 at 07:20

SQL HowTo: TOP-N на субинтервалах

Easy

3 min

5.9K

Тензор corporate blogDatabase Administration * SQL * PostgreSQL * High performance *

Case

Периодически сталкиваюсь с однотипными задачами вида "показать TOP-N позиций на каждом из вложенных интервалов некоторого периода".

Это может быть "5 лучших по успеваемости студентов в каждом семестре за последний учебный год", или "помесячная динамика позиции 10 наиболее продающихся товаров", или, как у нас в сервисе визуализации PostgreSQL-планов explain.tensor.ru, "3 наиболее активных страны за каждый день":

Читать далее

+11

@Kilor Nov 2 2023 at 06:45

PostgreSQL Antipatterns: ходим по JSON-граблям

Easy

3 min

20K

Тензор corporate blogHigh performance * PostgreSQL * SQL * Database Administration *

Case

Недавно попался на глаза примерно такой кусок запроса, и тут прекрасно примерно все:

• множество чтений из CTE (хоть и единственной записи, но все же);

• извлечение по каждому ключу текста с раскастовкой в jsonb;

• извлечение каждого отдельного json-ключа в каждое отдельное одноименное поле;

• "ручное" преобразование текстового представления массива в json в текстовое представление PostgreSQL.

А как - правильно?

Читать далее

+26

@Kilor Sep 13 2023 at 06:35

SQL HowTo: ближайший общий предок в дереве (LCA)

Medium

5 min

4.9K

Тензор corporate blogDatabase Administration * Algorithms * SQL * PostgreSQL *

Tutorial

В иерархических структурах регулярно возникает потребность определить ближайшего общего предка в дереве, он же наименьший общий предок (Lowest (Least) Common Ancestor).

Правда, "классические" алгоритмы для решения этой задачи работают лишь с парой узлов (раз, два, три, четыре), а мы, используя всю мощь PostgreSQL, будем решать задачу сразу для нескольких узлов.

Читать далее

+13

@Kilor Jul 31 2023 at 15:06

Всегда ли хорош Index Only Scan?

Medium

5 min

18K

Тензор corporate blogHigh performance * PostgreSQL * SQL * Database Administration *

Case

Среди применяемых в PostgreSQL методов доступа к данным Index Only Scan стоит особняком, считаясь у многих разработчиков "волшебной пилюлей" для ускорения работы запроса - мол, "Index Scan - плохо, Index Only Scan - хорошо, как только получим его в плане - все станет замечательно".

Как минимум, это утверждение неверно. Как максимум, при определенных условиях может вызвать проблемы чуть ли не на ровном месте.

Читать далее

+25

@Kilor May 25 2023 at 06:25

Кэш в JavaScript: не все Map'ы одинаково полезны

Easy

2 min

7.4K

Тензор corporate blogNode.JS * Programming * JavaScript * High performance *

Case

При разработке приложений регулярно возникает задача кэширования каких-то данных, которые из хранилища должны читаться много чаще, чем писаться. Давайте рассмотрим на примере простого теста, когда и на каком механизме эффективнее организовать его для JavaScript-приложения - на Map или на Object.

Читать далее

+14

@Kilor May 11 2023 at 14:40

SQL HowTo: замена в строке по набору

Easy

2 min

7.6K

Тензор corporate blogSQL * Programming * PostgreSQL * Abnormal programming *

Tutorial

Решим сегодня простую, казалось бы, задачу: как на PostgreSQL можно в строке провести замены по набору пар строк. То есть в исходной строке 'abcdaaabbbcccdcba' заменить, например, 'а' -> 'x', 'bb' -> 'y', 'ccc' -> 'z' и получить 'xbcdxxxybzdcbx'.

Фактически, мы попробуем создать аналог str_replace или strtr.

Читать далее

+9

@Kilor Feb 21 2023 at 05:35

SQL HowTo: крупицы золота в реестре

Hard

7 min

11K

Тензор corporate blogHigh performance * PostgreSQL * SQL * Algorithms *

Tutorial

В большинстве учетных систем, типа нашего СБИС, рано или поздно возникает проблема быстрого отображения реестра, в который по просьбам бизнес‑пользователей накручено несколько комбинируемых фильтров с очень редкой выборкой, ну никак не ложащихся в вашу красивую структуру базы данных и индексов базовой таблицы реестра — что‑нибудь типа "список продаж покупателям, чей день рождения выпадает на 29 февраля".

Универсального способа сделать «хорошо» тут нет, но я расскажу про модель запроса, которая позволит вам дать пользователю быстрый отклик, но при этом весьма эффективно с точки зрения PostgreSQL.

Читать далее

+18

@Kilor Jan 19 2023 at 12:31

Node.js: Клонирование ключей. Is eval() evil?

5 min

3.5K

Тензор corporate blogNode.JS * Programming * JavaScript * High performance *

Tutorial

На примере простой задачи клонирования ключей объекта посмотрим, есть ли реальные альтернативы по производительности столь презираемой JavaScript-разработчиками функции eval().

Подобная задача возникает, если оригинальное значение ключа надо оставить у объекта, а как-то обработанное - положить рядом в новый соответствующий ключ. То есть, для начала, из {"a" : 1, "b" : 2} надо получить {"a" : 1, "a-copy" : 1, "b" : 2, "b-copy" : 2}.

Пару лет назад я уже рассказывал, почему максимальная производительность подобных операций на JavaScript важна для нашего сервиса потокового анализа логов PostgreSQL, как можно поускорять парсинг с помощью WebAssembly, и вот сегодня - продолжение.

Читать далее

+12

@Kilor Jan 13 2023 at 12:40

PostgreSQL Antipatterns: Индиана Джонс и максимальное значение ключа, или В поисках «последних» записей

2 min

11K

Тензор corporate blogHigh performance * PostgreSQL * SQL * Database Administration *

Tutorial

Сегодняшняя задача вполне традиционна для любых учетных систем - поиск записей, содержащих максимальное значение по каждому из ключей. Что-то вроде "покажи мне последний заказ по каждому из клиентов", если переводить в прикладную область.

Кажется, что тут и споткнуться-то негде в реализации - но все оказывается совсем не тривиально.

Читать далее

+20

@Kilor Dec 26 2022 at 07:25

PostgreSQL в «Тензоре» — публикации за год (#3)

3 min

4K

Тензор corporate blogDatabase Administration * SQL * PostgreSQL * High performance *

Под занавес уходящего года предлагаю традиционно вспомнить, про какие интересные возможности и особенности работы с PostgreSQL мы рассказали в нашем блоге.

Если не видели дайджест за прошлый год — время наверстать упущенное!

Читать далее

+6

@Kilor Dec 8 2022 at 13:25

DBA: хранение списков — таблица, массив, строка?

4 min

20K

Тензор corporate blogERP-systems * Database Administration * SQL * PostgreSQL *

Достаточно часто при проектировании схемы БД возникает задача сохранить по основной сущности некоторый набор простых второстепенных данных.

Например, это могут быть ФИО сотрудников, принимающих участие во встрече, список приложенных к сообщению файлов или перечень отгружаемых по документу позиций.

Во всех этих случаях мы заранее понимаем, что список этот меняется редко и ни индексировать эти данные, ни искать по ним, ни извлекать отдельно от основной сущности (встречи, сообщения или документа), мы не захотим.

Давайте посмотрим, какие варианты хранения таких данных мы можем использовать в PostgreSQL, и какой из них окажется в разы более эффективным.

Читать далее

+14

@Kilor Dec 1 2022 at 13:16

PostgreSQL Antipatterns: простой(?) INSERT… VALUES

3 min

19K

Тензор corporate blogHigh performance * PostgreSQL * SQL * Database Administration *

Представим, что у вас есть некоторая табличка статистики, куда вы периодически скидываете таймстамп последнего "текущего" состояния в паре координат - например, (ID организации, ID сотрудника).

Как больно наступить на грабли в совсем простом, казалось бы, запросе?

Читать далее

+35

@Kilor Nov 1 2022 at 14:00

PostgreSQL, что в логе твоем?

3 min

14K

Тензор corporate blogData visualization * Database Administration * System Analysis and Design * PostgreSQL *

Наверняка, многие из вас пользуются explain.tensor.ru - нашим сервисом визуализации PostgreSQL-планов или уже даже развернули его на своей площадке. Но визуализация конкретного плана - это лишь небольшая помощь разработчику, поэтому в "Тензоре" мы создали сервис, который позволяет увидеть сразу многие аспекты работы сервера: медленные или гигантские запросы, возникающие блокировки и ошибки, частоту и результаты проходов [auto]VACUUM/ANALYZE.

И сегодня мы, наконец, готовы представить вам демо-режим этого сервиса, куда вы самостоятельно можете загрузить лог своего PostgreSQL-сервера и наглядно увидеть, чем он у вас занимается.

Читать далее

+29

@Kilor Oct 20 2022 at 07:45

Приручаем многопоточность в Node.js (часть 5/5: автомасштабирование под нагрузку)

19 min

9.1K

Тензор corporate blogHigh performance * JavaScript * Programming * Node.JS *

Tutorial

В прошлых частях цикла мы:

- рассмотрели базовые концепты работы с многопоточностью в JavaScript на примере среды Node.js;

- научились формировать общую очередь и каналы обмена данными и сигналами, чтобы более эффективно управлять загрузкой потоков;

- использовали разделяемую память и Atomics-операции как самое быстрое средство обмена большими блоками данных;

- и создали отдельный поток-координатор, чтобы устранить негативное влияние синхронного кода в основном потоке исполнения на загрузку потоков вспомогательных.

В сегодняшней, заключительной, части я продемонстрирую, как все эти механики вместе позволяют сделать эффективный микросервис, автоматически подстраивающийся под изменения входящей нагрузки.

В данном случае эффективность - это не про максимально возможную скорость обработки каждой отдельной задачи, а про сбалансированное использование аппаратных ресурсов с учетом тех ограничений, на которые мы готовы пойти. Особенно актуально это для различных "облачных" размещений, где оплата идет за фактически потребленные CPU и RAM.

Читать далее

+15

@Kilor Oct 4 2022 at 12:50

Приручаем многопоточность в Node.js (часть 4/5: координатор против синхронного кода)

11 min

5.3K

Тензор corporate blogNode.JS * Programming * JavaScript * High performance *

Tutorial

В предыдущей части мы научились эффективно передавать данные вспомогательным потокам из основного через разделяемую память, используя Atomics-операции и блокировки.

Но мы рассматривали все-таки идеальную ситуацию, когда основной поток больше ничем не занимался, кроме обмена с "подчиненными" уже заранее готовыми данными. В реальных же приложениях такое встречается достаточно редко - обычно эти самые данные приходится готовить непосредственно перед передачей. И, бывает, в этом участвует существенная доля синхронного кода, что для JavaScript крайне неприятно, но иногда неизбежно - например, при вычислении регулярных выражений.

Давайте оценим, насколько синхронные операции "роняют" производительность нашего тестового приложения. И узнаем, как можно в разы улучшить ее, "скрестив ужа с ежом", используя выделенный поток-координатор из позапрошлой части статьи совместно с разделяемой памятью.

Читать далее

+13

@Kilor Sep 29 2022 at 06:55

Приручаем многопоточность в Node.js (часть 3/5: разделяемая память, атомарные операции и блокировки)

12 min

1K

Тензор corporate blogNode.JS * Programming * JavaScript * High performance *

Tutorial

В предыдущей части мы остановились на мысли, что минимизировать простой вспомогательных потоков нашего приложения можно, если заставить их самих получать себе задачи, не дожидаясь, пока их загрузит кто-то другой со стороны.

Но тут возникает две проблемы:

1. как эффективно доставить данные в обрабатывающий поток

2. как распределять задачи между активными потоками, чтобы ничего не пропустить, но и дважды не обработать

В этом нам как раз и помогут два рассматриваемых в этой статье концепта работы с многопоточностью: разделяемая (shared) память и потокобезопасные (thread-safe, Atomics) операции над ней.

Читать далее

+21

@Kilor Sep 26 2022 at 05:45

Приручаем многопоточность в Node.js (часть 2/5: очередь, каналы и координатор)

16 min

11K

Тензор corporate blogHigh performance * JavaScript * Programming * Node.JS *

Tutorial

В первой части статьи мы остановились на моменте, когда с помощью распределения задач между потоками по алгоритму Round-robin мы добились-таки ускорения работы приложения за счет многопоточности.

Но вот неприятность: такой алгоритм очень неравномерно нагружает потоки и не полностью утилизирует их возможности - пока кто-то простаивает, другой уже копит очередь. Как это можно обойти?

Читать далее

+14

3

4 5 ...