Комментарии / Профиль vadv / Хабр

Васильев Дмитрий@vadv

Пользователь

Подписчики

ПрофильСтатьи6ПостыНовостиКомментарии138

Релиз открытого приложения для мониторинга системы Mission Center 1.0.0

vadv 12 мая 2025 в 09:56

на самом деле еще очень далеко до уиндоус :)
например: покажи историю с какой скоростью читает процесс X из файла Y.

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 10 июл 2021 в 06:38

Эпизодический запуск pg_repack, даже раз в неделю, будет проносить профит: он сделает индексы компактнее и быстрее. Принесет ли профит кластеризация по индексу конкретно вам я не могу сказать, так как все зависит от ваших запросов.
Другого использования pg_repack не предусмотренно

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 9 июл 2021 в 11:43

alexeiivanov

И в том и в другом случае включен FPW (full page write), но средний размер записи в wal у bigserial меньше.
А происходит это потому что FPW записывается только после первой модификации страницы.
В случае с UUID — переиспользование буферов в буферном пуле маленькое и там мы пачкаем "новые" страницы чаще и чаще вызываем FPW.

Так что я оказался прав, запись WAL связана с вытеснением страниц из буфера, прав но отчасти :)

UUID:
rmgr: Heap        len (rec/tot):     54/  1378, tx: 2255313124, lsn: 2E5/1A036540, prev 2E5/1A036500, desc: INSERT off 25 flags 0x00, blkref #0: rel 1663/14010/24831 blk 703953 FPW
rmgr: Btree       len (rec/tot):     53/  8157, tx: 2255313124, lsn: 2E5/1A036AA8, prev 2E5/1A036540, desc: INSERT_LEAF off 8, blkref #0: rel 1663/14010/24832 blk 287891 FPW

bigserial:
rmgr: Heap        len (rec/tot):     71/    71, tx: 2255587536, lsn: 2E5/33FFFAC0, prev 2E5/33FFFA98, desc: INSERT off 41 flags 0x00, blkref #0: rel 1663/14010/24838 blk 24892
rmgr: Btree       len (rec/tot):     64/    64, tx: 2255587536, lsn: 2E5/33FFFB08, prev 2E5/33FFFAC0, desc: INSERT_LEAF off 83, blkref #0: rel 1663/14010/24843 blk 12623

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 9 июл 2021 в 10:52

в случае с bigserial:

pg_waldump pg_wal/00000001000002E4000000E9 | awk '{print $14}' | sort | uniq -c
  92288 COMMIT
  91804 INSERT
    489 INSERT+INIT
  92042 INSERT_LEAF
    252 INSERT_UPPER
   2797 LOG
    253 SPLIT_R
      3 ZEROPAGE

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 9 июл 2021 в 10:46

в случае с UUID v4

pg_waldump pg_wal/00000001000002E4000000B8 | awk '{print $14}' | sort | uniq -c
   2723 COMMIT
      5 DEDUP
   2703 INSERT
     18 INSERT+INIT
   5423 INSERT_LEAF
     18 INSERT_UPPER
      7 SPLIT_L
     11 SPLIT_R

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 9 июл 2021 в 06:40

сброс буферов на диск через WAL не проходит

хм, вы правы, а тут я не прав, каюсь :)
запустил тест еще раз и после этого натравлю pg_waldump

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 8 июл 2021 в 17:29

поиск по uuid, подозреваю, тоже ускорится. vadv, не хотите проверить?
наверное зависит от запросов, а подскажите что именно проверить?

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 8 июл 2021 в 17:27

привет alexeiivanov !

тестирование проводилось на 8GB Ram, shared_buffers 2GB, max_clients 100, 4 CPU, 7k IOPS:
```
number of clients: 20
number of threads: 2
duration: 21600 s
```
генерируется много WAL потому что запросам (бакендам) приходилось вытеснять грязные страницы на диск, так как не хватало место в shared_buffers

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 6 июл 2021 в 19:38

PostgreSQL проверяет области видимости и ему приходится таскать страницы из истории в случае с неравномерным индексом, поэтому хотелось показать насколько это важно — индекс по равномерным данным. Если вы историю будете хранить на медленном IO с неравномерным индексом — это вас погубит.

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 6 июл 2021 в 19:36

Речь о том как сделать так, что бы вычитка большого числа строк из таблицы работала ещё быстрее, при использовании индекса по полю с условно рандомным значением.

ну не совсем так, речь про эффективный кэш, стабильный buffer pool в котором лежат стабильные части "горячих" данных — последний день, месяц.

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 6 июл 2021 в 09:15

В других СУБД есть возможность Clustered indexes (MSSQL, MySQL, Oracle) со своими особенностями. В PostgreSQL такой важной возможности нет, есть CLUSTER и сторонний pg_repack, с чем живем то и обслуживаем.

Почему PostgreSQL тормозит: индексы и корреляция данных

vadv 6 июл 2021 в 08:49

Вы правы, я намерено выбрал самый неудачный для моего случая UUID v4. Согласен, что лучше использовать стандартные решения, или прокачивать их.
Но задача была не перепробовать все UUID, а показать насколько может тормозить индекс и почему. Дать повод разработчикам задуматься о том что недостаточно просто построить индекс, надо понимать как он будет работать и как его обслуживать в дальнейшем. Поэтому для примера добавил известные решения, что бы дать волю экспериментам :)

Хорошие новости для тех, кто всё ещё использует row-level локи в PostgreSQL

vadv 19 мая 2021 в 09:25

Спасибо, Григорий! Опечатку в тексте исправил, речь конечно была про row-level локи

Восстановление данных PostgreSQL после потери pg_control

vadv 24 июл 2020 в 08:39

Select вызывает запись при обновлении страниц после hot-update

select всегда вызывает запись (переписывает страницы при full_page_write) если находит закомиченные в clog, но не помеченные как закомиченные данные в data.

Как работать с Postgres в Go: практики, особенности, нюансы

vadv 2 авг 2019 в 07:49

мощная индексация по json

Стоит обратить внимание, что по json просто нельзя собрать статистику.
А база, планер которой работает по весовой схеме, просто не может нормально работать без статистики.

Но надеюсь скоро исправят, здесь smagen писал: http://akorotkov.github.io/blog/2015/09/07/jsonb_statistics/ для 10-ки точно еще актуально.

Последние изменения в IO-стеке Linux с точки зрения DBA

vadv 11 июл 2019 в 12:49

ну как откуда, в control-файле же информация про два checkpoint'а

Java vs GO. Тестирование большим числом пользователей

vadv 3 окт 2018 в 16:45

потестили как быстро pg открывает коннект, поздравляю

Обзор ноутбука Dell XPS 13 9370: лёгкий, красивый, быстрый

vadv 2 окт 2018 в 13:33

dell precision 5510 — меняли бесплатно батарею с такой же проблемой (в гарантийный срок) в http://screspect.ru/

Kubernetes в production: сервисы

vadv 24 сен 2018 в 17:04

Николай, спасибо за статью!
Как можно решить с помощью envoy можно проблему пинания 504 от апстрима к апстриму?

Индексы в PostgreSQL — 1

vadv 20 апр 2017 в 12:46

ни колонок переменной длины, а содержит в основном значения типов integer и timestamp.

дело в движке:

каждый индекс живет своей отдельной жизнью от данных
каждое обновление строки не делает обновление по месту, а создает новую версию строки и для каждой новой версии появляется такая же новая запись в индексе.

обслуживание

обычно через concurrency создают такой же индекс и удаляют старый, были баги в 9.4 с репликами, когда новый индекс не подхватывался, сейчас устранено.

2 3 ...

6 7