Kilor 26 мар 2020 в 10:20

Рецепты для хворающих SQL-запросов

7 мин

51K

Блог компании ТензорPostgreSQL*SQL*Администрирование баз данных*Визуализация данных*

Несколько месяцев назад мы анонсировали explain.tensor.ru — публичный сервис для разбора и визуализации планов запросов к PostgreSQL.

За прошедшее время вы уже воспользовались им более 6000 раз, но одна из удобных функций могла остаться незамеченной — это структурные подсказки, которые выглядят примерно так:

Прислушивайтесь к ним, и ваши запросы «станут гладкими и шелковистыми». :)

А если серьезно, то многие ситуации, которые делают запрос медленным и «прожорливым» по ресурсам, типичны и могут быть распознаны по структуре и данным плана.

В этом случае каждому отдельному разработчику не придется искать вариант оптимизации самостоятельно, опираясь исключительно на свой опыт — мы можем ему подсказать, что тут происходит, в чем может быть причина, и как можно подойти к решению. Что мы и сделали.

Давайте чуть подробнее рассмотрим эти кейсы — как они определяются и к каким рекомендациям приводят.

Для лучшего погружения в тему сначала можно послушать соответствующий блок из моего доклада на PGConf.Russia 2020, а уже потом перейти к детальному разбору каждого примера:

индексная «недосортировка»
пересечение индексов (BitmapAnd)
объединение индексов (BitmapOr)
читаем много лишнего
разреженная таблица
чтение с «середины» индекса
CTE × CTE
swap на диск (temp written)
неактуальная статистика
«что-то пошло не так»

#1: индексная «недосортировка»

Когда возникает

Показать последний счет по клиенту «ООО Колокольчик».

Как опознать

-> Limit
   -> Sort
      -> Index [Only] Scan [Backward] | Bitmap Heap Scan

#2: пересечение индексов (BitmapAnd)

Когда возникает

Показать все договоры по клиенту «ООО Колокольчик», заключенные от имени «НАО Лютик».

Как опознать

-> BitmapAnd
   -> Bitmap Index Scan
   -> Bitmap Index Scan

#3: объединение индексов (BitmapOr)

Когда возникает

Показать первые 20 самых старых «своих» или неназначенных заявок для обработки, причем свои в приоритете.

Как опознать

-> BitmapOr
   -> Bitmap Index Scan
   -> Bitmap Index Scan

#4: читаем много лишнего

Когда возникает

Как правило, возникает при желании «прикрутить еще один фильтр» к уже существующему запросу.

«А у вас нет такого же, но с перламутровыми пуговицами?» х/ф «Бриллиантовая рука»

Например, модифицируя задачу выше, показать первые 20 самых старых «критичных» заявок для обработки, независимо от их назначенности.

Как опознать

-> Seq Scan | Bitmap Heap Scan | Index [Only] Scan [Backward]
   && 5 × rows < RRbF -- отфильтровано >80% прочитанного
   && loops × RRbF > 100 -- и при этом больше 100 записей суммарно

#5: разреженная таблица

Когда возникает

Разнообразные попытки сделать собственную очередь обработки задач, когда большое количество обновлений/удалений записей на таблице приводят к ситуации большого количества «мертвых» записей.

Как опознать

-> Seq Scan | Bitmap Heap Scan | Index [Only] Scan [Backward]
   && loops × (rows + RRbF) < (shared hit + shared read) × 8
      -- прочитано больше 1KB на каждую запись
   && shared hit + shared read > 64

#6: чтение с «середины» индекса

Когда возникает

Вроде и прочитали немного, и все по индексу, и никого лишнего не фильтровали — а все равно прочитано существенно больше страниц, чем хотелось бы.

Как опознать

-> Index [Only] Scan [Backward]
   && loops × (rows + RRbF) < (shared hit + shared read) × 8
      -- прочитано больше 1KB на каждую запись
   && shared hit + shared read > 64

#7: CTE × CTE

Когда возникает

В запросе набрали «жирных» CTE из разных таблиц, а потом решили сделать между ними JOIN.

Кейс актуален для версий ниже v12 или запросов с WITH MATERIALIZED.

Как опознать

-> CTE Scan
   && loops > 10
   && loops × (rows + RRbF) > 10000
      -- слишком большое декартово произведение CTE

#8: swap на диск (temp written)

Когда возникает

Разовая обработка (сортировка или уникализация) большого количества записей не влезает в выделенную для этого память.

Как опознать

-> *
   && temp written > 0

#9: неактуальная статистика

Когда возникает

В базу влили сразу много, но не успели прогнать ANALYZE.

Как опознать

-> Seq Scan | Bitmap Heap Scan | Index [Only] Scan [Backward]
   && ratio >> 10

#10: «что-то пошло не так»

Когда возникает

Случилось ожидание блокировки, наложенной конкурирующим запросом, или не хватило аппаратных ресурсов CPU/гипервизора.

Как опознать

-> *
   && (shared hit / 8K) + (shared read / 1K) < time / 1000
      -- RAM hit = 64MB/s, HDD read = 8MB/s
   && time > 100ms -- читали мало, но слишком долго

Рецепты для хворающих SQL-запросов

#1: индексная «недосортировка»

Когда возникает

Как опознать

Рекомендации

#2: пересечение индексов (BitmapAnd)

Когда возникает

Как опознать

Рекомендации

#3: объединение индексов (BitmapOr)

Когда возникает

Как опознать

Рекомендации

#4: читаем много лишнего

Когда возникает

Как опознать

Рекомендации

#5: разреженная таблица

Когда возникает

Как опознать

Рекомендации

#6: чтение с «середины» индекса

Когда возникает

Как опознать

Рекомендации

#7: CTE × CTE

Когда возникает

Как опознать

Рекомендации

#8: swap на диск (temp written)

Когда возникает

Как опознать

Рекомендации

#9: неактуальная статистика

Когда возникает

Как опознать

Рекомендации

#10: «что-то пошло не так»

Когда возникает

Как опознать

Рекомендации