Комментарии / Профиль miruzzy / Хабр

обычный людь :)

Профиль Публикации 3Комментарии 51Закладки

https://www.postgrespro.ru/education/courses
Ну как минимум вот эти курсы довольно хороши

Из книг - ну если нужно что-то на русском языке - опять же от этих ребят есть 2 книги по постгресу. Одна у Рогова, вторая у Моргунова

Посмотреть

Пакетная обработка в PostgreSQL

miruzzy 26 июн в 00:16

Плюсом можно подключить нелогируемые таблицы и поработать с настройкой work_mem.

Что, зачем это делать, как это поможет и при каких условиях ?

DO $$
BEGIN
  FOR i IN 1..1000 LOOP
    INSERT INTO my_table (column1, column2)
    VALUES (i, i * 2);
  END LOOP;
END $$;

А это что такое, почему не generate_seriaes ? ( тот же вопрос и про удаление ( коммент был выше, да и вообще, почему не транкейт ? )

Раз уж массовая производительная обработка, то почему нет `merge` ?

Просто вброс какой-то инфы, взятой из разных источников, вообще не информативно ничего.

Посмотреть

Go и pgx. Пагинация в запросах к БД Postgres

miruzzy 22 июн в 00:29

Давайте я вам предложу способ получше:

возьмите приблизительное количество строк из статистики

select 
  *,
  (
    select n_live_tup 
    from pg_stat_user_tables 
    where relname = 'clients'
    /*добавь схему ещё*/
  )
from clients
offset 10
limit 10

UPD

Если вы хотите очень приблизительный результат ( допустим, у вас условия по выборке идёт и вы не можете применить выше ) - запустите explain и вытяните кол-во записей из планировщика. ( конечно, если у вас данные нормально распределены )

Ну ещё кэши запросов есть на всякий ( внешний кэш имею в виду )

-1

Посмотреть

Три основных способа оптимизировать ваши запросы в PostgreSQL

miruzzy 27 мая в 14:08

Скорее это оптимизация работы кластера

Индексы - оптимизация чтения ( выполнения запросов)

А вот оптимизация запросов - это правильно писать сами запросы

Посмотреть

Хеш-Индексы в PostgreSQL

miruzzy 24 мая в 11:19

-- Поиск без индекса
SET enable_seqscan = OFF;

Что-то явно напутали :)

+ по хорошему - надо бы делать все тесты на именно на холодном кэше, ну или грязном. А судя по второму плану - там явно всё уже было в кэше.

+ интересно, что статистика по таблице поменялась :) :)

+ сравнение поиска без индекса и с индексом - ну это такое себе. Лучше уж сравнивать тот-же b-tree и hash. Ну и сразу показать разницу между поиском по уникальным значениям и когда значения часто повторяются

+ мб я уже сильно далеко захожу. Но можно было вкратце объяснить, как работает именно поиск + что делает hash_mem_multiplier при этом

А вообще, хотелось бы кое-что добавить сюда:

Хэш-индекс не умеет в `index only scan` , поскольку он всегда проверяет строку в в таблице. У b-tree такой проблемы нет из-за карты видимости
Он меньше весит, чем b-tree, но строится в 1 поток ( btree умеет в многопоточку). ЗЫ это инфа старая, мб сейчас умеет, точно не знаю
Хэш-фукнция работает только с операциями равенства ( т.е. column = value ), другие операции ему не доступны. B-tree умеет в поиск по интервалам, поскольку у него всё отсортировано
Не умеет в UNIQUE
Не умеет в INCLUDE
И самое главное - hash-индекс очень помогает, когда вы его правильно употребляете. Ради примера: соединение больших наборов строк по нескольким столбцам сразу. Вы можете увидеть, что планировщик и так решает делать hashJoin, вот вы можете прекрасно базе помочь - просто сделайте по большой таблице хэш-индекс сразу по столбцам, которые участвуют в присоединении

Посмотреть

Мысли вслух По итогам многолетней практики...

miruzzy 2 апр в 18:46

Добавь ещё:

Откуда я знаю, что запрос тормозит, я его через орм генерировал)

Посмотреть

Мысли вслух По итогам многолетней практики...

miruzzy 2 апр в 12:30

P. S. Особенно вредно и абсолютно непродуктивно менять параметры СУБД во время аварийной ситуации(что как раз и очень любят настойчиво требовать разнообразные манагеры).

А разработчики ?))

увидел в аналайзе, что при большом запросе оч много чтения происходит ( не лежало в shared_buffers ) и сразу давай увеличивать буфер )

Или выполнялась долго группировка - ай-да увеличим воркмем до 2Гб ( и 200 коннектов оставим ) :)

Ну ещё из крижа - медленно записывается в БД - отключи wal и fsync

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 24 мар в 13:40

Пока-что для проверки можно взять функционал из раздела генерации "добивочных" миграций, а именно ( первые 2 пункта взяты):
1) Возьмём клон dev-базы
2) Накатим туда весь МР
3.1) Меньше рисков: сравним с фич-БД, путём сравнивания именно генерации файлов ( обработанный выхлоп pg_dump)
3.2) Альтернативный вариант, но больше рисков: сравнение сделать не через структуру файлов, а через диф-утилиту

Конечно, надо понимать, что ни первый, ни второй вариант не спасут от ошибки, если в результате МР мы создаём уникальный индекс по уже существующему полю, а там есть дубли.
Тут могут вызникнуть некоторые проблемы, которые будут зависеть от того, каким инструментом заливки пользоваться

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 24 мар в 13:22

Уточните, пожалуйста, вы имеете в виду проверку именно правильности выполнения миграций или вообще проверки кода, не связанные с тематикой статьи ?

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 23 мар в 10:24

Ну генерировать скрипты на удаление и создание.
Как вариант с другой стороны - не допускать такой архитектуры в системе ( ну или как-то абстрагировать структуры )

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 23 мар в 09:57

то есть, я явно выразил намерение заменить функцию

Ну так функция уйдёт под замену, если выполняется 3 условия:

Совпадает название
Совпадают типы входных параметров
Совпадают типы выходных параметров

В остальных случаях будет создание новой функции

Причём сохранить DDL надо всех объектов рекурсивно, так как это представление может использоваться в другом представлении, а то — в следующем. Это решаемая задача, но огромный геморрой.

Ну так а для чего предлагается хранение в гите ?
Как раз для того, чтобы вы точно видели, что у вас меняется в структуре

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 23 мар в 01:25

в любом случае, если во время разработки вы дропните что-то - система всё равно делает дамп и показывает на файлах, что случилось ( т.е. в гите в МР вы увидите, что у вас удалилось в итоге )

Мы пока ещё не дошли до теста удаления вью и 100% не могу сказать, на сколько система сможет полностью восстановиться ( пересоздать вьюшки )

ЗЫ добавлю, что мы не так часто используем вью. Например, если клиент не гибкий ( например даталенз ).

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 23 мар в 01:12

К сожалению, иногда PostgreSQL ругается на функции, используемые в других функциях, а иногда нет.

Я могу сейчас ошибаться.
Но функции на plpgsql у вас кэшируются при первом выполнении ( строится план и кэшируется в локальной памяти процесса )

Так вот, как мне кажется, если удалили функцию после кэширования и создали новую - можно получить ошибку ( хотя я такого не встречал, если честно )

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 23 мар в 01:06

не не, всё дело в том, что VIEW у PG хранится уже как скомпиленная ( разобран SQL-запрос в свой формат ).
Т.е. если иначе представить - ПГ во вьюхе стучится не по названию и входных параметрам, а по oid функции ( удалили функцию, потеряли oid )

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 22 мар в 19:12

Представления зависят, при дропе надо будет пересоздавать вьюхи

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 22 мар в 12:21

100, 101 и 102
Это как раз пример того, как собирают код в миграции ( это всё разные файлы версии БД )

Поэтому они даже гит-конфликтом не отловятся

Посмотреть

Альтернативный вариант к подходу хранения SQL-кода в репозитории и его разработке

miruzzy 22 мар в 10:58

CREATE OR REPLACE FUNCTION или CREATE OR REPLACE PROCEDURE. А как еще?

Это понятно, что такие скрипты. Как вы эти скрипты на прод зальёте ?
Руками или через какой-то софт ? ( я намекаю, что софт кушает как раз миграции ( файлы со скриптами) для БД )

В ветке контура не только интеграционное и нагрузочное, но даже просто полноценное тестирование произвести в общем случае невозможно. Для контуров БД обрезается многократно до скромных не более чем сотни гигабайт.

Никто вам не мешает использовать,, условно ZFS и быстро откатываться назад

А замораживать на несколько дней тестирования релиза основную ветку разработки - не лучшая идея. Особенно, если релизный цикл всего 1-2 недели.

Вводите промежуточный сервер
Я не понимаю, при чём тут рассмотрение стейджей ревью, тестирования и т.д. к теме этой статьи ( я напомню, что статья про хранение скриптов для версионирования БД )