Комментарии / Профиль lesovsky / Хабр

Алексей Лесовский@lesovsky

Разработка инструментов для PostgreSQL

Подписчики

ПрофильСтатьи25ПостыНовостиКомментарии193

Анализ производительности блочных устройств с blktrace

lesovsky 29 окт 2013 в 17:13

Спасибо, а можете привести пару прикладных кейсов где пришлось использовать blktrace?
Имею ввиду в вашей компании.

«Идеальный» www кластер. Часть 1. Frontend: NGINX + Keepalived (vrrp) на CentOS

lesovsky 25 окт 2013 в 13:16

Хорошее how-to, с достаточно хорошо прокоментированными конфигами. Но имхо, недостаточно объяснений, например:
1) Почему используется именно такая конфигурации keepalived? Она избыточна и это неспроста, а вот почему не рассказано.
2) Почему удаляете хосты по умолчанию и приводите их к совершенно другому виду.
3) Это очень важный шаг: net.ipv4.ip_nonlocal_bind=1 — Почему?

HAPRoxy для Percona или Galera на CentOS. Его настройка и мониторинг в Zabbix

lesovsky 23 окт 2013 в 12:53

поторопился с первым каментом, напишу более развернуто. я протестую против ALL в конце,
я бы сделал так «zabbix ALL=(root) NOPASSWD: /usr/bin/socat»
а то ваш вариант приравнивает аккаунт zabbix'а почти к руту.

вот тоже неплохой пример если уже есть определенная политика в отношении sudo для других пользователей

Cmnd_Alias ZABBIX = /bin/cmd1, /sbin/cmd2, /usr/sbin/cmd3
zabbix ALL=(root) NOPASSWD: ZABBIX

HAPRoxy для Percona или Galera на CentOS. Его настройка и мониторинг в Zabbix

lesovsky 23 окт 2013 в 12:36

>> zabbix ALL=(ALL) NOPASSWD: ALL
это еще что за жесть?

Ускоряем базу данных. Bcache

lesovsky 7 июн 2013 в 13:22

Около года используем FlashCache в продакшене под postgresql базами, отзывы только положительные. Отличия:
Flashcache основан на devoce-mapper поэтому перед тем как начать его использовать, нужно «слепить» гибридный dm-том из имеющегося тома и SSD-тома/раздела/диска. И потом это гибридное устройство монтировать и использовать.
Bcache (как и EnhanceIO) это отдельный блочный драйвер, не использующий device-mapper слой.
Оба отличаются подходом в создании томов (в flashcache мне как-то показалось проще это устроено, bcache показался непривычным flashcache… а enhanceio вобще показался сказкой, но он медленный это правда + пару раз ловил kernel panic).

Резервное копирование и восстановление в PostgreSQL

lesovsky 14 мая 2013 в 08:30

то достаточно делать бэкапы непосредственно перед ними

да, можно дергать DBA «эй, сделай-ка нам дамп», но я за автоматизацию)))

Резервное копирование и восстановление в PostgreSQL

lesovsky 14 мая 2013 в 08:28

это я))) мы пару лет назад общались по аське на тему постгреса… у меня контакт до сих пор сохранился)))

Резервное копирование и восстановление в PostgreSQL

lesovsky 14 мая 2013 в 03:17

>> на мастере в команде архивирования надо указывать путь к папке на реплике, чтобы мастер туда складывал wal-файлы на время активного pg_base_backup при первоначальной «наливке» реплики
Необязательно складывать архивы на реплику. Можно складывать локально, а потом на слейве указать restore_command = 'scp user@master:/path/to/archive/%f "%p"'. Пусть берет их по сети.

Резервное копирование и восстановление в PostgreSQL

lesovsky 13 мая 2013 в 18:29

Наоборот старался сократить объем, в развернутом виде, как мне показалось, получилось слишком много текста и выглядит нудно (более подробно расписал пункты реализации).
скрипты да, требуют тщательного изучения т.к. при работе могут создать определенную нагрузку

Еще пара слов о потоковой репликации в postgres…

lesovsky 24 мар 2013 в 06:26

c pg_basebackup получается так. Вы заходите на свой сервер который хотите сделать слейвом, создаете там каталог «dest_dir» в котором будет жить реплика и выполняете там pg_basebackup -P -v -h master_ip -U postgres -D dest_dir (не забываем про pg_hba.conf на мастере)
pg_basebackup выполнит подключение к указанному серверу по протоколу репликации, сделает чекпойинт черезpg_start_backup и начнет передавать данные в ваш каталог дест_дир, по завершению сделает pg_stop_backup. Вам остается сделать chown -R postgres: dest_dir, указать recovery.conf и запуститься. Постгрес прочитает recovery.conf и запустится в соответствии с ним (прочитает нужные wal-архивы и догонит мастера). Все слейв готов))

Еще пара слов о потоковой репликации в postgres…

lesovsky 24 мар 2013 в 06:19

начиная с 9.2 стендбай тоже умеет отдавать.
With 9.2, a standby can also send replication changes, allowing cascading replication.
wiki.postgresql.org/wiki/What's_new_in_PostgreSQL_9.2#Replication_improvements

Еще пара слов о потоковой репликации в postgres…

lesovsky 23 мар 2013 в 09:13

pg_ctl не может быть «не в комплекте», скорей всего он не прописан в PATH (наверное у вас RHEL/CentOS), поищите, найдется.
триггер файл открывает хот-стендбай для записи, а собственно чем отличает мастер от хот-стендбая? именно возможностью записи)) так что тут игра слов… После создания триггер файла вы получаете standalone постгрес сервер. И последующая настройка потоковой это уже отдельное дело.

Еще пара слов о потоковой репликации в postgres…

lesovsky 23 мар 2013 в 09:08

При настройке потоковой репликации, всегда стоит помнить про триггерный файл. провозглашение хот-стендбая в мастер становится делом нескольких секунд.
Архивы WAL рекомендуется бэкапить на отдельный узел, чтобы в случае аппаратных проблем на мастере, хот-стендбай мог их подтянуть для себя.
Используйте pg_basebackup, он делает тоже самое что и pg_start/stop_backup + rsync, но в одной command line.

Проектирование высокопроизводительных систем: о чем не расскажут в книгах

lesovsky 4 мар 2013 в 04:07

Более детальней посмотрите на раздел с описанием использования ресурсов, оф.справка PG всегдя является хорошей отправной точкой.
Почитать про оптимизацию постгреса можно в блогах, например у Depesz, у него достаточно часто появляется свежая инфа и есть статьи с фундаментальными вещами.

Проектирование высокопроизводительных систем: о чем не расскажут в книгах

lesovsky 4 мар 2013 в 03:54

У постгреса или kvm?
Постгрес по умолчанию настроен на работу таким образом как будто он запущен на машине с памятью меньше 1GB (shared_buffers) на одном диске (effective_io_concurrency) и как-будто в него совсем не будет записи (checkpoint_segments). Пожалуй к этому можно добавить ident авторизацию (по умолчанию в RHEL/CentOS) которая вводит в прострацию новичков)))).
В KVM может использоваться дефолтное кэширование (writethrough) которое во некоторых случаях не идеально (гости на внешних хранилищах по iSCSI или NFS). Не используются hugepages, отключены некоторые вкусные процессорные флаги. Паравиртуальные драйвера для устройств опять же не всегда по умолчанию.

Проектирование высокопроизводительных систем: о чем не расскажут в книгах

lesovsky 3 мар 2013 в 16:36

Дефолтные настройки postgresql вообще ни к черту.
Дефолтные параметры запуска KVM зачастую нацелена на универсальную возможность запуска виртуалки на любом железе (производительность же второстепенна).

Table bloat? Не, не слышал…

lesovsky 22 фев 2013 в 19:59

Если не секрет, расскажите поподробнее про «самописец — кольцевой», а то на уме одни догадки и гипотезы. В частности интересует общая схема, взаимосвязь компонентов, версии софта, причины почему используется такая схема.

>> несколько разные понятия.
да разные понятия, но цель преследуется общая, снизить размер индексов (кстати на графике в процессе работы над таблицей, незаметно чтобы индексы росли в размерах… хз почему так, такто должны были)

Table bloat? Не, не слышал…

lesovsky 22 фев 2013 в 09:28

Да, fill factor очень полезен, нужно только заранее спрогнозировать дополнительное место, т.к. таблица будет занимать больше места чем собственно данные. И это дествительно только для UPDATE'ов.

Table bloat? Не, не слышал…

lesovsky 22 фев 2013 в 09:20

>> Во-первых, INSERT никоим образом не раздувает таблицу, а лишь добавляет туда данные, собственно, как и DELETE — он просто не освобождает.
я не писал что INSERT раздувает таблицу. Раздувание идет за счет сочетающихся INSERT и DELETE.

>> Во-вторых, обратите внимание на ваши индексы после фейковых
ой, это известная проблема,… не зря там есть функция перестроения индексов (вы что не читали список возможностей?)

>> В итоге надо последовательно и инкрементально апдейтить записи. лучше идя от физического конца.
об этом тоже написано, четвертый абзац: «Если обновлять таблицу с помощью т.н. fake updates, типа some_column = some_column с последней страницы» (да хватит уже читать по диагонали)

>> Сам я в экстренных случаях использую «перекладывалку»
Сами то почему pg_reorg не используете? потому что есть риски. А вот погуглите про pgcompactor, о нем вобще интернеты не знают.

Имхо вы немножко поторопились с ответом и вывали все на горячую голову не осмыслив написаного (сложилось впечатление что читали текст по диагонали). Середина и конец коментария уже более вменяемея и есть конструктив относительно PG 8. (Про него я вообще ничего не могу сказать, т.к. не работал с ним).

Table bloat? Не, не слышал…

lesovsky 22 фев 2013 в 04:35

Насколько мне известнт pg_reorg работает через создание новой таблицы и навешивание триггеров на старую и затем переносит данные из старой таблицы в новую (раньше было так, а сейчас может принцип работы тулзы и изменился).
Если интересно, еще есть compact_table от depesz.

1 2 ...

6 7

9 10