PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

a_belyaev 18 ноя 2021 в 08:30

Роковой каскад: JIT, и как обновление Postgres привело к 70% отказов на национальном сервисе критической важности

12 мин

20K

Блог компании HaulmontPostgreSQL*Microsoft Azure*Облачные сервисы*

Перевод

Сайт мониторинга ситуации по коронавирусу Соединенного Королевства - основной сервис отчетности во время пандемии COVID-19 для всей страны. Он испытывает нагрузку порядка 45–50 миллионов запросов в день и относится к национальным сервисам критической важности.

Мы работаем в соответствии с архитектурой active-active, что значит, у нас есть минимум две, часто - три экземпляра каждого сервиса, которые запущены в разных географических локациях.

Есть только одно исключение - наша база данных. Сервис работает с использованием специальной версии PostgreSQL: Hyperscale Citus. Тот факт, что наша база данных не соответствует архитектуре active-active — это не следствие того, что мы не знаем, как делать реплики для чтения, скорее - результат логистических проблем, обсуждение которых выходит за рамки этой статьи.

Тем не менее, база данных работает в высокодоступной экосистеме, где сбойный экземпляр может быть заменен в течение пары минут.

И что же могло пойти не так?

+39

stratnevpy 15 окт 2021 в 06:41

Опыт миграции кластера PostgreSQL на базе Patroni

17 мин

25K

Блог компании ФлантСистемное администрирование*PostgreSQL*Базы данных*

Туториал

Недавно мне посчастливилось заниматься переносом кластера PostgreSQL под управлением Patroni на новое железо. Задача казалась простой — я и не думал, что могут возникнуть проблемы. Но в процессе реализации встретились некоторые сложности, которые натолкнули на мысль поделиться полученным опытом. В этой работе описываются практические шаги и нюансы, которые встретились во время переноса кластера на новую платформу. Использовались следующие версии ПО: PostgreSQL 11.13, Patroni 2.1.1, etcd 3.2.17 (API version 2). Итак, поехали!

+48

alexey_and_kazakov 12 окт 2021 в 08:00

SQL в SQLAlchemy

14 мин

69K

Блог компании ДомкликPython*PostgreSQL*SQL*

Меня зовут Алексей Казаков, я техлид команды «Клиентские коммуникации» в Домклик. По моему опыту подавляющее большинство приложений, взаимодействующих с базой данных, использовали для этого Object Relational Mapper. В этой статье я продолжу знакомить вас с популярными ORM, которые встречались мне в продовых проектах. На очереди всемогущий SQLAlchemy.

+26

lodz 6 окт 2021 в 10:26

Популярные расширения для PostgreSQL: как установить и для чего использовать

5 мин

16K

Блог компании SelectelIT-инфраструктура*PostgreSQL*SQL*Базы данных*

Облачные базы данных Selectel поддерживают 40 расширений для PostgreSQL. Некоторые добавляют небольшие радости оптимизации баз данных, другие — заменяют отдельные модули разработки на стороне приложения. На данный момент расширениями пользуются 26% пользователей DBaaS. Мы узнали, какие экстеншены наиболее популярны у клиентов и где они их применяют.

Если вы опытный DBA, вы точно нужны в комментариях — расскажите, какие расширения используете и как они решают ваши задачи.

Читать дальше →

+44

keddok 6 окт 2021 в 09:14

Что должен, но не знает про конкуренцию в PostgreSQL каждый разработчик?

13 мин

22K

Веб-разработка*PostgreSQL*SQL*

Из песочницы

Опыт показывает, что разработчики редко задумываются о проблемах, которые могут возникать при многопользовательском доступе к данным. При этом практически любое web-приложение является многопользовательским и так или иначе использует блокировки при доступе к данным в БД. При неправильном использовании эти блокировки могут больно бить по пользователям, а иногда и по системе в целом. Поэтому рано или поздно каждый разработчик многопользовательских систем должен задуматься о том, как ему начать работать с БД так, чтобы пользователи не мешали другу другу. Многие считают, что это сложно, давайте вместе убедимся, что это не так.

+42

IvanVakhrushev 19 сен 2021 в 19:12

Запускаем PostgreSQL в Docker: от простого к сложному

Простой

12 мин

640K

PostgreSQL*IT-инфраструктура*

Туториал

О простых и продвинутых способах запуска PostgreSQL в Docker: добавляем healthcheck, ставим на мониторинг, настраиваем параметры.

+35

erogov 25 авг 2021 в 20:36

Запросы в PostgreSQL: 1. Этапы выполнения

17 мин

89K

Блог компании Postgres ProfessionalPostgreSQL*SQL*

Привет, Хабр! Начинаю еще один цикл статей об устройстве PostgreSQL, на этот раз о том, как планируются и выполняются запросы.

Предыдущие циклы были посвящены изоляции и многоверсионности, журналированию и блокировкам.

В этом цикле я собираюсь рассмотреть этапы выполнения запросов, статистику, последовательное сканирование, индексное сканирование, соединение вложенным циклом, соединение хешированием, сортировку и соединение слиянием.

Материал перекликается с нашим учебным курсом QPT «Оптимизация запросов», но ограничивается только подробностями внутреннего устройства и не затрагивает оптимизацию как таковую. Кроме того, я ориентируюсь на еще не вышедшую версию PostgreSQL 14. А курс мы тоже скоро обновим (правда, на версию 13; приходится бежать со всех ног, чтобы только оставаться на месте).

Поехали

+33

Kilor 17 авг 2021 в 09:10

PostgreSQL Antipatterns: «слишком много золота»

6 мин

14K

Блог компании ТензорБазы данных*SQL*PostgreSQL*Высоконагруженные системы*

Иногда мы пишем SQL-запросы, мало задумываясь над тем фактом, что сначала они должны быть по сети как-то доставлены до сервера, а затем их результат - обратно в клиентское приложение. Если при этом на пути до сервера присутствует еще и пулер соединений типа pgbouncer, дополнительно "перекладывающий" байты между входящими и исходящими коннектами, ситуация становится еще тяжелее...

Поэтому сегодня рассмотрим некоторые типичные ситуации, в которых разработчики иногда принимают не самые оптимальные решения, гоняя по сети мегабайты трафика при общении с сервером PostgreSQL - а заодно посмотрим, как можно увидеть такую ситуацию в плане с помощью explain.tensor.ru и подумаем над вариантами, как сделать подобное взаимодействие более эффективным.

+27

Magvai69 22 июл 2021 в 10:09

Мониторинг PostgreSQL. Расшифровка аудиочата Data Egret и Okmeter

22 мин

5.5K

Блог компании ФлантСистемное администрирование*PostgreSQL*Базы данных*Интервью

Представляем текстовую версию недавнего разговора с коллегами из Data Egret — компании, которая специализируется на поддержке PostgreSQL. Ведущий инженер команды Okmeter Владимир Гурьянов пообщался с Ильей Космодемьянским (CEO Data Egret) и Алексеем Лесовским (senior DBA Data Egret). Обсудили, как мониторить PostgreSQL, какие бывают ошибки при выборе и настройке систем мониторинга, кто такие DBA и какие soft skills для них важны, а также затронули более хардкорные темы. Пост объемный, но он того стоит.

+29

Kilor 13 июл 2021 в 14:00

Борем deadlock при пакетных UPDATE

3 мин

20K

Блог компании ТензорБазы данных*SQL*PostgreSQL*Высоконагруженные системы*

Однажды при выполнении достаточно тривиального запроса:

UPDATE tbl SET val = val + 1 WHERE id IN (1, 2, 3)

... вы получаете ошибку ERROR: deadlock detected

Но почему? Ведь еще вчера все успешно работало!

И что с этим теперь делать? Давайте разбираться.

+25

plotn1 12 июл 2021 в 06:34

Почему мы перешли с Oracle на PostgreSQL, и как это сделать

19 мин

23K

Блог компании РостелекомSQL*PostgreSQL*Oracle*

Всем привет!

Сегодня расскажем о сравнительно новой для нас теме — про перевод приложения с Oracle на Postgres Pro (далее в тексте везде сокращу до PG). В общем смысле тема не столь уж нова — многие компании этим также занимаются или даже уже прошли этот путь. Так, например, на ежегодной конференции pgConf всегда есть несколько интересных докладов по этой теме (https://pgconf.ru/). Если говорить о формальностях, то мы реализуем инициативу согласно (Приказ Министерства связи «Об утверждении плана по импортозамещению программного обеспечения» от 01.02.2015 № 96). По факту — ещё и денег экономим, слезая с "лицензионной иглы". На эту тему можно отдельную статью написать, а в этой речь пойдёт о программной стороне вопроса. Кому интересно, добро пожаловать под кат.

Читать дальше →

+31

vadv 6 июл 2021 в 06:21

Почему PostgreSQL тормозит: индексы и корреляция данных

12 мин

40K

Блог компании Ozon TechPostgreSQL*

"Хочешь ускорить запросы, построй индекс" – классический первый шаг по увеличению производительности в PostgreSQL. Вот только на практике можно встретить ситуацию, когда индексы в PostgreSQL есть, но тормоза никуда не делись. Не все индексы являются эффективными. Одна из возможных причин тормозов индексов – это отсутствие корреляции данных. Давайте поговорим о пенальти на производительность, которое дает расположение данных: почему это происходит и как это можно предотвратить.

Ускорить свой PostgreSQL

+46

i_am_chasing_the_clouds 17 июн 2021 в 08:00

PostGIS + JPA. Погружение в детали и тонкости для чайников

12 мин

19K

Блог компании ДомкликPostgreSQL*Java*Kotlin*

Привет. Сегодня я расскажу о работе с геоданными в PostgreSQL и немного о том, как это сделать в своем Java/Kotlin-приложении.

Допустим, есть прикладная задача: написать приложение, которое находит ближайший к текущему местоположению магазин с мороженным. Для человека, который прежде не сталкивался с решением подобных задач, это покажется чем-то нетривиальным. Наверное, так и есть. Ну, что ж, появилась необходимость — значит, надо реализовать задуманное, а заодно и расширить свой кругозор и опыт работы с технологиями.

+34

Spinifex 3 июн 2021 в 10:58

Как реляционная СУБД делает JOIN?

9 мин

35K

Высоконагруженные системы*PostgreSQL*Программирование*.NET*SQL*

Статья о том, как реляционная СУБД может выполнить JOIN. Для лучшего понимания мы попробуем своими руками написать такую же реализацию на языке C#. Что позволит нам лучше вникнуть в детали.

А чтобы было не совсем скучно - мы зададимся вопросом производительности. Что работает быстрее C# или SQL? И хоть сам по себе вопрос не корректен, к этому пониманию мы как раз и придем.

+29

Kilor 26 апр 2021 в 07:10

Чего «энтерпрайзу» в PostgreSQL не хватает

6 мин

16K

Блог компании ТензорВысоконагруженные системы*PostgreSQL*SQL*Базы данных*

Технотекст 2021

В конце прошлого года Иван Панченко предложил мне рассказать на внутреннем семинаре Postgres Pro, чего, по нашему опыту использования PostgreSQL в "кровавом энтерпрайзе" "Тензора", не хватает в этой СУБД.

С докладом пока так и не сложилось, зато появилась эта статья, в которой я постарался собрать наиболее показательные вещи, которые вызывают "напряги" при активном использовании PostgreSQL в реальном бизнесе.

+31

alexey_and_kazakov 22 апр 2021 в 08:00

SQL в DjangoORM

12 мин

25K

Блог компании ДомкликSQL*Django*PostgreSQL*Python*

Меня зовут Алексей Казаков, я техлид команды «Клиентские коммуникации» в ДомКлик. В большинстве приложений, с которыми мне приходилось иметь дело, при взаимодействии с БД не ограничиваются лишь драйвером, который позволяет выполнять сырые запросы. Для удобства и избавления от SQL-запросов внутри, например, Python-кода дополнительно используют библиотеки (Object Relational Mapper, ORM).

Это первая статья в серии, посвященной различным ORM. Начнём мы с DjangoORM.

+51

Kilor 20 апр 2021 в 10:15

SQL HowTo: решаем головоломку «Небоскрёбы» почти без перебора

20 мин

9.4K

Блог компании ТензорНенормальное программирование*Занимательные задачкиPostgreSQL*SQL*

Многие знают правила этой головоломки (Skyscrapers):

"Перед вами вид сверху на городской квартал. В каждой клетке стоит "небоскреб" высотой, равной числу в этой клетке. Числа с боков сетки означают количество "небоскребов", видимых из соответствующей строки или столбца, если смотреть от этого числа.

Задача: заполнить сетку числами так, чтобы в каждой строке и в каждом столбце каждое число использовалось лишь единожды."

Понятно, что алгоритмом полного перебора можно решить что угодно, но - за экспоненциальное время. Поэтому мы попробуем написать такой SQL-запрос, который решит нам такую головоломку за приемлемое время.

Зачем же делать это на SQL? Потому что можем! А заодно потому что это позволит научиться конструировать "очень сложные запросы", что может пригодиться и в обычной работе.

Сломать голову, вывихнуть мозг

+32

lesovsky 18 апр 2021 в 05:06

Noisia — генератор аварийных и нештатных ситуаций в PostgreSQL

12 мин

4.3K

PostgreSQL*Базы данных*Системное администрирование*

Расшифровка доклада «Noisia — генератор аварийных и нештатных ситуаций в PostgreSQL» с конференции PGConf.Online 2021.

В докладе рассказывается про утилиту Noisia которая используется для намеренного создания аварийных ситуаций в СУБД PostgreSQL. Докладчик (то есть я) рассказывает о функциональности и назначении утилиты и о разных способах сломать Postgres.

Примечание: Доклад расшифрован пользователем chemtech. Антон, большое спасибо за проделанную работу. В этой расшифровке очень много правок, на мой взгляд читать дословную расшифровку любого доклада довольно сложно, поэтому я внес много правок и постарался привести текст к тому виду чтобы его было легче читать. В результате текст здесь местами может существенно отличаться от того что в видео.

Сам доклад и видео здесь.

Читать дальше →

+25

Kilor 24 мар 2021 в 13:40

DBA: когда почти закончился serial

10 мин

8.3K

Блог компании ТензорБазы данных*SQL*PostgreSQL*Высоконагруженные системы*

Туториал

"Шеф, всё пропало, у нас serial на мегатаблице кончился!" - а это значит, что либо вы его неаккуратно накрутили сами, либо у вас действительно данных столько, что разрядности integer-столбца уже не хватает для вашей большой и активной таблицы в PostgreSQL-базе.

Да и столбец этот не простой, а целый PRIMARY KEY, на который еще и ряд других немаленьких таблиц по FOREIGN KEY завязан. А еще и приложение останавливать совсем не хочется, ибо клиентам 24x7 обещано...

В общем, надо как-то с минимальными блокировками увеличить размер PK-поля в большой таблице, на которое многое завязано.

+40

olegborzov 23 мар 2021 в 08:37

PGHero — дашборд для мониторинга БД PostgreSQL

5 мин

14K

Блог компании ДомкликRuby*PostgreSQL*

Туториал

Всем привет. Сегодня я бы хотел поделиться рецептом установки утилиты PGHero с подключением нескольких баз данных. PGHero — это простенькая утилита, написанная на Ruby, с минималистичным дашбордом для мониторинга производительности БД PostgreSQL.

Что может показать нам PGHero:

• статистику по запросам: количество вызовов, среднее и суммарное время выполнения (с возможностью хранения истории);

• активные в данный момент запросы;

• информацию о таблицах: занимаемое на диске место, даты последних запусков VACUUM и ANALYSE;

• информацию об индексах: занимаемое на диске место, наличие дублируемых/неиспользуемых индексов. Также может порекомендовать добавить индекс при наличии сложных запросов с Seq Scan;

• статистику по открытым подключениям к БД;

• вывод основных настроек БД, влияющих на производительность (shared_buffers, work_mem, maintenance_work_mem и т.д.)

+35

1 2 ...

6 7

9 10 ...

22 23

PostgreSQL *

Роковой каскад: JIT, и как обновление Postgres привело к 70% отказов на национальном сервисе критической важности

Опыт миграции кластера PostgreSQL на базе Patroni

SQL в SQLAlchemy

Популярные расширения для PostgreSQL: как установить и для чего использовать

Что должен, но не знает про конкуренцию в PostgreSQL каждый разработчик?

Запускаем PostgreSQL в Docker: от простого к сложному

Запросы в PostgreSQL: 1. Этапы выполнения

PostgreSQL Antipatterns: «слишком много золота»

Мониторинг PostgreSQL. Расшифровка аудиочата Data Egret и Okmeter

Борем deadlock при пакетных UPDATE

Почему мы перешли с Oracle на PostgreSQL, и как это сделать

Почему PostgreSQL тормозит: индексы и корреляция данных

PostGIS + JPA. Погружение в детали и тонкости для чайников

Ближайшие события

Как реляционная СУБД делает JOIN?

Чего «энтерпрайзу» в PostgreSQL не хватает

SQL в DjangoORM

SQL HowTo: решаем головоломку «Небоскрёбы» почти без перебора

Noisia — генератор аварийных и нештатных ситуаций в PostgreSQL

DBA: когда почти закончился serial

PGHero — дашборд для мониторинга БД PostgreSQL

Вклад авторов