PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

leborchuk 19 сен в 08:50

Гид по Apache Cloudberry ч.1: история появления, архитектура и функции

Средний

11 мин

Блог компании Yandex Cloud & Yandex InfrastructureБазы данных * SQL * PostgreSQL * Open source *

Обзор

В конце августа вышел релиз распределённой СУБД Apache Cloudberry 2.0.0 — опенсорс‑проекта, который в режиме инкубации находится в Apache Software Foundation (ASF). В новой версии состоялся переход на кодовую базу PostgreSQL 14, а также было добавлено множество улучшений.

При этом на Хабре до сих пор незаслуженно мало статей, посвящённых этой СУБД. Мы решили исправить это совместно с Максом Янгом, техническим лидером и участником PPMC Apache Cloudberry (Incubating). Эти статьи созданы по материалам совместного митапа Yandex Cloud Data Platform — про Greenplum® и не только. В этот раз пройдёмся по базовым особенностям и функциям этой СУБД, а в следующий — доберёмся до advanced‑возможностей.

+10

melanny20 18 сен в 11:23

Портим данные с удовольствием

Простой

10 мин

7.5K

Блог компании Postgres ProfessionalСистемное администрирование * Базы данных * SQL * PostgreSQL *

Туториал

Всю свою карьеру инженеры строят системы, которые бережно хранят данные и защищают их от искажений. А что если мы скажем, что иногда правильнее всё делать наоборот: намеренно портить данные, генерировать их из воздуха и создавать неотличимые от настоящих подделки? Системный аналитик Postgres Professional Максим Грамин расскажет, почему создание фейковых данных — это критически важный навык для тестирования, безопасности и разработки, и как научиться делать это правильно, не превращая базу в свалку из «Иванов Ивановых».

+15

DenAgapitov 18 сен в 10:42

Обмен событиями распределённого приложения на Java

Средний

14 мин

6.2K

Блог компании BercutPostgreSQL * Java * Высоконагруженные системы * Распределённые системы *

Туториал

Сегодня я хочу рассказать вам об одном из вариантов доставки событий для распределённого приложения на Java.

Это доставка событий через БД, в которой хранится состояние распределённого приложения.

+14

spring_aio 18 сен в 08:25

Чем хорош Postgres 18?

Простой

8 мин

14K

Блог компании Spring АйОПрограммирование * PostgreSQL * Java * Kotlin *

Обзор

Перевод

PostgreSQL 18 вот-вот выйдет, и это не просто минорное обновление, а настоящий прорыв для разработчиков и администраторов БД. В новом переводе от команды Spring АйО рассмотрим ключевые новинки — асинхронный I/O для ускорения чтения, поддержка UUID версии 7 с улучшенной сортировкой, skip scans в B-tree индексах, виртуальные вычисляемые столбцы и даже OAUTH 2.0 для аутентификации. Всё это делает Postgres ещё более быстрым, гибким и современным.

+35

Amonoc 17 сен в 08:19

Как я сделал школьного бота в Telegram — и почему проект пришлось закрыть

4 мин

16K

Python * PostgreSQL * Google API *

В одной из московских школ мы сделали Telegram-бота, который автоматизировал «операционку»: согласия на мероприятия, запись на кружки, заявки в хозчасть/ИТ, массовые оповещения, анонимный канал психолога и контур директора с согласованиями и дашбордами. Я старался максимально упростить сложную и разрозненную модель управления.

Проект реально сработал, но его пришлось закрыть: с 2025/26 учебного года все школьные коммуникации перевели в национальный мессенджер «Макс» (MAX), а Telegram оказался «под запретом».

+21

OlegIct 15 сен в 05:44

Логирование (аудит) сессий в PostgreSQL

Средний

10 мин

6.7K

Блог компании Тантор ЛабсPostgreSQL * Базы данных *

Обзор

В статье рассматривается логирование соединений с базами данных кластера PostgreSQL. Системы мониторинга создают сессии для сбора метрик и проверки доступности экземпляра. Это создаёт большое число записей в диагностическом журнале кластера, затрудняя его анализ. Администраторы ищут возможность отключения логирования для сессий мониторинга. Такая возможность есть только у параметра log_disconnections. Приводится пример, как с его помощью отключить логирование при создании сессии. Также рассматриваются особенности использования расширений pgaudit и pgaudittofile, которые позволяют выводить логирование соединений в отдельный файл аудита.

+10

spring_aio 11 сен в 16:39

UUIDv7 в PostgreSQL 18

Простой

8 мин

13K

Блог компании Spring АйОПрограммирование * Java * Kotlin * PostgreSQL *

Обзор

Перевод

Совсем скоро (в конце сентября) выйдет PostgreSQL 18. Релиз готовит важные обновления — от асинхронного I/O до EXPLAIN с показателями CPU и WAL.

Довольно громкая новинка — нативная поддержка UUIDv7, нового стандарта уникальных идентификаторов, идеально подходящих для B-tree индексов.

В новом переводе от команды Spring АйО рассказывается, почему это важно, как работает UUIDv7 и чем он лучше UUIDv4 для современных распределённых систем.

+17

python_leader 11 сен в 07:30

Как мы освободили 20 ГБ в PostgreSQL без удаления данных

Простой

13 мин

13K

Программирование * Python * PostgreSQL * Django *

Кейс

Перевод

Команда Python for Devs подготовила перевод статьи о том, как можно освободить десятки гигабайт места в PostgreSQL без удаления данных и индексов. TL;DR: удаляем неиспользуемые индексы, чистим bloat, пересобираем таблицы и используем частичные индексы, чтобы хранить только то, что реально нужно.

+17

KoppeKTop 11 сен в 07:00

Миграция без боли и даунтайма: как мы перевозили данные с MongoDB на PostgreSQL

Средний

12 мин

8.7K

Блог компании ЯндексБазы данных * MongoDB * PostgreSQL * Высоконагруженные системы *

Ретроспектива

Всем привет! Меня зовут Андрей, я бэкенд‑разработчик ядра Яндекс Диска. В индустрии я уже около 15 лет и повидал некоторое ПО. Последние три года занимаюсь ядром файловой системы — всем, что связано с метаданными о файлах.

Однажды мы в Диске переносили общие данные из шардированного MongoDB в шардированный же PostgreSQL. После переноса пользовательских данных у нас осталась часть данных про общие папки.Их было сложно изолировать внутри шарда пользователя, и они остались в общей БД на MongoDB, которую мы так и назвали — CommonDB. Спустя время мы заметили, что общая БД не справляется с нагрузкой: все запросы перед выполнением должны были сначала получить информацию об общих папках, и только после этого они начинали работать. Поэтому надо было дублировать информацию ближе к другим данным пользователей — на их шарды.

Однако при дублировании важно было избежать распределённых транзакций, так как они снижают общую производительность. Также проблемой был сам процесс перехода: у нас сотни миллионов пользователей, которые не должны были ощущать процесс перехода и потерять доступ к своим данным. При этом надо было выкатывать изменения не сразу на 100%, а частично, с возможностью в любой момент отключить функциональность. При выкатке также нельзя было допустить даунтайм.

В статье я хочу поделиться опытом этой масштабной миграции. Под катом покажу, как вообще устроены сложные миграции и как к ним подходить. А также перечислю те пункты, на которые нужно обратить внимание, если вам предстоит миграция под нагрузкой.

Замигрировать

+28

drema201 10 сен в 13:29

О «залипании» процесса checkpoint и archive_timeout в Postgres

4 мин

7.6K

Блог компании АО «ГНИВЦ»PostgreSQL * Базы данных * SQL *

Кейс

Добрый день, коллеги!

Недавно мы столкнулись со следующей проблемой при тестировании СУБД PostgresPro под высокой нагрузкой: процесс представлял собой массированную многопоточную заливку данных на протяжении многих часов,а данных было около 20 ТБ, потоков — 75.

В процессе загрузки наблюдалось следующее явление: через некоторое время процесс checkpointer переставал делать контрольные точки в зависимости от других параметров БД либо сразу, либо через 2-3 часа.

+10

VGcom 10 сен в 07:05

Что стоит за дистрибуцией Greenplum?

Средний

13 мин

4.7K

Блог компании BegetData Engineering * PostgreSQL * SQL * Базы данных *

Что известно про Greenplum?
Это MPP система на базе PostgreSQL, которая нужна, чтобы работать с большими объемами данных и делать OLAP. Отлично, но лично меня не устраивает это поверхностное знание, хочется узнать, что внутри. Какие алгоритмы использует Greenplum в своих процессах. Я хочу начать с дистрибуции, и приглашаю вас с собой в это путешествие.

Что внутри?

+12

pluzanov 9 сен в 15:09

PostgreSQL 18: Часть 5 или Коммитфест 2025-03

Средний

36 мин

8.1K

Блог компании Postgres ProfessionalPostgreSQL * SQL * Базы данных *

Обзор

25 сентября ожидается выход PostgreSQL 18. Эта статья о мартовском коммитфесте завершает описание новых возможностей 18-й версии. Статья получилась большая, ведь последний мартовский коммитфест по традиции наиболее объемный и богатый на новинки.

Самое интересное из предыдущих коммитфестов версии можно прочитать здесь: 2024-07, 2024-09, 2024-11, 2025-01.

Клиентские и серверные приложения

pg_dump[all]/pg_restore: выгрузка и восстановление статистики
Сбор статистики после обновления сервера
pg_upgrade --swap: перемещение каталогов из старого кластера в новый
pg_combinebackup --link или жесткие ссылки вместо копирования файлов
pg_dump[all], pg_restore: --no-policies
pg_createsubscriber: включение параметра two_phase для всех подписок
pg_createsubscriber: удаление публикаций на подписчике
pg_createsubscriber: создание подписок для всех баз данных сервера публикации
psql: конвейерный режим работы
psql: информация о текущем подключении
psql: настройка умолчания для интервала времени в команде \watch
psql: \dx показывает версию расширения по умолчанию

Мониторинг

NUMA: инструменты мониторинга систем с архитектурой неоднородного доступа к памяти
pg_stat_get_backend_wal: статистика WAL для отдельного процесса
EXPLAIN: фактическое число строк с точностью до двух знаков после запятой
EXPLAIN: интерфейс для добавления команде новых параметров
Журналирование неудачных попыток захватить блокировку
Журналирование времени на подключение нового сеанса
log_line_prefix: IP-адрес локального сервера
pg_stat_statements: нормализация команд со списками констант в IN
Дополнительные инструменты мониторинга переполнения буфера WAL
Отслеживание времени простоя при выполнении очистки и анализа

[Авто]очистка и анализ

vacuum_truncate: управление обрезанием пустых страниц в конце таблицы
Более частая автоочистка «мертвых» строк в больших таблицах
Более частая автоочистка после вставки новых строк
Нетерпеливая заморозка в помощь агрессивной очистке

Производительность

Асинхронный ввод/вывод
io_combine_limit: максимальный размер увеличен до 1МБ
[Применение интер

+31

spersics 6 сен в 19:15

HistoryHelper — плагин для DBeaver, который генерирует history-таблицы и триггеры за пару кликов

Простой

4 мин

13K

Базы данных * Java * PostgreSQL * СофтФинансы в IT

Из песочницы

HistoryHelper - плагин для DBeaver

Зачем и почему?

Работая с БД часто приходится вручную писать SQL для создания history-таблиц, которые хранят "историю" о каждой записи из таблицы. То есть, если запись создана/изменена/удалена, для неё создается новая запись в таблице с окончанием "_hist" или "_history".

Задача знакомая, но крайне рутинная: для каждой таблицы нужно вручную писать SQL, проверять, чтобы все колонки были учтены, тип колонок был корректным, и не было опечаток.

Поэтому, я решил сделать небольшой плагин для DBeaver, который предоставляет удобное меню выбора колонок и событий.

После нескольких выходных дней получилась минимальная реализация, которой хочу с вами поделиться.

В данный момент реализован самый простой функционал.

+14

JavaUnchained 5 сен в 13:45

Как мы в Java-проекте UDT для PostgreSQL поддерживали

Сложный

33 мин

7.2K

Блог компании BercutJava * PostgreSQL * Программирование *

Туториал

PostgreSQL позволяет создавать хранимые функции и процедуры. И если при их вызове с простыми данными проблем не возникает, то сложные иерархические структуры могут вызвать трудности.

В статье мы разберёмся, как передавать и получать вложенные объекты в процедурах и функциях PostgreSQL с помощью JDBC.

+25

slonik_pg 4 сен в 11:08

Глобальные индексы для секций в Postgres Pro: глобальная уникальность без костылей

Средний

7 мин

6.3K

Блог компании Postgres ProfessionalPostgreSQL * Базы данных * Серверное администрирование * SQL *

Обзор

Когда фильтра по ключу секционирования нет, локальные индексы превращаются в марафон по секциям. Новый gbtree держит единый каталог ключей и прыгает к строке по PK; покажем алгоритм, реальные цифры и ограничения (PK обязателен, ON CONFLICT не работает) — и где это решает боль в CRM/биллинге.

+17

ITFB_Group 3 сен в 09:48

Когда дело не в коде: как мы ловили мистические пропажи запросов на сетевом уровне

Средний

3 мин

6.5K

Блог компании ITFB GroupDevOps * Kubernetes * PostgreSQL * Java *

Кейс

Привет, меня зовут Анатолий, я ведущий разработчик в ITFB Group. У нас высоконагруженный сервис торговых операций. И раз в неделю, как по расписанию, раздавался панический звонок: «Опять пропали запросы!». Мы неслись смотреть логи — а там... ничего. Ни ошибок, ни падений. Никаких пятисотых, только стабильные двухсотые. Стенды dev и prod молчали, как рыбы. Запросы загадочным образом появлялись через некоторое время, и всё работало, пока история не повторялась снова. Это был не баг, это был призрак. Призрак в сети.

Сегодня я расскажу, как мы его поймали.

+15

badcasedaily1 2 сен в 15:08

Пять возможностей PostgreSQL, о которых редко вспоминают

Простой

5 мин

16K

Блог компании OTUSPostgreSQL * SQL * Базы данных * Программирование *

Обзор

Привет, Хабр!

Постгрес – не просто реляционная БД, а настоящий кладезь фич, о которых начинающий разработчик может и не догадываться. Всё началось с того, что PostgreSQL изначально писался на С/C++ и всегда тянуло к расширению стандартного SQL набора возможностей. Так однажды разработчики решили добавить в него JSONB, логику на уровне запросов и многое другое – что в итоге сделало его не хуже NoSQL-систем. Но вернёмся к малоизвестным фичам. Ниже – пять приёмов и возможностей, которые неожиданно полезны в повседневной работе.

+37

TantorLabs 2 сен в 05:04

Как мониторить сотни инстансов PostgreSQL и не сойти с ума

13 мин

9.4K

Блог компании Тантор ЛабсPostgreSQL * Базы данных * Высоконагруженные системы * Системное администрирование *

Обзор

Если вы инженер в крупной компании, а особенно если ваша организация поставляет свои услуги в виде SaaS-решений, то вам так или иначе придется решать задачу мониторинга работы всех ваших баз PostgreSQL. На них часто бывает завязан функционал, важный для компании с точки зрения финансовых рисков, поэтому крайне желательно организовать не только мониторинг, но и получение уведомлений, когда что-то идет не по плану (или пойдет в ближайшем будущем). В рамках статьи мы рассмотрим несколько способов, как это можно сделать: самостоятельно, с использованием уже привычного стека Prometheus + Grafana, либо подключая сторонние open-source специализированные решения для мониторинга PostgreSQL, либо же используя специализированные платные решения. По каждому варианту поймем все плюсы и минусы, чтобы вы cмогли более уверенно выбрать свой путь.

+10

python_leader 1 сен в 08:00

Эволюция ForeignKey в Django: от наивной модели до продакшена

Простой

27 мин

5.8K

Python * Программирование * Django * PostgreSQL *

Туториал

Перевод

Команда Python for Devs подготовила перевод статьи о том, как легко «сломать» внешние ключи в Django и что с этим делать. Если кратко, то unique_together больше не нужен, индексы на ForeignKey работают не так, как вы думаете, миграции могут блокировать продакшен, а правильный порядок операций и частичные индексы экономят гигабайты и спасают нервы.

+10

OlegIct 30 авг в 06:25

Сравнение транзакционных систем Oracle и PostgreSQL

Средний

9 мин

9.4K

Блог компании Тантор ЛабсPostgreSQL * SQL * Базы данных * Oracle *

Обзор

Перевод

Механизм реализации транзакций - основная часть реляционных баз данных. Он упрощает разработку приложений, в которых гарантируется целостность данных. Стандарт SQL регламентирует, часть свойств по поддержке транзакций, но многие детали не стандартизованы. Как следствие, реализация поддержки транзакций в разных базах данных может существенно различаться. В настоящее время, многие пытаются перейти с Oracle на PostgreSQL. Для миграции приложений важно понимать различия в реализации работы транзакций, иначе можно столкнуться с неприятными сюрпризами, которые могут поставить под угрозу производительность и целостность данных. Поэтому Лоренс Альбе решил, что полезно сравнить реализацию работы транзакций в Oracle и PostgreSQL и свести различия в одной статье.

+24

1 2 3

5 6 ...

66 67

PostgreSQL *

Гид по Apache Cloudberry ч.1: история появления, архитектура и функции

Портим данные с удовольствием

Обмен событиями распределённого приложения на Java

Чем хорош Postgres 18?

Как я сделал школьного бота в Telegram — и почему проект пришлось закрыть

Логирование (аудит) сессий в PostgreSQL

UUIDv7 в PostgreSQL 18

Как мы освободили 20 ГБ в PostgreSQL без удаления данных

Миграция без боли и даунтайма: как мы перевозили данные с MongoDB на PostgreSQL

О «залипании» процесса checkpoint и archive_timeout в Postgres

Что стоит за дистрибуцией Greenplum?

PostgreSQL 18: Часть 5 или Коммитфест 2025-03

HistoryHelper — плагин для DBeaver, который генерирует history-таблицы и триггеры за пару кликов

Ближайшие события

Как мы в Java-проекте UDT для PostgreSQL поддерживали

Глобальные индексы для секций в Postgres Pro: глобальная уникальность без костылей

Когда дело не в коде: как мы ловили мистические пропажи запросов на сетевом уровне

Пять возможностей PostgreSQL, о которых редко вспоминают

Как мониторить сотни инстансов PostgreSQL и не сойти с ума

Эволюция ForeignKey в Django: от наивной модели до продакшена

Сравнение транзакционных систем Oracle и PostgreSQL

Вклад авторов