PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

MightyDok 12 мая в 14:16

Обзор Greenmask — утилиты для логического дампа PgSQL с трансформацией данных на лету

Простой

7 мин

2.6K

DevOps * Тестирование IT-систем * PostgreSQL * Go * Open source *

Из песочницы

Greenmask — это кроссплатформенный инструмент, разработанный на Go специально для безопасной работы с данными PostgreSQL: он помогает делать логические бэкапы, восстанавливать таблицы и при необходимости — анонимизировать чувствительную информацию. Главное преимущество Greenmask — полная совместимость с pg_dump и pg_restore. То есть, если вы уже работаете с этими инструментами, интеграция Greenmask не потребует пересмотра всей инфраструктуры.

Один из ключевых сценариев использования утилиты - подготовка баз данных для тестового стенда. Greenmask позволяет упростить процесс дампа продуктивных баз, обработки их для анонимизации тех же персональных данных, снижения размера баз (в тестовой среде зачастую не нужны терабайты данных с прода), восстановления дампов в тестовый контур.

Ниже в статье я опишу базовый функционал, примеры конфигураций для начала работы с Greenmask, а так же рассмотрим примеры трансформации данных при дампе таблиц.

Официальный сайт: https://greenmask.io

Документация: https://docs.greenmask.io/latest/

GitHub-репозиторий: https://github.com/GreenmaskIO/greenmask (уже 1308 звезд)

Telegram-канал: https://t.me/greenmask_ru

nvantropov 11 мая в 15:20

Работа с базой данных для джунов и вайбкодеров. Соединения

Средний

4 мин

2.2K

Java * PostgreSQL * Node.JS * Go *

Из песочницы

Коннекты обычно не приносят много головной боли на начальных этапах разработки. Вообще работа с ними обычно делается один раз, во время настройки, и дальше тюнится по необходимости. Но эта необходимость возникает часто в виде непонятных ошибок, которые выкидываются в случайных местах, непонятных графиков в графане и суеты админов вашей базы данных. Я постарался собрать ту информацию, которая позволит вам не потеряться в такой ситуации и даже поможет определить суть проблемы.

-9

zebin 10 мая в 08:02

Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций

Средний

4 мин

26K

Java * SQL * PostgreSQL * Go *

Туториал

Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций

Задача перевода денег в первом приближении сводится к обновлению пары строк и кажется простой — но обеспечение корректности при параллельном доступе может быть неожиданно сложным для только знакомящихся с уровнями изоляций БД.

+24

147

OlegIct 8 мая в 11:12

Обзор пяти докладов конференции PgBootcamp 2025

Простой

12 мин

1.3K

PostgreSQL *

Обзор

В статье обзор пяти докладов прошедшей в апреле 2025 года конференции PgBootcamp. Даже на тех конференциях, которые я посещал, мне было бы интересно почитать обзор докладов, но я их не встречал. Иногда можно найти статью к докладу, но для большинства докладов на конференциях такого формата нет. По какой-то причине, обзоры докладов с конференций - редкость. Я решил написать обзор, возможно он окажется полезен.

Доклады конференции PgBootcamp недавно выложили в общий доступ и их можно скачать и посмотреть.

Введение

Доклады конференций полезны тем, что содержат описание того, что актуально при работе с PostgreSQL. Организаторы выбирают наиболее интересные доклады и не пропускают то, что уже всем известно.

О конференции PgConf я знал давно, а о конференции PgBootcamp я узнал год назад. За это время прошли три конференции: в Казани, Минске и Екатеринбурге. Архив докладов есть на сайте pgbootcamp.ru (регистрироваться на сайте не нужно, в "Программе" - список докладов, внизу каждого доклада ссылка на видеозапись доклада).

Перед очередной конференцией можно бесплатно зарегистрироваться онлайн и оффлайн, она однодневная и проходит параллельно в двух залах. Регистрация на конференции полезна тем, что, что присылается ссылка на трансляцию и запись можно просматривать во время и сразу после окончания конференции. Без регистрации доклады становятся доступны только через 2-3 недели.

Safreliy 7 мая в 18:20

LLM пайплайны укрощают сложность баз данных, или как мы подружили ИИ с БД без ИБД

Простой

12 мин

5.8K

Блог компании Postgres ProfessionalИскусственный интеллектМашинное обучение * SQL * PostgreSQL *

Кейс

Большие языковые модели (Large Language Model, LLM) используют в разных областях: с их помощью генерируют программный код, ищут информацию, озвучивают реплики чат-ботов. А вот при работе с реляционными данными языковые модели часто ошибаются.

Чтобы справиться с этими ошибками, в мы разработали три пайплайна для работы с базами данных. Эти пайплайны представляют собой цепочку связанных между собой языковых моделей: каждая из них генерирует свой ответ, и следующая модель работает с ответом предыдущей. Таким образом мы получаем дополнительный контекст, и запрос к базе данных становится точнее.

+14

WMT 7 мая в 15:18

Использование Daterange для поиска разрывов истории записей SCD2

Простой

9 мин

804

TensorFlow * PostgreSQL * Анализ и проектирование систем * SQL *

Мнение

Привет, Хабр!

Меня зовут Сергей Аладышев, работаю системным аналитиком на протяжении 10 лет, и в работе часто сталкиваюсь с задачами, в том числе типовыми, решения для которых выглядят понятными, но не всегда оптимальными, а главное затратными по времени.

Появляется непреодолимое желание их оптимизировать. Сегодня хочу обсудить похожую задачу: «поиск разрывов истории записей», она же: «поиск разрывов истории SCD2 в SQL». С задачей сталкивался несколько раз, но статей с её разбором не нашел, поэтому решил, что тема актуальна.

Началось все, как и всегда, с получения исчерпывающих требований от заказчика:

net0pyr 6 мая в 13:01

Резервное копирование PostgreSQL по-взрослому

Средний

7 мин

29K

Блог компании RUVDS.comPostgreSQL * Базы данных * Системное администрирование *

Туториал

Базы данных — замечательный инструмент, без которого сложно представить современное приложение. И как бы сильно я ни любил использовать БД, я просто ненавижу писать SQL-запросы. Поэтому однажды задался вопросом, кто мог бы делать это за меня, при этом несильно теряя в качестве. И, конечно же, на ум пришёл мой AI-друг. Тогда остаётся одна проблема, как скормить ему мою БД. Тут на помощь приходит резервное копирование! Выполнив все необходимые задачи, я решил углубиться в тему и поделиться с Хабром, какие вообще есть виды и, конечно, сравнить их между собой.

Читать дальше →

+43

badcasedaily1 5 мая в 06:39

D7 — не показатель: ищем правду

5 мин

Блог компании OTUSSQL * PostgreSQL * Анализ и проектирование систем *

Обзор

Привет, Хабр!

Сегодня поговорим про ретеншн — ту самую метрику, от которой часто пляшут все продуктовые команды. Вы знаете: «вернулся через 7 дней» (D7) — и сказано, что мы класс

Но на деле класс ломается, как только продукт усложняется. В этой статье рассмотрим, почему классический D7 retention не работает, как построить настоящие кривые удержания через когорты, в чём разница между recurring vs one-shot поведением, какие есть альтернативные метрики и сравним три метода.

lastrix 30 апр в 11:19

Шардировать или не шардировать

Простой

9 мин

2.7K

Java * PostgreSQL * Kubernetes * Анализ и проектирование систем *

Если ваш сервис рассчитан на миллиарды пользователей, то несомненно возникнет вопрос о масштабировании.

Ранее, автор уже рассмотрел способ масштабирования через партицирование. В данной статье рассмотрим шардирование сервиса Баланс дабы обеспечить его работу с миллиардами пользователей без необходимости использовать суперкомпьютеры, а при желании вовсе запускать на "кофеварках".

В чём вопрос?

danolivo 30 апр в 06:49

О переупорядочении выражений в Postgres

Простой

5 мин

PostgreSQL *

Кейс

Сегодня я хочу затронуть тему дополнительных ухищрений, которые могут позволить ускорить выполнение запроса. В данном случае речь пойдёт о перестановке условий в выражениях фильтрации, JOIN'ов, HAVING-клаузах и прочем. Идея заключается в том, что получив негативный результат в одном условии из цепочки выражений, объединенных оператором AND, равно как позитивный результат в одном из условий, объединённых оператором OR, можно не вычислять все последующие и сэкономить вычислительный ресурс. Что это даёт и как конкретно реализовать - об этом ниже.

+10

LesnoyChelovek 29 апр в 15:21

Русский след в истории логотипа PostgreSQL

Простой

8 мин

9.9K

Блог компании Postgres ProfessionalPostgreSQL * IT-компанииНаучно-популярноеБазы данных *

Мнение

Каждый, кто работает с PostgreSQL, знает его символ — синего слона. Но задумывались ли вы, откуда он взялся? Его история — это не результат работы дорогого брендингового агентства, а захватывающее повествование о зарождении IT-сообщества, питерских энтузиастах, случайных файлах и том, как «маленький презент» стал мировым символом.

Узнать историю slonik.gif

+98

LesnoyChelovek 25 апр в 13:54

Оптимальная настройка Postgres Pro в один клик с pgpro_tune

Простой

5 мин

Блог компании Postgres ProfessionalPostgreSQL * Базы данных *

Обзор

Представьте знакомую ситуацию: утро понедельника, задачи сыпятся одна за другой. Перед вами задача срочно развернуть новый сервис на базе Postgres Pro. Или, возможно, в эти выходные вы обновили железо своего сервера базы данных, увеличили количество CPU и объём RAM. Расскажем, как быстро привести СУБД в состояние, оптимально подходящее новому оборудованию и текущим нагрузкам.

+19

Nikolay58 25 апр в 12:44

Как мы упростили обновление СУБД Pangolin: показываю бэкенд решения

Средний

17 мин

3.2K

Блог компании СберPostgreSQL * Программирование * SQL *

Кейс

Привет, Хабр! Меня зовут Николай Литковец, я инженер-разработчик в СберТехе, развиваю СУБД Pangolin — это реляционная СУБД, целевая в Сбере и не только. До недавнего времени у нас было два типа обновлений СУБД — минорное и мажорное. Минорное обновление — быстро и сравнительно просто, мажорное — долго, муторно, со значительными затратами ресурсов сервера. Мы стали думать, можем ли мы где-то обойтись без перехода на мажорные версии? Нашли сценарий, где это было возможным и через время у нас появилось минорно-мажорное обновление, которое теперь экономит нам силы и время. В этой статье расскажу про создание инструмента, который позволил нам устроить эту реформу, как мы его делали и обходили риски и что нам это дало.

+13

Bushmelev_aa 25 апр в 10:16

От хаоса к порядку: автоматизация мониторинга СУБД в гибридных средах

7 мин

PostgreSQL *

Из песочницы

Всем привет! Недавно закончился PGConf, где большая часть докладов была посвящена новым фичам PostgreSQL Pro, и лишь немногие касались ванильной версии. В прометей Лаб я влился с октября 2024 года и начал развивать сервис администрирования баз данных. Сегодня я хочу поделиться нашим подходом к мониторингу, который не требует лицензий, при этом экономит время и нервы.

Если вы DBA, то вы наверняка сталкивались с задачей мониторинга разных инстансов баз данных — PostgreSQL, MSSQL, MariaDB, Oracle или что-то из NoSQL — на разных ОС, от bare metal до PaaS. Настройка мониторинга в таких условиях может занять недели, а ошибки в алертинге приводят к простоям.

Зачастую, в больших компаниях есть типовой мониториг который, мягко говоря, сложно кастомизировать, а попытки его доработать, в лучшем случае, вылились в пару месяцев переписки и доп. согласования с безами.. В худшем — вы разочаровались в жизни, смирились и продолжаете ~~кушать кактус~~ заводить заявки.

Я тоже через это проходил, поэтому в Prometey Lab мы сфокусировались на переносимом, масштабируемом, k8s ready решении, на типовых компонентах которое можно оперативно развернуть и с минимальной болью занести в разрешенный техстек. На последней демо, при наличии тех учеток в бд, весь процесс подключения нового клиента к мониторингу занимает 40 минут и поддерживает кастомизацию под любые нужды.

В этой статье я расскажу, как мы этого добились, поделюсь нашим стеком, примерами конфигураций и планами на будущее. Если вы сталкивались с подобными задачами, возможно эта статья натолкнет вас на мысли как «расшить» направление мониторинга и сократить время реакции на инциденты.

cleancodemonkey 23 апр в 15:09

CRUD на PHP с использованием файберов и пула соединений с PostgreSQL

Средний

12 мин

3.4K

PHP * Параллельное программирование * PostgreSQL *

В этой статье я подготовил для вас прототип CRUD-приложения, которое использует файберы и неблокирующие(асинхронные) возможности драйвера PostreSQL. Вместе они дают любопытные результаты по производительности и потреблению памяти.

+16

OlegIct 22 апр в 05:09

Параметры конфигурации мастера, отслеживаемые репликами PostgreSQL

Средний

9 мин

2.1K

PostgreSQL * Базы данных *

Обзор

Значения восьми параметров конфигурации мастера (primary, ведущего сервера PostgreSQL) сохраняются в управляющих файлах и изменения их значений передаются через журнал (WAL) на реплики. Если реплика открыта для запросов (hot_standby=on), то значения пяти числовых параметров на реплике должны быть не меньше, чем на мастере, иначе процесс startup прекратит накат (replay) журнальных записей. А после рестарта экземпляры реплик не запустятся. В статье рассматриваются эти параметры особенности изменения их значений.

Значения пяти числовых параметров конфигурации, сохраненных в управляющем файле кластера, можно посмотреть утилитой pg_controldata:

JetHabr 21 апр в 11:05

Только хардкор, только мануал: репликация данных

Средний

24 мин

2.6K

Блог компании Инфосистемы ДжетIT-инфраструктура * Oracle * PostgreSQL *

Туториал

Привет, Хабр!

Каждая компания стремится к тому, чтобы данные были не только доступны в нужный момент, но и надежно защищены (спасибо, КЭП!). Более того, необходимость обеспечения безопасности ЗОКИИ и требований по импортозамещению ставит новые задачи в области интеграции систем и миграции данных. Один из способов разобраться с этими вызовами — репликация данных. Она помогает компаниям справляться с растущими нагрузками, обеспечивает защиту данных и облегчает миграцию между различными платформами. Однако ее успешное внедрение требует тщательной подготовки, внимательного выбора стратегии и регулярного мониторинга. Хватит слов – за дело! В этой статье мы покажем сразу несколько технических решений.

+14

badcasedaily1 21 апр в 09:34

Почему COUNT(*) быстрее, чем COUNT(col) — и когда это не так

Простой

4 мин

24K

Блог компании OTUSSQL * PostgreSQL * Программирование * Базы данных *

Обзор

Привет, Хабр!

Сегодня поговорим про одну из тех тем, что вроде бы тривиальна, но до последней капли грязи тащит за собой внушительный пласт вопросов. Речь пойдёт про COUNT(*) и COUNT(col) в PostgreSQL.

+31

LesnoyChelovek 18 апр в 14:31

Профессия performance инженер: детектив с лицензией на производительность

Простой

6 мин

2.7K

Блог компании Postgres ProfessionalPostgreSQL * IT-компании

Мнение

Медленная работа базы данных высасывает ресурсы и нервы? Вы не одиноки. Но есть эксперты, способные выжать максимум из вашей инфраструктуры. Расскажем, как перфоманс инжиниринг помогает превратить «тормоза» в «ракету».

OlegIct 17 апр в 03:01

Аналитические запросы теста TPC-H в PostgreSQL

Средний

14 мин

1.8K

Oracle * SQL * Базы данных * PostgreSQL *

Обзор

В статье рассматривается использование теста TPC-H с PostgreSQL и проблемы, связанные с запросами Q17-Q20 теста.

Введение

Вместе с PostgreSQL поставляется утилит pg_bench с "TPC-B like" тестом. Кроме этого теста были созданы тесты TPC-R для отчётов, TPC-D для OLAP, TPC-W для заказов в веб-магазине, которые не получили распространения. На основе TPC-D был создан более удачный тест TPC-H для хранилищ данных и аналитических запросов ("OLAP нагрузка"). В тесте используется 8 таблиц и 17 ограничений целостности. В TPC-H выделены номинации по размерам обрабатываемых данных от "до 100Гб" до 30-100Тб. Тест TPC-H предназначен для хранилищ данных, включает в себя 22 запроса, которые называют Q1 ... Q22.

Запросы теста TPC-H не меняют данные в таблицах, а значит, для повторных тестирований не нужно пересоздавать или вакуумировать таблицы. В тестах TPC-B, TPC-C, TPC-E запросы довольно простые. В реальных приложениях запросы более сложные, чем в этих тестах. Поэтому для тестирования того, как СУБД выполняет запросы, которые могут встретиться в реальных приложениях, можно использовать все или отдельные запросы из теста TPC-H. Для быстрого аудита производительности различных СУБД используют вариант с 1Гб данных. В этом варианте запросы выполняются быстро, не нужно много памяти под экземпляр СУБД и много места на диске. Можно найти программы или скрипты для большинства СУБД, например, для PostgreSQL, Oracle Database, MySQL. После теста TPC-H появился тест TPC-DS с 99 запросами, но он менее популярен.

+10

1 2 ...

10 11

13 14 ...

103 104

PostgreSQL *

Обзор Greenmask — утилиты для логического дампа PgSQL с трансформацией данных на лету

Работа с базой данных для джунов и вайбкодеров. Соединения

Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций

Обзор пяти докладов конференции PgBootcamp 2025

LLM пайплайны укрощают сложность баз данных, или как мы подружили ИИ с БД без ИБД

Использование Daterange для поиска разрывов истории записей SCD2

Резервное копирование PostgreSQL по-взрослому

D7 — не показатель: ищем правду

Шардировать или не шардировать

О переупорядочении выражений в Postgres

Русский след в истории логотипа PostgreSQL

Оптимальная настройка Postgres Pro в один клик с pgpro_tune

Как мы упростили обновление СУБД Pangolin: показываю бэкенд решения

Ближайшие события

От хаоса к порядку: автоматизация мониторинга СУБД в гибридных средах

CRUD на PHP с использованием файберов и пула соединений с PostgreSQL

Параметры конфигурации мастера, отслеживаемые репликами PostgreSQL

Только хардкор, только мануал: репликация данных

Почему COUNT(*) быстрее, чем COUNT(col) — и когда это не так

Профессия performance инженер: детектив с лицензией на производительность

Аналитические запросы теста TPC-H в PostgreSQL

Вклад авторов