PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

Parampaika 28 мая в 16:34

Анализ и прогнозирование погодных условий

Простой

9 мин

1.1K

Python*PostgreSQL*

Из песочницы

Настоящее исследование посвящено комплексному анализу глобальных климатических изменений на основе исторических метеорологических данных за период с 1950 по 2024 год. Мы фокусируемся на шести ключевых странах, представляющих основные климатические зоны планеты.

dimoffon 28 мая в 10:28

Резервирование кластера Greengage DB (на базе Greenplum OSS)

Средний

14 мин

1.1K

Блог компании GreengageOpen source*Высоконагруженные системы*Распределённые системы*PostgreSQL*

Туториал

Greengage DB — это массивно-параллельная реляционная СУБД на базе Greenplum OSS, которая подходит для хранения и обработки данных. Позволяет выполнять сложные аналитические запросы над большими объёмами данных, предоставляя к ним гетерогенный доступ за счёт различного рода коннекторов и средств интеграции.

Но помимо функциональных возможностей, есть и ряд других необходимых вещей, таких как мониторинг, аудит, резервирование и пр. Они требуются для обеспечения полноценной и надёжной работы системы, особенно если речь идёт о промышленной эксплуатации. В рамках данной статьи как раз хочется обсудить подход к резервированию кластера Greengage: какие тут есть возможности, каковы подводные камни и многое другое.

+18

dub0v 28 мая в 07:18

Быстрый старт в маскировании данных PostgreSQL с инструментом pg_anon

Простой

9 мин

2.1K

Блог компании Тантор ЛабсPostgreSQL*SQL*Информационная безопасность*

Туториал

В этой статье поговорим о не самом гламурном, но жизненно важном — маскировании данных. Маскирование может касаться имён, телефонов, номеров карт, медицинских диагнозов и другой чувствительной информации. Если ваша компания до сих пор передает данные подрядчикам или аналитикам как они есть в базе, это в один «прекрасный» момент обязательно обернётся репутационной или финансовой проблемой для бизнеса.

В этой статье разберём, зачем нужно маскирование, какие данные требуют защиты, и представим opensource-инструмент, который поможет решить эти задачи гибко и эффективно.

GrishinAlex 27 мая в 08:17

Все, что нужно PostgreSQL: быстрые диски, дорогой процессор и терабайты RAM

Средний

13 мин

17K

Блог компании SelectelPostgreSQL*Базы данных*Облачные вычисления*Облачные сервисы*

Мнение

В облачном мире PostgreSQL возникает много вопросов. Какую конфигурацию выбрать для старта кластера? Сколько оперативной памяти и ядер CPU нужно под мою базу данных? Нужны ли под такой профиль нагрузки высокочастотные процессоры? Какое должно быть соотношение RAM к Storage в кластере? Хватает ли ресурсов и на системные службы, и на кэширование запросов? Не переплачиваю ли я?

Всем привет! Меня зовут Гришин Александр, я руководитель по развитию продуктов хранения данных в Selectel, отвечаю за объектное S3-хранилище и облачные базы данных. В этой статье я поделюсь своими практическими рекомендациями и ориентирами по планированию использования ресурсов кластера в PostgreSQL — в зависимости от типа и профиля нагрузки, размера данных и характера доступа к ним. Погнали!

Читать дальше →

+76

andrey7657956 26 мая в 11:18

Pytest-xdist: как распараллелить тесты без конфликтов в базе

Средний

15 мин

2.6K

Блог компании KTSPython*Тестирование IT-систем*Базы данных*PostgreSQL*

Туториал

Привет! Я Андрей Сташок, бэкенд-разработчик в KTS. В этой статье я расскажу о запуске параллельных тестов через pytest-xdist.

Почему это важно?

Объясню на нашем примере. При разработке продуктов мы постоянно выполняем юнит-тестирование. Раньше мы проверяли все последовательно, и с расширением тестовой базы время проведения испытаний заметно возрастало. Распараллеливание через pytest-xdist помогло нам сильно ускориться, и сегодня я хочу поделиться этим трюком с вами.

Я расскажу, как запускать параллельные тесты для реляционной БД PostgreSQL (с драйверами asyncpg и psycopg2) и key-value БД Redis. Для подключения к реляционной БД мы будем использовать SQLAlchemy, а для Redis — библиотеку redis. Кроме того, я рассмотрю, как автоматизировать выполнение миграций при каждом запуске тестов с использованием alembic.

+30

TantorLabs 23 мая в 14:29

Работа с длинными строками в PostgreSQL

Средний

9 мин

5.3K

Блог компании Тантор ЛабсPostgreSQL*Базы данных*1С*

Обзор

Если в таблицах БД PostgreSQL есть поля большого размера, при выгрузке часть строк таких таблиц может не выгружаться с выдачей ошибки ERROR: out of memory. Столкнуться с подобной ситуацией можно, например, при выгрузке утилитой pg_dump таблиц, в которых хранятся XML-документы, или при выгрузке таблицы public.config системы «1C:Предприятие». В статье рассматриваются причины возникновения подобных ошибок и способы решения проблемы.

+18

kirillkosolapov 23 мая в 08:24

Переосмысляя Serverless. Парадигма хранения и обработки данных

5 мин

2.1K

Блог компании AmveraServerless*Big Data*PostgreSQL*MySQL*

Мнение

Много было сказано про Serverless в нагрузках без сохранения состояния. Действительно, когда у вас есть контейнеры или функции их легко почти мгновенно масштабировать и нет большой разницы, на какой именно машине это делать.

Но данные имеют очень конкретную привязку к диску, на котором размещены. Что создает немало сложностей к самой концепции бессерверных вычислений.

В этой статье я хочу показать, где бессерверная архитектура может быть применима, и рассмотрю несколько новых, и весьма перспективных решений в этой области, таких как Neon, Warpstream и TiDB.

dipweb 22 мая в 06:15

Правильный порядок колонок в B-tree индексах PostgreSQL или правило ESR

Средний

9 мин

6.9K

SQL*PostgreSQL*Базы данных*Серверная оптимизация*Data Engineering*

Из песочницы

Когда в проекте используется составной B-tree индекс, важно не просто "создать индекс", а сделать это правильно — иначе запросы могут не только не ускориться, но и начать работать медленнее. Возникает логичный вопрос: как выбрать порядок колонок, чтобы индекс действительно работал эффективно? Брутфорсом? По интуиции? По селективности?

В этой статье я расскажу, как подходить к построению составных индексов в PostgreSQL, на что реально влияет порядок колонок. Также разберём простое правило ESR, которое помогает упростить выбор и получать стабильный прирост производительности на всех стендах.

+21

LesnoyChelovek 21 мая в 13:08

Секционируй и властвуй: делимся нетайными знаниями о секционировании в Postgres Pro

Средний

13 мин

2.6K

Блог компании Postgres ProfessionalPostgreSQL*Базы данных*Высоконагруженные системы*

Туториал

В арсенале Postgres Pro есть мощное, но порой недооцененное оружие — декларативное секционирование. Оно только звучит сложно, а на деле позволяет элегантно «нарезать» гигантские таблицы, превращая их из неповоротливых монстров в управляемые и быстрые структуры. Делимся нетайными знаниями, которые помогут оптимизировать запросы и упростить жизнь.

+16

badcasedaily1 20 мая в 19:01

Проблема мягкого удаления (deleted_at) и как её решить

Простой

4 мин

11K

Блог компании OTUSPostgreSQL*Базы данных*

Обзор

Привет, Хабр!

В этой статье рассмотрим классическую проблему «мягкого удаления» на уровне схемы баз данных и её влияние на аналитику.

Почти в каждой системе встречается требование «не удалять данные окончательно».

SergeySeredkinlipetsk 19 мая в 19:04

Асинхронность в JavaScript, как использовать в web разработке на React, цепочка промисов и параллельное выполнение

Средний

9 мин

4.5K

HabrJavaScript*NestJS*PostgreSQL*ReactJS*

Туториал

Асинхронность в JavaScript, где и как использовать в web разработке на frontend и backend. Цепочка промисов и их параллельные выполнение.

Переходим к Async/await

-8

Kmamish 19 мая в 13:27

Как заставить вашу базу данных летать, а не ползать. Часть 1 масштабирование и репликация

Средний

10 мин

12K

Блог компании SENSEMySQL*SQL*Базы данных*PostgreSQL*

Туториал

Всем привет! Меня зовут Илья Криволапов, тружусь системным аналитиком в SENSE на проекте одного из цветных банков РФ. В профессии я уже пятый год и, несмотря на фамилию, ломал прод всего лишь несколько незначительных раз (надеюсь).

На досуге я преподаю в университете дисциплину «Хранение и обработка больших объемов данных» и за все время у меня накопилось много полезной информации. Непростительно хранить такой клад у себя в столе, поэтому я подготовил для читателей Хабра ультимативный гайд по оптимизации или хорошему такому, грамотному проектированию баз данных с расчетом на масштабирование.

Всего в цикле будет 3 статьи. В первой поговорим о двух разных подходах масштабирования БД и о том, как лучше его делать и как лучше не делать (Никогда. Пожалуйста).

Кому будет полезно? Всем отвечающим за «здоровье» базы данных: DBA, архитекторам, DevOps-инженерам, аналитикам и разработчикам.

Согласны? Узнали? Тогда поехали!

+11

Igor_Le 18 мая в 15:05

PGConf.Russia 2025 Москва — Непал

10 мин

1.6K

Блог компании Postgres ProfessionalPostgreSQL*

PGConf.Russia 2025 прошла в месте историческом: в Центре Международной Торговли. История её короткая, но эффектная: построили в конце 70-х, ЦМТ был сначала Совинцентром, потом «Хаммеровским центром» - это было в то время такое окно в Европу. Через окно входили и выходили технологии и бизнес. Скульптура Меркурия перед фасадом мелькала тогда то и дело в новостях. Бизнес, судя, например, по машинам на парковке, это здание (комплекс зданий) отнюдь не позабыл. Хотел написать (и, как видите, написал) круче только в Кремлёвском Дворце Съездов эту конференцию провести, но и не так, и КДС тут не при чём. Но я был впечатлён и вспоминал с некоторыми коллегами былые технологические события, проходившие здесь во времена, когда таких мест было раз два и обчёлся, а может и раз - без два.

+19

badcasedaily1 15 мая в 16:10

Зачем нужен fillfactor в PostgreSQL

Простой

4 мин

4.4K

Блог компании OTUSБазы данных*PostgreSQL*

Обзор

Привет, Хабр!

Один параметр PostgreSQL может похоронить вашу производительность, если вы о нём забудете — это fillfactor. Почему однократная настройка числа приводит к неожиданным page split, bloat и мучительному откату запросов? Давайте разбираться.

+15

mizhka 14 мая в 13:00

Как мы под Новый Год загрузили в PostgreSQL петабайт данных и что из этого вышло

Средний

19 мин

15K

Блог компании Postgres ProfessionalPostgreSQL*Базы данных*

Эта история началась с шутки на офисной кухне 10 декабря, но, как водится, у каждой приличной шутки, она вдруг стала интересной для воплощения, а в конце переросла в не самую технически простую реализацию с хождением по многочисленным граблям.

А началось всё просто: пока все вокруг спорят как настраивать железо и тюнить операционные системы дабы выжать лишних TPS, мы решили проверить как отреагирует движок PostgreSQL если загрузить в него действительно большой объём данных. Например, давайте сделаем базу размером один петабайт и посмотрим как он это переживёт.

На дворе было 10 декабря, руководство поставило задачу сдать отчёт 20 января, до нового года оставалось меньше месяца, а в руках появился знакомый всем инженерам зуд.

+116

eivanov 13 мая в 08:42

Шардированный не значит распределённый: что важно знать, когда PostgreSQL становится мало

Средний

9 мин

13K

Блог компании YDBБазы данных*Высоконагруженные системы*Программирование*PostgreSQL*

Шардирование, двухфазный коммит и распределенные транзакции окружены определенными мифами и заблуждениями. Например, может быть достаточно неочевидно, что двухфазный коммит обеспечивает только атомарность транзакций, но не их изоляцию. Поэтому мы решили написать пост, который бы помог разобраться в этих сложных вещах и сделать правильный выбор, когда Postgres'а Вам станет мало и Вы столкнётесь с шардированием.

+91

kostja 13 мая в 06:54

Picodata: вторая жизнь in-memory баз данных

Сложный

17 мин

5.3K

Блог компании ArenadataБазы данных*Open source*Высоконагруженные системы*PostgreSQL*

Обзор

Привет, меня зовут Костя Осипов, и я занимаюсь разработкой СУБД. На Хабре есть несколько моих статей про MySQL, Tarantool и про всякое-разное. Кроме того, я веду Telegram-канал, где делюсь инсайтами в области управления базами данных. Сегодня я выступаю в роли основателя компании Picodata, создающей одноимённую открытую СУБД, и управляющего директора ПАО Arenadata по исследованиям и разработке. Ниже — вольный пересказ моего недавнего доклада на HighLoad. Он про то, что нас ждёт в мире СУБД завтра, и, в частности, про место резидентных СУБД в архитектурах будущего.

+46

MightyDok 12 мая в 14:16

Обзор Greenmask — утилиты для логического дампа PgSQL с трансформацией данных на лету

Простой

7 мин

2.5K

DevOps*Тестирование IT-систем*PostgreSQL*Go*Open source*

Из песочницы

Greenmask — это кроссплатформенный инструмент, разработанный на Go специально для безопасной работы с данными PostgreSQL: он помогает делать логические бэкапы, восстанавливать таблицы и при необходимости — анонимизировать чувствительную информацию. Главное преимущество Greenmask — полная совместимость с pg_dump и pg_restore. То есть, если вы уже работаете с этими инструментами, интеграция Greenmask не потребует пересмотра всей инфраструктуры.

Один из ключевых сценариев использования утилиты - подготовка баз данных для тестового стенда. Greenmask позволяет упростить процесс дампа продуктивных баз, обработки их для анонимизации тех же персональных данных, снижения размера баз (в тестовой среде зачастую не нужны терабайты данных с прода), восстановления дампов в тестовый контур.

Ниже в статье я опишу базовый функционал, примеры конфигураций для начала работы с Greenmask, а так же рассмотрим примеры трансформации данных при дампе таблиц.

Официальный сайт: https://greenmask.io

Документация: https://docs.greenmask.io/latest/

GitHub-репозиторий: https://github.com/GreenmaskIO/greenmask (уже 1308 звезд)

Telegram-канал: https://t.me/greenmask_ru

nvantropov 11 мая в 15:20

Работа с базой данных для джунов и вайбкодеров. Соединения

Средний

4 мин

2.1K

Java*PostgreSQL*Node.JS*Go*

Из песочницы

Коннекты обычно не приносят много головной боли на начальных этапах разработки. Вообще работа с ними обычно делается один раз, во время настройки, и дальше тюнится по необходимости. Но эта необходимость возникает часто в виде непонятных ошибок, которые выкидываются в случайных местах, непонятных графиков в графане и суеты админов вашей базы данных. Я постарался собрать ту информацию, которая позволит вам не потеряться в такой ситуации и даже поможет определить суть проблемы.

-9

zebin 10 мая в 08:02

Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций

Средний

4 мин

25K

Java*SQL*PostgreSQL*Go*

Туториал

Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций

Задача перевода денег в первом приближении сводится к обновлению пары строк и кажется простой — но обеспечение корректности при параллельном доступе может быть неожиданно сложным для только знакомящихся с уровнями изоляций БД.

+24

147

1 2

4 5 ...

95 96

PostgreSQL *

Анализ и прогнозирование погодных условий

Резервирование кластера Greengage DB (на базе Greenplum OSS)

Быстрый старт в маскировании данных PostgreSQL с инструментом pg_anon

Все, что нужно PostgreSQL: быстрые диски, дорогой процессор и терабайты RAM

Pytest-xdist: как распараллелить тесты без конфликтов в базе

Работа с длинными строками в PostgreSQL

Переосмысляя Serverless. Парадигма хранения и обработки данных

Правильный порядок колонок в B-tree индексах PostgreSQL или правило ESR

Секционируй и властвуй: делимся нетайными знаниями о секционировании в Postgres Pro

Проблема мягкого удаления (deleted_at) и как её решить

Асинхронность в JavaScript, как использовать в web разработке на React, цепочка промисов и параллельное выполнение

Как заставить вашу базу данных летать, а не ползать. Часть 1 масштабирование и репликация

PGConf.Russia 2025 Москва — Непал

Ближайшие события

Зачем нужен fillfactor в PostgreSQL

Как мы под Новый Год загрузили в PostgreSQL петабайт данных и что из этого вышло

Шардированный не значит распределённый: что важно знать, когда PostgreSQL становится мало

Picodata: вторая жизнь in-memory баз данных

Обзор Greenmask — утилиты для логического дампа PgSQL с трансформацией данных на лету

Работа с базой данных для джунов и вайбкодеров. Соединения

Задачи на собеседованиях. Денежные переводы в SQL. Обновление счетов и уровни изоляций

Вклад авторов