PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

Vit_IT 29 июн 2022 в 10:09

Алгоритм работы HA кластера PostgreSQL с помощью Patroni

3 мин

15K

PostgreSQL * Базы данных * Системное администрирование *

Из песочницы

Привет всем Хабр-читателям. Про развертывание и настройку HA кластера PostgreSQL с помощью Patroni написано много полезных статей, однако я не нашел описания алгоритма его работы. В этой статье я хочу поделиться своим исследованием по данному вопросу.

Kilor 29 июн 2022 в 07:00

SQL HowTo: обход дерева иерархии «по курсору» через двойную рекурсию

3 мин

12K

Блог компании ТензорPostgreSQL * SQL * Алгоритмы * ERP-системы *

В предыдущих статьях "PostgreSQL Antipatterns: навигация по реестру", "PostgreSQL 13: happy pagination WITH TIES" и "SQL HowTo: курсорный пейджинг с неподходящей сортировкой" я уже рассматривал проблемы навигации по данным, представленных в виде плоского реестра.

Но что если мы хотим выводить данные не простым "бесконечным списком", а в виде иерархической структуры с быстрой навигацией по узлам - например, обширный каталог товаров или меню ресторана, как это делает Presto - наш продукт для автоматизации заведений питания? Вот тут нам и придется что-то поизобретать...

+15

SergeiKitaev 25 июн 2022 в 14:19

Технология SQL-файл, препроцессор для T-SQL, “бок-о-бок” файлы и др

20 мин

5.8K

Базы данных * Microsoft SQL Server * SQL * PostgreSQL * MySQL *

Завершив в недавнем прошлом очередную доработку своей легковесной технологии SQL-файл, применяемой для эффективной трансляции файлового SQL-кода в базу данных, автор данной статьи решил в очередной раз представить (в этой заметке теперь, на популярном ресурсе) свои реализованные, хотя бы отчасти, идеи касательно программирования MSSQL, а также некоторые соображения относительно применения SQL вообще. Автор полагает, что несмотря на форму предлагаемой им частной реализации SQL-файл (для MSSQL), лежащая в основе подхода концепция имеет определённую силу и смысл.

Выше на картинке: SQL-трансляция исходных файлов из нескольких директорий (скрипты *.sql), запуск fill_with_data.cmd

Afftobus 23 июн 2022 в 06:00

История одного OOM

7 мин

9.6K

Блог компании hh.ruPostgreSQL * Java *

Технотекст 2022

Cезон Java

В далекой-далекой галактике были времена стабильности и процветания. Сервис с шестнадцатью инстансами работал на благо человечества. Через Hibernate он ходил в PostgreSQL-базу, доставал необходимые данные и отдавал другим по REST-интерфейсу. Однако спокойные времена прошли. Внезапно один из инстансов упал с OutOfMemoryError. Лучшие программисты hh.ru пустились в погоню за heapdump-ом в поисках ценнейшей информации.

Привет, меня зовут Артем, я — бэкенд-разработчик в hh.ru. В этой статье расскажу о том, как мы чинили одну из ошибок OutOfMemoryError, которая возникла при работе сервиса с базой данных. Сегодня говорим только на бэкендерском!

+23

ru_vds 22 июн 2022 в 13:00

Приложение для чата в реальном времени с помощью Nestjs и PostgreSQL

9 мин

31K

Блог компании RUVDS.comМессенджеры * PostgreSQL * Node.JS * NestJS *

Перевод

При помощи этого руководства вы научитесь добавлять функции чата в реальном времени в ваше веб-приложение Nestjs с использованием веб-сокетов. Мы создадим само приложение для чата, а также сохраним чаты пользователей в базе данных PostgreSQL.

Читать дальше →

+23

TCapS 22 июн 2022 в 10:08

In-App шардирование PostgresDB. Практическое велосипедостроение

14 мин

30K

Блог компании AliExpress CISPostgreSQL * .NET *

Привет, Хабр! Сегодня с вами команда AliExpress Order Management System, и мы поговорим про очередное решение по шардированию PostgreSQL, на этот раз in-app, то есть живущее непосредственно в приложении, которому нужна функциональность шардинга.

+12

deleburth 20 июн 2022 в 09:46

Миграция электронного документооборота Directum RX на Linux и PostgreSQL

7 мин

7.8K

Блог компании ЕАЕ-КонсалтPostgreSQL * Linux * Облачные сервисы *

Итак, произошло то, что произошло, сегодня невозможно сделать сет Directum RX на MS SQL. Microsoft перестал отгружать лицензии в России. Для многих это стало неожиданностью, а для нас — нет. Задолго до введения санкционных ограничений мы позаботились о переходе на PostgreSQL и Linux. Причины были банальны — хотелось сократить расходы на лицензии.

Также хотелось научиться переводить системы Directum на PostgreSQL, предполагая, что слонёнок будет востребован у наших заказчиков по той же финансовой причине. Для нас отказ от баз Microsoft был плановым. Кроме того, мы перевели инфраструктуры вместе с Directum на Linux. Сегодня оцениваем эту попытку “переехать” с сокращением затрат как отчасти удачную.

Я, Виталий Волнянский, руководитель практики технологических решений (CTO), директор по продажам (VPS) ООО “ЕАЕ-Консалт”, под катом расскажу о том, как проходила миграция и с какими проблемами нам пришлось столкнуться.

Igor_Le 18 июн 2022 в 22:30

Postgresso #5 (42)

18 мин

6.3K

Блог компании Postgres ProfessionalPostgreSQL *

ИТ-инфраструктура — это как водопровод, без неё жизнь уже почти невозможна. И мы продолжаем выпускать Postgresso.

PostgreSQL 14.4

Экстренный релиз, исправляющий баг при индексировании в PostgreSQL 14. Незадолго до этого был даже специальный анонс:

PostgreSQL 14 out-of-cycle release coming June 16, 2022

Сразу после выхода первой же версии PG14 стало известно, что при выполнении команд CREATE INDEX CONCURRENTLY и REINDEX CONCURRENTLY могут незаметно попортиться индексы. Наконец, в 14.4 уже не нужно осторожничать, выполняя эти команды или проверять индексы при помощи команды pg_amcheck с флагом --heapallindexed (которая, к тому же, проверяет только btree-индексы).

Но этим исправления в PostgreSQL 14 отнюдь не исчерпываются. Список их в release notes не слишком короткий.

Читать дальше →

+17

rikki_tikki 17 июн 2022 в 19:02

Неожиданная находка, которая освобождает 20 GB неиспользованного индексного пространства

14 мин

43K

Блог компании OTUSPostgreSQL * Хранение данных *

Перевод

Раз в несколько месяцев мы получаем предупреждения от системы мониторинга базы данных о том, что свободное место скоро закончится. Обычно мы просто выделяем больше места и забываем об этом, однако в этот раз мы мы были на карантине и система была нагружена меньше, чем обычно. И тут мы подумали, что это хорошая возможность провести чистку.

Начнем с конца: в итоге нам удалось освободить более чем 70 GB не оптимизированного и неиспользуемого пространства без удаления индексов и данных.

+51

azatyakupov 16 июн 2022 в 10:11

Возможности Heap Table в PostgreSQL

12 мин

20K

Блог компании QuadcodeData Engineering * PostgreSQL *

Меня зовут Якупов Азат, я дата-архитектор Quadcode. В индустрии я больше 20 лет, из них больше 6 лет — в архитектуре. Эта статья — немного сокращенный пересказ моего выступления на митапе по теме «Heap Table в PostgreSQL».

Речь в тексте пойдет об обычных таблицах, с которых начинается вся дата-инженерия. Посмотрим на то, как метаданные располагаются в Postgres, разберемся, что такое table page и fillfactor, а также поближе познакомимся с TOAST-таблицами.

+14

kot_review 10 июн 2022 в 08:00

Как настроить и запустить систему отслеживания измененных данных PostgreSQL

12 мин

31K

Блог компании FirstVDSPostgreSQL * Системное администрирование *

Перевод

PostgreSQL предлагает метод логического декодирования и делает возможным сбор данных об изменениях на основе логирования. Вы сможете настроить и запустить CDC в несколько шагов.

Архитектура современных веб-приложений состоит из нескольких программных компонентов, таких как информационные панели (дашборды), аналитические системы, базы данных, озёра данных (Data Lakes), кэшевые хранилища, функции поиска и т.д.

База данных обычно является основной частью любого приложения. Обновление данных в режиме реального времени позволяет поддерживать разрозненные системы данных в непрерывной синхронизации и быстро реагировать на появление новой информации. Как же поддерживать экосистему приложений в синхронном состоянии? Как эти компоненты получают информацию об изменениях в базе данных? Термин отслеживание изменённых данных, или сокращённо CDC, — относится к любому решению, которое идентифицирует новые или изменённые данные.

Статья посвящена отслеживанию изменённых данных (CDC) в PostgreSQL и способам достижения этой цели.

Отслеживание изменённых данных (CDC) — это метод интеграции данных для обнаружения, захвата и передачи изменений, внесённых в источники данных базы данных.

Как правило, интеграция данных на основе CDC состоит из следующих шагов:

Захват изменённых данных в исходной базе данных.
Преобразование изменённых данных в формат, который могут принять ваши потребители (консьюмеры).
Публикация данных для консьюмеров или целевой базы данных.

PostgreSQL предлагает два встроенных способа сделать CDC возможным:

Из журналов транзакций, PostgreSQL WALs (они же Write Ahead Logs).
С помощью триггеров базы данных.

Давайте кратко обсудим плюсы и минусы использования журналов транзакций (WALs) и триггеров для отслеживания изменения данных.

Читать дальше →

+13

skitial 9 июн 2022 в 09:17

Облегчаем жизнь PostgreSQL таблице под нагрузкой

11 мин

12K

Блог компании KarunaPostgreSQL * Базы данных *

Туториал

У любого современного продукта — если он успешен — есть тот момент жизни, когда он из гадкого стартапа вдруг становится вполне себе прекрасным “энтерпрайз монолит платформ систем легаси”. Без тестов, без мониторинга, с highload и, конечно же, уймой родовых травм, вызванных быстрым развитием.

На критическую бизнес логику тесты будут написаны сами, без них никуда. Мониторинг и хайлоад — это курица и яйцо. После того, как у вас появится кто-то один из этой пары, на горизонте появится и второй. А вот все те, казалось бы, “удачные” и “быстрые” решения, заложенные при рождении, придётся исправлять. И если кодовую базу можно спокойно переписать (ну или хотя бы закидать костылями), то вот база данных — это одна сплошная горячая точка. Запросы и миграции, которые легко проходили на момент становления вашего продукта, легко могут сейчас положить прод, потому что ваша база теперь под постоянной нагрузкой, а ещё она неприлично раздулась.

Привет! Меня зовут Константин, и в Каруне я работаю backend-разработчиком. Данная статья — компиляция ряда сложностей, с которыми мы столкнулись, и методик для их решения. Вся проблема громоздких таблиц в том, что они, как визит к стоматологу — неожиданно, дорого, больно и ужасно вариативно.

+19

kmoseenk 6 июн 2022 в 16:11

Два размера подходят большинству: PostgreSQL и Clickhouse

7 мин

Блог компании OTUSPostgreSQL *

Перевод

С момента появления System R в 1974 году реляционные базы данных в целом, и SQL-базы в частности, стали доминирующим подходом для хранения данных, и до сих пор сохранили это положение, несмотря на появление многочисленных серьезных конкурентов. Слухи о кончине и упадке традиционных реляционных баз данных появляются постоянно, но PostgreSQL уверенно держит позиции и опережает как своих предшественников, так и предполагаемых преемников.

Фактически, база данных MySQL была настолько распространена, что стала частью одноименного стека LAMP (Linux, Apache, MySQL, Perl), преобладающего в ранних веб-разработках.

Единственным большим исключением из этой тенденции является OLAP, со специализированными методами, позволяющими резко повысить производительность определенных рабочих нагрузок. А новые соперники, такие как ClickHouse, качественно изменили подходы к аналитике.

-1

SIGMA_team 6 июн 2022 в 15:15

30 тыс. строк кода или как мы переходили с Oracle на PostgreSQL с помощью утилиты Ora2Pg 23.0

9 мин

17K

Блог компании СИГМАOracle * PostgreSQL * Базы данных *

Технотекст 2022

Привет, меня зовут Андрей, я работаю ведущим разработчиком в компании СИГМА и отвечаю за решения по автоматизации расчетов технических условий. Сегодня хочу поделиться своим опытом переноса в среду PostgreSQL данных из СУБД Oracle и процедур, разработанных на PL/SQL.

Перед моей командой была поставлена срочная и нетривиальная задача перенести разрозненный функционал, ранее разработанный на базе СУБД Oracle, в единую систему управления распределительными электрическим сетями (по-простому СИГМА СУС), которая работает на основе PostgreSQL и сочетает в себе подсистемы DMS, SCADA, GIS, NIS, OMS и другие.

+10

Polina_Averina 30 мая 2022 в 08:52

Построение DWH на основе Greenplum

11 мин

25K

Блог компании СлёрмPostgreSQL * SQL * IT-инфраструктура * Базы данных *

DBA в Southbridge Иван Чувашов подготовил статью о построении DWH на основе Greenplum. Слово Ивану.

Привет, Хабр! Я администратор баз данных с 15-летним опытом. Сегодня хочу рассказать про Data Warehouse на основе Greenplum — как они устроены, как их поднимать и с какими проблемами и нюансами я лично сталкивался в своей практике.

Читать про Greenplum

Kilor 30 мая 2022 в 06:30

«Ленивый сахар» PostgreSQL

7 мин

70K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

SQL - декларативный язык - то есть вы описываете "что" хотите получить, а СУБД сама решает, "как" именно она будет это делать. Некоторые из них при этом позволяют им "подсказывать", как именно лучше выполнять запрос, но PostgreSQL - нет.

Тем не менее, "синтаксический сахар" некоторых языковых конструкций позволяет не только писать меньше кода (учите матчасть!), но и добиться, что ваша база будет делать часть вычислений "лениво", только при фактической необходимости.

+42

Mauzzz0 21 мая 2022 в 23:01

ORM — отвратительный анти-паттерн

10 мин

119K

ООП * IT-стандарты * SQL * Java * PostgreSQL *

Перевод

_{От автора перевода: Написанный далее текст может не совпадать с мнением автора перевода. Все высказывания идут от лица оригинального автора, просьба воздержаться от неоправданных минусов. Оригинальная статья выпущена в 2014 году, поэтому некоторые фрагменты кода могут быть устаревшими или "нежелаемыми".}

Содержание статьи:

В статье приведены доводы, которые ставят под вопрос правильность присутствия ORM в рамках ООП.

+27

196

olegbunin 20 мая 2022 в 10:58

Автоматическое масштабирование БД в Kubernetes для MongoDB, MySQL и PostgreSQL

7 мин

6.8K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL * SQL * MongoDB * Kubernetes *

Перевод

Стремясь к повышению производительности базы данных, вы можете столкнуться с ситуацией, когда оптимизации и настройки уже недостаточно. Если вы не можете заменить движок БД, а для настройки параметры рабочей нагрузки больше нет возможностей — базу данных придется масштабировать. Делать это руками долго и нецелесообразно, но и у автоматизации процессов масштабирования есть свои подводные камни.

Это перевод статьи Дмитрия Костика и Миколы Моржан из Percona. С их помощью посмотрим, в какой степени можно автоматизировать горизонтальное масштабирование баз данных MongoDB, MySQL и PostgreSQL в Kubernetes и как это сделать?

+13

RekGRpth 18 мая 2022 в 08:51

Рецепты REST OData в 1C: Python vs… PL/pgSQL !?

8 мин

8.7K

1С * Python * PostgreSQL *

Туториал

Для приготовления CRUD нам понадобится 1C, Python и ... PostgreSQL. Сначала нужно включить REST OData в 1C.

Igor_Le 17 мая 2022 в 00:11

Постгрессо №4 (41)

10 мин

5.6K

Блог компании Postgres ProfessionalPostgreSQL *

ИТ-инфраструктура — это как водопровод, без неё жизнь уже почти невозможна. И в эти безрадостные дни мы продолжаем выпускать Postgresso.

PostgreSQL 14.3

Вышла версия 14.3 (release notes), и обновлены предыдущие ветки: 13.7, 12.11, 11.16, и 10.21 (объявлено, что ветвь PostgreSQL 10 не будет обновляться с 10-го ноября 2022-го).

В версии много исправлений, отметим два. Александр Лахин из Postgres Professional обратил внимание на лазейку:

В случае, когда привилегированный пользователь работает с объектами другого пользователя, команды REINDEX, CREATE INDEX, REFRESH MATERIALIZED VIEW и CLUSTER отрабатывали недостаточно безопасно. Это же относится и к autovacuum, и pg_amcheck. Они активировали релевантную защиту (заключали процессы в песочницу операций, ограниченных соображениями безопасности — «security restricted operation» sandbox) или слишком поздно, или вообще не активировали её. Если у атакующего были привилегии создавать не временные объекты хотя бы в одной схеме, он мог запустить под суперпользователем зловредные SQL-функции.

Похожая проблема, но с конструкциями DECLARE CURSOR… WITH HOLD и вызовом отложенных триггеров в выражениях индексов и запросов матпредставлений была замечена и ликвидирована ещё в PostgreSQL 12. Новый баг поправлен во всех версиях PostgreSQL от 10 до 14.

Читать дальше →

+17

1 2 ...

53 54

56 57 ...

107 108

PostgreSQL *

Алгоритм работы HA кластера PostgreSQL с помощью Patroni

SQL HowTo: обход дерева иерархии «по курсору» через двойную рекурсию

Технология SQL-файл, препроцессор для T-SQL, “бок-о-бок” файлы и др

История одного OOM

Приложение для чата в реальном времени с помощью Nestjs и PostgreSQL

In-App шардирование PostgresDB. Практическое велосипедостроение

Миграция электронного документооборота Directum RX на Linux и PostgreSQL

Postgresso #5 (42)

Неожиданная находка, которая освобождает 20 GB неиспользованного индексного пространства

Возможности Heap Table в PostgreSQL

Как настроить и запустить систему отслеживания измененных данных PostgreSQL

Облегчаем жизнь PostgreSQL таблице под нагрузкой

Два размера подходят большинству: PostgreSQL и Clickhouse

Ближайшие события

30 тыс. строк кода или как мы переходили с Oracle на PostgreSQL с помощью утилиты Ora2Pg 23.0

Построение DWH на основе Greenplum

«Ленивый сахар» PostgreSQL

ORM — отвратительный анти-паттерн

Автоматическое масштабирование БД в Kubernetes для MongoDB, MySQL и PostgreSQL

Рецепты REST OData в 1C: Python vs… PL/pgSQL !?

Постгрессо №4 (41)

Вклад авторов