PostgreSQL *

Свободная объектно-реляционная СУБД

Kilor 5 мая 2022 в 14:00

PostgreSQL Antipatterns: в этом плане кто-то лишний

3 мин

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Сегодня будет рассказ про избыточные группировки и сортировки в SQL-запросах - как они возникают, по каким признакам их можно потом вычислить и как избавиться от них.

+10

Anna_sokol22 4 мая 2022 в 09:54

Миграция с Oracle на PostgreSQL: зачем, как и что для этого нужно

8 мин

18K

Блог компании СлёрмOracle * PostgreSQL *

Привет, Хабр! Меня зовут Иван Чувашов, я сертифицированный администратор PostgreSQL с 13-летним опытом работы с БД. Хочу поговорить на весьма актуальную в последнее время тему — о миграции на PostgreSQL с Oracle. Расскажу, зачем вообще тратить время и деньги на миграцию, какие для этого понадобятся компетенции, какие есть варианты миграции, как этот процесс можно организовать и избежать типичных ошибок.

+19

r9deyes 1 мая 2022 в 03:48

Мгновенные снепшоты postgres на tablespace и btrfs

4 мин

9.3K

PostgreSQL * Linux * Тестирование веб-сервисов *

Из песочницы

Для работы бывает полезно иметь несколько копий одной реальной базы для экспериментов, фикстур или просто тестовых приложений. База растет и время копирования через разворачивание дампа или с помощью шаблона также возрастает до утомительных величин. Для решения этого кейса уже описаны варианты использования файловой системы с поддержкой CoW - Btrfs. В интернете находил такие инструкции, они сводятся к тому, что делается снепшот всего сервера. И для работы второго "скопированного" нужно перегенерировать pid и сменить порт для предотвращения конфликтов. Этот способ довольно универсальный относительно конфигурации баз на сервере, но кажется имеет ограничение для неопределенного кол-ва параллельных снепшотов серверов.

В этой статье предлагаю свой вариант реализации снепшотов на одном экземпляре сервера postgres и одной базы, на произвольное кол-во копий.

Инструкция linux only, про поддержку CoW файловых систем на Windows не в курсе.

+12

Kilor 26 апр 2022 в 13:45

Псс, парень… индекс нужен?

8 мин

28K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Самый больной вопрос для любого разработчика, которому приходится вычитывать данные из базы: "Как сделать мой запрос быстрее?". Классический ответ - необходимо создать подходящий индекс. Но куда именно его стоит "накатывать", да и как вообще он должен выглядеть?..

Мы научили наш сервис визуализации планов PostgreSQL отвечать на эти вопросы, и под катом расскажем, чем именно он руководствуется в своих рекомендациях.

+22

ptolmachev 20 апр 2022 в 12:47

Как работает оптимизатор PostgreSQL при большом количестве таблиц в запросе

9 мин

26K

Блог компании Postgres ProfessionalPostgreSQL * SQL * Базы данных *

Технотекст 2022

SQL — это декларативный язык программирования, используемый для создания и манипулирования объектами в реляционных СУБД. Этот язык описывает что должно быть получено, но не описывает как это получить. Программист пишет запрос и (чаще всего) хочет получить результат от СУБД максимально быстро.

Работу по нахождению самого лучшего способа получения требуемых данных выполняет планировщик (он же оптимизатор) запросов. Он выбирает способы соединения наборов строк и их обработки, строит различные планы выполнения запроса и находит среди них наилучший, для чего используется стоимостная модель оптимизации.

Поэтому оптимизатор — это ключевая часть СУБД, один из самых сложных элементов всей системы.

Для демонстрации работы оптимизатора практически во всех наших (и чужих) примерах на эту тему используются довольно скромные параметры: две-три таблицы, пара JOIN-ов, миллисекунды на выполнение запросов. А что будет, если загрузить оптимизатор десятками таблиц за раз? Как разные конфигурационные параметры влияют на производительность запросов с сотней JOIN-ов? И переживет ли это среднестатистический рабочий ноутбук? Ответы на эти вопросы — со схемами и графиками — вы найдете под катом!

Читать дальше →

+21

Igor_Le 19 апр 2022 в 16:00

Postgresso #3 (40)

6 мин

5.8K

Блог компании Postgres ProfessionalPostgreSQL *

ИТ-инфраструктура — это как водопровод, без неё жизнь уже почти невозможна. И в эти безрадостные дни мы продолжаем выпускать Postgresso.

Feature Freeze

7 апреля произошла Заморозка функциональности. Вошедших новшеств много. Традиционный обзор Павла Лузанова выйдет немного позже.

Главными достижениями недавнего времени стали 2 серии мощных патчей, добавляющие важную функциональность и ещё плотней приближающие к стандартам SQL — SQL/JSON и MERGE.

SQL/JSON

Вот два поста в ЖЖ Олега Бартунова:

SQL/JSON standard-2016 conformance for PostgreSQL, Oracle, SQL Server and MySQL

SQL/JSON in PG15 !

Скрин стандартов из статьи Олега Бартунова

Между этими двумя постами три года. В первом он обозначил 3 большие серии патчей, связанных со стандартом SQL/JSON. Во втором — недавние коммиты. Судьба патчей такова:

SQL/JSON: jsonpath (закоммичено на коммитфесте 2019-03)
SQL/JSON: functions (закоммичено на коммитфесте 2022-03)
SQL/JSON: JSON_TABLE (закоммичено на коммитфесте 2022-03)

Читать дальше →

+18

ivolake 15 апр 2022 в 09:55

Поднимаем Apache Superset — необходимый и достаточный гайд

9 мин

74K

PostgreSQL * IT-инфраструктура * Apache * Визуализация данных * DIY или Сделай сам

Из песочницы

Пингвины для привлечения внимания. Как поднять Apache Superset, подключить к нему локальный Postgres и чтобы потом на вас коллеги не смотрели косо.

Kilor 13 апр 2022 в 13:30

«Импортозамещаем» анализ планов PostgreSQL

4 мин

13K

Блог компании ТензорPostgreSQL * SQL * Базы данных * Визуализация данных *

Вчера Hubert 'depesz' Lubaczewski закрыл доступ с российских IP ко всем своим сайтам, включая широко известный визуализатор планов PostgreSQL-запросов explain.depesz.com.

Но это не беда, потому что в компании "Тензор" мы разработали сервис explain.tensor.ru, функционал которого гораздо обширнее, и которым можете воспользоваться и вы.

+40

randall 13 апр 2022 в 10:15

Как мы ускорили выполнение запросов PostgreSQL в 100 раз

10 мин

56K

Блог компании MWS CloudВысоконагруженные системы * Open source * PostgreSQL * Базы данных *

Перевод

Существует великое множество статей об оптимизации PostgreSQL — эта «кроличья нора» весьма глубока. Когда несколько лет назад я начал разрабатывать бэкэнд аналитического сервиса, у меня уже был опыт работы с другими СУБД, такими как MySQL и SQL Server. Тем не менее, раньше мне не приходилось так фокусироваться на производительности. В прошлых проектах, над которыми я работал, либо не было жестких требований к времени обработки (DS/ML), либо не требовалось обрабатывать много строк одновременно (обыкновенные веб-приложения). Однако в этот раз мои запросы:

• состояли из 3-10 JOIN-ов по коррелирующим запросам;

• уielded от 10 до 1,000,000 строк;

• должны были выполняться в течение времени, определенного UX-ом;

• не могли быть hinted — пока Cloud SQL, управляемый PostgreSQL в Google Cloud, не стал поддерживать pg_hint_plan в конце 2021 года;

• запрещали прямой доступ к серверному процессу, чтобы, например, хакнуть некоторые perf — потому что PostgreSQL был managed.

Получение целого миллиона строк в одном API endpoint сигнализирует о проблеме в алгоритме или архитектуре. Конечно, все можно переписать и перепроектировать, но за это нужно платить.

У нас не нашлось «заклинания», которое решило бы все проблемы с производительностью SQL. Тем не менее, я упомяну здесь несколько дельных предложений, которые помогли нам и, надеюсь, смогут помочь читателю. Разумеется, это не какие-то сакральные знания. Но когда мы начинали оптимизацию, я был бы рад их прочитать или услышать.

+24

1shaman 1 апр 2022 в 10:21

Правила перезаписи PostgreSQL

7 мин

15K

Блог компании FirstVDSPostgreSQL * Серверная оптимизация * Системное администрирование *

Перевод

Представления (Views) — это не совсем то, о чём вы можете подумать. В этой статье мы разберём правила перезаписи PostgreSQL, как они работают, что они могут и чего не могут делать.

Начиная с версии 10, PostgreSQL поддерживает концепцию правил перезаписи, которые позволяют изменять способ выполнения запросов.

Фактически правила перезаписи — это то, как представления реализованы в PostgreSQL. Когда вы обращаетесь к представлению, ваш запрос фактически переписывается в соответствии с правилом, которое было создано при создании представления. По сути, представление — это, как мы сейчас увидим, правило перезаписи.

Однако не стоит расслабляться — некоторые условности всё же есть. Например, эти правила перезаписи сильно отличаются от плагинов перезаписи MySQL и в целом являются более комплексными.

Читать дальше →

+15

KiraD 30 мар 2022 в 08:48

Импорт и экспорт данных в PostgreSQL, гайд для начинающих

3 мин

244K

PostgreSQL * SQL *

Из песочницы

В процессе обучения аналитике данных у человека неизбежно возникает вопрос о миграции данных из одной среды в другую. Поскольку одним из необходимых навыков для аналитика данных является знание SQL, а одной из наиболее популярных СУБД является PostgreSQL, предлагаю рассмотреть импорт и экспорт данных на примере этой СУБД.

В своё время, столкнувшись с импортом и экспортом данных, обнаружилось, что какой-то более-менее структурированной инфы мало: этот момент обходят на всяких там курсах по аналитике, подразумевая, что это очень простые моменты, которым не следует уделять внимание.

В данной статье приведены примеры импорта в PostgreSQL непосредственно самой базы данных в формате sql, а также импорта и экспорта данных в наиболее простом и распространенном формате .csv, в котором в настоящее время хранятся множество существующих датасетов. Формат .json хоть и является также очень распространенным, рассмотрен не будет, поскольку, по моему скромному мнению, с ним все-таки лучше работать на Python, чем в SQL.

chemtech 30 мар 2022 в 08:19

Что нового в плане мониторинга в PostgreSQL (Алексей Лесовский)

22 мин

9.2K

PostgreSQL * Базы данных *

Доклад Алексея Лесовского про то, что нового есть в PostgreSQL в плане мониторинга.

Охватывать Алексей будет 13 и 14 версии. Далее от его лица.

Читать дальше →

+13

Kilor 29 мар 2022 в 07:50

SQL HowTo: разные варианты работы с EAV

3 мин

33K

Блог компании ТензорERP-системы * Базы данных * SQL * PostgreSQL *

Соблазн использовать модель EAV (Entity-Attribute-Value) при организации структуры БД весьма велик, особенно когда предметная область заранее плохо известна (или разработчик просто не хочет в нее углубляться). Это ведь так удобно - создать "универсальный" способ описания характеристик объектов, который больше не потребует доработок базы ни при появлении новых типов объектов, ни при возникновении новых атрибутов...

Однако, за любую универсальность приходится платить сложностью и производительностью запросов - так что json[b] может оказаться более эффективной заменой. Но если уж такая модификация невозможна - давайте попробуем выжать максимум производительности из доставшегося нам legacy на самом простом примере.

+22

nvv 28 мар 2022 в 14:56

Когда помогает партиционирование, пример в PostgreSQL

10 мин

22K

Блог компании OTUSБазы данных * PostgreSQL *

Recovery Mode

Разберем внедрение партиционирования на практическом примере, обсудим выбор реализации, альтернативы. Учтем ограничения, проистекающие из самих обрабатываемых данных.

Подробнее

+14

KargaltsevMikhail 27 мар 2022 в 16:19

TRY / CATCH в PostgreSQL

2 мин

42K

PostgreSQL * SQL *

Туториал

Во встроенном процедурном языке PL/pgSQL для СУБД PostgreSQL отсутствуют привычные операторы TRY / CATCH для для перехвата исключений возникающих в коде во время выполнения. Аналогом является оператор EXCEPTION.

Cepera_C_A 24 мар 2022 в 17:18

BIK Beep – Telegram Bot

22 мин

12K

Python * PostgreSQL * Программирование * Git * HTML *

Туториал

Технотекст 2022

Мой путь по созданию бота в Telegram.

Прочитать ▶

slysha 22 мар 2022 в 10:28

Отчёт с митапа: PostgreSQL-as-Service — можем, умеем, практикуем

1 мин

5.6K

Блог компании Ozon TechPostgreSQL * Программирование * Базы данных * Конференции

Выкладываем запись с Ozon Tech PostgreSQL Meetup. Ранее я уже описывал нашу инфраструктуру: весь PostgreSQL основан на виртуальных машинах — 2К в тестовой среде и ~8К в проде. Это около 2К кластеров баз данных. Так как у нас микросервисная архитектура, мы придерживаемся принципа 1 сервис = 1 база. Нагрузка на базы может быть приличная: 2-2,5 млн транзакций в секунду, а WAL-трафик порядка 1.5 ГБ/c.

Рассказали, как наша команда управляет всей этой инфраструктурой, как пришли к парадигме выдачи базы по кнопке и как воплотили её в жизнь.

Видео и слайды под катом

+14

Igor_Le 21 мар 2022 в 01:19

Postgresso #2 за 2022 (39)

11 мин

7.3K

Блог компании Postgres ProfessionalPostgreSQL *

В эти безрадостные дни многим трудно работать, сочинять и даже читать статьи. Но ИТ-инфраструктура это как водопровод — без неё жизнь уже почти невозможна. И мы продолжаем выпускать Postgresso. По понятным причинам в этом выпуске будет много ссылок, меньше анализа. И главная тема — миграция

Миграция

Проблемы миграции с Oracle на Postgres обычно начинаются там, где приходится иметь дело с различиями в синтаксисе команд и прочими расхождениями в этих СУБД. Об этом и говорится в большинстве статей и видео.

Начнём с Oracle to Postgres Conversion

Это официальный документ сообщества PostgreSQL. Есть список инструментов миграции.

The Complete Oracle to PostgreSQL Migration Guide: Move and convert Schema, Application & Data

Довольно пространное руководство от EDB. Есть матрица возможностей миграционных инструментов.

Читать дальше →

+11

olegbunin 16 мар 2022 в 06:54

Чем Linux HugePages важны для серверов баз данных?

7 мин

27K

Блог компании Конференции Олега Бунина (Онтико)PostgreSQL * Базы данных * Тестирование IT-систем *

Перевод

Часто пользователи рассказывают о сбое базы данных по вине Out Of Memory Killer. Он завершает процессы PostgreSQL и остается причиной большинства отказов этой БД. Память на хост-компьютере может закончиться по нескольким причинам. Наиболее распространены из них четыре. Во-первых, может быть плохо настроена память на хост-компьютере. Во-вторых, могут быть ограничения глобальной переменной work_mem. Например, если у вас 32Гб RAM и work_mem=1Гб, то больше 32 соединений вы никогда не запустите. Каждое соединение PostgreSQL будет выделять этот размер памяти.

Третьей причиной будет большое количество подключений. Даже неактивное соединение может занимать значительный объем памяти. И наконец, другие программы тоже потребляют ресурсы, потому что для каждой из них этот компьютер является хостом.

Представляем вам перевод статьи от Jobin Augustine, который работает в Percona старшим инженером службы поддержки. Более 20-лет он был консультантом, архитектором, администратором и инструктором по PostgreSQL, Oracle и другим технологиям баз данных. Сегодня поговорим о том, как можно защититься от OOM с помощью HugePages и разберем насколько они важны и почему нужны.

+18

JuniorProg 12 мар 2022 в 11:08

Создание телеграм-бота (Spring Boot, Kafka, PostgreSQL), часть первая

17 мин

48K

PostgreSQL * Java * Gradle *

Туториал

Из песочницы

Всем привет, данная статья является, своего рода моей первой, но все же постараюсь максимально просто рассказать вам о том, как создать бота, прикрутив к нему все обещанные выше свистелки-тарахтелки.

Статьи будут разделены на 2 части, первая часть - создание основного бота с оправкой логов (Kafka Producer) и записью их в БД, вторая часть - обработка всех логов (Kafka Consumer).

1 2 ...

54 55

57 58 ...

107 108

PostgreSQL *

PostgreSQL Antipatterns: в этом плане кто-то лишний

Миграция с Oracle на PostgreSQL: зачем, как и что для этого нужно

Мгновенные снепшоты postgres на tablespace и btrfs

Псс, парень… индекс нужен?

Как работает оптимизатор PostgreSQL при большом количестве таблиц в запросе

Postgresso #3 (40)

Feature Freeze

SQL/JSON

Поднимаем Apache Superset — необходимый и достаточный гайд

«Импортозамещаем» анализ планов PostgreSQL

Как мы ускорили выполнение запросов PostgreSQL в 100 раз

Правила перезаписи PostgreSQL

Импорт и экспорт данных в PostgreSQL, гайд для начинающих

Что нового в плане мониторинга в PostgreSQL (Алексей Лесовский)

SQL HowTo: разные варианты работы с EAV

Ближайшие события

Когда помогает партиционирование, пример в PostgreSQL

TRY / CATCH в PostgreSQL

BIK Beep – Telegram Bot

Отчёт с митапа: PostgreSQL-as-Service — можем, умеем, практикуем

Postgresso #2 за 2022 (39)

Миграция

Чем Linux HugePages важны для серверов баз данных?

Создание телеграм-бота (Spring Boot, Kafka, PostgreSQL), часть первая

Вклад авторов