PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

Kilor 15 мар 2021 в 13:30

Случайности не случайны

5 мин

7.7K

Блог компании ТензорPostgreSQL * Алгоритмы * SQL * Математика *

Можно ли достоверно предсказать будущее хоть на немного вперед? Иногда - вполне, надо только много везения... или немного знаний.

Сегодня пронаблюдаем сеанс черной магии с последующим разоблачением, или «Я угадаю твой рандом с 3 строк!»

+16

olegborzov 11 мар 2021 в 08:00

Обрезаем большую таблицу PostgreSQL в production

7 мин

15K

Блог компании ДомкликPostgreSQL * Python *

Всем привет. Сегодня я хотел бы поделиться рецептом по обрезанию большой таблицы PostgreSQL в production.

Пример: мы имеем в БД достаточно большую таблицу (несколько сотен миллионов строк) с устаревшими данными, которые нам уже не нужны. Точнее, они мешают — БД долго дампится, а индексы становятся неэффективными.

Решение в лоб (delete from table where id < 1234567) работает очень долго из-за большого количества индексов и ограничений в таблице и нас не устраивает.

Более быстрый способ рассмотрим в этой статье.

Рассмотрим его подробнее

+51

Igor_Le 28 фев 2021 в 15:18

Постгрессо 29

6 мин

3.6K

Блог компании Postgres ProfessionalPostgreSQL *

Мы продолжаем знакомить вас с самыми интересными новостями PostgreSQL.

Конференция PGConf.Online 2021

Она начинается уже 1-го марта и закончится 3-го. О ней подробно написано в статье Ивана Панченко, зам. гендира Postgres Professional.

На этой конференции (которая не вместо, а кроме офлайновой, теплой-ламповой, она ожидается в конце весны) будет рекордное число иностранных гостей — чему явно поспособствовал онлайн-формат. В том числе на этот раз поучаствует и Саймон Риггс (Simon Riggs). Доклады в 3 потока с 10 утра до 6 вечера. А также мастер-классы.

Статьи

PostgreSQL 14: Часть 4 или «январское наступление» (Коммитфест 2021-01)

Очередной must read Павла Лузанова. Крупные изменения после первых трех относительно скромных коммитфестов (июльский, сентябрьский, ноябрьский).

«Вопросы для затравки», предложенные Павлом:

Могут ли диапазоны содержать пропуски значений?
Зачем нужна индексная нотация типу json?
Может ли индекс при частых обновлениях разрастаться меньше, чем таблица? А вообще не разрастаться?
Сколько времени простаивали сеансы в idle_in_transaction?
Как построить ER-диаграмму для таблиц системного каталога?

Читать дальше →

lojiver 28 фев 2021 в 12:34

Подключение БД с SSH-туннелем к PowerBI

3 мин

13K

DevOps * MySQL * PostgreSQL * Веб-аналитика *

Из песочницы

Как интегрировать БД с SSH-туннелем в PowerBI, как настроить SSH-туннель с приватным ключом, как обновлять данные по запросам к БД в PowerBI

proto_group 25 фев 2021 в 10:59

Углубленный мониторинг баз данных с помощью DBmarlin – вебинар

1 мин

2.2K

Блог компании ProtoСистемное администрирование * MySQL * PostgreSQL * Базы данных *

Привет, друзья! Приглашаем на вебинар, посвященный продукту для углубленного мониторинга баз данных – DBmarlin, который:

– контролирует производительность баз данных – MySQL, MariaDB, PostgreSQL, Oracle, MS SQL Server, развернутых как в своей инфраструктуре, так и у облачного провайдера (AWS, Azure);

– предоставляет детальную видимость работы серверов, на которых развернуты БД;

– собирает statements и wait states, благодаря чему вы видите, на что именно тратится время внутри БД во время исполнения SQL запроса;

– автоматически обнаруживает изменения в объектах схемы БД, параметрах БД, собирает планы выполнения запросов, чтобы вы видели их влияние на производительность.

- регистрирует релизы и другие события для анализа их влияния на БД.

При возникновении проблемы с запросом к БД, инструменты мониторинга и APM, не специализирующиеся на БД, покажут вам SQL-запрос в трейсе, который долго исполнялся. Все, что вы сможете увидеть – это текст SQL запроса и длительность его исполнения. Причина, по которой он был таким медленным остается неизвестной. DBmarlin покажет, в чем именно была проблема в БД - вы увидите, например, что вызывает блокировку.

На вебинаре мы покажем и расскажем:

– Какие задачи должен решать современный продукт для мониторинга баз данных?

– Кто выигрывает от улучшения мониторинга СУБД (спойлер – не только DBA).

– Что отличает продукт DBMarlin от конкурентов?

Регистрация доступна прямо на этой странице ниже или по ссылке.

-1

grishenkovp 24 фев 2021 в 12:18

Поговорим о RFM-анализе

8 мин

4.6K

SQL * PostgreSQL * Python *

Добрый день уважаемые читатели! О данном методе сегментации клиентов по давности покупок, частоте и сумме сделок написано довольно много материалов. На просторах Интернета вы без труда найдете публикации с описанием теории и практики rfm-анализа. Он может выполняться как на платформе табличного редактора (при небольшом количестве данных), так и с помощью sql-запросов или силами тематических библиотек Python/R. Методология всех примеров одна и та же, расхождение будет только в деталях. Например, порядок присвоения номеров сегментам или принцип деления на группы. Ввиду всего вышеизложенного мне будет трудно привнести новизну в эту тему. В статье я лишь постараюсь заострить ваше внимание на некоторых моментах, которые могут помочь начинающим аналитикам данных.

x-wao 20 фев 2021 в 08:25

Приглашаем на PGConf.Online 2021

5 мин

Блог компании Postgres ProfessionalPostgreSQL * Конференции

Традиционную конференцию PGConf.Russia в этом году из за злобного вируса не удалось провести в обещанные сроки в традиционной форме. Поэтому пока онлайн, с надеждой на офлайн в будущем - но в запланированные дни - с 1 по 3 марта. Онлайн упрощает приглашение иностранных докладчиков, участники на подножном корме - в общем, онлайн обходится дешевле, поэтому мы смогли сделать конференцию бесплатно (благодаря уважаемым спонсорам, на текущий момент это Intel, Nutanix, Avito и Zabbix, список, скорее всего, пополнится.

Что же в программе?

+11

grishenkovp 16 фев 2021 в 08:24

Повторяем когортный анализ. Комплексный подход — Python, SQL, Power BI

7 мин

7.3K

Python * SQL * PostgreSQL * Data Mining * Data Engineering *

Добрый день уважаемые читатели! Данная статья является продолжением публикации "Повторяем когортный анализ, выполненный в Power BI, силами Python" (ссылка). Настоятельно рекомендую познакомиться с ней хотя бы бегло, иначе последующее повествование будет вам малопонятным. С момента ее выхода на Хабр прошло достаточно времени. Я основательно пересмотрел методологию решения подобных задач. Первым желанием было просто переписать старый материал, но после недолгих размышлений я пришел к выводу, что более разумным шагом будет оформить наработки в новую рукопись.

Какова основная причина моего "недовольства" Python и Power BI? Язык Python/R c тематическими библиотеками и Power BI (Tableau, Qlik) могут на 70-80% закрыть потребности бизнеса в расчете сложных метрик и построении визуализаций. Но только если речь идет об обработке относительно небольших датасетов с уже агрегированными данными. Если мы говорим о предварительном манипулировании данными в промышленном масштабе, то здесь игра переходит на сторону сервера с БД и используется SQL. Данный момент я не осветил в предыдущей публикации, поэтому решил ликвидировать это упущение здесь.

Kilor 12 фев 2021 в 11:15

DBA: «Кто-то слишком много ест!»

6 мин

18K

Блог компании ТензорPostgreSQL * SQL * Базы данных * Высоконагруженные системы *

Тема "распухания" таблиц и индексов из-за реализации MVCC - больная для пользователей и администраторов PostgreSQL.

Однажды я уже поднимал ее в статье "DBA: когда пасует VACUUM — чистим таблицу вручную", разобрав на конкретных примерах, насколько драматический эффект для производительности запросов может оказывать невовремя проведенный или бесполезно отработавший из-за конкурентных транзакций VACUUM.

Но, помимо влияния на скорость, есть еще и факт влияния на занятое место. Наверное, вы сильно удивитесь, если таблица с единственной "живой" записью после успешного прохода autovacuum продолжит занимать гигабайты пространства на дорогих SSD.

Сегодня немного поисследуем структуру хранения данных в файлах и копнем pg_catalog - схему с описанием базы PostgreSQL, чтобы понять, как можно определить таблицы, которые явно занимают подозрительно много места.

+26

eugeneovsyannikov 11 фев 2021 в 07:45

Just for fun: команда PVS-Studio придумала мониторить качество некоторых открытых проектов

6 мин

Блог компании PVS-StudioOpen source * PostgreSQL * C++ *

Статический анализ кода — это важная составляющая всех современных проектов. Еще более значимым является его правильное применение. Мы решили организовать регулярную проверку некоторых открытых проектов, чтобы увидеть эффект от частого прогона анализатора. Мы используем анализатор PVS-Studio для проверки проектов, а просматривать результаты будем при помощи SonarQube. Так наши подписчики будут узнавать о новых интересных багах в только что написанном коде. Думаем, это будет забавно.

+13

Kilor 8 фев 2021 в 16:05

Агрегаты в БД — прокси-таблицы

4 мин

8.7K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Мы заканчиваем мини-серию статей о работе с агрегатами в PostgreSQL:

- зачем, как, а стоит ли?

- эффективная обработка потока «фактов»

- многомерные суперагрегаты

И сегодня поговорим о том, как можно снизить суммарные задержки на вставку множества изменений в таблицы агрегатов за счет использования промежуточных таблиц и внешней обработки.

pluzanov 7 фев 2021 в 20:26

PostgreSQL 14: Часть 4 или «январское наступление» (Коммитфест 2021-01)

20 мин

11K

Блог компании Postgres ProfessionalPostgreSQL * SQL *

PostgreSQL 14 наступает! После первых трех относительно скромных коммитфестов (июльский, сентябрьский, ноябрьский) пошли крупные изменения.

Вот только несколько вопросов для затравки:

Могут ли диапазоны содержать пропуски значений?
Зачем нужна индексная нотация типу json?
Может ли индекс при частых обновлениях разрастаться меньше, чем таблица? А вообще не разрастаться?
Сколько времени простаивали сеансы в idle_in_transaction?
Как построить ER-диаграмму для таблиц системного каталога?

Читать дальше →

+18

akabarukhin 4 фев 2021 в 13:17

Кластер PostgreSQL внутри Kubernetes: что нужно знать для успешного внедрения

8 мин

30K

Блог компании Райффайзен БанкDevOps * Kubernetes * PostgreSQL * Базы данных *

Хабр, привет!

В этой статье расскажу про PostgreSQL и его работу внутри кластера Kubernetes. Небольшое превью, о чем поговорим: как появился PostgreSQL, какие у него есть High Availability обвязки, как обеспечивается отказоустойчивость внутри Kubernetes и какие существуют Kubernetes-операторы.

Будут схемы-примеры для наглядности и обзор возможных кейсов, начнем!

Читать дальше →

+16

hedgehog_on_rainbow 4 фев 2021 в 07:00

PostgreSQL. Плохие запросы, примеры и их поиск

9 мин

34K

Блог компании Конференции Олега Бунина (Онтико)Базы данных * PostgreSQL *

При поиске проблем в RDBMs разработчик обычно подозревает медленные запросы. А что, если дело не в них? О том, какого типа запросы дают нагрузку на базу данных, не позволяя вашему приложению работать должным образом, рассказал в своем докладе на конференции Saint HighLoad++ Online 2020 администратор баз данных Data Egret Андрей Сальников.

Он поделился тем, как backend-разработчику определять такие запросы, и каким инструментом для этого лучше воспользоваться. Особенно эти знания пригодятся в случае, если нужно найти проблемы в работающей системе здесь и сейчас, когда дорога каждая минута, а работа приложения с базой данных тормозит.

+15

Kilor 3 фев 2021 в 07:10

Агрегаты в БД — многомерные суперагрегаты

4 мин

4.9K

Блог компании ТензорPostgreSQL * SQL * Базы данных * ERP-системы *

В прошлой статье мини-цикла о работе с агрегатами я рассказывал, как организовать эффективное многопоточное преобразование потока первичных данных в данные агрегированные. Там мы рассматривали задачу "свертки" продаж в агрегаты вида товар/дата/кол-во.

Сегодня мы рассмотрим более сложный вариант, который зачастую начинается со слов "А заказчик захотел…" и приводит нас к иерархичным агрегатам в нескольких одновременных разрезах, которые позволяют нам в СБИС практически мгновенно строить оперативные отчеты в подсистемах организации торговли, бухгалтерского учета и даже управления активными продажами.

+11

nikolai-averin 2 фев 2021 в 20:43

SQL миграции в Postgres. Часть 1

Средний

15 мин

49K

PostgreSQL * SQL * Базы данных *

FAQ

Технотекст 2021

Как обновить значение атрибута для всех записей таблицы? Как добавить первичный или уникальный ключ в таблицу? Как разбить таблицу на две? Как ...

Если приложение может быть недоступно какое-то время для проведения миграций, то ответы на эти вопросы не представляют сложности. А что делать, если миграции нужно проводить на горячую – не останавливая базу данных и не мешая другим с ней работать?

На эти и другие вопросы, возникающие при проведении миграций схемы и данных в PostgreSQL, постараемся дать ответы в виде практических советов.

Читать дальше →

+32

splarv 2 фев 2021 в 09:11

Кеш бывает разным

11 мин

14K

Блог компании ДомкликPostgreSQL *

PostgreSQL хранит данные на каких-то носителях. И между PostgreSQL и, например, магнитной поверхностью диска находится несколько кешей: кеш самого винчестера, кеш RAID-контроллера или винчестерной полки, кеш файловой системы на уровне операционной системы и кеш самого PostgreSQL. Если первыми перечисленными кешами мы практический не можем управлять, то последними, находящимися в ОЗУ сервера, управлять можем: например, выделяя больше ОЗУ под кеш PostgreSQL в ущерб кешу ОС, или наоборот. В официальной документации можно прочитать ничем не подтвержденные рекомендации, типа выделять под PostgreSQL четверть ОЗУ. Это вызывает сомнения. PostgreSQL в виде Postgres95 впервые появился в 1995 году и, кто знает, быть может и эти рекомендации относятся к тому же году. Поэтому появилась идея эксперимента с целью разобраться, как лучше распределять ОЗУ.

Читать дальше →

+21

Igor_Le 2 фев 2021 в 00:48

Postgresso 28

8 мин

Блог компании Postgres ProfessionalPostgreSQL *

Привет всем уже в 21-м году. Надеемся, он будет добрей к нам, чем прошлый. Жизнь продолжается. И мы продолжаем знакомить вас с самыми интересными новостями PostgreSQL. Для разнообразия начну с конференций: этот жанр больше всего пострадал.

Конференции

Организаторы конференций выбирают разные стратегии в условиях карантина. Самый простой — отменить, но лучше чем-то компенсировать.

Nordic PGDay 2021

Отменена. Рассчитывают на Хельсинки в марте 2022. Виртуального варианта не будет, но собираются сфокусироваться на PostgreSQL-треке FOSDEM 2021 в феврале. На сайте написано 2022, но имеется в виду, судя по всему FOSDEM 2021, о котором ниже.

А вот подход Highload++. Бескомпромиссный — никакого онлайна:
Highload++ 2020 (2021)

Конференцию HighLoad++ не стали переносить в онлайн — решили, что она для этого слишком масштабная. Но даты передвинули с 9-10 ноября 2020 г. на 20-21 мая 2021 года. Должна пройти в Москве в «Крокус Экспо 3».

А вот полная противоположность:
FOSDEM 2021

Никакого Брюсселя, в 2021 только онлайн. Не только бесплатно, но и регистрации даже не требуется. Среди участников этой огромной конференции немало докладчиков, известных среди российских постгресистов: Олег Бартунов, Павел Борисов, Алексей Кондратов, Анастасия Лубенникова, Никита Глухов (Postgres Professional), Николай Самохвалов (Postgres.ai), Пётр Зайцев (Percona), Андрей Бородин (Yandex), Олег Иванов (Samsung AI Center, он автор плагина AQO в Postgres Pro Enterprise).
Расписание можно попробовать изучить здесь. Поток PostgreSQL здесь.

PGConf.Online 2021

Читать дальше →

+20

varanio 1 фев 2021 в 19:02

Упрощенный синтаксис для jsonb в PostgreSQL 14

1 мин

11K

PostgreSQL * SQL * Программирование * Веб-разработка *

Как сообщает telegram-канал Cross Join, в репозиторий Postgres упал комит, упрощающий работу с jsonb. Теперь можно обращаться к частям jsonb с помощью квадратных скобок, причем это работает как на чтение, так и на запись.

Прощай jsonb_set и прочие костыли типа data = data - 'a' || '{"a":5}'

Несколько примеров:

Обновляем значение объекта по ключу. 25 здесь является числом, но взято в кавычки, потому что присваиваемое значение должно быть jsonb

-- (person_data имеет тип jsonb)
UPDATE users 
SET person_data['age'] = '25';

Читать дальше →

+50

DiNoZawR 29 янв 2021 в 07:14

Использование libpq в VisualStudio (Windows)

2 мин

13K

PostgreSQL * C++ * Visual Studio * Windows *

Туториал

Recovery Mode

Данный пост ни на что не претендует, а написан мной в целях помочь таким-же недопрограммистам как я. Возможно, если бы я прочитал документацию по этой API полностью, то этой статьи бы и не понадобилось. Однако, в свою защиту скажу, что я не нашел внятной инструкции для чайников.

Я столкнулся с рядом проблем при попытке подключить libpq в VS 2017: начиная с несоответствия документации по данной API с инструкциями по подключению, заканчивая умолчанием некоторых ключевых моментов.

В общем по порядку.

-4

1 2 ...

63 64

66 67 ...

107 108

PostgreSQL *

Случайности не случайны

Обрезаем большую таблицу PostgreSQL в production

Постгрессо 29

Конференция PGConf.Online 2021

Статьи

Подключение БД с SSH-туннелем к PowerBI

Углубленный мониторинг баз данных с помощью DBmarlin – вебинар

Поговорим о RFM-анализе

Приглашаем на PGConf.Online 2021

Повторяем когортный анализ. Комплексный подход — Python, SQL, Power BI

DBA: «Кто-то слишком много ест!»

Just for fun: команда PVS-Studio придумала мониторить качество некоторых открытых проектов

Агрегаты в БД — прокси-таблицы

PostgreSQL 14: Часть 4 или «январское наступление» (Коммитфест 2021-01)

Кластер PostgreSQL внутри Kubernetes: что нужно знать для успешного внедрения

Ближайшие события

PostgreSQL. Плохие запросы, примеры и их поиск

Агрегаты в БД — многомерные суперагрегаты

SQL миграции в Postgres. Часть 1

Кеш бывает разным

Postgresso 28

Конференции

Упрощенный синтаксис для jsonb в PostgreSQL 14

Несколько примеров:

Использование libpq в VisualStudio (Windows)

Вклад авторов