PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

vladislav_shevchenko 31 окт 2024 в 06:55

Выбираю Open Source БД для себя

Простой

6 мин

7.9K

Блог компании Альфа-БанкOpen source*PostgreSQL*Базы данных*Хранение данных*

Обзор

Задача такая: искал Open Source БД для своего пет-проекта. Решил посмотреть в интернете новые решения в рамках БД. После чтения статей и отбора из 6-7 БД остались три (3), которые понравились лично мне. Больше ничего путного не нашел.

Почему именно эти? Во-первых, они Open Source, а во-вторых, у них есть ответы на два главных моих вопроса «Для чего это нужно?» и «Работает ли из коробки?».

Давайте покажу на примерах.

+36

kkontiq 31 окт 2024 в 06:00

Как мы внедрили CockroachDB на DBaaS в компанию классических СУБД

Средний

11 мин

7.7K

Блог компании AvitoTechБазы данных*PostgreSQL*Go*Big Data*

Обзор

Привет! Меня зовут Полина Кудрявцева, я инженер DBA в Авито. В этой статье я расскажу о том, как мы внедрили CockroachDB на DBaaS в компанию классических СУБД, а также опишу его плюсы, минусы и особенности работы.

+27

vQFd4 24 окт 2024 в 10:54

Быстрее пули: как найти счастье с PostgreSQL

Простой

24 мин

15K

Блог компании РостелекомВеб-разработка*Java*PostgreSQL*Поисковые технологии*

Туториал

Recovery Mode

В этой статье мы расскажем о том, как эффективно реализовать полнотекстовый поиск с помощью PostgreSQL. Узнайте, как улучшить скорость и точность поиска по текстовым данным, используя такие инструменты, как tsvector, tsquery и индексы GIN, и как эти возможности могут значительно повысить производительность вашего приложения.

+40

Loxmatiymamont 23 окт 2024 в 09:21

PostgreSQL 17: уже можно просто делать бекапы и перестать страдать?

10 мин

18K

Блог компании Postgres ProfessionalPostgreSQL*Базы данных*Системное администрирование*

Так исторически сложилось, что задача организации простого и понятного резервного копирования в мире PostgreSQL до сих пор не решена. Есть набор комьюнити утилит, у каждой из которых есть некие плюсы, но всегда в нагрузку будет прорва минусов (тут нет инкрементных копий, там нет внятного расписания, это может только весь сервер вместо конкретной базы увозить и так далее). Да, есть тяжёловесный энтерпрайзный софт за много денег, зачастую требующий странного и работающий по какой-то своей логике, но это тоже не панацея. А вот чтобы просто и понятно, без головных болей организовать прозрачный процесс банального бекапа с инкрементами, работающим расписанием и восстановления только того что надо - вот такого нет.

Но буквально на днях вышел PostgreSQL 17 и может там что-то изменилось? И да, и нет. Та самая мана небесная в виде pg_awesome_backup_tool так и не появилась, однако в релиз попал механизм walsummarizer, который обещает нативно отслеживать изменения в файлах баз данных, что позволит делать инкрементальные бекапы нативно и без лишних приседаний.

А чтобы не рассматривать новичка в вакууме, будем сравнивать его с ptrack - нашей (Postgres Professional) разработкой, которую наши любимые конкуренты уже расхватали в свои продукты и продают их как уникальнейшие решения.

+36

ru_vds 21 окт 2024 в 14:09

Почему многие пользуются древними версиями Postgres?

Простой

5 мин

17K

Блог компании RUVDS.comPostgreSQL*Базы данных*Хранение данных*

Обзор

Перевод

Postgres 17.0 уже вышла, и она замечательная, но реальность такова: большинство пользователей Postgres не выполняют апгрейд сразу же. Многие, вероятно, сейчас даже не на 16.4, и даже не на 16, они пользуются Postgres 15 или ещё более старой версией. Ситуация с Postgres не такая же, как с новыми Call of Duty, когда каждый хочет скачать обновление сразу же после его выхода.

Почему же люди так неохотно идут на апгрейд?

На то есть множество причин, но всё сводится к двум основным: качество работы Postgres и неудобство апгрейдов.

Читать дальше →

+45

alizar 21 окт 2024 в 09:01

Почему СУБД такие медленные

Средний

11 мин

39K

Блог компании RUVDS.comPostgreSQL*SQL*Базы данных*Высоконагруженные системы*

Обзор

Недавно на Хабре публиковался перевод статьи «Просто выберите Postgres» (оригинал, англ. яз) с аргументами, что Postgres — оптимальная БД для десктопных и мобильных приложений. Аналогичное мнение высказывают в других популярных статьях вроде «До свидания MongoDB, здравствуй PostgreSQL». Главным недостатком SQLite называют то, что данные хранятся в одном файле, а MongoDB (а также DynamoDB и Cassandra) — низкую производительность:

«Всё это связано с тем, что подобные базы данных, по сути, представляют собой огромную распределённую хеш-таблицу. Единственные операции, работающие без необходимости сканирования всей базы данных — это поиск по секционному ключу и сканы, при которых используется ключ сортировки.

…Если паттерны доступа существенно изменятся, то может потребоваться полная повторная обработка всех данных».

Более производительные резидентные БД хранят данные в памяти (Redis, Valkey), но их использование ограничено объёмом ОЗУ.

После такого заявления интересно посмотреть на независимые тесты производительности разных СУБД.

Читать дальше →

+55

yakvenalex 12 окт 2024 в 07:03

Асинхронный SQLAlchemy 2: простой пошаговый гайд по настройке, моделям, связям и миграциям с использованием Alembic

30 мин

46K

Блог компании AmveraPython*PostgreSQL*Doctrine ORM*SQL*

Туториал

Наконец-то пришло время взяться за то, что я давно планировал — подробный гайд по асинхронной версии SQLAlchemy 2.0 в стиле ORM. В этой серии статей я подробно расскажу обо всех аспектах: от создания моделей и установления связей между ними до миграций с Alembic и взаимодействия с данными в базе. Мы будем шаг за шагом разбирать ключевые моменты работы с асинхронной базой данных, что позволит вам глубже понять SQLAlchemy и применить эти знания на практике.

Для начала, давайте разберёмся, что такое SQLAlchemy и почему каждый разработчик, работающий с реляционными базами данных (такими как SQLite, PostgreSQL, MySQL и т. д.), должен знать о ней. После этого — настройка. Мы будем работать с PostgreSQL, но не переживайте: код, который мы напишем, универсален для всех реляционных баз данных. Мы начнем с базовой настройки SQLAlchemy для асинхронного взаимодействия, а затем перейдём к созданию таблиц в современном декларативном стиле.

+30

Kilor 7 окт 2024 в 13:51

PostgreSQL Antipatterns: валим «слона» — highload на ровном месте

Простой

7 мин

19K

Блог компании ТензорPostgreSQL*Базы данных*Node.JS*Высоконагруженные системы*

Кейс

Сегодняшняя тема посвящена нелегким взаимоотношениям клиентского приложения и сервера PostgreSQL: как на ровном месте, неудачной архитектурой приложения, можно обеспечить себе хронические проблемы производительности.

Рассмотрим классические ситуации, когда разработчики начинают жаловаться на производительность БД - а виновата-то и не она!

+26

danolivo 3 окт 2024 в 11:15

PostgreSQL 'VALUES -> ANY' transformation: должна ли СУБД делать работу за пользователя?

Сложный

6 мин

3.9K

PostgreSQL*SQL*

Из песочницы

Недавно, на хабре вышла статья про один нюанс в оптимизаторе PostgreSQL [1]. Будучи предельно технической и скучной по-определению, она триггернула интересную дискуссию в комментах и дала мне, как разработчику систем баз данных, возможность взглянуть на систему с точки зрения разработчика приложений. Это оказалось крайне продуктивным и даже привело к патчу и треду в сообществе. Возможно, нам нужно больше таких небольших и узко-специализированных постов? Данная статья - попытка развить это направление.

[1] Странное поведение планировщика запросов PostgreSQL

+34

Kilor 30 сен 2024 в 14:05

PostgreSQL Antipatterns: устраняем вложенные интервалы

Простой

5 мин

7.7K

Блог компании ТензорАлгоритмы*Базы данных*SQL*PostgreSQL*

Кейс

Недавно попался на глаза запрос, которым хотели отобрать в таблице (очевидно, для последующего удаления) все id записей интервалов, которые полностью перекрыты каким-то другим интервалом того же owner'а.

Но self-JOIN показал себя не лучшим образом...

Как сделать эффективнее?

+36

Loxmatiymamont 19 сен 2024 в 08:13

Майкл Стоунбрейкер: «Всё новое — это хорошо забытое старое. Продолжение»

40 мин

6.8K

Блог компании Postgres ProfessionalЧитальный залХранение данных*Базы данных*PostgreSQL*

Мнение

Перевод

От редакции: Майкл Стоунбрейкер - один из самых известных в IT мире ученых и отец-основатель Postgres. В соавторстве с Энрю Павло, недавно опубликовал большой обзор всех актуальных технологий систем управления базами данных. В этом материале — подробно обо всем, что произошло в мире баз данных за последнее время, а также прогнозы. Мы посчитали что нельзя лишать нашу аудиторию возможности ознакомиться с этим обзором, поэтому подготовили данный перевод.

+31

CrushBy 17 сен 2024 в 08:05

Странное поведение планировщика запросов PostgreSQL

Средний

9 мин

9.2K

Блог компании lsFusionOpen source*PostgreSQL*SQL*Базы данных*

Кейс

В одной из предыдущих статей я описывал проблемы, которые возникают при работе с временными таблицами. Тогда я вкратце описывал, почему нам приходится их так часто использовать. В частности, одной из причин была неправильная работа планировщика запросов в PostgreSQL. Многие из проблем планировщика запросов (и не только PostgreSQL) были также описаны в статье Почему не SQL. В этой статье я покажу достаточно простой и часто используемый случай, когда планировщик ошибается, что может приводить к значительному росту потребления ресурсов.

Проблема воспроизводится на последней стабильной на данный момент версии PostgreSQL - 16.2. При этом используются стандартные настройки PostgreSQL. Я пробовал менять разные настройки, но мне не удалось добиться правильного плана в общем случае, поскольку в данном случае проблема скорее логическая, а не в определении стоимости вычислений. Однако, каждый может легко воспроизвести эту ситуацию локально и попробовать поиграться с настройками.

Рассмотрим простую доменную логику, в которой есть документы и их строки. Для каждой строки вводится сумма. Строки лежат в отдельной таблице и ссылаются на документ :

+30

Kilor 12 сен 2024 в 12:45

SQL HowTo: загадка Эйнштейна, или снова Джиндош

Средний

7 мин

3.8K

Блог компании ТензорНенормальное программирование*PostgreSQL*SQL*Алгоритмы*

Мнение

Пару дней назад был опубликован пост с решением на MySQL загадки Джиндоша (она же загадка Эйнштейна).

Предложенное решение показалось мне "неспортивным" - помимо необходимости жестко учитывать в структуре запроса количество исходных элементов ("джойнить" нужные таблицы нужное количество раз), так еще и условия в запросе приходилось многократно дублировать.

Поэтому я попробовал решить эту задачу "в общем виде", используя возможности PostgreSQL, и вот что из этого получилось.

+25

Safreliy 9 сен 2024 в 10:54

Нейронные оптимизаторы запросов в реляционных БД (Часть 1)

Средний

15 мин

8.5K

Блог компании Postgres ProfessionalМашинное обучение*Искусственный интеллектPostgreSQL*Алгоритмы*

Обзор

В 1970-х годах известный программист Эдгар Кодд разработал математически выверенную теорию организации данных в виде таблиц (реляций). С тех пор утекло немало воды — появилось большое количество различных коммерческих и open-source реляционных систем управления базами данных (РСУБД). Скоро стало понятно, что эффективное получение данных из базы — задача далеко не тривиальная. Если говорить прямо, она нелинейная и в общем случае NP-сложная.

Когда SQL-запрос становится немного сложнее: SELECT * FROM table, у нас появляется огромная вариативность его исполнения внутри системы — и не всегда понятно, какой из возможных вариантов эффективнее как по памяти, так и по скорости. Чтобы сократить огромное количество вариантов до приемлемого, обычно используются так называемые эвристики — эмпирические правила, которые придуманы человеком для сокращения пространства поиска на несколько порядков. Понятное дело, эти правила могут отсечь и сам оптимальный план выполнения запроса, но позволяют получить хоть что-то приемлемое за адекватное время.

В последние годы в связи с активным развитием ML начали развиваться и нейронные оптимизаторы запросов —особенность которых в том, что они самостоятельно, без участия человека, находят необходимые закономерности в выполнении сложных планов исходя из обучения на огромном количестве данных. Тенденция началась приблизительно в 2017 году и продолжается до сих пор. Давайте посмотрим, что уже появилось в этой области в хронологическом порядке и какие перспективы нас ждут.

+33

Igor_Le 21 авг 2024 в 20:54

Postgresso 7 (68)

19 мин

4.2K

Блог компании Postgres ProfessionalPostgreSQL*

Из жизни малышей и гигантов

PGlite 0.2

Опенсорсный проект ElectricSQL явил маленькое чудо. Совсем маленькое: сервер PostgreSQL уместился в архив 3МБ.

Сервер сделан как клиентская библиотека TypeScript/JavaScript, PostgreSQL можно запускать в браузере, Node.js и Bun, ничего больше инсталлировать не надо, всё есть. Есть и некий API "live query", для реакции на изменения данных в таблицах. Утверждают, что обычные CRUD-запросы исполняются за 0.3 мс.

Ресурсы:

сайт;

репо;

доки

каталог расширений (22 расширения Postgres, в том числе pgvector, и 1 плагин для PGlite - live);

первые бенчмарки.

Более того: компания Supabase уже запустила сайт postgres.new, построенный поверх PGlite, мол, have fun.

+31

PatientZero 19 авг 2024 в 16:56

Просто выберите Postgres

Средний

6 мин

30K

Веб-разработка*PostgreSQL*Базы данных*

Мнение

Перевод

Отчасти это действенный совет, отчасти — вопрос к читателям.

Совет: при создании нового приложения, требующего постоянного хранения данных, как это и бывает в случае большинства веб-приложений, по умолчанию следует выбирать Postgres.

+41

Loxmatiymamont 16 авг 2024 в 08:00

Продолжаем выжимать максимум из PostgreSQL

10 мин

16K

Блог компании Postgres ProfessionalБазы данных*PostgreSQL*Системное администрирование*Высоконагруженные системы*

В апреле этого года мы, команда производительности из Postgres Professional, совместно с коллегами из Selectel решили протестировать несколько дистрибутивов PostgreSQL и узнать, как они себя поведут на разных архитектурах. С результатами можно ознакомиться в этой статье, но, как сразу было верно отмечено читателями, там был один важный косяк – мы не сравнили производительность ванильного PostgreSQL с применением всем известных настроек по улучшению производительности и Postgres Pro Enterprise из коробки as is. Терпеть такое не было решительно никакой возможности, поэтому сегодня будет продолжение истории и ответ на важный для многих вопрос: «А есть ли у нашего форка хоть какое-то преимущество перед бесплатной ваниллой?» Или мы просто накатили общеизвестный конфиг и занимаемся импортозаместительным переклеиванием наклеек?

+32

AidarNasibullin 31 июл 2024 в 19:39

Как фронтендер сертификацию PostgresPro сдавал

Простой

4 мин

10K

PostgreSQL*

Мнение

✏️ Технотекст 7

Оговорюсь, заголовок кликбейтный, и примерно последние 2 года своей трудовой деятельности в рамках своей компании считаюсь фуллстек разработчиком, но все же моя база это фронтенд и специального образования я не имею.

Я хочу поделится тем, каким образом я подготовился к сертификации. Какого рода вопросы были. Насколько сложно это было для человека, который о СУБД не знал ничего и пользовался БД на уровне элементарных запросов. И не большая часть моих размышлений на тему того на сколько это вообще нужно.

+27

pabel0071 22 июл 2024 в 07:00

Как перенести 1,4 ТБ с MS SQL на PostgresSQL за 13 часов

Простой

7 мин

18K

Блог компании РСХБ.цифра (Россельхозбанк)C#*Microsoft SQL Server*PostgreSQL*

Кейс

✏️ Технотекст 7

Привет, Хабр! Меня зовут Павел Кузьмин, я работаю ведущим разработчиком в РСХБ-Интех. Однажды в своей работе мы столкнулись с острой необходимостью перенести БД объемом 1,4 ТБ (более 1,5 млрд строк) с MS SQL на PostgresSQL не более чем за 20 часов. Неожиданно для нас, все имеющиеся готовые варианты не подходили, поэтому мы решили взять библиотеку Npgsql на C# и написать свой код. В итоге созданное решение справилось с поставленной задачей за 13 часов. Рассказываем, как мы это сделали, и делимся кодом. Возможно, он вам пригодится в работе.

+28

splarv 14 июл 2024 в 10:00

Популярная задача на собеседовании: сотрудники с максимальной зарплатой в отделе

Средний

8 мин

107K

Высоконагруженные системы*PostgreSQL*SQL*

Обзор

Кто ходил на собеседования по устройству на работу, тот знает, спрашивают там всякое и странное. Нередко можно встретить задачу SQL по нахождению сотрудников с максимальной зарплатой в отделе. Причем ваш потенциальный начальник считает, что у этой задачи есть только одно «правильное решение», то, про которое он прочитал в Интернете. Так ли это?

Любопытно...

+97

198

1 2

4 5 ...

22 23

PostgreSQL *

Выбираю Open Source БД для себя

Как мы внедрили CockroachDB на DBaaS в компанию классических СУБД

Быстрее пули: как найти счастье с PostgreSQL

PostgreSQL 17: уже можно просто делать бекапы и перестать страдать?

Почему многие пользуются древними версиями Postgres?

Почему СУБД такие медленные

Асинхронный SQLAlchemy 2: простой пошаговый гайд по настройке, моделям, связям и миграциям с использованием Alembic

PostgreSQL Antipatterns: валим «слона» — highload на ровном месте

PostgreSQL 'VALUES -> ANY' transformation: должна ли СУБД делать работу за пользователя?

PostgreSQL Antipatterns: устраняем вложенные интервалы

Майкл Стоунбрейкер: «Всё новое — это хорошо забытое старое. Продолжение»

Странное поведение планировщика запросов PostgreSQL

SQL HowTo: загадка Эйнштейна, или снова Джиндош

Ближайшие события

Нейронные оптимизаторы запросов в реляционных БД (Часть 1)

Postgresso 7 (68)

Просто выберите Postgres

Продолжаем выжимать максимум из PostgreSQL

Как фронтендер сертификацию PostgresPro сдавал

Как перенести 1,4 ТБ с MS SQL на PostgresSQL за 13 часов

Популярная задача на собеседовании: сотрудники с максимальной зарплатой в отделе

Вклад авторов