PostgreSQL *

Свободная объектно-реляционная СУБД

СтатьиПостыНовостиАвторыКомпании

Bright_Translate 21 мар в 13:01

О скрытии сообщений в эмодзи и взломе казначейства США

Средний

7 мин

15K

Блог компании RUVDS.comPostgreSQL*Информационная безопасность*Программирование*Хранение данных*

Кейс

Перевод

30 декабря 2024 года, пока большинство из нас суетились в преддверии празднования Нового года, Казначейство США готовило для Финансового комитета Сената США важное уведомление. В нём сообщалось, что его системы, которые, очевидно, содержат особо чувствительные конфиденциальные данные, были взломаны группой правительственных хакеров Китая.

Даже не знаю, как пропустил эту новость. Обычно я всё активно отслеживаю, особенно уязвимости опенсорсного ПО, которые касаются казначейства моей страны 🤷‍♂‍

И это ещё не самое безумное. Сейчас я расскажу вам, как именно они это сделали!

Читать дальше →

+83

DevOpsDiva 18 мар в 14:11

Укрощаем мажорные обновления: сценарий обновления системных данных каталога без лишней боли

Средний

15 мин

1.2K

Блог компании СберDevOps*PostgreSQL*

✏️ Победитель Технотекста 7

В мире разработки и эксплуатации ПО мажорные обновления — это всегда стресс. Независимо от того, насколько хорошо вы тестируете изменения, всегда есть риск, что что-то пойдёт не так. Особенно это касается обновлений, которые затрагивают пользовательские данные. В какой-то момент мы задумались о том, как нам минимизировать риски и сделать обновления более предсказуемыми.

Меня зовут Кристина Демидович, я DevOps‑инженер в СберТехе, занимаюсь автоматизацией в команде СУБД Pangolin — это целевая СУБД в Сбере и не только. Я расскажу о нашем подходе к обновлению СУБД Pangolin, который позволил нам превратить часть мажорных обновлений в обновление данных системного каталога — что проще, удобнее и занимает вдвое меньше времени.

Надеюсь, наш опыт будет полезен тем, кто занимается автоматизацией и имеет дело с обновлением сложных систем.

+27

tratatatanya 18 мар в 08:19

Делаем жизнь легче: быстрый поиск в django и postgresql с помощью search_vector

Средний

28 мин

5.3K

Блог компании ИдаПроджектDjango*PostgreSQL*

Туториал

Привет, меня зовут Таня и я backend-разработчик в ИдаПроджект.

Сегодня хочу рассказать о полнотекстовом поиске — как это все работает в django, а как в postgres, и откуда вообще взялось.

Современные компании ежедневно сталкиваются с разной текстовой информацией. Эффективный поиск не только ускоряет доступ к нужным данным, но и повышает продуктивность, снижает затраты и открывает новые возможности для анализа и принятия решений.

Новичкам важно понять, как полнотекстовый поиск облегчает обработку данных и извлечение информации. Для тех, кто уже знаком с Django и PostgreSQL, статья станет экскурсом в полнотекстовый поиск, а заодно поможет интегрировать его в проекты.

Ну что, погнали! Разберем, как эта технология развивалась, и какие ее ключевые элементы (триграммы и tsvector) делают возможным быстрый и точный доступ к информации.

+31

OlegIct 9 мар в 16:25

Влияние источника времени на результат explain в PostgreSQL

Средний

7 мин

PostgreSQL*Базы данных*Настройка Linux*

Обзор

При выполнении тестов периодически сталкивался с неожиданными изменениями результатов тестов после рестарта linux и при обновлении версии linux. Причиной оказался источник времени. В статье рассмотрен как влияет источник времени на выполнение команды explain analyze

+25

Sravni_Tech 6 мар в 14:15

Postgres как поисковый движок

12 мин

11K

Блог компании СравниPostgreSQL*Поисковые технологии*

Перевод

Поиск — это сложно. Важная часть многих приложений, которую нелегко реализовать правильно. Особенно в случае с RAG-пайплайнами, где на качество поиска завязан весь процесс.

Хотя семантический поиск в моде, старый добрый лексический поиск по-прежнему остается базой. Семантические методы могут улучшить результаты, но эффективнее всего они работают, когда добавляются к прочному фундаменту текстового поиска.

Эрик Закариассон, разработчик и автор блога Anyblockers, рассмотрел в своей статье, как использовать Postgres для создания надёжной поисковой системы. В рамках задачи автор объединил три техники:

1. Полнотекстовый поиск с tsvector

2. Семантический поиск с pgvector

3. Нечёткое сопоставление с pg_trgm

4. Бонус: BM25

Возможно, это не оптимальный подход для любой ситуации, но отличная альтернатива созданию отдельного поискового сервиса; отправная точка, которую можно реализовать и масштабировать в рамках существующей базы данных Postgres.

+57

LesnoyChelovek 5 мар в 11:52

«Postgres. Первое знакомство» (11-е издание) надёжный проводник в мир PostgreSQL

Простой

4 мин

5.3K

Блог компании Postgres ProfessionalЧитальный залPostgreSQL*

Обзор

Занимаемся не только разработкой, но и помогаем освоиться в мире PostgreSQL новичкам. Обновлённая книга для тех, кто только начинает изучение темы СУБД, уже доступна для свободной загрузки. Кому и как поможет «Postgres. Первое знакомство», расскажем подробнее.

Прочитать обзор книги

+25

nrddog 28 фев в 14:00

Что в черном ящике, или Как разработчику понять, что требует оптимизации в БД PostgreSQL

Простой

20 мин

11K

Блог компании Т-БанкPostgreSQL*

Обзор

Привет! Меня зовут Дмитрий Руденко, я из команды Databases Т-Банка. В последние годы наблюдается тенденция к переходу на Postgres со стороны многих команд и компаний, что приводит к увеличению количества Postgres-баз данных, требующих эффективного мониторинга и управления.

Мы достигли впечатляющего масштаба — почти 10 000 работающих экземпляров PostgreSQL, с которыми работают более 2 000 команд. Каждый из этих инстансов обслуживает уникальные рабочие нагрузки, разработанные командами с различными подходами к архитектуре, используемыми фреймворками и паттернами проектирования.

Мы пришли к созданию общей системы мониторинга баз данных Postgres, предоставляющей пользователю в простом и понятном виде данные о состоянии инстанса. В этой статье я расскажу о нашем видении визуального представления информации для пользователя и о созданной нами группе дашбордов для наблюдения за базами данными Postgres. Вы увидите, что накопительная статистика Postgres совместно с Prometheus и Grafana способны творить чудеса.

+35

fisher 18 фев в 08:52

Нужен ли нам сейчас кеш-слой перед СУБД

Средний

13 мин

27K

Блог компании Конференции Олега Бунина (Онтико)Хранение данных*Исследования и прогнозы в IT*PostgreSQL*MySQL*

Обзор

Уже лет 20 существует миф (или не миф), что современный Highload-проект невозможен без кэшей. Они всегда нас выручали, когда не справлялись базы данных. Но с тех пор, как появились первые кэши, key-value баз данных и другие технологии, многое изменилось и традиционные СУБД значительно эволюционировали. И так ли теперь нужен кэш?
Мы протестировали самые известные кэш-сервисы и СУБД и попробовали выжать из них миллион запросов в секунду в разных условиях. Делимся с вами результатами в этой статье.
Привет, Хабр! Я Алексей Рыбак, предприниматель и основатель R&D-лаборатории DevHands, автор телеграм-канала про System Design и Highload. В прошлом — СТО и руководитель московского офиса Badoo. Работал во втором по размеру такси-сервисе «Везёт», который мы после продажи интегрировали с Яндекс.Такси. Сейчас наша компания разрабатывает образовательные программы по Highload и перформансу.

+95

fishday 17 янв в 06:00

Управление резервным копированием PostgreSQL через веб-интерфейс: обзор утилиты PG Back Web

Простой

7 мин

8.5K

Блог компании ФлантБазы данных*PostgreSQL*DevOps*Kubernetes*

Обзор

В обзоре узнаете, как графический интерфейс PG Back Web значительно облегчает управление резервными копиями PostgreSQL. Мы покажем, как настраивать резервные копии всего за несколько кликов.

+26

sokolcati 15 янв в 11:00

Как поймать и обезвредить проблемные запросы в PostgreSQL

Средний

10 мин

16K

Блог компании Postgres ProfessionalPostgreSQL*Базы данных*

Туториал

«Как ускорить выполнение запросов к базам данных?» — извечный вопрос админов и пользователей. Казалось бы, раньше всё работало неплохо, но стоило клиентской базе вырасти в пять раз, как всё замедлилось. Знакомая ситуация? В этой статье расскажем, как найти запросы, которые можно ускорить, и оптимизировать их.

Статья подготовлена по материалам выступления на конференции PGCONF.СПБ 2024.

Бежим ловить запросы!

+42

ElKornacio 12 янв в 14:09

PGlite — полноценный Postgres-сервер на WASM. Работает прямо в браузере и Node.js

Простой

4 мин

5.6K

Node.JS*JavaScript*PostgreSQL*

Обзор

Безумные штуки иногда можно найти в интернете. Листая 2024 JavaScript rising stars (https://risingstars.js.org/2024/en#section-all) обнаружил там удивительного зверя - Postgres скомпилированный через emcc в WASM версию, и допиленный до состояния, когда его можно запустить внутри JS-процесса (браузер/Node.js/Bun/etc).

Как он устроен, как им пользоваться, и, самое главное, зачем? Добро пожаловать под кат :)

Поехали!

+34

IvanVakhrushev 4 янв в 17:16

pg-index-health – статический анализ структуры PostgreSQL баз данных

Сложный

19 мин

6.6K

Java*PostgreSQL*Open source*

✏️ Технотекст 7

С 2019 года я занимаюсь разработкой open source инструмента под названием pg-index-health, который позволяет анализировать структуру БД и находить потенциальные проблемы.

Все эти годы pg-index-health эволюционировал и развивался. За 2024 год мне при поддержке нескольких контрибьюторов удалось решить большинство остававшихся «детских болячек» и довести проект до состояния, когда он готов к масштабной экспансии.

В этой статье я хочу подробно рассказать об идеях, которые стоят за этим инструментом, и как его использовать в ваших проектах.

+25

danolivo 1 янв в 14:00

Оптимизация запросов SQL Server V/S PostgreSQL: есть куда расти?

Сложный

15 мин

Блог компании Postgres ProfessionalPostgreSQL*

Кейс

Перевод

Выбор SQL-запроса в реляционной СУБД в основном определяется пространством поиска возможных планов и техниками поиска плана в этом пространстве. У каждой СУБД оба этих фактора имеют свои особенности, что объясняет, почему иногда при миграции с одной СУБД на другую можно наблюдать как ускорения, так и провалы во времени выполнения отдельных запросов.

Здесь я привожу четыре случая, когда SQL Server позволяет строить планы запросов значительно более оптимальные, нежели это доступно PostgreSQL используя как более широкое пространство возможных планов, так и более совершенные методы оценок эффективности планов. Эти примеры: использование тредов, расширенная статистика, кэширование промежуточных результатов запроса и внутренняя параметризация. Примеры независимы и все кроме первого содержат скрипт воспроизведения - можно сразу листать на ту часть, которая выглядит интереснее.

Полагаю, знание о таких кейсах может быть полезным. Как минимум уменьшит количество стресса при миграции на PostgreSQL и возможно заинтересует кого-то настолько, чтобы начать свой проект в open-source сообществе разработчиков СУБД.

+36

kotosova43 25 дек 2024 в 09:12

POSTGRES EXPLAIN

Простой

14 мин

12K

Блог компании SpectrУправление e-commerce*Разработка под e-commerce*SQL*PostgreSQL*

Всем привет! На связи Ришат Садыков из Spectr. Сегодня мы поговорим про explain в Postgres. Это объемная тема, по ней можно найти много материала. В статье я постарался собрать только ту информацию, которой достаточно для начала использования explain. Материал поможет эффективно использовать его для повышения производительности запросов тем, кто этим никогда не занимался.

Узнать о повышении производительности

+25

Loxmatiymamont 18 дек 2024 в 11:00

Будущее PostgreSQL: как 64-битный счетчик транзакций решает проблему масштабирования

Средний

7 мин

13K

Блог компании Postgres ProfessionalPostgreSQL*Базы данных*SQL*Системное программирование*

✏️ Технотекст 7

Много лет в комьюнити PostgreSQL никто не верил что эта СУБД в принципе может использоваться в системах с большой транзакционной нагрузкой. То есть, какие-то тестовые лаборатории, бэкенд веб-приложений средней руки и так далее — вот его типичные задачи. А когда нужна серьёзная нагрузка, это уже надо брать СУБД за много денег и не сомневаться. Ну и раз никто не верил, то и не развивал особенно его в эту сторону, оставляя всё больше повисших в воздухе вопросов.

Но на практике вышло так, что наши клиенты всё чаще сталкиваются с проблемами, которые породил этот подход. Например, в международном комьюнити постгреса считается, что 64 ядра — это предельный размер сервера, где его вообще можно запустить. А мы всё чаще видим, что это становится минимальной типовой конфигурацией. Другим таким узким местом стал счётчик транзакций, ситуация с которым намного более интересная. Поэтому о нём мы сегодня и поговорим. В чём там проблема, как мы её решили, и что на эту тему думает международное комьюнити.

+65

timnizam 17 дек 2024 в 06:00

Как обновить PostgreSQL и не потерять данные: метод минимизации простоя

Простой

12 мин

13K

Блог компании ФлантPostgreSQL*Системное администрирование*DevOps*Базы данных*

Кейс

Мы успешно обновили кластер PostgreSQL с версии 13 до 16, обеспечив минимальный простой и высокую производительность. Процесс включал в себя создание новой реплики через логическую репликацию, перенос роли мастера на обновлённую реплику и настройку потоковой репликации. Несмотря на некоторые сложности, такие как управление LSN и проблемы с подписками, нам удалось сохранить данные и обеспечить синхронизацию.

Подробности читайте в статье.

+57

LyubavinSergey 29 ноя 2024 в 12:00

Оптимизация хранения данных в PostgreSQL

Средний

39 мин

17K

Блог компании BercutPostgreSQL*SQL*

Туториал

✏️ Технотекст 7

Всем привет. Меня зовут Сергей, я — эксперт компании Bercut. За плечами — более 20 лет работы с различными СУБД (PostgreSQL, Oracle, MS Access, MS FoxPro, Borland InterBase) и высоконагруженными системами на их основе.

В Bercut мы занимаемся разработкой и развитием IT‑продуктов, решений для операторов цифровых услуг и мобильных сервисов. Наши системы работают на различном железе, разных СУБД и обслуживают 24×7x365 в режиме онлайн сотни миллионов абонентов.

Сегодня поговорим о том, как оптимизировать хранение данных в PostgreSQL, снизив объем дискового пространства, потребляемого таблицами и ускорить выборку данных. Это может быть особенно актуально после перевода информационной системы с другой СУБД на PostgreSQL.

Это не лонгрид (как кажется с первого взгляда), а краткое практическое руководство.Есть навигация, можно сразу перейти на нужные пункты.

+38

danolivo 19 ноя 2024 в 13:55

Ускоряем запросы в PostgreSQL, оптимизируя оператор GROUP BY

Сложный

9 мин

19K

Блог компании Postgres ProfessionalPostgreSQL*Базы данных*SQL*

Кейс

Пользователи PostgreSQL нередко оперируют аналитическими запросами, при выполнении которых данные сортируются и группируются по разным правилам. За счёт оптимизации вычисления агрегатов и сортировок можно значительно сократить время и стоимость выполнения запросов. Об одной из таких оптимизаций — выборе порядка колонок в выражении GROUP BY — расскажем в этой статье.

Postgres уже умеет перестраивать список группируемых выражений в соответствии с порядком колонок из условия ORDER BY, чтобы исключить дополнительную сортировку и сэкономить вычислительные ресурсы. Мы пошли дальше, реализовали свою идею в дистрибутивах Postgres Pro Standard и Enterprise и вынесли патчи на обсуждение сообщества Postgres (первое и второе) в надежде, что они войдут в ближайшую версию ванильного PostgreSQL.

+43

ru_vds 18 ноя 2024 в 13:01

Неочевидные для начинающих тонкости Postgres

Средний

15 мин

46K

Блог компании RUVDS.comPostgreSQL*Базы данных*

Обзор

Перевод

Добрую часть десятилетия я профессионально занимаюсь веб-приложениями, и за этот срок научилась пользоваться множеством разных систем и инструментов.

В процессе этого обучения я обнаружила, что самой полезной обычно оказывается официальная документация.

За исключением… Postgres.

Не потому, что официальная документация несовершенна (она прекрасна!), просто её очень много. Если распечатать её как стандартный PDF на бумаге формата Letter, то получится 3206 страниц (для текущей версии 17)¹. Разработчик-джун вряд ли сможет сесть и прочитать её с начала до конца.

^{1. Если печатать на бумаге A4, то получится 3024 страницы; наверно, это ещё один аргумент в пользу стандарта.}

Поэтому мне захотелось каталогизировать ту информацию, которая бы очень пригодилась мне, когда я только начинала работать с базой данных Postgres.

Надеюсь, это упростит процесс освоения для читателей моей статьи.

Стоит отметить, что многое из описанного может быть применимо и к другим системам управления базами данных (СУБД) SQL и вообще к базам данных в целом, но я слабо знакома с ними, так что не буду утверждать с уверенностью.

Читать дальше →

+105

techevangelist 17 ноя 2024 в 20:44

Где PostgreSQL выигрывает у Oracle DB

Простой

5 мин

17K

Блог компании OTUSPostgreSQL*

Обзор

Если вы стоите перед выбором между PostgreSQL и Oracle DB, то эта статья для вас. Разберем где PostgreSQL побеждает Oracle. Будет код и примеры — всё, что нужно для практического сравнения.

P.S: эта статья не про то, какой PSQL хороший в отличии от Oracle, а про то, в чем PSQL по мнению автора лучше.

+33

3 4 ...

22 23

PostgreSQL *

О скрытии сообщений в эмодзи и взломе казначейства США

Укрощаем мажорные обновления: сценарий обновления системных данных каталога без лишней боли

Делаем жизнь легче: быстрый поиск в django и postgresql с помощью search_vector

Влияние источника времени на результат explain в PostgreSQL

Postgres как поисковый движок

«Postgres. Первое знакомство» (11-е издание) надёжный проводник в мир PostgreSQL

Что в черном ящике, или Как разработчику понять, что требует оптимизации в БД PostgreSQL

Нужен ли нам сейчас кеш-слой перед СУБД

Управление резервным копированием PostgreSQL через веб-интерфейс: обзор утилиты PG Back Web

Как поймать и обезвредить проблемные запросы в PostgreSQL

PGlite — полноценный Postgres-сервер на WASM. Работает прямо в браузере и Node.js

pg-index-health – статический анализ структуры PostgreSQL баз данных

Оптимизация запросов SQL Server V/S PostgreSQL: есть куда расти?

Ближайшие события

POSTGRES EXPLAIN

Будущее PostgreSQL: как 64-битный счетчик транзакций решает проблему масштабирования

Как обновить PostgreSQL и не потерять данные: метод минимизации простоя

Оптимизация хранения данных в PostgreSQL

Ускоряем запросы в PostgreSQL, оптимизируя оператор GROUP BY

Неочевидные для начинающих тонкости Postgres

Где PostgreSQL выигрывает у Oracle DB

Вклад авторов