Администрирование баз данных *

Все об администрировании БД

Статьи Посты Новости Авторы Компании

Maksvelis 12 апр в 15:37

Выжимаем максимум из PostgreSQL

Средний

14 мин

13K

Блог компании SelectelPostgreSQL*IT-инфраструктура*Администрирование баз данных*

Обзор

Привет, Хабр! Меня зовут Максим, я работаю тестировщиком оборудования в Selectel Lab. В лаборатории мы занимаемся тестированием нового оборудования для дата-центров. О том, как мы измеряли производительность PostgreSQL на разных конфигурациях — под катом!

Читать дальше →

+63

kubelet 3 апр в 11:06

В погоне за заменой Redis

11 мин

18K

Блог компании ФлантOpen source*NoSQL*Администрирование баз данных*Бизнес-модели*

Мнение

Перевод

21 марта Redis Ltd. объявила, что, начиная с Redis 7.4, ее «in-memory data store» будет выпускаться под несвободными лицензиями с доступным (source-available) исходным кодом. Новость малоприятная, но вполне ожидаемая. Необычно в этой ситуации обилие альтернатив для тех, кто хочет остаться со свободным ПО: есть как минимум четыре варианта замены, включая уже существующий форк под названием KeyDB и недавно анонсированный проект Valkey от Linux Foundation. Вопрос теперь в том, что предпочтут пользователи, провайдеры и создатели дистрибутивов Linux.

+35

sergiorussia 3 апр в 10:00

Как мы переехали с Oracle на PostgreSQL в нагруженном сервисе без даунтайма

Средний

30 мин

21K

Блог компании ЯндексOracle*PostgreSQL*Администрирование баз данных*

Кейс

Всем привет! Я Сергей, работаю в B2B-команде Яндекс Маркета последние 3,5 года. Как уже понятно из заголовка, сейчас я вам расскажу про yet-another-миграцию с базы на базу, которая началась в середине 2021 года и заняла почти год. Получается, мемуары.

Вас ждёт рассказ о том, как мы:

- несколько месяцев чинили тесты и делали трансформер;

- десятки раз переливали данные;

- чинили баги незаметно для пользователей;

- заставили сервис работать на PostgreSQL быстрее, чем он работал на Oracle.

+90

Kilor 2 апр в 12:50

Курс «PostgreSQL для начинающих»: #4 — Анализ запросов (ч.1 — как и зачем читать планы)

Средний

16 мин

17K

Блог компании ТензорPostgreSQL*Анализ и проектирование систем*SQL*Администрирование баз данных*

Туториал

Продолжаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В этой лекции мы узнаем, что такое план выполнения запроса, как и зачем его читать (и почему это совсем непросто), и о каких проблемах с производительностью базы он может сигнализировать. Разберем, что такое Seq Scan, Bitmap Heap Scan, Index Scan и почему Index Only Scan бывает нехорош, чем отличается Materialize от Memoize, а Gather Merge от "просто" Gather.

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись (часть 1, часть 2).

+32

olegsklyarov 26 мар в 11:19

Как я уронил прод на полтора часа (и при чем тут soft delete и partial index)

7 мин

36K

Блог компании SkyengPHP*Symfony*Администрирование баз данных*

В жизни любого разработчика наступает момент, когда он роняет прод. Представьте: полдень, в Skyeng час пик, тысячи запланированных онлайн-уроков, а наша платформа лежит…

Все упало из-за ошибки в процессе деплоя, которая связана с тонкостью PostgreSQL. К сожалению, на этом моменте у нас прокололась не одна команда. И чтобы такое больше не произошло ни у нас, ни в другой компании — велкам под кат.

+164

174

eivanov 20 мар в 11:07

Когда одного Postgres'a мало: сравнение производительности PostgreSQL и распределенных СУБД

Сложный

12 мин

10K

Блог компании YDBВысокая производительность*PostgreSQL*Администрирование баз данных*Распределённые системы*

Перевод

Общеизвестно, что PostgreSQL - крайне эффективная СУБД с богатой функциональностью. При этом не секрет, что PostgreSQL масштабируется только вертикально и её производительность ограничена возможностями одного сервера.

Написано много хороших постов, в которых сравнивают архитектуру монолитных и распределенных СУБД. К сожалению, обычно авторы ограничиваются теоретическим сравнением и не приводят конкретные цифры. Данный пост же наоборот основан на эмпирическом исследовании с использованием бенчмарка TPC-C, который является промышленным стандартом для оценки производительности транзакционных СУБД (On-Line Transaction Processing, OLTP).

Мы расскажем, когда именно одного Postgres'a становится мало, и какие возможны компромиссы между производительностью и надежностью. Для тех, кто не готов к компромиссам, мы покажем, что могут предложить такие распределенные СУБД, как CockroachDB и YDB.

+27

justwack 5 мар в 09:07

Что нового в планировщике / оптимизаторе запросов Postgres 16

Средний

18 мин

6.3K

PostgreSQL*Программирование*SQL*Администрирование баз данных*

Обзор

Перевод

PostgreSQL 16 вносит немало улучшений в планировщик запросов и позволяет выполнять многие SQL-запросы быстрее, чем в предыдущих версиях PostgreSQL.

Если вы посмотрите на PG16 release notes, то увидите некоторые из этих улучшений. Но из-за объема изменений, вносимых в каждом выпуске PostgreSQL, невозможно предоставить достаточно подробную информацию о каждом изменении.

В этом посте вы получите глубокое представление о 10 улучшениях, внесенных в планировщик запросов PostgreSQL 16. Для каждого из улучшений будет сравнения выходных данных планировщика PG15 и PG16, а также примеры того, что изменилось, в виде автономного теста, который вы можете попробовать сами.

+27

miruzzy 3 мар в 21:45

Мифы и реалии «Мультимастера» в архитектуре СУБД PostgreSQL. Часть. 1

12 мин

9.8K

Блог компании Postgres ProfessionalСистемное администрирование*PostgreSQL*Администрирование баз данных*

Привет, Хабр! Недавно мы делали доклад на конференции HighLoad 2023 — «Мифы и реалии Мультимастера в архитектуре СУБД PostgreSQL». Мы — это Павел Конотопов (@kakoka) и Михаил Жилин (@mizhka), сотрудники компании Postgres Professional. Павел занимается архитектурой построения отказоустойчивых кластеров, а Михаил — анализом производительности СУБД. У каждого за плечами более десяти лет опыта в своей области.

Порассуждаем о том, как развивалась технология «Мультимастер» в экосистеме PostgreSQL, остановимся на том, что она из себя представляет, на каких внутренних механизмах PostgreSQL основана и как её можно использовать.

Мы также поговорим о том, существует ли «Честный Мультимастер» (само понятие «Честный Мультимастер» достаточно специфично и в основном употребляется в кругу разработчиков), какие реализации у него есть и как его следует применять.

+40

sergepetrenko 19 фев в 12:34

Во что обойдется линеаризуемость в распределенной системе

Средний

12 мин

5.9K

Блог компании VKВысокая производительность*Администрирование баз данных*Распределённые системы*Tarantool*

Всем привет, меня зовут Сергей Петренко, я программист в Tarantool. Сегодня мы посмотрим, с какими трудностями сталкивается клиент, когда вместо того чтобы общаться с системой, расположенной на одном инстансе, начинает общаться с распределенной системой. И разумеется, поговорим о том, как эти трудности преодолеть. Я расскажу, что такое линеаризуемость, как мы ее реализуем в Tarantool и как это делают другие СУБД. В завершение мы поговорим о накладных расходах от линеаризуемости.

Читать дальше →

+59

KoppeKTop 6 фев в 12:22

Шардирование: с нуля до Яндекс Диска

9 мин

8.8K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Яндекс 360Высокая производительность*Администрирование баз данных*

Меня зовут Андрей Колнооченко. Я отвечаю за ядро файловой системы Яндекс Диска. Когда мы запускали сервис, то сразу ориентировались на рост и приняли решение шардировать базу метаданных о файлах. Но за 11 лет Яндекс Диск настолько вырос, что нам пришлось трижды менять подход к шардированию. В статье расскажу, с какими проблемами мы сталкивались по мере роста сервиса и как от MongoDB пришли в итоге к PostgreSQL.

Эта статья будет полезна, если вы планируете распределить нагрузку на вашу БД или вам просто интересен опыт развития БД для обработки большого числа запросов.

+30

maxkokryashkin 22 янв в 11:30

Exception Handling: сквозь мультивселенные интероперабельности

10 мин

2.4K

Блог компании VKБлог компании Конференции Олега Бунина (Онтико)Высокая производительность*Администрирование баз данных*Tarantool*

В любой программе периодически возникают исключительные ситуации, которые необходимо обрабатывать. В большинстве случаев обработка ошибок не вызывает вопросов, но ситуация становится сложнее, когда среда вашего исполнения представляет собой сэндвич из интерпретируемого и нативно исполняемого кода на разных языках.

Меня зовут Максим Кокряшкин, я занимаюсь поддержкой и расширением функциональности форка LuaJIT, интегрированного в Tarantool. В этой статье мы обсудим, как интероперабельность исключений помогает упростить обработку ошибок на стыках разных языковых рантаймов, а также посмотрим, как можно реализовать интероперабельность стандартными механизмами обработки исключений.

Читать дальше →

+38

Kilor 10 янв в 15:30

Курс «PostgreSQL для начинающих»: #3 — Сложные SELECT

Средний

12 мин

26K

Блог компании ТензорPostgreSQL*SQL*Администрирование баз данных*

Мнение

В этой лекции углубимся в расширенные возможности команды SELECT : как можно "сложить" и "вычесть" выборки (UNION/INTERSECT/EXCEPT), или запомнить и использовать в рекурсивных запросах (CTE), что дают оконные функции (WINDOW) и соединения (JOIN).

Как обычно, для предпочитающих смотреть и слушать, а не читать - доступна видеозапись.

+34

ednersky 27 дек 2023 в 14:36

Tarantool 3.0

Средний

15 мин

8.1K

Блог компании VKВысокая производительность*Администрирование баз данных*Tarantool*

Обзор

Когда мы видим в сети сообщение о выходе новой версии того или иного продукта, это, как правило, скучно. Ченджлог описывает лишь перечень изменений, а вот зачем и для чего они, понятно не всегда.

В этой статье я попытаюсь рассказать о том новом, что появится в Tarantool 3.0, не простым перечислением изменений, а описывая проблемы, которые мы пытались решить. В таком ключе это может быть интересно и тем, кто не собирается устанавливать Tarantool, — просто с технической точки зрения.

Читать дальше →

+52

PatientZero 26 дек 2023 в 10:27

Почему B-деревья быстрые?

Простой

7 мин

46K

Алгоритмы*Администрирование баз данных*Хранение данных*

Обзор

Перевод

B-дерево — это структура, помогающая выполнять поиск в больших объёмах данных. Она была изобретена более сорока лет назад, однако по-прежнему используется в большинстве современных баз данных. Хотя существуют и более новые структуры индексов, например, LSM-деревья, B-дерево пока никто не победил в обработке большинства запросов баз данных.

После прочтения этого поста вы будете знать, как B-дерево упорядочивает данные и выполняет поисковые запросы.

+183

Kilor 20 дек 2023 в 16:50

SQL HowTo: итоги по строкам и столбцам «в одно действие»

Средний

4 мин

14K

Блог компании ТензорВысокая производительность*PostgreSQL*SQL*Администрирование баз данных*

Туториал

Немного отвлечемся от простых SELECT и посмотрим на реальной бизнес-задаче построения различных "тепловых карт" и "шахматок", как знание возможностей SQL может облегчить жизнь и разработчику, и его базе.

+27

Kilor 12 дек 2023 в 08:30

Курс «PostgreSQL для начинающих»: #1 — Основы SQL

Простой

13 мин

43K

Блог компании ТензорPostgreSQL*SQL*Администрирование баз данных*

Мнение

Этим постом я запускаю публикацию расширенных транскриптов лекционного курса "PostgreSQL для начинающих", подготовленного мной в рамках "Школы backend-разработчика" в "Тензоре".

В программе: рассказ об основах SQL, возможностях простых и сложных SELECT, анализ производительности запросов, разбор [не]эффективного применения индексов и особенностей работы транзакций и блокировок в этой СУБД.

Курс не претендует на лавры "войти в айти", поэтому подразумевает наличие у слушателя опыта программирования или работы с другими СУБД, и, главное, желания самостоятельно изучать тему работы с PostgreSQL глубже.

Для тех, кому комфортнее смотреть и слушать, а не читать - доступна видеозапись.

+33

jobgemws 11 дек 2023 в 12:49

Почему вам стоит отказаться от использования timestamp в PostgreSQL

10 мин

61K

PostgreSQL*Программирование*Администрирование баз данных*

Из песочницы

Не секрет, что работа с часовыми поясами — боль, и многие разработчики объяснимо стараются ее избегать. Тем более что в каждом языке программирования / СУБД работа с часовыми поясами реализована по-разному.

Среди тех, кто работает с PostgreSQL, есть очень распространенное заблуждение про типы данных timestamp (который также именуется timestamp without time zone) и timestamptz (или timestamp with time zone). Вкратце его можно сформулировать так:

Мне не нужен тип timestamp with time zone, т.к. у меня все находится в одном часовом поясе — и сервер, и клиенты.

В статье я постараюсь объяснить, почему даже в таком довольно простом сценарии можно запросто напороться на проблемы. А в более сложных (которые на самом деле чаще встречаются на практике, чем может показаться) баги при использовании timestamp практически гарантированы.

+90

136

2 3 ...

15 16

Администрирование баз данных *

Выжимаем максимум из PostgreSQL

Новости

В погоне за заменой Redis

Как мы переехали с Oracle на PostgreSQL в нагруженном сервисе без даунтайма

Курс «PostgreSQL для начинающих»: #4 — Анализ запросов (ч.1 — как и зачем читать планы)

Истории

Как я уронил прод на полтора часа (и при чем тут soft delete и partial index)

Когда одного Postgres'a мало: сравнение производительности PostgreSQL и распределенных СУБД

Что нового в планировщике / оптимизаторе запросов Postgres 16

Рекомендации при работе с PostgreSQL

Рекомендации при работе с PostgreSQL

Мифы и реалии «Мультимастера» в архитектуре СУБД PostgreSQL. Часть. 1

Во что обойдется линеаризуемость в распределенной системе

Шардирование: с нуля до Яндекс Диска

Exception Handling: сквозь мультивселенные интероперабельности

Ближайшие события

Курс «PostgreSQL для начинающих»: #3 — Сложные SELECT

Tarantool 3.0

Почему B-деревья быстрые?

SQL HowTo: итоги по строкам и столбцам «в одно действие»

Курс «PostgreSQL для начинающих»: #1 — Основы SQL

Рекомендации по ведению SQL-кода

Почему вам стоит отказаться от использования timestamp в PostgreSQL

Вклад авторов

Работа