Статьи / Закладки / Профиль Sleuthhound / Хабр

Михаил Григорьев @Sleuthhound

Системное администрирование и базы данных

ПрофильСтатьи7ПостыНовостиКомментарии1.1K

Lexx_Nimofff 15 апр в 15:13

Переход из Oracle в Postgres Pro: не просто смена СУБД, а сдвиг подхода. Интервью с Марком Ривкиным

Простой

31 мин

6.1K

ИнтервьюАдминистрирование баз данных*PostgreSQL*Искусственный интеллект

Интервью

Давно не было обстоятельных интервью, тем более с таким корифеем отечественной СУБД‑разработки. В 2022 году в Postgres Professional перешла команда специалистов по Oracle, включая Марка Ривкина, который занял позицию руководителя отдела технического консалтинга. Вместе с командой он занялся адаптацией продуктов под требования крупных корпоративных заказчиков и доработкой функциональности Postgres Pro — в первую очередь для тех, кто планирует миграцию с проприетарных СУБД.

В интервью для Хабра Марк рассказал, с какими задачами столкнулись на старте, какие функции пришлось внедрять в первую очередь, как выстроена работа с разработкой и сообществом, и в чём сегодня Postgres Pro реально может заменить Oracle, а в чём — пока нет. Поговорили и про ИИ в администрировании, и про перспективы российских форков PostgreSQL, и даже о том, что бы он заложил в архитектуру, если бы проектировал СУБД с нуля. Приятного чтения!

+31

VBart 13 мар в 13:31

Стильный современный «autoindex» в Angie/nginx без sms и сторонних модулей

Простой

24 мин

3.3K

ХостингСерверное администрирование*Веб-разработка*Системное администрирование*Nginx*

Туториал

Авто‑индекс — это функциональность HTTP‑сервера, позволяющая при обращении к каталогу на файловой системе автоматически выводить список содержащихся в нем файлов.

Поводом для этой статьи стал вопрос из нашего Telegram‑чата поддержки (присоединяйтесь — он открыт для всех!): «Почему в репозиториях Angie среди множества сторонних модулей отсутствует Nginx Fancy Index?».

Меня удивило, что кто‑то пользуется устаревшим модулем, поскольку ещё в 2014 году я добавил во встроенный в nginx модуль «autoindex» поддержку форматов JSON и XML, что делает сторонние решения избыточными.

Для чего понадобился сторонний модуль, упомянутый в вопросе, — вполне понятно, ведь внешний вид страницы со списком файлов по умолчанию выглядит весьма аскетично, поэтому хочется его разукрасить и улучшить. А как это сделать элегантно и просто без дополнительных модулей, я продемонстрирую наглядно на готовых примерах.

+38

PPR 12 мар в 13:40

Bloom-фильтры в Postgres: скрытый инструмент для оптимизации запросов

Простой

7 мин

1.8K

Блог компании Программный ПродуктSQL*PostgreSQL*

Туториал

В мире разработки и работы с базами данных Bloom-фильтры – это мощный, но малоизвестный инструмент, который может значительно ускорить выполнение запросов и снизить нагрузку на систему. Однако, несмотря на их потенциал, многие разработчики даже не знают, что Postgres поддерживает Bloom-фильтры "из коробки" (функциональность Bloom-фильтров доступна сразу после установки Postgres, при включении соответствующего расширения) через расширение bloom.

Bloom-фильтры особенно полезны в ситуациях, когда нужно быстро проверить, принадлежит ли элемент к множеству, или когда требуется оптимизировать запросы с несколькими условиями. Например, они могут ускорить JOIN-запросы, поиск по нескольким столбцам или агрегатные функции.

В этой статье мы разберем, что такое Bloom-фильтры, как они работают в Postgres, и в каких случаях их использование может быть полезным. Мы также рассмотрим практические примеры и покажем, как Bloom-фильтры могут помочь в оптимизации запросов.

danolivo 9 мар в 14:00

Автоматизированное управление расширенной статистикой в PostgreSQL

Средний

9 мин

PostgreSQL*Администрирование баз данных*

Кейс

Здесь я описываю результаты разработки одного расширения Postgres, которое сделал просто ради любопытства. Суть его состоит в автоматическом управлении расширенной статистикой по колонкам таблицы. Идея родилась в момент, когда заканчивая работу над очередным "умным" query-driven продуктом улучшения качества планирования Postgres я осознал, что архитектура этой СУБД пока ещё не готова к полностью автономной работе - автоматическому детектированию плохих планов и подстройки оптимизатора. Так может быть зайти с другой стороны, и попробовать сделать автономный data-driven помогатор?

OlegIct 9 мар в 19:25

Влияние источника времени на результат explain в PostgreSQL

Средний

7 мин

2.7K

PostgreSQL*Администрирование баз данных*Настройка Linux*

Обзор

При выполнении тестов периодически сталкивался с неожиданными изменениями результатов тестов после рестарта linux и при обновлении версии linux. Причиной оказался источник времени. В статье рассмотрен как влияет источник времени на выполнение команды explain analyze

+25

nrddog 28 фев в 17:00

Что в черном ящике, или Как разработчику понять, что требует оптимизации в БД PostgreSQL

Простой

20 мин

10K

Блог компании Т-БанкPostgreSQL*

Обзор

Привет! Меня зовут Дмитрий Руденко, я из команды Databases Т-Банка. В последние годы наблюдается тенденция к переходу на Postgres со стороны многих команд и компаний, что приводит к увеличению количества Postgres-баз данных, требующих эффективного мониторинга и управления.

Мы достигли впечатляющего масштаба — почти 10 000 работающих экземпляров PostgreSQL, с которыми работают более 2 000 команд. Каждый из этих инстансов обслуживает уникальные рабочие нагрузки, разработанные командами с различными подходами к архитектуре, используемыми фреймворками и паттернами проектирования.

Мы пришли к созданию общей системы мониторинга баз данных Postgres, предоставляющей пользователю в простом и понятном виде данные о состоянии инстанса. В этой статье я расскажу о нашем видении визуального представления информации для пользователя и о созданной нами группе дашбордов для наблюдения за базами данными Postgres. Вы увидите, что накопительная статистика Postgres совместно с Prometheus и Grafana способны творить чудеса.

+35

o4ina 9 апр 2024 в 13:30

PostgreSQL. Устройство карты свободного пространства

Средний

24 мин

Open source*PostgreSQL*Алгоритмы*C*Реверс-инжиниринг*

Из песочницы

СУБД PostgreSQL способна бысто работать с огромными массивами данных благодаря множеству различных механизмов, таких как карта свободного пространства, позволяющая за короткий промежуток времени найти страницу из основного слоя с необходимым свободным пространством для вставки новых версий строк.

В этой статье мы разберемся в устройстве карты свободного пространства, а также познакомимся с алгоритмом получения страницы с необходимым свободным пространством.

+13

melanny20 13 фев в 13:11

Устраняем эффект шумного соседа в PostgreSQL с помощью cgroups

Средний

7 мин

6.6K

Блог компании Postgres ProfessionalPostgreSQL*Настройка Linux*

Туториал

Если вы когда-нибудь запускали несколько экземпляров PostgreSQL или другого ПО на одной машине (виртуальной или физической), то наверняка сталкивались с эффектом шумного соседа, когда инстансы мешали друг другу работать. Так как же примирить соседей? У нас есть ответ!

+24

utdm 8 фев в 11:16

Замедление работы pg_repack с помощью cgroup

Средний

3 мин

898

PostgreSQL*Администрирование баз данных*

Из песочницы

Операция VACUUM FULL полностью пересоздаёт таблицу, предельно оптимизируя её. Она требует полной блокировки таблицы, поэтому высоконагруженные таблицы обрабатывать ею без простоя системы нельзя. Вместо VACUUM FULL можно использовать расширение pg_repack. Оно создаёт на обрабатываемой таблице триггер, отслеживающей модификации, создаёт копию таблицы, догоняет набежавшие изменения. В конце работы берётся короткая блокировка, старая таблица удаляется, новая становится на её место.

Недостатком pg_repack является то, что она работает СЛИШКОМ БЫСТРО – фактически данные копируются и удваиваются в объёме (по отношению к исходной таблице). Каталог pg_wal забивается с такой скоростью, что архиватор не успевает обрабатывать файлы.

Далее описывается способ замедления работы pg_repack с использованием механизма cgroup.

+12

lesovsky 1 фев в 19:39

Postgres Pro OpenTelemetry Collector

Средний

5 мин

2.9K

Блог компании Postgres ProfessionalPostgreSQL*

Обзор

Всем привет, меня зовут Алексей, я люблю мониторинг, немного в нем разбираюсь, а в этом посте расскажу про pgpro-otel-collector который 31 января выпустили в публичное использование.

TLDR: pgpro-otel-collector - opentelemetry-коллектор (агент мониторинга) для сбора метрик и журналов Postgres от PostgresPro.

Продолжить

+24

vQFd4 23 янв в 17:56

Ревизор приехал: pg_anon проверяет, всё ли скрыто

Простой

21 мин

2.5K

Блог компании РостелекомИнформационная безопасность*PostgreSQL*

Туториал

В современной разработке мы постоянно сталкиваемся с дилеммой: для эффективной работы командам нужны реальные данные, но их использование несет существенные риски безопасности. Как тестировать функциональность на реалистичных данных, не подвергая риску конфиденциальность пользователей? Как предоставить аналитикам доступ к данным, сохранив при этом их статистические свойства? Как обеспечить безопасную разработку в условиях постоянно ужесточающегося законодательства?

В этой статье мы разберем практический подход к решению этих проблем с помощью pg_anon – инструмента для автоматической анонимизации данных в PostgreSQL. Я постараюсь рассказать вам основной сюжет работы с производственными данными, не замедляя при этом разработку.

+15

andrey0700 9 янв в 00:24

Сравнение Bash и Python при написании скриптов в Linux

Средний

24 мин

34K

*nix*Python*Разработка под Linux*

Обзор

Sh (от shell) является обязательным командным интерпретатором для UNIX‑совместимых систем по стандарту POSIX. Однако по возможностям он ограничен, поэтому зачастую вместо него используются более богатые возможностями командные интепретаторы, такие как Bash или Ksh. Ksh обычно используется в операционных системах семейства BSD, в то время как Bash — в операционных системах семейства Linux. Командные интерпретаторы облегчают решение мелких задач, связанных с работой с процессами и файловой системой. В данной статье будут рассматриваться операционные системы Linux, поэтому речь пойдёт о Bash.

Python, в свою очередь, является полноценным интерпретируемым языком программирования, и он также нередко используется для написания скриптов или решения мелких прикладных задач при работе с операционной системой. Современную UNIX‑подобную систему сложно представить как без Sh, так и без Python, если только это не устройство с минималистичной ОС вроде маршрутизатора. Например, в Ubuntu Oracular пакет python3 удалить не получится хотя бы потому, что от него зависит пакет grub‑common, от которого, в свою очередь зависят пакеты grub2-common и, соответственно, grub‑pc, то есть непосредственно загрузчик операционной системы. Таким образом, Python 3 можно смело использовать как замену Bash в случае необходимости.

+46

173

ass026 11 мар 2019 в 17:48

Сюрпризы планировщика запросов в БД PostgreSQL

13 мин

22K

Блог компании OkkoАдминистрирование баз данных*SQL*PostgreSQL*

Графики, отчеты и аналитика – все это так или иначе присутствует в back-office любого, даже совсем маленького, предприятия. Когда в обычных таблицах в Excel/Numbers/Libre становится уже тесно, но data все еще не очень big, традиционные решения для внутренних потребностей компании часто строятся с помощью реляционных баз данных, таких как PostgreSQL, MySQL или MariaDB.

Эти базы данных бесплатны, благодаря SQL удобно интегрируются с остальными компонентами в системе, они популярны и с ними умеют работать большинство разработчиков и аналитиков. Нагрузку (трафик и объемы) они могут переварить достаточно объемную, чтобы спокойно продержаться до того момента, когда компания сможет позволить себе более сложные (и дорогие) решения для аналитики и отчетов.

Однако даже в многократно изученной технологии всегда существуют разные нюансы

+38

vQFd4 24 окт 2024 в 13:54

Быстрее пули: как найти счастье с PostgreSQL

Простой

24 мин

14K

Блог компании РостелекомПоисковые технологии*PostgreSQL*Java*Веб-разработка*

Туториал

Recovery Mode

В этой статье мы расскажем о том, как эффективно реализовать полнотекстовый поиск с помощью PostgreSQL. Узнайте, как улучшить скорость и точность поиска по текстовым данным, используя такие инструменты, как tsvector, tsquery и индексы GIN, и как эти возможности могут значительно повысить производительность вашего приложения.

+40

karen07 19 окт 2024 в 16:53

AntiBlock 2.0

Средний

6 мин

7.5K

C*Сетевые технологии*Разработка под Linux*Высокая производительность**nix*

Туториал

Приблизительно два года назад я начал разрабатывать свою программу AntiBlock, о которой я писал ранее. Версия, которую я описал тогда, была далека от завершения. Но сейчас уже применятся другая архитектура, появился скрипт для сборки пакета и удобная служба, с конфигурационным файлом.

С помощью обработки DNS запросов, программа направляет только заблокированные сайты через VPN, а остальные идут без изменений.

+11

nikolai-averin 20 мая 2023 в 21:22

SQL миграции в Postgres. Часть 2

Средний

17 мин

14K

PostgreSQL*SQL*Администрирование баз данных*

FAQ

В первой части мы рассмотрели базовые операции, такие как добавление новых атрибутов, создание индексов и ограничений и т.д.

Эта статья посвящена двум более сложным миграциям:

- обновление большой таблицы
- разделение таблицы на две

Рассмотрим подходы, которые позволяют провести миграции с минимальным простоем для приложения.

+20

YaGolub 25 июн 2020 в 16:02

Собираем логи с Loki

13 мин

155K

Блог компании BadooDevOps*Kubernetes*Open source*Системное администрирование*

Мы в Badoo постоянно мониторим свежие технологии и оцениваем, стоит ли использовать их в нашей системе. Одним из таких исследований и хотим поделиться с сообществом. Оно посвящено Loki — системе агрегирования логов.

Loki — это решение для хранения и просмотра логов, также этот стек предоставляет гибкую систему для их анализа и отправки данных в Prometheus. В мае вышло очередное обновление, которое активно продвигают создатели. Нас заинтересовало, что умеет Loki, какие возможности предоставляет и в какой степени может выступать в качестве альтернативы ELK — стека, который мы используем сейчас.

+44

an1ik 16 сен 2024 в 20:04

Тестирование лучших self-hosted аналогов Notion

Простой

6 мин

31K

Блог компании Serverspace*nix*IT-инфраструктура*Облачные сервисы*Системное администрирование*

Обзор

Хабр, в связи с уходом Notion выросла потребность в аналогичном решении, которое бы было сопоставимо удобной Wiki, Task Manager — платформе.

Я испробовал десять self-hosted решений и нашел несколько почти идеальных! Вы можете развернуть их у себя на сервере, при работе над совместными проектами с командой или для ведения личных записей.

Читать дальше →

+57

ig_rudenko 29 июл 2024 в 10:00

PostgreSQL 16. Страницы и версии строк. Часть 3

Средний

10 мин

6.3K

Open source*PostgreSQL*Администрирование баз данных*

Данная статья является продолжением: PostgreSQL 16. Изоляция транзакций. Часть 2.

В этой части мы рассмотрим, из каких частей состоит страница в PostgreSQL, как выполняются операции CRUD (создание, чтение, обновление, удаление) для строк с сохранением нескольких версий одной и той же строки в таблице и как на это влияют транзакции. Также рассмотрим вложенные транзакции.

+18

badcasedaily1 18 июл 2024 в 08:39

Как и зачем создавать кастомные сборщики мусора в Go

8 мин

4.3K

Блог компании OTUSВысокая производительность*Программирование*Серверная оптимизация*Go*

В Golang (да в принципе во всех ЯП) управление памятью и эффективное использование ресурсов — основа создания высокопроизводительных приложений. Одним из важных инструментов, который помогает справляться с этой задачей, является сборщик мусора (на англ garbage collection). Встроенный сборщик мусора Go выполняет свою работу довольно хорошо, но иногда требуется более тонкая настройка, чтобы соответствовать специальным требованиям потребностям конкретного приложения.

Здесь нам и помогут кастомные сборщики мусора.

+10

2 3 ...

41 42

Переход из Oracle в Postgres Pro: не просто смена СУБД, а сдвиг подхода. Интервью с Марком Ривкиным

Стильный современный «autoindex» в Angie/nginx без sms и сторонних модулей

Bloom-фильтры в Postgres: скрытый инструмент для оптимизации запросов

Автоматизированное управление расширенной статистикой в PostgreSQL

Влияние источника времени на результат explain в PostgreSQL

Что в черном ящике, или Как разработчику понять, что требует оптимизации в БД PostgreSQL

PostgreSQL. Устройство карты свободного пространства

Устраняем эффект шумного соседа в PostgreSQL с помощью cgroups

Замедление работы pg_repack с помощью cgroup

Postgres Pro OpenTelemetry Collector

Ревизор приехал: pg_anon проверяет, всё ли скрыто

Сравнение Bash и Python при написании скриптов в Linux

Сюрпризы планировщика запросов в БД PostgreSQL

Быстрее пули: как найти счастье с PostgreSQL

AntiBlock 2.0

SQL миграции в Postgres. Часть 2

Собираем логи с Loki

Тестирование лучших self-hosted аналогов Notion

PostgreSQL 16. Страницы и версии строк. Часть 3

Как и зачем создавать кастомные сборщики мусора в Go

Информация

Специализация