Comments / Profile of Stillgray / Habr

@Stillgray

User

ProfileArticlesPostsNewsComments92

Промышленный увлажнитель дома

Stillgray Oct 4 at 07:06

Вот статья про увлажнение под давлением. Выглядит компактнее и возможно, дешевле.
И слизи нет.

https://habr.com/ru/articles/706460/

Look

Как мониторить сотни инстансов PostgreSQL и не сойти с ума

Stillgray Sep 3 at 02:07

Спасибо, Вадим!

Доклад интересный. Ратвин Константин постарался быть объективным, по мере сил в существующей ситуации.
Думаю, что на этот доклад можно положиться при выборе управлялки.

Look

Как мониторить сотни инстансов PostgreSQL и не сойти с ума

Stillgray Sep 2 at 07:57

Могу, конечно ошибиться, но PPEM имеет большее количество установок в России, нежели Платформа, просто за счёт большего распространения PostgresPro.

Вот как раз тут то и интересно сравнить два российских конкурирующих продукта со сходным функционалом и областью применения.

Look

Как мониторить сотни инстансов PostgreSQL и не сойти с ума

Stillgray Sep 2 at 06:05

Странно, что в статье не упоминается PosgresPro Enterprize Manager, как одно из решений доступных на российском рынке. Которое к тому же бесплатно, для владельцев лицензии БД PostgresPro.

Look

Падение Data Mart и 100 миллиардов записей в ОЗУ. История о том, как починить в одиночку вендорский баг

Stillgray Aug 23 at 05:56

Детский лепет какой-то...
Пять дней искать ежечасную задачу в основной бд, хотя аналитическая система имеет отдельную бд.
Логи только на второй день начал смотреть...

Look

Анализируем сетевой трафик средних и крупных сетей с помощью Netflow/IPFIX/sFlow и боремся с DoS/DDoS с помощью BGP

Stillgray May 15 at 01:05

Да, верно. Но и задачи бывают разными.

В случае задачи сбора flow в БД, postgresql работает хорошо только на небольших масштабах. postgresql больше заточен под OLTP и слабо подходит для аналитики, особенно, если данные в таблицу пишутся довольно интенсивно.
Можно применять разные трюки, например, семплирование данных, партиционирование таблиц. Можно использовать расширение TimescaleDB, в том числе с шардированием на удалённые серверы БД. Но всё равно самая простая стратегия увеличения производительности - это вертикальное масштабирование.

В отличии от postgresql, clickhouse - это самое оно для аналитики: хранение данных в колоночном формате позволяет очень сильно сжимать данные. Крайне радикально. Миллионы монотонно увеличивающихся значений может уместиться в несколько килобайт. А когда оптимизация не помогает, парты сжимаются архиватором, что ускоряет чтение с диска.
Агрегация по полю не требует вычитывания всей записи, а только нужного поля.
Отдельно можно сказать про функционал вьюшек - материализованных представлений, которые обновляются в момент поступления данных в таблицу. Например, таким образом можно сделать семплирование в несколько диапазонов (5 минут, час) и дешево хранить их годами.
Предагрегацию и т.п.
Также легко реализуется TTL жизни записи (а дальше либо удаление, либо вынос на холод).
При этом всё происходит самим движком БД, без участия приложения.
Ещё можно упомянуть про кластеризацию CH - за счёт хранения данных в партах весьма элегантно реализуется мультимастер.

Если мне не изменяет память, то у меня с одного устройства за месяц набегало порядка пары миллиардов flow, которые занимали от силы пару гигабайт.

Ну да, на raspberripi связку не запустишь, и для небольшой сети штука явно избыточная: из-за ограничений CH, для неё требуется буферизация данных - например kafka. А это тоже требует ресурсов.
Но зато, в случае сотен подсетей позволяет гибко масштабироваться - добавлять коллекторы, очереди в брокере, экземпляры СУБД...

Look

Анализируем сетевой трафик средних и крупных сетей с помощью Netflow/IPFIX/sFlow и боремся с DoS/DDoS с помощью BGP

Stillgray May 14 at 23:51

Спасибо за интересную находку.
Собственно, в моём случае, я искал область применения для изучения ClickHouse. Сбор flow стал хорошей возможностью пощупать эту СУБД в деле.

Look

Анализируем сетевой трафик средних и крупных сетей с помощью Netflow/IPFIX/sFlow и боремся с DoS/DDoS с помощью BGP

Stillgray May 14 at 00:47

Костылил сборщик и анализатор на связке goflow+kafka+clickhouse+grafana ради любопытства.
Трафик конторы на 300 пользователей переваривает не напрягаясь.
Плюсы такого решения в том, что данные не нужно агрегировать, все флоу сохраняются в БД, также легко горизонтально масштабируется.

Look

Как мы делали поддержку PostgreSQL

Stillgray Feb 7 at 01:25

Хорошие новости, спасибо.

Но есть один момент:

Перед base backup мы создаем репликационный слот и при каждом инкрементном бэкапе считываем все накопившиеся в слоте WAL‑файлы.

Это не инкрементальный бэкап, это бэкап журналов транзакций, по аналогии с BACKUP LOG MS SQL Server.

Сам инкрементный бэкап выполняется очень быстро и минимально нагружает систему — его можно делать хоть каждые 10–15 мин.

В этом-то и кроется проблема. На средненагруженном сервере поток WAL генерируется со скоростью 3-5 Гб/мин. То есть за 10-15 минут можно получить от 30 до 75 Гб при нормальной работе СУБД.
В случае пропуска нескольких инкрементальных бэкапов возникает угроза остановки сервера СУБД из-за переполнения тома, на котором расположен pg_wal.

Решая эту проблему, настроив параметр max_slot_wal_keep_size, попадаем в другую: КБ при потери слота вместо инкрементального бэкапа инициирует полный бэкап в момент пиковой нагрузки на сервер.
Каждые 10-15 минут. )

На ненагруженных, но толстых БД также достаточно просто попасть в такую же ситуацию: Массовая операция (copy/pg_restore/vacuum_lo/update) вызовет генерацию WAL файлов, переполнение тома или инвалидацию слота с выполнением полного бэкапа.

Поэтому, для прода такая история мало подходит.
Ну либо обходиться без PITR.

Look

Я перешёл на Firefox и обратно возвращаться не намерен

Stillgray Jan 31 at 23:46

Не знаю. Я - не они, и могу только строить предположения.
Например то, что востребованность это функции ниже плинтуса.

Look

Я перешёл на Firefox и обратно возвращаться не намерен

Stillgray Jan 31 at 23:44

Никак

Look

Я перешёл на Firefox и обратно возвращаться не намерен

Stillgray Jan 31 at 14:05

Ключик -proxy при запуске чем не угодил?
Работает во всех деривиативах хрома.

Look

История жанра или Почему мы любим игры про зомби?

Stillgray Dec 22 2024 at 01:19

В свое время понравился Rammbock.
Малобюджетный, да. Но довольно оригинальный.

Look

pg_partman: автоматизация партиционирования PostgreSQL

Stillgray Dec 19 2024 at 05:23

https://github.com/postgrespro/pg_pathman
удобнее и функциональнее pg_partman, но устанавливается без танцев с бубном только на семейство СУБД PGPro.

Look

Оптимизация хранения данных в PostgreSQL

Stillgray Dec 3 2024 at 01:01

И запрос select * from t1 начинает возвращать столбцы в другом порядке - так, как select c, a, b from t1. Обратная совместимость потеряна, приложение сломано.

Ни одна нормальная РСУБД не гарантирует порядок полей и порядок строк при возвращении. Если программист надеется на это - то он сам себе злобный буратино, не знающий ничего про реляционную алгебру.

Look

Радикальное изобилие энергии

Stillgray Nov 3 2024 at 01:19

Уже было.
Питер Уоттс «Ложная слепота»

Look

Инспектор транзакций: управление конфликтами в СУБД

Stillgray Oct 11 2024 at 04:36

Что бы удалить миллиард строк, надо записать миллиард строк в индекс, а потом удалить этот же миллиард строк из индекса.
А кроме того, ещё и индексы к таблице есть. И, по-хорошему, там тоже надо отдельную сущность инспектора на каждый индекс.

И, если я не ошибаюсь, в СУБД, которые работают на основе блокировок, всё это так и выглядит - есть структура в памяти, в которой учитываются блокировки строк, страниц, экстентов, таблиц, индексов, объектов и базы данных.

Look

Возврат заметок домой на Obsidian и git

Stillgray May 15 2024 at 23:46

Технически, если в вашем хранилище нет ничего чувствительного, можно ограничиться github/gitlab etc.
Всё становится ещё проще.

-1

Look

Байт-кодовые VM в неожиданных местах

Stillgray May 9 2024 at 13:24

Вроде Another World тоже

Look

Восхитительная теория [якорных] баз данных от Ларса Рённбека

Stillgray Apr 19 2024 at 04:51

И что если стоит, но поступила такая информация - затирать ли предыдущую? Не записывать?
Что ж вы меня спрашиваете?
Спросите лучше архитектора вашей модели данных.

Собственно, якорное моделирование данных - это 6NF, судя по статье в википедии. Поэтому нет никакого противоречия между РСУБД и якорными БД. Данные якорной модели хранятся в нескольких таблицах в РСУБД по факту.

Look

2 3 4 5