Comments / Profile of n_bogdanov / Habr

Николай Богданов @n_bogdanov

DevOps-инженер

ProfileArticles12PostsNews1Comments137

Loghouse 0.3 — долгожданное обновление нашей системы работы с логами в Kubernetes

n_bogdanov Mar 23 2020 at 11:06

Так может стоит попробовать tabix?

Look

Loghouse 0.3 — долгожданное обновление нашей системы работы с логами в Kubernetes

n_bogdanov Mar 23 2020 at 11:05

За всех (потенциальных пользователей loghouse) не скажу, т.к. продукт изначально появился как ответ на нашу внутреннюю потребность и отсутствие подходящих решений. Если кого-то устраивает завязка на конкретного провайдера — это нормальная ситуация, пусть отчасти и убивающая красоту K8s (cloud agnostic); специфика и выбор есть у каждого.
В нашей компании мы стараемся создать для себя базовую универсальную инфраструктуру и использовать у всех клиентов унифицированные решения. Это облегчает поддержку. Соответственно, мы хотели иметь относительно легковесную систему сбора логов для себя, которая бы покрывала наши потребности и требовала минимальных навыков от наших инженеров. Поэтому и появился loghouse.
Теперь к вопросу. Если коротко, то всё зависит от сложившейся ситуации в проекте. Проще пояснить на примерах:

Клиент пришел к нас с legacy-инфраструктурой, которая умещалась в 1-2 сервера, и ему требуется развитие, чтобы его приложение соответствовало запросам бизнеса — в этом случае мы попробуем поставить loghouse и использовать его.
Клиент собирает только ошибки и имеет обширный мониторинг. Такому клиенту логи особо и не нужны. Тут мы точно согласуем и поставим loghouse с минимальным размером диска, чтобы иметь возможность вести расследования проблем.
Например, у клиента есть желание использовать EFK стэк или Graylog — мы не будем мешать клиенту и будем вместе с ним использовать этот стек, loghouse в кластере не будет.
Клиент пользуется стеком от datadog, соответственно проще и логичнее подключить datadog к логам кластера при переезде в k8s, а не городить loghouse.

Look

Loghouse 0.3 — долгожданное обновление нашей системы работы с логами в Kubernetes

n_bogdanov Mar 23 2020 at 10:53

В loghouse есть свой язык запросов, кроме того можно делать быстрые шаблоны запросов и сохранять их в базу. Но вам никто не мешает делать SQL запросы напрямую. Вы можете использовать tabix.io, он есть в поставке loghouse.

Look

Managed Databases в Selectel: приглашаем в бету

n_bogdanov Feb 2 2020 at 19:30

А какие расширения будут идти в комплекте к вашему решению? Будут ли нестандартные? Где можно увидеть список?

Look

Разговоры про PostgreSQL. Интервью с Алексеем Лесовским в подкасте «Цинковый прод». Часть первая

n_bogdanov Jan 29 2020 at 08:05

Почему не сделать не всякие высокоинтеллектуальные патрони, а простой аля хапрокси, который на запись шлет двум одновременно, а читает к примеру поочереди от нагрузки?

Это прямо pgpool — у него есть такой режим

Look

Пишем драйвер для ноутбука for fun and profit, или как закоммитить в ядро даже если ты дурак

n_bogdanov Jan 20 2020 at 09:15

Спасибо. Мне как раз пригодится.

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 30 2019 at 10:26

В используемых нами системах нет централизованного коллектора, который выступал бы фильтром или аккумулятором логов. Все преобразования происходят на fluentd, за исключением EFK-стека — там вложенный json разбирает сам Elasticsearch.

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 29 2019 at 09:58

На самом деле особых проблем с тем, что именно разбирает система логгировнаия, нет. Говоря об удобстве логов в json-формате, когда одно событие явялется одним json, мы подразумеваем, что такие логи будут автоматически разобраны loghouse или EFK и, в дальнейшем, можно будет удобно составлять аналитические запросы по полям этих логов, строить диаграммы и не использовать регулярные выражения, так как все критичные данные будут определены соответствующими полями json-лога.
Тут очень много вариантов. Например, можно ошибки выводить в stderr, не ломая stdout. Можно даже больше — настроить, например, sentry, так как почти любой язык программирования умеет навешивать глобальную функцию для исключений и проблемы с тем, что в потоках ввода-вывода будет каша опять таки отпадёт.

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 27 2019 at 07:38

Справлялся, но по ресурсам прям впритык. И любое снижение производительности могло приводить к проблемам и потере части потока логов.

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 26 2019 at 14:59

Всё, конечно же, зависит от нагрузки и общей конфигурации системы логирования. Выше уже идёт обсуждение

В нашем сетапе Clickhouse использовал 2 ядра и 2Gb, после замены на Elasticsearch начала использоваться машинка с 8 ядрами и 32Гб памяти.

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 26 2019 at 14:18

Сравнивали. Clickhouse выигрывал в этом плане. Он очень быстрый и легко расширяется горизонтально. Но с другой стороны, вокруг Elasticsearch выросла очень классная инфраструктура с кучей плагинов.

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 26 2019 at 05:52

Случайно вставил битую ссылку. Правильная ссылка на статью ЦИАН

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 26 2019 at 04:53

Да, именно про это и статья — в дивном новом мире всё простое стало одновременно и простым и сложным. Это еще хорошо отражено у коллег из ЦИАН в статье про логи

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 25 2019 at 20:21

В статье есть про это, правда вскользь — мы упоминаем, что наша схема работы с CH несколько устарела. Так же надо понимать, что Engine Buffer это не надёжное хранилище.

Look

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

n_bogdanov Dec 25 2019 at 15:30

У меня 2 примера:

Логи платёжного шлюза
Логи запросов к государственным API SMEV

И то и другое клиенты вынуждены хранить до 5 лет по своим внутренним ТЗ.

Look

Не New Relic’ом одним: взгляд на Datadog и Atatus

n_bogdanov Sep 11 2019 at 21:12

Конечно упомянутый выше elastic apm, pinba и Pinpoint. Про Pinpoint уже, кстати писали на habr'e.

Коротенько напишу обо всех:

Pinba — старое решение, но закрывает только php, да и то не очень то хорошо. Хочется универсальный инструмент для go, php, nodejs, python.
Pinpoint — пробовал ставить на домашнем стенде. В итоге APM потреблял больше ресурсов, чем инструментируемое приложение.
Про elastic apm ответ выше.

Look

Не New Relic’ом одним: взгляд на Datadog и Atatus

n_bogdanov Sep 11 2019 at 21:10

Не пробовали, но очень хотелось бы. Сейчас мы смотрим в сторону Jaeger + prometheus exporter к нему. Это частично закроет наши потребности к APM без установки дополнительного софта в наших кластерах. Вдохновение брали вот отсюда.

К сожалению стек ES+Kibana бывает очень требователен к ресурсам, которые у клиентов есть не всегда. Иногда дешевле платить за облако, нежели иметь self-hosted решение.

Look

1 2 ...

5 6