DmitryKoterov Aug 17 2011 at 11:40

Logreplica: сбор логов со всего кластера в единую точку в реальном времени

4 min

7.8K

System administration*

+22

Comments 47

x_T Aug 17 2011 at 11:46

Еще бы веб-морду, аля Splunk, к этому всему — и вообще идеально

DmitryKoterov Aug 17 2011 at 11:48

Ну утилита не совсем про это, она более низкоуровневая.

Вообще, задача выуживания статистики из логов огромных размеров довольно сложная. Навскидку я знаю только один стартап — loggly — который хотя бы пытается это делать, но там дороговато.

huksley Aug 17 2011 at 12:12

Интересная утилита!

Правда вот эта секция в конфиге не понятна

# What hosts to connect to gather logs from.

[hosts]

first=machine1.example.com

second=nobody@machine2.example.com

Это получается туда надо прописать все машины? А если их сотни?
А если добавлять новые то перезапускать наверное надо?

DmitryKoterov Aug 17 2011 at 12:26

Ну с сотней машиной я, честно говоря, не пробовал. Несколько десятков — точно потянет (там на каждую машину форкается отдельный процесс на лог-сервере). Может быть, и сотню тоже потянет, но в таких масштабах лучше, наверное, пользоваться какими-то другими, более тяжеловесными инструментами — типа как в фейсбуке делают. Перезапускать после изменения конфига надо, да — но это довольно дешевый процесс, а главное, данные, которые накопятся за время перезапуска, не потеряются, так что тут все ОК.

fenidik Aug 17 2011 at 12:48

Где ты раньше то был :(

DmitryKoterov Aug 17 2011 at 13:38

Утилита на dklab выложена несколько месяцев как (правда, на английском). Там есть и другие какие-то вещи, кстати. Я просто потихоньку разные инструменты, которые только на английском сейчас опубликованы, облагораживаю и анонсирую на Хабре.

fenidik Aug 17 2011 at 13:41

А почему именно over ssh. Небыло мысли клиент сервер написать?

NickyX3 Aug 17 2011 at 13:56

ставить клиента на сотню серверов — то еще развлечение

fenidik Aug 17 2011 at 14:05

Пользователя создать и ключи положить — тоже трудозатраты :) зато не будет потенциальной опасности, что если кто-то получит доступ к ключу приватному лог-сервера, тот получит ssh доступ на все сервера которые вы добавили. Конечно можно и chroot делать пользователю забирающему логи, но это уже опять же те же трудозатраты как и на раскидать пакет по серверам и набрать gpkg -i имяпакета (ну или rpm)

Опять же зачем по шифрованому каналу пускать, а если большой поток логов, дешевле в плане ресурсов будет напрямую. Ещё можно и gzипить логи на лету туда обратно чтобы траффик сетевой уменьшить, но это для гурманов и вообще спорная мысль.

DmitryKoterov Aug 17 2011 at 14:34

Ключи, кстати, раскладывать несложно — это ведь просто один файлик. Можно его в шаблон виртуальной машины дефолтный положить (это публичный ключ, так что не стоит бояться, что он утечет).

stalker_by Aug 17 2011 at 14:42

Из описания в статье получается что нужно делать ключи для root.
Как-то не камильфо получается…

DmitryKoterov Aug 17 2011 at 14:45

Обычно из /var/log/* может только рут читать, не?

В любом случае — можно указать в директиве user любого другого юзера (и положить именно для него публичный ключ). Тогда на удаленные машины будет коннектиться именно под этим пользователем.

stalker_by Aug 17 2011 at 14:55

Я про то что с Syslog`ом безопаснее :)
Нет никакой возможности получить доступ к серверу.

Вообще я говорю с точки зрения маньяка по безопасности, а так да, ключи вполне надежны :)
Основная проблема с SSH это трафик и затраты на шифрование/сжатие при больших объемах.

eigrad Aug 17 2011 at 19:43

Уже лучше. Но всё равно, зачем давать shell на сервера только для того чтобы логи складывать. Неужели так сложно простой клиент-сервер реализовать?.. Ах, да, он есть уже — syslog. Куда же без велосипедов…

DmitryKoterov Aug 17 2011 at 14:44

Кстати, насчет gzip — в ssh же есть режим сжатия потока, нужно его использовать (там какой-то ключ командной строки). Для logreplica это будет прозрачно.

UFO landed and left these words here

eigrad Aug 17 2011 at 19:41

Ни от чего это не защитит. Тот кто имеет доступ к серверу с логами очевидно сможет с него и на сервер зайти, защита по IP не актуальна (только помешает если нужно будет ip-шник сервера сменить). Ну зайдя на сервер с no-pty, злоумышленник первым делом избавиться от этой назойливой строчки в файле, просто перезаписав его, это ему будет позволено.

sn00p Aug 22 2011 at 03:42

Для сотни серверов можно использовать системы деплоя конфигурации, например chef.

divanikus Aug 17 2011 at 13:45

Отлично! У меня тут сотни узлов, а логи собирать руками влом. Поглядим.

stanly Aug 17 2011 at 13:57

чтобы не ставить и не запускать netstat: каким образом всё же происходит отправка инфы на сервер с машины-клиента?

DmitryKoterov Aug 17 2011 at 14:36

На удаленной машине-источнике логов запускается небольшой perl-процесс (его код прямо в командной строке через -e передается), и уже этот perl-процесс мониторит изменения в лог-файлах по маске и посылает в свой stdout пачки изменений. А сервер эти изменения принимает и раскладывает по файлам у себя. Протокол чем-то похож на tail -f файл1 файл2 ..., но только он чуть более приспособлен к дальнейшему парсингу и устойчив к разрывам связи.

ctapnep Aug 17 2011 at 17:18

a если на машине нет перла?

DmitryKoterov Aug 17 2011 at 18:18

Тогда на дворе 80-е.

BasilioCat Aug 17 2011 at 20:29

Как раз в 2000х годах из дистрибутива FreeBSD был вычищен перл, и все системные утилиты, его использовавшие, были переписаны на шелл или Си. Кому нужен — поставят из пэкэджей или портов; Я бы с радостью еще и питон из минимальной конфигурации CentOS оторвал, но видимо этого никогда не случится.

duzvik Aug 17 2011 at 14:18

а Scribe?

DmitryKoterov Aug 17 2011 at 14:38

Вот это как раз то самое тяжеловесное решение от facebook для тысячи серверов, похоже. Оно?

stalker_by Aug 17 2011 at 14:56

Scribe не тяжеловесный (не более метра в скомпилированом виде), он скорее решает другие вопросы :)

duzvik Aug 17 2011 at 15:02

да, оно.

eigrad Aug 17 2011 at 19:49

он же syslog не осилил, куда ему scribe?

stalker_by Aug 17 2011 at 14:35

Мануал по Syslog-NG вам в помощь. Он умеет и не Syslog данные передовать и производить фильтрацию, и собирать логи с других серверов, и делать UDP-spoofing если вдруг решите собирать логи на центральный коллектор и пересылать на нормальны интерфейс для обработки логов, например тот-же Splunk.

Для высоко-нагруженных проектов где логи генерятся в огромных количествах их передача по SSH станет вам боком из-за использования CPU с обеих сторон, собственно по этой причине протокол Syslog не заморачивается на сохранность данных при передаче по сети и тупо шлет их по UDP.

Если сохранность данных критична, юзайте Splunk + NFS.

stalker_by Aug 17 2011 at 14:39

* нормальный

DmitryKoterov Aug 17 2011 at 14:40

Про syslog-ng в конце статьи есть детальный разбор, почему он не всегда оказывается удобен.

stalker_by Aug 17 2011 at 14:52

Проблему синхронизации конфигов Syslog[-NG] (и не только) на кластере можно решить при помощи какой-нибудь CMS (Configuration Managment System), например Puppet (http://stproject.info/blog/?tag=puppet).

Проблему описанную в 3 пункте я решал сбором всех конфигов Apache/Nginx в один файл с добавлением в конец строки имени VHOST`а к которому относится строчка, что кстати упрощает фильтрацию и обработку при помощи все того-же Splunk или самописных скриптов.

DmitryKoterov Aug 17 2011 at 15:08

Ну я не спорю, что syslog-ng тоже «можно готовить» — сам им пользовался в нескольких проектах на протяжении нескольких лет. Однако все же намучился, и logreplica после этого — как глоток свежего воздуха, правда (она так и возникла, из-за мучений).

CLaiN Aug 17 2011 at 16:28

А для винды такого нету?

DmitryKoterov Aug 17 2011 at 18:19

Нету. Logreplica использует возможности *nix. Да и тормозить Perl на винде будет дай-то боже в такой задаче…

dendery Aug 17 2011 at 17:14

есть в этой схеме печальные моменты.
1. все машины, с которых собираются логи, вынуждены пускать рута по ssh.
2. ключ хранится в незащищенном виде на машине с logreplica.

с точки зрения безопасности это очевидные минусы. с точки зрения какой-нибудь более менее серьезной
сертификации по защищенности — такая схема будет неприемлима.

DmitryKoterov Aug 17 2011 at 18:26

ИМХО вред от пускания рута по SSH несколько преувеличивают (особенно для случая, когда логин происходит не по паролю, а по ключу, который к тому же никогда за пределы одной машины не выходит). Помогает ведь ограничение по ip-адресу и фаервол. Но это весьма холиварный вопрос.

eigrad Aug 17 2011 at 19:27

Вопрос совсем не холиварный, это просто вопрос компетенции специалиста. Класть толстый таёжный прибор на безопасность сервера(ов) помещая все яйца в одну корзину с ключиком который ещё и паролем не защищен, может только полный идиот. Любой, кому будет предоставлен доступ на сервер где хранятся логи, в твоей системе получает root-доступ на все сервера.

Конечно в реальности всё равно приходится делать общий root-ключ для управления серверами при их большом количестве, но система, в которой этот ключ хранится защищается просто параноидально. К серверу хранения логов конечно тоже должны предъявляться серьезные требования по безопасности, но круг лиц, имеющих доступ к этому серверу гораздо шире чем можно позволить для машины с ключом от всех серверов.

BasilioCat Aug 17 2011 at 20:35

Для ключей SSH, помимо ограничения по адресам, есть еще и forced command, которая может принимать и валидировать параметры, переданные через STDIN. Это конечно усложнит развертывание (хотя тем, у кого сотни машин не усложнит — они либо автоматизировали такие вещи, либо их уже уволили), однако это более серьёзная мера. Не говоря о том, что получать привилегии рута можно только на определенные действия, через тот же sudo

eigrad Aug 17 2011 at 20:54

Команда разрешенная для выполнения при аутентификации определенным ssh-ключем это конечно вариант, плюс ещё неплохо если она не от root'а будет выполняться. Но использование ssh для сбора логов всё равно overkill.

eigrad Aug 17 2011 at 19:04

более удобный и надежный способ сбора логов в центральное место, нежели способ использования настроек syslog/syslog-ng

facepalm.png

Напоминает как мой однокурсник написал на диплом свою программку и заявил что она круче openssh.

eigrad Aug 17 2011 at 19:06

Часто хочется реплицировать лог-файлы на центральную машину по маске, а не жестко указав имя лог-файла. Syslog и syslog-ng этого делать не умеют.

RTFM

eigrad Aug 17 2011 at 19:31

Наконец, на практике оказывается очень удобно хранить логи не только на центральной машине, но и на той машине, где они создаются (на машине-источнике может при этом настраиваться более узкое «окно ротации»). Так что ваши конфиги syslog и syslog-ng снова растут...

Ну растут. Ровно на три строчки, в которых написано «сохраняй логи в файлы прежде чем отправлять их по сети».

sn00p Aug 22 2011 at 03:49

Не всем подходит такой способ. Есть системы, где логи на диск писать нельзя, но читать надо. В I/O каждый tps на счету.
Надежность. За год работы нашего лог сервера syslog-ng ничего не потерялось. Весь служебный ядерный трафик ходит по своему влану и по отдельному интерфейсу. Так что этот мотив очень спорный.
Целесообразность. Если мы начнем писать логи прямо на сервис, а потом его забирать, да еще по ssh, у нас точно все работать для пользователей перестанет и начнет работать только затем, чтобы передать логи.
Способ хорош, но он один из многих. И минусов, кажется, больше, чем плюсов.

sn00p Aug 22 2011 at 03:50

Простите, не «его», а «их».

BreathLess Sep 7 2011 at 12:07

Вот что отдельно бесит, так это пихание пяти букв дклаб повсюду.
Выглядит уебански.

Почему не просто /etc/logreplica?
Самолюбие тешите?