kai_zer_ru Jun 6 2016 at 18:15

Установка связки Carbon + Graphite + Grafana + Nginx + MySQL для сбора и отображения метрик в Ubuntu

5 min

52K

MySQL*

Tutorial

+10

Comments 35

beho1der Jun 6 2016 at 18:35

А есть возможность как-то выводить графики из Grafana, не только в дашборды, но и например на свой ресурс?

kai_zer_ru Jun 6 2016 at 18:37

Да, у Grafana есть свои API для этого, в том числе шаринг. Примерно год назад пользовался, сейчас на вскидку не вспомню. Как будет время — допишу статью на эту тему. Спасибо.

beho1der Jun 6 2016 at 18:38

А может есть какие ссылки внешние, чтобы почитать?

kai_zer_ru Jun 6 2016 at 18:40

В статье указаны ссылки на официальную документацию. В самом низу.

Официальная документация Grafana

divanikus Jun 6 2016 at 19:43

Сам пользуюсь Graphite / Carbon для метрик и он мне дико не нравится, начиная от большой привередливости к скорости дисковой подсистемы и заканчивая колхозом в самой инфраструктуре.

kai_zer_ru Jun 6 2016 at 19:47

Как говорится, на вкус и цвет. Меня вполне устраивает. Моим запросам, и запросам начальства он соответствует. Да и выглядит, на мой взгляд, очень даже.
Сам Graphite, конечно, выглядит не очень, но Grafana всё это дело очень хорошо спасает.

thunderspb Jun 6 2016 at 20:05

для Carbon, говорят, лучше использовать carbon-c-relay, по крайней мере на rootConf графики показывали красивые, что С-версия намнооого быстрее carbon_cache.py

kai_zer_ru Jun 6 2016 at 20:34

Спасибо, как-нибудь найду время, опробую и отпишусь.

Civil Jun 6 2016 at 21:25

carbon-c-relay это замена carbon-cache в роли relay и aggregator. Он действительно очень быстрый. Агрегатор может переварить порядка пары миллионов метрик в минуту на железе уровня 2xe5-2620v3, а в виде relay — несколько миллионов в секунду (сеть куда более узкое место). Но там дальше узким местом станут другие компоненты.

Требования к дисковой подсистеме идут из формата хранения данных. Whisper довольно странный и имеет очень большой write amplification. Решения на базе всевозможных influxdb, kairosdb и т.п. тоже имеют свои проблемы (например influxdb намного меньше использует диск, но даже 0.13 требует больше CPU и хуже масштабируется чем carbon-cache). Встроенная кластеризация у graphite тоже довольно странная, но тут есть carbonzipper и carbonserver, которые несколько спасают положение.

С фронтэндом тоже все не очень здорово. Читать код graphite-web не очень приятно. Есть graphite-route-api который чище и не имеет собственного интерфейса, но он в какой то момент узким местом станет питон (если много сложной математики будет). Можно конечно взять pypy, станет раз в 5 быстрее, но все равно на сотне запросов в секунду и ему станет плохо. Есть реализации на Go, например carbonapi, но они зачастую не полностью повторяют функционал graphite-web's/graphite-api и, как минимум carbonapi, требует использования carbonzipper.

Но в целом адекватных альтернатив пока что не видно, протокол графита очень много кто умеет и при желании можно получить очень неплохую производительность на чтение и запись.

divanikus Jun 7 2016 at 00:48

Претензия к диску у меня простая. Ganglia c rrdcached тянула кластер в сотню виртуалок находясь сама в виртуалке. Graphite в виртуалке вообще не живет, на вращающихся дисках быстро наступает затык с высоким LA на сервере, а ram disk из-за формата whisper постоянно не хватает, у меня вот уже за 28 гигов перевалил.

Civil Jun 7 2016 at 00:57

Да, whisper на не-SSD нагрузку держит плохо и попытки заставить его нормально работу выливаются в ram-диск или долгий и упорный тюнинг кэшей.

К слову, если есть только вращающиеся диски и не очень жалко в случаи проблем потерять данные, может быть тут как раз стоит глянуть на influxdb. Ну или если смириться с его недостатками, то на kairosdb с бэкэндом в виде cassandra. Они с диском намного лучше обращаются, но особенно первый стоит очень аккуратно тыкать, раньше были проблемы со стабильностью работы.

divanikus Jun 7 2016 at 00:58

Смотрю в этом направлении, но пока руки не дошли.

bers666 Jun 6 2016 at 20:08

И что? а где эти самые графики для cpu,mem,load,df,disk,network (плюс интеграл скорости по времени в виде потребленного трафика) и так далее? Неужели самому рисовать эти метрики?

Так что Graphite крут как идея, но я не смог найти готовых пресетов для всех системных метрик. В отличие от решений на основе rrd, вроде Cacti или Collectd+CGP — там нужно было просто нужные плагины подключить в демон и они сразу в браузере появляются как графики.

kai_zer_ru Jun 6 2016 at 20:12

Есть метрики по умолчанию, они записаны в разделе carbon.
Вот пример:

Civil Jun 6 2016 at 21:08

collectd умеет отправлять данные в graphite.

Еще можно посмотреть на diamond из популярного.

kai_zer_ru Jun 7 2016 at 09:14

Про collectd напишу чуть позже. Настроить получилось, и довольно легко. Там уйма плагинов. И это очень хорошо.

kai_zer_ru Jun 7 2016 at 20:30

Вот и статья про collectd + Graphite.

leoleovich Jun 6 2016 at 22:47

На кой чёрт, извините, вам phpmyadmin там?

1it Jun 6 2016 at 23:02

# Log files
sudo touch /var/log/nginx/grafana.access.log
sudo chmod 666 /var/log/nginx/grafana.access.log
sudo touch /var/log/nginx/grafana.error.log
sudo chmod 666 /var/log/nginx/grafana.error.log

Я прошу прощения, но зачем это? Nginx сам создает логи (если может писать в директорию), а chmod 666 (спасибо что не 777) зачем? Это просто 5 бесполезных строк.
И зачем делать touch /etc/nginx/conf.d/grafana.conf, если можно просто сказать vim /etc/nginx/conf.d/grafana.conf и вставить содержание конфига.

Вместо стороннего модуля nginx echo, можно использовать встроенный модуль rewrite с директивой return:

  location = /robots.txt {
     default_type text/html;
     return 200 "User-agent: *\nDisallow: /\n";
  }

Хотя, как по мне, проще файлик подложить в нужное место, чем потом вспонимать откуда этот robots.txt взялся и где его править.

kai_zer_ru Jun 7 2016 at 09:35

Спасибо за замечания. Действительно, эти строки оказались лишними. Исправил.

leahch Jun 7 2016 at 07:55

А мы пользуем связку из collectd + influxdb + grafana.

valentinmk Jun 7 2016 at 16:54

Настройки графаны для постгрес — нужно порт исправить (по-умолчанию)
type = mysql
host = 127.0.0.1:~~5432~~3306

kai_zer_ru Jun 7 2016 at 16:54

Да, спасибо. Исправил. В оригинале была настройка на PostgerSQL.