Комментарии 7
Grafana вообще молодцы! Они и логи и метрики и трейсы закрывают своими open source решениями. Еще бы логи можно было бы у них долго хранить, хотя-бы несколько месяцев ...
Взамен Prometheus лучше сразу использовать vmagent для сбора и VM для хранения, получите запас на рост количества метрик в разы на тех же ресурсах.
Мы написали свой сборщик логов, отправляющий их в MongoDB, откуда они транслируются клиентам.
У MongoDB такая же лицензия как у Elasticsearch, которая вроде как раз запрещает её использование в облаке для продажи услуг.
Sentry - инструмент не совсем для алертинга и оперативного реагирования, кстати. Скорее для долгосрочного отслеживания ошибок, их дедупликации и мапинга на задачи и релизы. Правильное использование, нужно что бы в ивенте в sentry не было уникальных идентитификаторов, тогда алерты будут только по уникальным ошибкам.
Мы MongoDB и т.д. используем у себя внутри, а не "перепродаем", поэтому тут нет проблемы с лицензией. Для внутренних целей использовать можно)
А Zabbix?
Не скажу что он мне очень нравится, но используется часто
Как мы строили систему мониторинга. Тернистый путь к стабильной работе сложных IT-систем