Комментарии 4
Все это круто. Классно. Но, насколько я понимаю, смотря вот сюда, ваша система еще использует consul, arangodb, redis, postgres, rabbitmq. Не удивлюсь, если подумываете использовать кафку. Понимаю, что критиковать не строить, но выглядит конструкция, конечно, монструозно. У меня в аналогии сразу всплывает sentry, где количество субд и очередей довольно много, и поддерживать это сложно. А еще сложнее разобраться как оно все работает под капотом. Не думали отказаться от каких-то частей в пользу чего-то одного? Например как делает signoz и qryn?
Наверное, такую систему, как и в случае с сентри, проще брать облачную.
Отказаться скорее всего не получится, система действительно использует большой набор системных компонент. Еще и преимущественно кластерные версии. Компоненты специфические и лучшие для их конкретного применения у нас в продукте. Логи летят в клик, метрики в викторию, и сделано это было чтобы соответствовать требованиям клиентов по выдерживанию высоких нагрузок. Тысячи событий в секунду по требованиям безопасников или во время агрегации syslog, десятки миллионов метрик c инфраструктуры с миллионом устройств, как это бывает в крупных телекомах. И все это на одном инстансе.
Для продуктивной установки есть специальный установщик, выдаваемый поддержкой, также есть простая установка через виртуальную машину, которую можно скачать с сайта. Поддерживать самим все это тоже можно, также регулярно проходят обучающие курсы по администрированию и траблшутингу продукта.
Много раз внутри обсуждали необходимость запуска облака. А нужно ли оно?
все, Все, ВСЕ метрики мониторинга ИТ-инфраструктуры под один зонтик