Обновить
4K+
2
Alexandr Bandurchin@lexband

Пользователь

2
Рейтинг
Отправить сообщение

Distributed tracing: от 100% error rate до первопричины за 60 секунд

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели5.4K

В микросервисной архитектуре один падающий эндпоинт может скрывать проблему в совершенно другом сервисе. В этой статье я покажу пошаговый процесс расследования реального инцидента: от обнаружения 100% error rate до точной причины сбоя — и всё это менее чем за минуту.

Мы будем использовать Uptrace - OpenTelemetry-native платформу для трейсинга и мониторинга. Все примеры основаны на реальном demo-приложении с микросервисами.

Читать далее

Uptrace v2.0: как новый JSON-тип ClickHouse ускорил запросы по трейсам в 10 раз

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели4.8K

Uptrace v2.0 использует новый JSON-тип ClickHouse для хранения observability-данных. Результат: запросы по трейсам ускорились в 10 раз.

Делюсь практическим опытом внедрения: установка за 5 минут через Docker, настройка data transformations для обработки данных на лету, гибкие retention policies для экономии на хранении.

В статье:

Пошаговая инструкция от установки до production

Примеры кода на Node.js с OpenTelemetry

Кейсы настройки: снижение cardinality URL, парсинг данных, удаление PII

Чеклист для продакшена

Подходит для микросервисных архитектур на 5+ сервисов, где нужна скорость поиска по атрибутам трейсов.

Читать про 10x ускорение

Информация

В рейтинге
1 666-й
Откуда
Кишинев, Молдова, Молдова
Дата рождения
Зарегистрирован
Активность

Специализация

Маркетинговый аналитик, SEO-специалист
Ведущий
Управление проектами
Стратегическое планирование
Оптимизация бизнес-процессов
Автоматизация процессов
Продвижение проектов
Стратегическое управление