Как стать автором
Обновить
4
0
Илья Вазем @Funki

Пользователь

Отправить сообщение

Риск-менеджмент: Инцидент, post-mortem, плановые работы и Support card

Время на прочтение13 мин
Количество просмотров4.2K

Меня зовут Илья Вазем, я отвечаю за всю инфраструктуру в СберМегаМаркете. Сегодня мы поговорим о наболевшем для любой команды разработки — об инцидентах. Я расскажу о том, как мы пытаемся с ними справляться и сводить возможность их появления к минимуму. А по ссылке можно посмотреть видео с моего доклада на DevOps Conf. 

СберМегаМаркет, наш маркетплейс, — высоконагруженная онлайн-платформа, где более 8 000 продавцов и более 100 000 заказов в день. Мы хостимся в трех дата-центрах, у нас 250 микросервисов, 2 500 виртуальных машин. Поддерживать такую систему без серьезного подхода к инцидентам невозможно. Итак, что представляет собой этот подход в нашем случае?

Читать далее
Всего голосов 5: ↑4 и ↓1+4
Комментарии1

Как мы искали свой Vector в построении высоконагруженной системы логирования

Время на прочтение10 мин
Количество просмотров7.2K

Логов много не бывает, а если бывает?! Расскажем, как мы внедряли новую систему логирования на основе EFK (Elasticsearch-Fluetnd-Kibana), как страдали, когда FluentD перестал держать нагрузку, как мы переходили на Fluentbit (спойлер: неудачно) и почему смогли найти свой Vector. А в конце дадим пару советов о культуре логирования: как к ней относиться, чтобы не страдали вы, ваши коллеги, тестировщики и разработчики. 

Этот пост — расшифровка доклада, который мы представили на конференции HighLoad++ Foundation 2022 в Москве. Видео можно найти по ссылке, а здесь — почитать доклад и посмотреть слайды из презентации. 

Читать далее
Всего голосов 13: ↑13 и ↓0+13
Комментарии6

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

DevOps, Chief information officer (CIO)
Lead
Git
Linux
Docker
PostgreSQL
Nginx
Redis
High-loaded systems
Elasticsearch
Kubernetes
Apache Kafka