Pull to refresh
11
0
Иван Фролов @ivan_fr

Руководитель продукта

Send message

Гайд с видео: метрики в Monq от сбора данных до алертинга

Level of difficultyMedium
Reading time13 min
Views790

Как получить от мониторинга уверенность, что ИТ-инфраструктура работает как надо? В этойстатье разберемся, как устроена работа с метриками в Monq: от их сбора и автоматической привязки к контекстным элементам до создания кастомных метрик и контроля качества покрытия. Поговорим о том, как быть уверенным, что система действительно «зеленая» — а не делает вид,что у вас все в порядке. А в конце статьи вас ждет видео с конкретным примером работы с метриками от А до Я.

Читать далее

9 правил внедрения корпоративного ИТ-мониторинга: как сделать все правильно и избежать боли на старте

Level of difficultyMedium
Reading time16 min
Views5.6K

Кто бы мог подумать, что внедрение корпоративного ИТ-мониторинга может быть таким… скажем так, «интересным»? Вы начинаете с благих намерений, а заканчиваете в окружении мигающих экранов и тысячи алертов. Большинство проектов могли бы проходить гораздо быстрее, если бы не хаотичный подход. Особенно «весело» дела обстоят с legacy-системами, где документация — это древний свиток, а знания разбросаны, как пазл, потерявший половину деталей. Мы собрали 9 правил, которые помогут избежать хаоса и внедрить мониторинг без боли.

О том, «Что делать?» (без «Кто виноват?») — читайте в нашей статье.

Читать далее

Мониторинг высоконагруженных систем: поддержка SLA и масштабируемость

Level of difficultyMedium
Reading time17 min
Views2.3K

Это обзорная статья: высоконагруженные системы обеспечивают работу онлайн-сервисов, облачных платформ, финансовых операций, стриминговых сервисов и других цифровых решений. Их отказоустойчивость и производительность напрямую влияют на удовлетворенность пользователей и соответствие условиям SLA (Service Level Agreement). Мониторинг помогает следить за поведением систем, а также и предотвращать сбои.

Читать далее

Observability vs Monitoring: почему в 2025 году это две стороны одной медали

Level of difficultyEasy
Reading time8 min
Views3.5K

Сегодня обсудим разницу между мониторингом и наблюдаемостью (observability), а также их значение для современных распределенных ИТ-систем. Если ваша инфраструктура поддерживает сложные сервисы или работает в условиях постоянно растущей нагрузки, вы, вероятно, уже задумывались о необходимости видеть полную картину происходящего в реальном времени. Мы расскажем, почему в 2025 году мониторинг и наблюдаемость стали двумя сторонами одной медали, и как эти подходы помогают предотвращать сбои, анализировать проблемы и повышать надежность систем.

Читать далее

Chaos Engineering и мониторинг: как готовиться к неожиданным сбоям

Level of difficultyEasy
Reading time13 min
Views1.8K

В этом посте затронем тему про Chaos Engineering и роль мониторинга в обеспечении отказоустойчивости сложных ИТ-систем. Возможно, вы уже слышали про термин хаос-инжиниринг, и если ваша ИТ-инфраструктура обслуживает критически важные сервисы с большим числом пользователей, то самое время добавить ей надежности, внедрив этот самый Chaos Engineering вместе с системой зонтичного мониторинга. 

Читать далее

7 основных этапов реагирования на ИТ-инциденты, используя мониторинг Monq

Level of difficultyMedium
Reading time17 min
Views1.8K

Эффективное реагирование на инциденты — это ключевая задача команды ITOps (IT Operations), которая помогает поддерживать стабильность и безопасность ИТ-инфраструктуры предприятия. Весь процесс состоит из нескольких этапов, каждый из которых играет важную роль в минимизации ущерба, восстановлении работы и предотвращении будущих сбоев. В этой статье разберем сущность каждого этапа, чтобы показать как обеспечить систематизированное и оперативное реагирование на инциденты в ИТ-среде.

Читать далее

Современный on-call менеджмент: 5 основных шагов от мониторинга до постмортема

Reading time12 min
Views3K

Управление инцидентами - это порой ночной кошмар любого ИТ-директора. Поднимите руку те, у кого не было ночных сообщений, что упал критический сервис! Почему так мало рук? Да потому что этот самый процесс в большинстве компаний устроен криво. Каждый раз его придумывают заново, проходя путь от ручного режима, далее общей почты или телеграмм группы до самописной системы управления инцидентами. И чем позже мы приходим в компанию выправлять процесс, тем больше сопротивления и непонимания “А что так можно было?”.

Помню, как 8 лет назад я руководил сервисной службой в компании, которая предоставляла услуги поддержки важной внутренней системы крупного клиента. Однажды ночью, примерно в три часа, мой телефон разрывается от звонка. На экране — заказчик. Не успеваю сказать "алло", как слышу: "Вы там спите что ли? У нас АСУ ПОБСУ лежит! Вы в курсе почему? (Я молчу) Мы больше не будем с вами работать!" — и бросает трубку.

Читать далее

Автоматизация мониторинга с Monq: Управление сигналами и интеграция с Zabbix

Level of difficultyMedium
Reading time11 min
Views2.2K

Сегодня я расскажу, как с помощью системы Monq и ее инструмента low-code автоматизации можно эффективно настраивать мониторинг и управление инцидентами на примере интеграции с Zabbix. Будет описание ключевых элементов, включая создание и обработку сигналов, управление состоянием конфигурационных единиц и автоматизации процессов. А еще — полезные ссылки на бесплатную комьюнити версию и ранний доступ к облачной версии. Надеюсь, этот пост будет полезен специалистам, которые хотят оптимизировать мониторинг сложной ИТ-инфраструктуры, заодно улучшив управление инцидентами.

Читать далее

AI CoPilot в ИТ-мониторинге: перспективный тул или «Книга вредных советов»?

Level of difficultyEasy
Reading time8 min
Views2.2K

По мере развития генеративного ИИ, вендоры в сфере  ИТ-мониторинга работают над созданием инструментария AI CoPilot. Название тула пошло от представления, что управление ИТ-инфраструктурой подобно пилотированию самолетов. В случае инцидента пилоты пользуются «Руководством по летной эксплуатации» (РЛЭ) и «Аварийной картой» для быстрого решения проблемы, стремясь сохранить контроль над ситуацией. AI Copilot (второй пилот, 2/П в терминах авиации) помогает сотруднику ITOps (в роли КВС) быстро проанализировать данные мониторинга, найти в базе данных описание похожего инцидента, предложить путь решения проблемы и затем автоматически запротоколировать событие в журнале инцидентов (Postmortem).

Читать далее

Упал интернет-магазин? Мониторинг бизнес-сервисов Monq поможет найти причину

Level of difficultyEasy
Reading time9 min
Views2.9K

Hola. Хабр! В этой статье хотелось рассказать, как корпоративный ИТ-мониторинг Monq отслеживает работоспособность ИТ-систем предприятия, облачных сервисов и коннекторов с внешними поставщиками, такими как системы оплаты, логистики, бронирования товаров или билетов, а также в других сферах. Real-time мониторинг инфраструктуры и работоспособности ИТ-инфраструктуры бизнеса критически важен для функционирования электронной торговли, ритейла, промышленности, банкинга и страхования, медклиник и госучреждений. 

Читать далее

Information

Rating
Does not participate
Location
Дубна, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity

Specialization

Product Manager, Systems Analyst
Lead
Project management
People management
Development management
Information Technology
IT service management