Как стать автором
Обновить
73.35
Холдинг Т1
Многопрофильный ИТ-холдинг

Ситуационный центр для мониторинга IT-инфраструктуры и UX — как такое решение может выглядеть на практике

Время на прочтение5 мин
Количество просмотров4.4K

Подобные системы применяют организации из самых разных отраслей — промышленные предприятия, нефтегазовые компании, облачные провайдеры и многие другие. Расскажем, что важно знать о ситуационных центрах.

/ Unsplash.com / Ibrahim Boran
/ Unsplash.com / Ibrahim Boran

Почему мы об этом говорим

Сегодня можно легко представить ситуацию, когда финансовая структура или ретейлер внезапно сталкиваются с технологическими проблемами, становятся «заложниками» сбоя или аварии в дата-центре. В силу обстоятельств они перестают обслуживать часть клиентов, а если речь идет о крупном маркетплейсе или банке из топ-20, их число может исчисляться тысячами.

Денежные и репутационные потери в таком случае, конечно же, приведут к серьезным последствиям. Подобные риски появились не вчера. Операторы дата-центров работают с ними с момента запуска облачных платформ как таковых, а организации-клиенты с каждым годом тратят все больше на обеспечение информационной безопасности, доступности и бесперебойной работы своих сервисов. Аналитики из Global Industry Analysts ожидают, что в ближайшие четыре года рынок систем управления производительностью и стабильностью приложений продолжит свое развитие и вырастет до $12 млрд. Для сравнения, еще в 2020-м его оценили в $6,3 млрд.

Решения, направленные на обеспечение работоспособности отдельных сервисов, достаточно разнообразны. Только Gartner выделяет порядка пятнадцати ключевых игроков. У них отличается технологический стек и функциональные подходы, зачастую они фокусируются на мониторинге процессов. При этом часть задач компании могут закрывать собственными силами, не привлекая сторонних поставщиков. Управлять таким «зоопарком» достаточно сложно — необходимы компетенции для связи и синхронизации инструментов, что тянет за собой дополнительные расходы.

В то же время даже минимальная децентрализация структуры мониторинга приводит к тому, что нештатные ситуации решаются с задержкой, а процесс устранения последствий затягивается. На эту проблему обращали внимание еще в 2015 году — тогда специалисты из аналитической фирмы Enterprise Management Associates установили, что большинство корпораций имеет более одиннадцати коммерческих платформ, отвечающих за мониторинг и бесперебойную работу сервисов. Две трети организаций отметили, что на поиск причины неполадок у них уходит от одного до трех часов (но эта цифра может достигать и шести часов). Дело в том, что в условиях децентрализации размывается ответственность за устранение инцидентов.

/ Unsplash.com / Ibrahim Boran
/ Unsplash.com / Ibrahim Boran

Одно из возможных решений — управление процессами с помощью централизованного ситуационного центра (СЦ). Он мониторит ключевые бизнес-операции (например, скорость обслуживания в офисе или колл-центре и необходимые для этого трудозатраты), а также выявляет потенциальные слабые места в инфраструктуре и ПО и заблаговременно предупреждает о сбое. Типичный спектр задач такой системы может включать и вопросы, связанные с управлением UX. Далее, рассмотрим все эти моменты подробнее.

Как это работает

Вообще, под ситуационным центром принято понимать единую систему, которая контролирует ключевые показатели бизнес-процессов компании и работу ИТ-инфраструктуры. В каком-то смысле она реализует data driven подход, позволяющий принимать взвешенные решения на основе данных. Плюс — она делает разработку новых продуктов и сервисов эффективной как с точки зрения ресурсов, так и информационной безопасности.

Такое решение становится основой для «зонтичного мониторинга» и единого центра ответственности. С его помощью можно координировать действия подразделений и контрагентов, чтобы оперативно устранять последствия аварий и сами уязвимости. Разумеется, к системам мониторинга можно подключить не только программное, но и аппаратное обеспечение. Например, вот так может выглядеть окно, позволяющее администратору оценить работоспособность отдельных рабочих станций.

При выборе централизованной системы для мониторинга следует обращать внимание на некоторые особенности вроде возможности анализа данных в контексте отдельно взятой компании, филиала или индивидуального рабочего места.

Также стоит обратить внимание на комплекс дополнительных решений, способных сэкономить время и ресурсы компании. Например, в некоторых случаях через ситуационный центр можно автоматизировать проведение конференц-звонков с руководителями ключевых подразделений при ЧС и настройку каналов для дистанционного доступа к корпоративной сети.

Еще один ключевой фактор — простота внедрения. Наличие исчерпывающих руководств и интуитивный интерфейс позволяют не тратить ресурсы на специальное обучение сотрудников, плюс — техподдержке проще реагировать на инциденты в процессе эксплуатации системы. Например, наш Watchman получает данные через унифицированные интерфейсы, что позволяет оперативно ставить на мониторинг новые и уже действующие приложения.

Что там с UX

В конечном счете — работа СЦ будет направлена на формирование благоприятного пользовательского опыта. В силу очевидной зависимости внешнего UX (клиенты и партнеры) от опыта внутренних потребителей (сотрудников), так как неэффективные процессы сказываются на общей удовлетворённости клиентов в не меньшей степени, чем технические сбои по «железу». Однако найти такие «тормозящие» процессы сложнее — зачастую их нельзя оценить визуально или с помощью каких-либо измерений.

В этом контексте стоит учитывать, что в составе СЦ обязательно должна быть многофункциональная система сбора данных о пользовательском опыте. Мониторинг такой информации является одновременно и элементом ситуационного центра, и инструментом для измерения эффективности его работы. Однако важно понимать, что метрики и параметры, на которых выстраиваются критерии анализа нештатных ситуаций, следует формировать на основе реальных данных.

В нашем портфолио есть такая система для комплексного бизнес-мониторинга — Watchman. Она построена на основе инструментов системного анализа, а также платформ для исследования бизнес-процессов — а именно, Process Mining и Process Discovery. Watchman получает данные мониторинга с рабочих мест и дает наиболее объективную картину ситуации с состоянием ПО и «железа». Такой подход дает возможность эффективнее оценивать то, как на самом деле выполняется тот или иной бизнес-процесс, в том числе и с помощью специализированных математических моделей.

Подобные решения по работе с данными, конечно же, подойдут не только условным предприятиям с разветвленной филиальной сетью, как упомянутый в начале статьи банк. Любая компания, имеющая в своем распоряжении широкий парк рабочих ПК и осуществляющая непрерывные бизнес-процессы, может выиграть от внедрения системы мониторинга. Так, для одного из наших клиентов мы добились увеличения доступности ИТ-сервисов с 99,3% до 99,7%, плюс — сократили число заявок в службу поддержки на 12%.


О других наших кейсах — в блоге на Хабре:

Теги:
Хабы:
+23
Комментарии3

Публикации

Информация

Сайт
t1.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия
Представитель
Холдинг Т1