Обновить
16K+
15

Пользователь

28,8
Рейтинг
22
Подписчики
Отправить сообщение

Почему бизнес теряет деньги на сетевых сбоях, и как NPM помогает это предотвратить?

На связи Станислав Грибанов, руководитель продуктового направления компании «Гарда». В предыдущем посте мы обсуждали, почему классический мониторинг часто оказывается «слеп» к проблемам бизнес-приложений, и разбирали базовые принципы работы NPM (Network Performance Monitoring). Сегодня углубимся в архитектуру отказов, методы анализа трафика и поговорим о том, как своевременная диагностика сетевых взаимодействий влияет на финансовую устойчивость компании.

Точки отказа: где теряются деньги?

Изнутри даже простые сервисы представляют собой обширную распределенную инфраструктуру. При этом системы мониторинга и оркестрации, призванные гарантировать стабильность, не всегда могут своевременно и точно обнаружить источник проблемы.

Отчасти причина такой «слепоты» кроется в том, что работа современного бизнес-приложения опирается на несколько уровней (аппаратный уровень, уровень ОС, уровень приложения, сетевой уровень), на каждом из которых потенциально может возникнуть точка отказа.

Первые три уровня обычно успешно закрывают агентские решения. С сетевым уровнем дела обстоят иначе: агент на сервере не всегда видит, что происходит между узлами.

Помимо технологических сложностей, есть и управленческая проблема. Часто за бесперебойную работу каждого уровня отвечают разные подразделения. Когда сервис падает, команда проверяет только свой участок. Это затягивает устранение инцидента и анализ, необходимый для поиска первопричин. Возникает эффект «футбола».

NPM как инструмент превентивной защиты

Сбои, задержки, атаки и мисконфигурации сетевого оборудования могут приводить не просто к снижению производительности, а к полной остановке бизнес-приложений. Для компаний это означает прямые убытки и репутационный ущерб.

Для решения таких задач применяются решения класса NPM. Они анализируют сетевой трафик (его копии или сетевую телеметрию NetFlow), а также данные syslog и SNMP. На их основе система подсчитывает метрики и строит интерактивные виджеты, визуализируя потенциально проблемные узлы сети. Например, можно вывести топ приложений по объему трафика, хостов по повторным передачами или хостов с наибольшим временем установки соединения и др.

На этом этапе возникает закономерный вопрос: какой источник данных лучше — сетевой трафик или телеметрия? Однозначного ответа здесь нет. Выбор зависит от особенностей инфраструктуры. Так, сетевой трафик предоставляет больше возможностей для извлечения разнообразных сетевых метрик. Однако его намного сложнее обрабатывать, а в некоторых случаях, таких как огромные объёмы данных (ЦОД) или распределённые децентрализованные сети с большим количеством сетевого оборудования с возможностью выхода в интернет, это становится либо вовсе невозможным, либо требует очень больших ресурсов. И тут на помощь приходит NetFlow или его аналоги.

Фактически сетевая телеметрия позволяет анализировать заголовки сессий сетевого трафика, предоставляя специалистам различные возможности для мониторинга производительности сети. В частности, мы можем контролировать объем трафика, его скорость, загрузку интерфейса, привязку объема или скорости трафика к приложениям. Кроме того, за счёт анализа сырого трафика все описанные кейсы можно дополнительно обогащать такими сетевыми метриками, как время установки соединения, задержка ответа сети или приложения и другими.

Благодаря машинному обучению NPM позволяют увидеть аномальные выбросы, которые сигнализируют о проблемах в сети. Например, большое количество сессий или, наоборот, провал в их количестве.

Вместо вывода

Решения класса NPM формирует единую картину производительности, позволяя видеть проблемы еще до того, как они повлияют на бизнес. Причем неважно, что вы выберете в качестве источника (полный трафик или Flow-данные), система подскажет, где именно искать причину сбоя.

Мы обязательно продолжим исследовать тему NPM в нашем блоге на Хабре. А пока мы структурировали всю информацию по NPM на нашем сайте.

Теги:
+5
Комментарии0

Пинг есть, а связи нет: когда не поможет классический мониторинг ИТ-инфраструктуры и как NPM спасает от «футбола» между отделами

Традиционные инструменты мониторинга ИТ-инфраструктуры хорошо справляются с контролем «здоровья» железа: они отслеживают доступность узлов, загрузку процессоров, свободное место на дисках.  Но когда возникает проблема на уровне бизнес-приложений, классическая система мониторинга говорит только: «Пользователи жалуются, что всё тормозит». Корень проблемы может скрываться как на стыке сетевых сегментов, так и в скрытой деградации канала, переполненных буферах оборудования или ошибках на уровне TCP. Спасение в такой ситуации — решения класса NPM (Network Performance Monitoring), они помогут точно диагностировать проблему. Скажем: маршрутизатор перегружен YouTube-трафиком из отдела маркетинга, и это вызывает потерю пакетов для 1С.

В отличие от мониторинга доступности, NPM работает с качеством доставки и взаимодействия. Система анализирует сетевые сессии и протоколы, вычисляет метрики передачи данных и помогает быстро находить первопричины замедлений.

В новом видео Станислав Грибанов, руководитель продуктов NDR и NPM компании «Гарда», расскажет подробнее о том, какие задачи закрывают NPM-решения, и на примере продукта «Гарда NPM» разберёт практические сценарии использования.

Еще больше видео о технологиях и трендах в сфере сетевой безопасности и защиты данных — на нашей странице «ВКонтакте» и на сайте.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Топ-3 популярных заблуждения про NTA и NDR

Многие до сих пор думают, что NTA ‒ это просто «продвинутый IDS», а NDR вообще не работает без полного дампа трафика. Кто-то считает, что NDR ‒ это функция песочницы, а кто-то уверен, что NTA не может работать на базе NetFlow. В реальности дела обстоят несколько иначе.

Мы подготовили видео, в котором Станислав Грибанов, руководитель продукта «Гарда NDR» компании «Гарда», автор блога «Кибербезопасность и продуктовая экспертиза для бизнеса», развенчивает три ключевых мифа про NTA и NDR.

Рекомендуем видео к просмотру всем, кто хочет понять, чем NDR отличается от традиционных средств защиты и когда он действительно нужен.

Еще больше видео о технологиях и трендах в сфере информационной безопасности ‒ на нашей странице «ВКонтакте» и на сайте.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Информация

В рейтинге
300-й
Работает в
Зарегистрирован
Активность