nvnikolai 19 дек 2018 в 14:51

Глубины SIEM: корреляции «из коробки». Часть 3.2. Методология нормализации событий

7 мин

9.7K

Блог компании Positive TechnologiesАнализ и проектирование систем*Информационная безопасность*

+11

Комментарии 14

mzhevnerev 19 дек 2018 в 20:10

На самом деле основная проблема в плохо работающей корреляции как раз в том, что вендоры пытаются нормализовывать и категоризировать события отдельно друг от друга.
Не учитывая информацию, которая могла бы быть необходима для соответствующих корреляционных правил.

nvnikolai 19 дек 2018 в 20:38

Да, верно, в этом тоже есть большая проблема. К сожалению я ее не затронул в этой статье.
Видится, что для ее решения надо выработать какой-то отраслевой стандарт. Этот цикл статей — робкая попытка начать наводить порядок хотя бы в рамках одной компании/вендоре. Если выработанные практики можно будет масштабировать, будет успех. На отраслевой стандарт, я пока не замахиваюсь. Здесь ключевое слово "пока" :)

mzhevnerev 19 дек 2018 в 20:36

В том же примере с Ораклом получается, что поле src.ip пустое (хотя пора бы уже научится резолвить хосты). А в других событиях оно может быть заполненным.
Или же вообще отсутствовать информация о сорс хосте
А в некоторых случаях — собираться из нескольких РАЗНЫХ событий

Virtual77 20 дек 2018 в 12:56

Вот на счет резолвить, тут слишком растяжимое понятие, некоторые SIEM (не буду показывать пальцем все и так знают на букву А) резолвингом убивают DNS сервера, и приходится забивать костыли в виде отдельных кеширующих DNS и затягиванием гаек на тайминги резолвинга при обновлении активов, так что лед очень тонкий.
Либо имеем актуальные активы и захлебывающийся DNS либо работающий DNS и слегка актуальные активы.

nvnikolai 20 дек 2018 в 12:58

На пути обогащения много таких проблем :) каждый вендор выкручивается как может… или не выкручивается :)

mzhevnerev 19 дек 2018 в 20:37

И для того, чтобы корреляция в итоге учитывала эти варианты, «эксперты» должны делать нормализацию и категоризацию исходя из того, какие поля будут (и должны в идеале быть заполнены) использоваться в корреляции. И при необходимости не вешать категории на исходные события, а заполнять их на уровне обогащения, корреляции и т.д.
В этом случае и с поиском будет намного проще :)

nvnikolai 19 дек 2018 в 20:56

В данном подходе категория отражает суть исходного события. Суть может быть определена на этапе нормализации (даже с пропущенными данными)
Категория определяет правила заполнения нужных полей. Но что делать с пропущенными данными (src.ip — действительно такой случай)? Восполнить такие пропуски можно обогащением (когда это возможно, но это далеко не всегда так). Т.о. зачем дотягивать категоризацию до обогащения?

mzhevnerev 19 дек 2018 в 21:08

Для того, чтобы во всех событиях одинаковой категории была вся необходимая информация (мой любимый пример с стартом\завершением vpn-сессий)
Когда мы ищем события определенной категории — хочется иметь всю информацию в событии, а не собирать ее каждый раз из разных
Когда мы делаем правило по категории событий — хочется быть уверенным, что в любом событии в этой категории будет вся необходимая информация. Как раз чтобы на этом уровне реализовывать логику детекта, а не очередной парсинг и исправление ведорских (тут я про тех, кто логи в продуктах создает) особенностей

nvnikolai 19 дек 2018 в 21:13

Вроде как именно об этом шаг 3 методологии.

nvnikolai 19 дек 2018 в 21:15

Как и писал выше в методологии, действительно есть дырка: она ничего не говорит о том как и где достать недостающие в событии данные.

mzhevnerev 19 дек 2018 в 21:18

А дьявол, как говорится, в деталях :)
И в данном случае они именно тут. Ибо если смотреть не на событие как оно есть, а на событие как оно могло бы быть — то можно и аудит где-то сделать другой. И категории вешать позже :)

nvnikolai 19 дек 2018 в 21:28

В этих словах есть правда… Следующая статья будет про использование данных об активах. Эта задача схожу с обогащением. Там постараюсь тему восполнения недостающих данных затронуть.
Спасибо за фидбек, момент с обогащением от меня ускользнул :(

Storchak 25 дек 2018 в 11:00

Статья хорошая, но написана непростым языком, тяжело воспринимается

nvnikolai 25 дек 2018 в 11:01

Спасибо, попробую следующие части писать не таким академическим языком ;)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий