На Хабре много писали о суперкомпьютере IBM Watson. Предполагается, что такая машина должна служить людям: помогать ставить диагнозы и решать другие сложные проблемы путём анализа массивов структурированных и неструктурированных данных. Но можно ли систему дата-майнинга приспособить для нужд информационной безопасности компании?
Компания IBM выпустила решение IBM Security Intelligence with Big Data для анализа информационных потоков внутри компании: сетевого трафика, логов, технических данных, и даже корпоративной почты и сообщений сотрудников в твиттере. Технологический директор подразделения IBM Security Systems Сэнди Бёрд (Sandy Bird) говорит, что автоматическое сканирование почты и социальных медиа позволяет оперативно выявить «недовольных» сотрудников, которые могут стать источниками утечек конфиденциальной информации.
«Путём анализа электронной почты вы можете сделать вывод, что этот парень — недовольный сотрудник, и шансы на утечку данных от него выше», — говорит Сэнди Бёрд. Система анализирует эмоциональный тон текстовых сообщений сотрудников, суммируя оценку каждого слова/фразы (положительное, нейтральное, отрицательное) и вычисляя общее значение сообщения целиком.
Среди факторов риска может быть такой, что при общении с менеджером и при общении с собеседниками за пределами компании у сотрудника наблюдается разный эмоциональный тон сообщений. Платформа IBM Security Intelligence позволяет пометить такого сотрудника для дальнейшей проверки отделом IT.
Кроме контент-анализа, система IBM Security Intelligence анализирует сетевые логи, записывает все сетевые пакеты и другую техническую информацию для поиска «аномалий». Система основана на БД Hadoop, с графическим фронтендом для визуализации и изучения данных.