Разработчики Университета Иллинойса создали программное обеспечение, которое якобы способно предсказывать места новых «оранжевых революций» путём ретроспективного анализа «тона» информационных сообщений в СМИ за последние тридцать лет. Авторы заявляют, что их программа успешно предсказала начало революций в Египте и Ливии. Более того, задолго до его уничтожения Усамы бин Ладена программа установила Северный Пакистан как самое вероятное его местонахождение.
Программа анализирует информационные сообщения практически со всех стран мира. Основные источники — глобальные базы данных Open Source Center (финансируется правительством США для нужд внешней разведки) и аналогичная британская база BBC Monitoring, а также архив New York Times. В сумме, все эти источники содержат более 100 млн новостных статей, в результате картирования которых составлено около 100 трлн связей. Обработка информации осуществляется на суперкомпьютере SGI Altix мощностью 8,2 TFLOPS.
Для анализа тона сообщений используются два основных метода. Первый (sentiment mining) подсчитывает общую эмоциональную оценку документа, учитывая эмоциональную окраску каждого слова. Например, слова «хороший», «добрый» имеют высокую положительную эмоциональную окраску, а слова «ужасный» или «страшный» — сильную отрицательную. Если тон сообщений резко падает, то это может свидетельствовать о росте напряжения в регионе. Вторая техника (full-text geocoding) позволяет привязывать эмоциональную оценку сообщений к географическим координатам.

На графике показан анализ тона информационных сообщений о Египте — до революции он снижался до такого уровня лишь дважды за последние 30 лет.
Например, широкие протесты в Египте начались 25 января 2011 года, что привело к свержению президента Мубарака 11 февраля. Мониторинг тона сообщений в СМИ включал в себя 52438 статей с января 1979 года до марта 2011 года, в которых упоминалось название хотя бы одного египетского города. Фильтр по слову «Египет» не был задействован, чтобы отсеять статьи, которые лишь случайно упоминают эту страну. Так вот, к 24 января 2011 года тон сообщений снизился до такого уровня, который в предыдущие 30 лет отмечался лишь дважды. Один раз — в январе 1991 года, когда авиация США бомбила иракскую армию в Кувейте, а второй раз — в марте 2003 года, во время американского вторжения в Ирак.
Таким образом, программа ещё до начала массовых волнений могла сделать предположение о большой вероятности свержения Мубарака, хотя даже знатные египтологи в то время не готовы были допустить такую возможность.
Аналогичные предсказания были сделаны в Тунисе (6636 статей) и Ливии (14109 статей), хотя они проявляются не так чётко из-за малого количества статей — по Тунису в некоторые месяцы в базе было не более 10 новостных материалов.


via Singularity Hub
Программа анализирует информационные сообщения практически со всех стран мира. Основные источники — глобальные базы данных Open Source Center (финансируется правительством США для нужд внешней разведки) и аналогичная британская база BBC Monitoring, а также архив New York Times. В сумме, все эти источники содержат более 100 млн новостных статей, в результате картирования которых составлено около 100 трлн связей. Обработка информации осуществляется на суперкомпьютере SGI Altix мощностью 8,2 TFLOPS.
Для анализа тона сообщений используются два основных метода. Первый (sentiment mining) подсчитывает общую эмоциональную оценку документа, учитывая эмоциональную окраску каждого слова. Например, слова «хороший», «добрый» имеют высокую положительную эмоциональную окраску, а слова «ужасный» или «страшный» — сильную отрицательную. Если тон сообщений резко падает, то это может свидетельствовать о росте напряжения в регионе. Вторая техника (full-text geocoding) позволяет привязывать эмоциональную оценку сообщений к географическим координатам.

На графике показан анализ тона информационных сообщений о Египте — до революции он снижался до такого уровня лишь дважды за последние 30 лет.
Например, широкие протесты в Египте начались 25 января 2011 года, что привело к свержению президента Мубарака 11 февраля. Мониторинг тона сообщений в СМИ включал в себя 52438 статей с января 1979 года до марта 2011 года, в которых упоминалось название хотя бы одного египетского города. Фильтр по слову «Египет» не был задействован, чтобы отсеять статьи, которые лишь случайно упоминают эту страну. Так вот, к 24 января 2011 года тон сообщений снизился до такого уровня, который в предыдущие 30 лет отмечался лишь дважды. Один раз — в январе 1991 года, когда авиация США бомбила иракскую армию в Кувейте, а второй раз — в марте 2003 года, во время американского вторжения в Ирак.
Таким образом, программа ещё до начала массовых волнений могла сделать предположение о большой вероятности свержения Мубарака, хотя даже знатные египтологи в то время не готовы были допустить такую возможность.
Аналогичные предсказания были сделаны в Тунисе (6636 статей) и Ливии (14109 статей), хотя они проявляются не так чётко из-за малого количества статей — по Тунису в некоторые месяцы в базе было не более 10 новостных материалов.


via Singularity Hub