В англоязычном же сегменте, особенно на «высокочастотке» похоже есть «рациональное зерно» в корреляции. Хотя некоторые корреляции забавляют.
А вот с русскими словами у сервиса почему-то не очень. Попробовал «от балды» ввести десяток русских запросов. Из введенных мной нескольких запросов, оказалось, он знает только два слова на русском «Путин» и «Медведев» :)
(При этом, русских слов «Превед», «Водка» и «Балалайка» сервис почему-то не знает).
Кстати, список корреляции соответвующий (т.е. говорит сам за себя):
Correlated with Путин
0.8363 путин
Correlated with Медведев
0.9497 дмитрий медведев
0.9246 Дмитрий Медведев
0.8791 medvedev jewish
0.8756 медведев
0.7999 dmitry medvedev
0.7266 medvedev
0.6703 medvedev russia
0.6075 russia medvedev
Возможно этим сервисом можно выявлять социальные проблемы.
Так, запросов «drugs» больше всего из штата Миссисипи, «vodka» — в штатах Пенсильвания и Нью Йорк.
А криминальные штаты (по запросы «criminal»): Техас, Флорида и Северная Каролина.
Интересно — совпадают ли эти выводы с реальностью?
Трактование статистики очень гибко и оттого интересно. Я мог бы сделать такой вывод из вышеприведенной диаграммы: о порно помнят всегда, а о священном месяце только когда он наступает.
Тут где-то на главной был конкурс, устроенный больницей, которая платит большие деньги за ПО прогнозирующее кол-во дней, которые проведут пациенты в больнице… :)
Зашел на этот сервис — довольно интересно. Позволяет загружать свои данные и искать корреляции с данными Google начиная с 2003 года. Кроме этого есть забавная опция — нарисовать свой тренд и Google выдаст корреляции. Вот что у меня получилось:
Главное не забывать что не каждое даже длительное совпадение есть корреляция. Те же изменения запросов по праздникам отражают корреляцию их с праздниками, а не друг с другом.
Корпорация Google запустила экспериментальный сервис Google Correlate