В нашем блоге на Хабре мы уже рассказывали о различных исследованиях, направленных на создание алгоритмов прогнозирования цен акций, к примеру, с помощью машинного обучения. Еще в 2013 году исследователи из бизнес-школы Уорика (Warwick Business School) опубликовали результаты эксперимента, в ходе которого в качестве инструмента для прогнозирования трендов фондового рынка использовался поисковик Google.

В эпоху интернета огромное количество генерируемой людьми информации доступно онлайн. И из этого шума вполне можно вычленить и нечто полезное. Исследователи убеждены, что в анализе тенденций фондового рынка можно использовать информацию о поисковых запросах.

Как это работает


Финансовые рынки представляют собой совокупность различных данных. Их анализ позволяет получить детальную информацию о принятии финансовых решений в мировом масштабе. Однако, на рынке отражается только окончательное решение инвестора о том покупает он акцию или продаёт её.

Данные, полученные с помощью инструментов анализа популярности поисковых запросов вроде Google Trends позволяют заглянуть в тот момент, когда инвесторы еще только анализируют доводы за и против определенного рыночного решения.

Исследователи пишут, что им удалось обнаружить корреляцию между увеличением числа поисковых запросов, связанных с различными политическими и экономическими темами, и последующими обвалами фондовых рынков.

Для обнаружения связи между такими запросами использовался специально созданный симулятор инвестиционной игры. Когда число поисковых запросов снижалось, компьютер виртуально «покупал» акции, а при росте числа запросов о «кризисах» и тому подобных событиях, закрывал длинные позиции.

Самым надёжным для США оказалось слово «долг». Отслеживая рынки только по нему, учёные увеличили свой гипотетический портфель ценных бумаг на 326% всего за семь лет. При моделировании стандартной стратегии торгов, которая не учитывала частоту поисковых запросов, им удалось добиться прироста лишь в 16%.



Другими словами, исследователи считают что нашли связь между тем, чем интересовались пользователи интернета, занимающихся инвестициями на бирже, до того момента, как ими было принято окончательное решение о покупке или продаже.

Помимо данных Google Trends в ходе эксперимента использовались, к примеру, данные сервиса Amazon Mechanical Turk.

Исследователи предполагают, что найдена корреляция объясняется тем фактом, что когда случаются какие-либо политические или важные экономические события, люди пытаются понять, что это может означать для рынка. Они не уверены в том, что последует после выхода таких новостей, поэтому начинают искать информацию, которая могла бы подсказать правильное решение.

Важно отметить, что увеличивается не число «прямых» поисковых запросов вида «в какую сторону пойдет рынок», а дополнительных материалов по теме политики или экономики.

В документе приводится два исторических примера, подтверждающих эту теорию. Первый из них — случай знаменитого инвестора сэра Джеймса Голдсмита, который успел продать свои акции прямо перед обвалом 1987 года. Позднее он заявил, что в какой-то момент просто перестал понимать рынок, поэтому предпочел «выйти» из него.

Второй пример — еще в 1929 году американский бизнесмен Джон Кеннеди решил временно уйти с рынка, когда о ситуации на бирже с ним заговорил мальчик, занимающийся чисткой обуви. Предприниматель рассудил, что когда на рынке появляется слишком много людей, включая тех кого там в действительности быть не должно, тогда всё стремится к обвалу.

Точно также большое количество поисковых запросов информации, которая может иметь отношение к ситуации на фондовом рынке, является сигналом о том, что им заинтересовались широкие массы пользователей сети. И этот интерес указывает на скорое падение рынка — к тому моменту, как общественность «замечает» восходящий тренд он, как правило, уже ослабевает и вскоре происходит разворот. Поэтому появление частных инвесторов, желающих войти в рынок — знак скорого окончания его роста.

Не только фондовый рынок


Подобный анализ популярности поисковых запросов помогает прогнозировать будущие события не только на фондовом рынке. К примеру, компания Google еще в 2013 году заявляла, что с помощью информации о поисковых запросов трейлеров выходящих фильмов может с вероятностью 94% предсказать кассовость ленты в первые дни проката. Анализ числа поисковых запросов в период четырех недель перед релизом позволяет с крайне высокой точностью прогнозировать сборы в первые выходные.

Кроме того, поисковик научился использовать доступные ему данные для предсказания эпидемий гриппа. Специалисты компании обнаружили корреляцию между повышением числа поисковых запросов о симптомах болезни и ростом случаев заболевания.

Тем не менее говорить о том, что подобное использование больших данных позволяет получать гарантированно точне предсказания, не приходится — неважно, идет ли речь о сфере финансов, киноиндустрии или здравоохранении. К примеру, ученые из Гарварда и Северо-восточного университета (North Eastern University) заявляли о том, что сервис Google Trends переоценивает степень распространения эпидемий гриппа в США. С критикой в адрес сервиса соглашался и его сооснователь Мэтт Хобебби, который заявлял о том, что его стоит рассматривать в качестве дополнительного инструмента, помогающего принять решение, а не в качестве самодостаточного средства создания прогнозов.