Как стать автором
Обновить
2769.96
RUVDS.com
VDS/VPS-хостинг. Скидка 15% по коду HABR15

Как анализ поисковых запросов в Google позволяет выявлять очаги COVID-19 раньше, чем это удается органам власти

Время на прочтение7 мин
Количество просмотров8.4K
Автор оригинала: Patrick Berlinquette
Аносмия — отсутствие обоняния — это симптом COVID-19.

В соответствии с данными, полученными от 2,5 миллионов пользователей приложения для изучения симптомов COVID-19, разработанного в Королевском колледже Лондона, две трети пользователей, у которых выявлено заболевание, сообщали об аносмии. При этом о том же симптоме сообщала лишь пятая часть тех, у кого заболевание выявлено не было.



А тем временем десятки тысяч человек ежедневно обращаются к Google за ответом на вопрос о том, почему они внезапно перестали ощущать запахи.

Есть ли корреляция между поисковым запросом «I can’t smell» («Я не чувствую запахи») и количеством заражений COVID-19? Да, такая корреляция есть.

Это исследование показывает, что поисковые запросы, связанные с аносмией, почти идеально соответствуют вспышкам заболевания в Нью-Йорке, Нью-Джерси, Луизиане и Мичигане.

Модель, построенная Биллом Лампосом и командой учёных из UCL, показывает, что анализ поисковых запросов в Google позволяет предсказывать рост числа выявленных случаев COVID-19 на срок до двух недель. Среди наиболее показательных запросов находятся запросы по аносмии.

Итак, поисковые запросы, имеющие отношение к аносмии, могут помочь предсказывать вспышки COVID-19. Но могут ли данные, полученные на основе анализа этих запросов, предотвращать такие вспышки?

Это зависит от того, насколько быстро можно получить нужные данные. Если планируется использовать эту информацию для опережающего реагирования на будущие вспышки, нужны данные реального времени.

5 июня Хьюстон, впервые, оказался впереди Нью-Йорка по поисковым запросам, связанным с аносмией.

В соответствии с данными CDC, симптомы COVID-19 появляются в промежутке от двух дней до двух недель после инфицирования. Это означает, что на то, чтобы что-то сделать, учтя данные по поисковым запросам, есть лишь 14 дней. При этом нужно знать о том, где именно живут люди, вбившие в Google «I can’t smell». И узнавать об этом нужно в тот момент, когда подобные запросы попадают в поисковик.

Кроме того, нужно знать о том, сколько людей обращаются к Google с подобным запросом. И это должны быть не приблизительные и не агрегированные данные (вроде тех, что можно найти в Google Trends).

Один из способов получения подобных данных в режиме реального времени, причём — точных данных, заключается в том, чтобы купить ключевые слова «I can’t smell» в Google Ads — в онлайновой рекламной платформе Google.

Затем нужно создать простое рекламное объявление об аносмии (или, ещё лучше, воспользоваться сведениями из авторитетного источника, предоставляющего сведения об аносмии). Наконец, остаётся лишь выбрать место на карте, из которого нужно получать данные по запросу «I can’t smell».

После этого объявление будет показываться на странице результатов поиска для каждого, кто ищет по словам «I can’t smell». Делаться это будет для запросов, введённых в том месте мира, на которое была нацелена реклама.

Вне зависимости от того, щёлкают ли пользователи Google по такому объявлению или нет, в Google Ads будут попадать сведения о количестве показов рекламы. Эти данные будут становиться доступными через час после сеанса поиска.

Вот график, показывающий, начиная с 23 апреля, сведения о поиске по словам «I can’t smell» в 250 городах США с самым высоким количеством населения. По оси Y показано количество сеансов поиска.


Количество поисковых запросов по словам «I can’t smell»

У меня есть эти данные из-за того, что я, начиная с 23 апреля, покупал ключевые слова «I can’t smell» в Google Ads и таргетировал рекламу на 250 городов США с самым высоким количеством жителей.

Пожалуй, воспринимать этот график довольно сложно. Давайте выведем те же данные на карте США.


Количество поисковых запросов по словам «I can’t smell», визуализированное с помощью карты США

Здесь можно видеть, что запросы «I can’t smell», в конце апреля и в начале мая, в основном, выполнялись из Нью-Йорка и из Чикаго. Это — два города, которые сильнее всего пострадали от COVID-19 в указанный промежуток времени.

Кроме того, можно заметить, что в июне растут показатели в Хьюстоне и в Далласе, штат Техас. 5 июня, впервые, Хьюстон оказался впереди Нью-Йорка по поисковым запросам, связанным с аносмией. А с 13 июня Хьюстон оказался на первом месте по таким запросам среди 250 городов США с самым высоким уровнем населения.

Вот графики, глядя на которые, можно сравнить количество поисковых запросов по аносмии в Хьюстоне и количество положительных тестов на COVID-19 в первые три недели июня.


Положительные испытания тестов на COVID-19 и количество поисковых запросов по аносмии

Хочу отметить, что любой, кто потратит несколько часов на то, чтобы разобраться с Google Ads, может воспроизвести эти эксперименты.

Я начал покупать ключевые слова, связанные с аносмией, так как мне хотелось больше узнать о тех людях, которые находились в местах, попавших под карантин.

Но через пару недель этого эксперимента, я понял, что этот метод добычи данных может быть использован и для сбора сведений о регионах, в которых «под карантин» попали данные.

В результате, покупка ключевых слов и нацеливание рекламы на граждан определённых государств, могут помочь узнать о том, органы власти каких стран врут своим гражданам (или всему миру). И это, кстати, относится не только к COVID-19, но и к любой другой теме. Взгляните, хотя бы, на это исследование.

Правительство скрывает количество смертей, это верно на все 100%. Как много они скрывают — сказать уже сложнее. Они, уже давно, полностью контролировали данные, в результате у нас не было возможности получить доступ к независимой информации о том, что происходит.

Зитто Кабве, лидер оппозиционной партии ACT-Wazalendo, Танзания


Случаи COVID-19 в Танзании

Танзания, страна в Восточной Африке, сообщила, начиная с 8 мая, о 509 случаях заражения COVID-19. С тех пор не сообщено ни об одном новом случае заражения.

Анализ поисковых запросов об аносмии коррелирует с количеством выявленных случаев заражения COVID-19 и даже позволяет прогнозировать этот показатель. Аносмия — это самый распространённый симптом COVID-19. Всё это значит, что мы должны ожидать того, что в Танзании, если там и правда нет новых заболевших с 8 мая, искать сведения об аносмии будут редко.

Однако, в ту же неделю, когда правительство Танзании прекратило сообщать о новых случаях заражения COVID-19, эта страна показала второе место в мире по поисковым запросам, связанным с аносмией.

Довольно скоро появились сообщения с мест событий, в которых говорилось о переполненных больницах и о ночных погребениях.

Критики обвиняют правительство Танзании в том, что оно не смогло проинформировать общество о реальном масштабе распространения болезни, и о том, сколько жизней она унесла.

Для того чтобы увидеть реальную картину, основываясь на данных, полученных от жителей Танзании, начиная с тех дней, когда правительство Танзании умолкло, я купил ключевые слова «I can’t smell» и нацелил поиск на всю Танзанию.

Вот тепловая карта по всем регионам Танзании.


Анализ запросов по словам «I can’t smell» в Танзании

Оказалось, что с 8 по 31 мая 2020 года англоговорящие жители Танзании делали ежедневно, в среднем, 93 интересующих меня запроса.

Одной из особенностей Google Ads является то, что здесь нельзя показывать рекламу пользователям, язык браузера которых задан как суахили. На этом языке, в расчёте на 1 англоговорящего, говорят примерно 12,15 танзанийцев. При этом нужно учитывать и то, что в распоряжении Google имеются данные примерно с 5,1% устройств страны.

В результате оказывается, что реальное количество поисковых запросов по аносмии в Танзании, на самом деле, близко к примерно 1824 в день. Google не позволяет раскрыть, как минимум, 94,9% данных по рекламным кампаниям, поэтому я умножил найденное количество сеансов поиска на 19,61 для того чтобы приблизительно оценить то, что происходит в стране на самом деле.

Для сравнения — между 8 и 31 мая в Нью-Йорке был зафиксирован 3251 сеанс поиска по аносмии. За то же время было сообщено о 18143 случаях заражения. Соотношение сеансов поиска и случаев заражения выглядит как 1:5,5.

В Чикаго такое же соотношение за тот же период выглядело как 1:4.

В округе Колумбия — это 1:1,96.

В большинстве городов США, на которые я нацелил рекламу, количество подтверждённых случаев COVID-19 превышало количество поисковых запросов в 1,75-6 раз.

А в Танзании каждый день, начиная с 8 мая, было сделано примерно 1824 поисковых запросов по аносмии.

О точных результатах тут речи не идёт, всё же, я не учитываю в США более неопределённые запросы, связанные с аносмией, вроде «loss of smell» («потеря обоняния»). Я, к тому же, не могу знать точных сведений о том, какие данные по пользователям, в сравнении с данными по устройствам, есть у Google для конкретного региона.

Но, в любом случае, я оцениваю, что в мае реальное количество ежедневных случаев COVID-19 в Танзании может быть выражено небольшим четырёхзначным числом.

Может, это количество и меньше. Но оно, точно, не равняется нулю.

Вот материал о том, как данные Google способны помочь в борьбе с COVID-19.

То, что в применении к нашей ситуации с краткосрочным прогнозом количества людей, заболевших COVID-19, можно назвать «наукастингом», представляет собой наблюдение за распространением болезни с использованием механизмов поиска Google. Это — работающая методика, что доказано моделью Билла Лампоса.

Но эта методика может давать сбои. Google Flu Trends, первый и самый известный инструмент «наукастинга», перестал работать через три года после запуска. Он не смог помочь в предсказании пика эпидемии гриппа 2013 года.

«Но самый полезный вывод, который можно сделать, заключается не в том, что анализ поисковых данных ненадёжен», — пишет Сэм Гилберт. «Это — дополнение к другим методам, но не их замена», — добавляет он.

Ещё одна модель, за которой я наблюдаю, поддерживается Имперским колледжем Лондона. Эта модель оценивает истинное количество заражений в Танзании, произошедшее за четыре недели между 29 апреля и 26 мая 2020 года, как 24689.

Анализ поисковых данных Google может оказаться ценной подсказкой для тех, кто наблюдает за некоей ситуацией и не ограничивается официальными данными.

Даже если окажется, что анализ поисковых запросов, связанных с аносмией, не помогают спрогнозировать распространение COVID-19, я не думаю, что нам надо поддаваться тому настроению, которое появилось после того, как платформа Google Flu Trends показала свою несостоятельность.

Сейчас — не время пессимистично относиться к наукастингу. Дело в том, что люди в наши дни чаще чем когда-либо обращаются к Google, рассказывая поисковику о таких вещах, о которых они не рассказывают больше никому. И сейчас, больше, чем когда-либо, нам нужны самые лучшие из доступных инструментов, которые позволят пробиться сквозь скрытие информации и, перехватывая сведения о мыслях, страхах, надеждах (или о симптомах) людей, понять то, о чём не говорят вслух.

Если органы власти стремятся скрывать данные, пытаются скрывать правду от граждан своих стран или от всего мира, то им, чтобы воспрепятствовать тому, о чём мы тут говорили, придётся полностью заблокировать Google. И не из-за того, что люди могут использовать Google для поиска объективной информации, а из-за того, что анализ поисковых запросов Google способен указать направление исследований тем, кто не довольствуется официальными данными.

«Реклама перестаёт быть рекламой в том случае, если она помогает находить ответы на какие-то вопросы». Это — лозунг, который помог бы моим коллегам лучше воспринимать то, чем они занимаются. Они, хотя и возмущались тем фактом, что были, в сущности, торговцами, при этом использовали Google Ads в коммерческих целях (для того, чтобы продавать людям товары и услуги, которые им не нужны).

Когда вы задаёте Google вопрос об отзывах на новые кроссовки, или спрашиваете поисковик о том, какова текущая ситуация с карантином, или о странных симптомах, которые у вас внезапно появились, то первым, что появится на странице поисковой выдачи, будет, с технической точки зрения, реклама.

Это, кроме того, ответ на какой-то вопрос. И, на самом деле, много чего ещё.

Планируете ли вы изучить что-либо, воспользовавшись методикой анализа поисковых запросов, представленной в этой статье?

Теги:
Хабы:
Всего голосов 20: ↑17 и ↓3+23
Комментарии15

Публикации

Информация

Сайт
ruvds.com
Дата регистрации
Дата основания
Численность
11–30 человек
Местоположение
Россия
Представитель
ruvds