Как стать автором
Обновить
27
0

Пользователь

Отправить сообщение

Спасибо. По-факту подтвердили предположение в статье.

сделал гистограмму со всеми странами

спойлер

Вы правильное замечание сделали. Я, конечно, хотел бы сразу всеми возможными способами проанализировать доступную статистику, но это, как вы понимаете, невозможно. Но цель этого поста немного другая - привлечь внимание людей, чтобы они заинтересовались, начали выдвигать свои гипотезы и проверять их. Поэтому и пост получился очень простым - простая метрика и пара гистограмм, по которым наглядно видно, что со статистикой не все гладко и требуется дальнейший анализ.

В следующей публикации я приведу более детальные расчеты. Но будет замечательно, если вы тоже попробуете проанализировать эти данные предложенным вами способом и опубликуете результаты на хабре.

На статистику запросов может влиять и то, как сми освещают происходящее. Если в какой-то момент времени становится сильно больше новостей про коронавирус - то и на количество запросов это повлияет. Плюс не факт, что люди будут искать одно и то же, если будут болеть второй раз.
Так что нельзя однозначно перенести рост запросов на рост заболеваемости.

Статистика явно сглажена, т.к. слишком сильно отличается от любой другой. Отказы брать тесты - один из способ влиять на статистику подтвержденных случаев. В статье есть ссылки на СМИ, где упоминаются случаи отказа брать тест, в т.ч. по постановлению минздрава.

Сглаживать статистику можно только не регистрируя уже взятые положительные ПЦР тесты или перенося их на другие дни для сглаживания. Никаких доказательств этого в статье нет, то есть тема не раскрыта.

Да, я согласен, что через один контроль над количеством тестов нельзя объяснить сглаживание статистики, либо можно объяснить без него. Но ограничение тестирования имеет место быть и сама связь тестов с подтвержденными случаями будет разобрана в следующей публикации. К сожалению, не получается опубликовать все за раз.

Вообще автор не знает достоверно, что означает дата в его данных, это дата взятия теста, получения результатов теста, дата постановки диагноза ковид или дата внесения одного из этих событий "в компьютер". И для разных стран это будут разные события и у них разные закономерности распределения. Нельзя просто взять выделить какую-то "аномалию" и сразу делать вывод о фальсификациях.

Я использую те данные, которые доступны для анализа. По доступным данным я сделал выводы. Если кто-то сможет объяснить эти же данные по-другому, желательно не на словах, а проведя хоть какие-то расчеты - это будет замечательно.

Цель публикации - не столько обвинить кого-то в чем-то, а показать, что в окрытом доступе есть данные по коронавирусу и их можно и нужно исследовать.

А в такой важной теме это еще и безответственно.

Возможно. Но не безответственней, чем скрывать информацию или вести статистику непрозрачно.

Посмотрите вторую гистограмму в статье, какие цифры в метрике у UK и Germany. Там действительно в UK данные более гладкие, но они даже близко не могут сравниться с нашей статистикой.



В разных странах разные системы учета. Но можно ли только системами учета объяснить такую гладкость данных, которая наблюдается у нас, когда треть дней в статистике - дни, когда число новых подтвержденных случаев отличалось от предыдущего дня менее чем на 1%?

Это всегда так было или только в последнее время, после выборов?

Выходные во всех странах есть, но амплитудные коллебания у нас - гораздо менее заметные, чем у всех остальных. И это надо как-то объяснить.

Да, можно сделать, но не по всем странам. Не все публикуют информацию о тестах. Это в следующей статье будет.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность