COVID-19: Модель параметрического предсказания эпидемии

Действительно, за последние месяцы тема анализа эпидемии covid-19 уже порядком достала, звуча из всех утюгов, кофеварок и лыж. Да и сама тема уже практически (очень зря) потеряла свою актуальность.
Однако, как раз сейчас, у нас накопился достаточный объем данных по которому мы можем посмотреть как именно развивалась эпидемия и проверить модели, которые использовались ‘в бою’.


Введение 


В этой статье мы не будем концентрироваться на жутком матане и тервере, рассматривать экономические или политические последствия и не будем пытаться изобрести свою статистику.  


Вместо этого мы: 


  • Рассмотрим некоторые моменты, подходы и идеи в обработке данных, которые пригодятся при построении модели.
  • Построим объемную модель эпидемии.
  • И оценим как изменение некоторых параметров может влиять на ход эпидемии.

Disclaimer 1:
В этой статье будет довольно сильный уклон в сторону анализа ситуации по России в целом, и Нижнего Новгорода в частности.

Disclaimer 2:
Все модели исходят из официальных данных указанных стран и регионов. 

Disclaimer 3:
Говоря о России и её регионах, мы сознательно будем убирать последние данные (начиная, примерно, с 15 мая) из-за целого ряда причин. Кратко опишем это как: Изменение методики подсчета заболевших. Однако, это тема для отдельной статьи и мы не будем вдаваться в эти дискуссии сегодня. 

Данные


Ну, начнем от печки. Данные по миру, странам с достаточным объемом статистики и их регионам можно найти тут CSSEGISandData, а по России и российским регионам тут стопкоронавирус.рф. Автоматически выгружаем данные из этих источников и формируем удобный датасет.


Для начала, стоит сделать сноску про то, что мы не может оценивать все страны одним и тем же методом. Так как методы сбора статистик, учет заболевших, учет смертности людей с сопутствующими заболеваниями (см. Ломбардийские дедушки) отличаются от страны к стране. (Не говоря уже о различных вводимых властями мерах по предотвращению эпидемии и национальных особенностях, про это немного позже).


Поэтому сложно предсказывать дальнейшее развитие эпидемии в конкретной стране, опираясь только на страны со схожей динамикой распространения вируса. (Как минимум, из-за существенного отличия  тренда Российской статистики и статистики других стран в пересчете на единицу населения.)
source



Еще одна проблема, на которой стоит заострить внимание, — методология сбора и обработки статистики по смертности. Учитываются ли люди, умершие от сопутствующих заболеваний, в то время как они были заражены COVID-19? Учитываются ли умершие с аналогичной симптоматикой, но без проведенного тестирования? Тем более что в России подход к учету статистики драматически менялся без пересмотра уже опубликованных данных.


Можно посмотреть отчет ВОЗ, где рассказывается про различие смерти с коронавирусом и смерти от коронавируса: "crude mortality ratio" и "infection mortality rate". (Для более подробной сводки по смертности можно посмотреть две статьи на habr: раз & два ).


Также, стоит брать во внимание намеренную или случайную неточность данных. И простой факт: чем больше хороших тестов проводится (с малой ошибкой первого рода), тем больше в стране будет выявленно заболевших. 


Еще одно интересное наблюдение, которое можно выделить из данных, — это ‘синдром выходного дня’ (как бы странно это не звучало). Значительный спад в количестве подтвержденных случаев наблюдается в понедельник-вторник (понедельники отмечены на графиках), что выполняется для большинства стран.


‘Синдром выходного дня’ в разных странах



Это, скорее всего, объясняется тем, что в выходные не проводятся (или существенно снижается объем) акции массового тестирования, не работают лаборатории и вызов врача на дом. Поэтому к понедельнику оказывается недостаточно материала для подтверждения новых случаев заражения. 



С Россией все несколько сложнее. В целом, если постараться, можно разглядеть этот ‘синдром’ вплоть до, примерно, 11 Мая. (См. Disclaimer 3).


Ну и последний важный момент, связанный с данными. Можно заметить, что в официальной статистике любой страны наблюдается ситуация, когда число заболевших первые несколько недель растет очень медленно или совсем не растет. Как будто мы действительно строим экспоненту и нецелое количество людей округляем вверх.



Это легко объясняется продолжительным временем развития первых симптомов у зараженных, отсутствием тестирования в первые дни и простым общечеловеческим раздолбайством. Этот факт понятен визуально, однако, почти любая модель будет довольно сильно "сбиваться" от такого долгого периода застоя. Поэтому далее все данные проходят предобработку и эпидемия будет рассматриваться с момента наличия 300 заболевших для страны и 50 для регионов (если не указано обратное).


Краткий вывод можно сформулировать так: данные разнятся от страны к стране и будет довольно сложно выделить и применять один универсальный метод к любым странам. Как мы увидим позже, страны с ‘очевидно адекватной’ статистикой (доверие к статистике, правильно введенные меры, снятие ограничений после эпидемии, а не во время и так далее) лучше всего будут подходить к модели.


Долгосрочная модель


Вот мы наконец-то и подобрались к основному разделу этой статьи и к самой точной модели, которая, забегая немного вперед, дает довольно адекватные предсказания.


Важным моментом в построении модели является возможность интерпретировать параметры модели и сравнивать адекватность полученных значений параметра с общемировыми (если во всех странах заразность составила около 20%, а в одной конкретной стране почему-то 3%, то что-то тут не то).


Да, можно использовать модель SIR/SEIR, которая уже стала ‘классической’ за последние месяцы. Однако, эта модель слабо интерпретируема и подбор параметров для неё неявно зависит от множества факторов. Как то: предпринимаемые государством меры, общий уровень соблюдения изоляции, вероятность передачи от асимптотических большых и их долей от него населения, да и просто уровнем выявляемости. Все эти параметры можно вбить в модель SEIR железным костылем, но обучение такой модели существенно затруднено. (Пример анализа вариантов развития эпидемии от мер на основе имитационного моделирования такой модели можно посмотреть в красивых видео в нашей прошлой статье)


В основу этой статьи легла публикация китайских ученых "Risk estimation and prediction by modeling the transmission of the novel coronavirus (COVID-19) in mainland China excluding Hubei province", которая была переработана и адаптированна под российские реалии.


Краткое описание исходной статьи

В этой статье предложена усовершенствованная модель SEIAR, обобщенная и расширенная дополнительными переменными (о них немного позже). Модель обучалась на статистических данных о заражении в материковом Китае, не включая провинцию Хубэй. (Её исключили на основании того, что здравоохранение было критически не готово к эпидемии, в отличии от остальной части страны, куда вирус дошел позже. Однако, модель с некоторыми оговорками можно экстраполировать и на весь Китай.). Сами дифференциальные уравнения решались с использованием цепей Маркова, а если быть точным, то использовать Markov chain Monte Carlo


Сама модель хороша тем, что учитываем момент не намеренного занижения статистики — когда просто физически невозможно учесть всех заболевших в симптомных и бессимптомных формах.


Замечание: Важно понимать, что не все значения параметров и выводы можно взять из статьи и принять за абсолютную правду. Разность подходов, развитость экономики, введенные меры и занижение статистики играют существенную роль. 


Если кратко, то модель может быть представлена так: 



Давайте забежим немного вперед и уже наконец покажем вам картиночку с прогнозом.



Причем предсказание выглядит вполне адекватно, если а) считать статистику идеально правдивой и б) опираться на опыт других стран при снятии мер.


Запись от 14 мая: Хорошо видно, что пик эпидемии наблюдается прямо вот сейчас. Сейчас самое время всем выйти гулять! (САРКАЗМ)


Но давайте, все же, не делать пока что поспешных выводов и начнем по порядку. 


Формальное описание 


Итак, под капотом модели работает набор диффуров:


Собственно, 11 диффуров


На самом деле, если внимательно посмотреть на описания параметров и формулы (и потратить часок-другой), то становится понятно, что это довольно простая по своей логике система диффур. Основная проблема возникает именно в решении этой системы по имеющимся данным. 


Описание всех параметров модели может быть найдено ниже: 


Описание константных параметров (что подбираем)
Обозначение: Описание: Используемые границы начальных значений:
phi
Показатель скорости развития симптомов у зараженных
от 1/15 — 1/4 
(то есть от 4 до 15 дней)
mu
Показатель длительности самоизоляции
(скорости выхода здоровых людей из самоизоляции) 

от 0 — 1/6 
(то есть от 6 дней)
с_0
Среднее число контактов в день на человека, значение на начало периода
от 30 до 45 человек в день
beta
Вероятность заболевания после контакта с инфицированным
от 0.05 до 0.6
theta
Вероятность проявления симптомов у зараженного (доля симптомных больных среди всех зараженных)
от 0.35 до 0.8
eta 

Показатель госпитализированных из числа находящихся на обсервации (скорости госпитализации)
от 0 до 1
gamma_I 
Доля выздоровевших среди симптомных больных 
от 0 до 1
gamma_A 
Доля выздоровевших среди бессимптомных больных
от 0 до 1
gamma_H 

Доля выздоровевших среди госпитализированных больных
от 0 до 1

Доля общего числа смертей, вызванных вирусом, из общего числа заболевших за весь период 
от 0.001 до 0.15 
epsilon 

Поправочный коэффициент для вероятности передачи от бессимптомных больных 
от 0.6 до 0.9 - 
q_1
Коэффициент, определяющий меры по ограничению контактов
q_2
Меры по выявлению инфицированных (тестирование)
от 0.1 до 0.9 
q_3
Меры по отслеживанию перемещений заболевших 
от 0 до 30 
sigma
Снижение частоты контактов с кумулятивным ростом случаев заражения (определяет экспоненциальное убывание доли контактов с ростом опубликованных  случаев инфекции)

от 0 до 0.001

После долгих консультаций с эпидимиологами, умственный усилий и получения своей собственной корочки вирусолога, были поставлены адекватные границы для каждого из параметров. Проблема возникает на этапе сравнения с другими странами, так как каждая страна использует свои подходы и возможные границы параметров будут различаться. Поэтому использованы наиболее широкие границы, позволяющие получить хороший результат.


А аппроксимировать и предсказывать мы будем следующие величины:


Описание переменных временных рядов (что предсказываем)
Обозначение: Описание: Используемые границы начальных значений:
S(t)
Уязвимые
E(t)
Зараженные в стадии инкубационного периода
[0, 1e+4]
I(t)
Симптомные больные
[0, 1e+4]
A(t)
Бессимптомные больные
[0, 1e+4]
Si(t)
Изолированные уязвимые
[0, 1e+4]
Q(t)
Зараженные на карантине
H(t)
Госпитализированные зараженные 
R(t)
Выздоровевшие
Rh(t)
Выздоровевшие из госпиталя
D(t)
Кумулятивное число смертей в госпитале
T(t)
Общее число подтвержденных случаев

В изначальной статье авторы предлогают использовать метод Марковских цепей Монте-Карло (MCMC). Но этот метод решает предложенные дифуры непозволительно долго и нестабильно. Поэтому мы используем другой метод. Всю эту сложную систему будем решать вполне классическими методами BDF — мы пошагово аппроксимируем производную функции. Метод, конечно, не идеален и имеет много как плюсов как и минусов. Да, можно было решить и очень сложно и красиво, но, совсем не факт, что это дало бы какие-либо значимые результаты. 


Также, сама модель была немного отредактирована. Начальные значения зараженных, изолированных, симптомных и бессимптомных больных (от которых начинается решение уравнений) теперь представляют собой параметры, которые мы находим. Также был введен коэффициент снятия ограничений, с увеличением количества контактов в определенные моменты для моделирования второй волны (В статье упор на это делать не будем).


Эксперименты


Проведем моделирование для России. (Еще раз сошлемся на дисклеймер вначале, что мы НЕ рассматриваем статистику начиная с  последнего времени из-за полного изменения методики учета)


Если мы считаем, что пик прошел в середине мая ровно в момент обращения президента и конца нерабочих дней.




Найденные параметры
phi mu c_0 beta theta eta gamma_I gamma_A gamma_H d epsilon q_2 q_3 sigma
Russia 0,064 0,004 30,889 0,064 0,410 0,182 0,793 0,208 0,020 0,001 0,642 0,900 12,387 0,000007

Как будет видно позже, экстремальные значения величины q_3 не будут сильно влиять на результат, а вот величина q_2, которая принимает тут максимально возможное значение при ограничениях показывает нам, что мы не нашли глобальный оптимум, а лишь уперлись в локальный минимум. Его найти будет очень сложно из-за совершенно неоднородной статистики в целом.


Важно учесть, что тут  мы именно берем официальную статистику за ground truth и строим предсказания исходя из этого.


Графики количества подтвержденных случаев в других странах



Параметры найденные для этих стран
phi mu c_0 beta theta eta gamma_I gamma_A gamma_H d epsilon q_2 q_3 sigma
Canada 0,063 0,049 32,453 0,071 0,783 0,137 0,735 0,443 0,028 0,004 0,750 0,843 0,047 1,63E-05
Germany 0,078 0,033 33,262 0,092 0,838 0,024 1,000 0,100 0,059 0,001 0,773 0,746 23,883 3,42E-05
Italy 0,063 0,083 33,837 0,129 0,531 0,004 0,736 0,486 0,023 0,005 0,741 0,602 8,119 1,36E-05

Вот, тут все гораздо приятнее. Параметры, которые мы получили для этих стран выглядят более правдоподобными. Так хорошо модель обучается, в том числе, из-за более точной статистики в исследуемых странах. Обобщим это как — отсутствие изменения методики подсчета походу дела и схожесть самой методологии измерения заболеваемости между этими странами.


Так же видно, что в Германии происходит ‘Немецкое Чудо’ (система здравоохранения работает практически идеально, смертность очень низкая) — поэтому некоторые параметры для Германии показывают экстремальные значения.


В целом эта модель горааааздо устойчивее к флуктуациям в статистике, хотя и не идеальна и иногда проваливается в локальные минимумы, хоть и близкие к глобальным. Можно так же заметить, что данные везде, кроме России, почти во всех странах подвержены "синдрому выходного дня", о котором упоминалось выше. 


Влияние изменения параметров


Попробуем немного поиграться с параметрами и посмотрим, как вводимые меры влияют на итоговое количество переболевших. При этом остальные параметры оставим фиксированными, как они были подобраны для текущего региона (вероятность передачи, количество бессимптомные больных и прочее). (В таком формате ст.8)


Тут мы не будем концентрироваться на статистике как таковой, а только косвенно описаться на неё при проверке адекватности вариаций параметра. 


Заразность



Подробнее про Заразность заболевания

beta — вероятность передачи вируса через контакт с инфицированным, при дистанции в полтора метра. Эту вероятность можно уменьшить путем соблюдения мер предосторожности и использования средств защиты, таких как перчатки, маски, антисептики. Кроме того, чем больше магазинов, транспорта дезинфицирует свои помещения и поверхности, тем вероятность beta, предположительно, меньше.



Видно, что это довольно эффективные меры, которыми можно сильно повлиять на ситуацию в целом. 
Соблюдая меры предосторожности, можно растянуть пик эпидемии, освобождая медицинскую систему от нагрузки, и, в конце концов, серьезно снизить количество заболевших.


Конечно, есть вариант переболеть быстро и всем (при этом умрет большой процент населения). В этом сценарии нужно посоветовать людям облизывать все поручни в маршрутках и почаще ходить на митинги / кафе / туристические места / храмы


Дополнение

Отдельные авторы пишут, что отказ от антисептиков может повышать риск ОРЗ как минимум в 1,3 раза. Оценка повышения вероятности передачи при отказе от ношения перчаток пока оценено довольно плохо. Но однозначно известно, что ослабление карантина (в разных его формах) повышает эту вероятность из-за более халатного отношения к дистанции. Социальное дистанцирование примерно в 2-3 раза снижает вероятность.


Коэффициент Страха 



Подробнее про Коэффициент опасения населения

Рассмотрим изменение параметра sigma, который отвечает за снижение частоты контактов относительно кумулятивной суммы зараженных. (Проще говоря — насколько люди пугаются больших цифр по телевизору и начинают добросовестно соблюдать самоизоляцию).



Игнорирование мер изоляции и базовых правил предосторожности ведут к увеличению количества заболевших.


Самые очевидные меры по предотвращению снижения значения данного параметра: оповещение в СМИ, в соцсетях, закрытие предприятий и так далее. 


Роль бессимптомных зараженных



Подробнее про Роль бессимптомных зараженных

А теперь проверим, как изменяется характер эпидемии при изменении доли бессимптомных больных. Границы этого параметра мы можем изначально оценить только приблизительно, потому что для уверенного заявления нужно массовое тестирование (см. Норвегию/Корею)



Довольно очевидно, что зараженные без выраженных симптомов дают меньший вклад в развитие эпидемии (нет кашля — меньше шанс заразить случайного прохожего рядом). Однако, очень сложно оценить не только количество асимптомных больных, но и как именно они влияют на общую картину хода эпидемии. Для этого нужно обширное проведение скрининговых исследований на антитела.
Так же довольно сильно будет влиять возрастное распределение этого параметра: молодые, в основном, болеют бессимптомно, пожилые — с осложнениями и выраженными симптомами.


А теперь перейдем к самому интересному — параметры, которые напрямую зависят от мер, введенных конкретным государством.


Массовое тестирование



Подробнее про Массовое тестирование

На этот параметр уже напрямую влияет государство. Доступность тестов, массовое тестирование на улицах, точность тестов (ошибка первого уровня) и банальная готовность системы здравоохранения. 



Массовое тестирование точными тестами (простите за тавтологию) помогает существенно снизить число заболевших в активной фазе, выявить большее число бессимптомных и, как следствие, изолировать больше активных переносчиков. 


Можно предложить, например, такие меры: патрули на улицах, которые (не арестовывают людей и ведут их в отделение, где будет скопление народа) берут тесты у всех желающих. Крупные предприятия продолжают работу только при условии регулярной бесплатной (!) проверки сотрудников. Проверки с выездом на дом или рабочее место. 


Большой Брат 



Подробнее про Контроль за перемещением граждан

На этом месте самое время вспомнить Большого Брата из романа 1984 и его жгучее желание отслеживать контакты и перемещения всех и каждого.


Введение похожих мер во многих странах оправдывается "заботой о людях" и соблюдением карантинных мер. К сожалению, государственные организации не могут предоставить конкретных данных по работе Рос-[Контроля] в этой сфере. Однако, посмотрев на колебания данного параметра, мы можем получить качественную оценку, показывающую полную неэффективность мер такого рода. 



Тут можно сделать простой вывод: отследить все контакты потенциальных больных физически невозможно (см пациент 31 из Южной Кореи). Да, Google & Apple разработывают систему, но она лишь увеличит количество людей, которые захотят провериться, но не сможет уберечь их от заражения. 


Область сценариев


Попробуем оценить насколько же разными может быть исход эпидемии в стране и регионе. Методика оценивания основывалась на умных книжках (например, Nonlinear Parameter Estimation — Yonathan Bard). В рамках этой статьи мы не будем залезать в матан, а только посмотрим на примерные картинки.  


Естественно, итоговый результат может сильно колебаться в зависимости от введенных далее мер (или снятия оных), сознательности граждан и банальной удачи.


Для каждого региона можем найти параметры модели, которые наилучшим образом предсказывают развитие эпидемии по текущим данным. По найденным параметрам, как по случайным величинам, можно оценить интервал параметров — как будет развиваться эпидемия в любой произвольной стране. 


Здесь применимы все стандартные средства матстата и статистического анализа.


Для Нижнего Новгорода было получено:



На графике, кроме интервала наиболее вероятных сценариев, так же изображено наиболее вероятное (для используемой статистики) предсказание.
Видно, что тренд может сильно меняться из-за недостаточной точности данных и большого шума в данных по регионам. Однако, прогнозы укладываются в нашу область.



Краткие выводы


Веря официальной статистике, переболеет небольшая часть населения, при условии соблюдения мер. Еще один вывод, вытекающий из  предыдущего, что "русский менталитет" помогает существенно снизить заразность вируса. Особенно в последнюю половину мая.


Для COVID-19 инкубационный период составляет от 2 до 14 дней (чаще всего 5-6), латентный период практически равен инкубационному. Поэтому, даже если вы чувствуйте себя отлично равно как и ваши друзья, с которыми вы хотите встретиться, то это не ограничит вас на 100% от заражения. А нарушением самоизоляции вы повысите beta — уровень заразности вируса в стране.


Очень сильно итоговая ситуация зависит от уровня изоляции жителей. Это связано с сознательностью, введением карантина, помощью государства, возможностью работать из дома и многим другим. 


Мем

Тогда как прямая слежка за перемещением от государства практически не влияет на ход эпидемии. 


В России и в мире значительная часть инфицированного населения переносит болезнь в бессимптомной форме. (в некоторых странах бОльшая часть, иначе не сходится официальная статистика и теоретические изыскания). Хотя это существенно не будет влиять на саму эпидемию.


В целом, для стран с большим доверием к статистики модель позволяет получить достаточно точный прогноз.


Отдельная благодарность kblack, pixml и keysloss за помощь в написании статьи и построении модели.


UPD: Стилистические правки. Спасибо Cerberuser!

Similar posts

AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 33

    +1
    В России и в мире значительная часть инфицированного населения переносит болезнь в бессимптомной форме.
    Я вот смотрю статистику оперштаба Москвы, там за последний день «22,5% не имели клинических проявлений болезни», при том что месяц назад эта цифра была 35% (а полтора месяца назад — 40%). И задаюсь вопросом — с чего это бессимптомных носителей стало меньше?
      0

      Тестируют хуже.

        0

        А может, наоборот лучше. На PCR ложно-положительный результат получить — нефиг делать. Вы вдумайтесь: коэффициент усиления — 230.

          +1

          Исключительно по узкому кругу знакомых: никого не направляют на тестирования даже при жёстком кашле и температуре. Только если сам за свой счёт пойдёшь провериться. У некоторых тестирование показало наличие вируса, и если бы не решились сами проверить — в статистике этих людей не было бы.

            +2

            То же самое среди наших знакомых. Странная тенденция пошла однако ...

              0

              Выше речь шла о бессимптомных. А там действительно фиг знает.


              Статистика действительно выглядит несколько странно. Ну вот в Новосибирски уже полтора месяца колебания заболеваемости в диапазоне 100-110 в день, при, по всем рассказам, весьма слабых противоэпид. мероприятиях. Ну вот с чего бы ей оставаться такой константной? Даже без сколько-то заметных флуктуаций? Так что у меня тоже много вопросов.
              Ну и вишенкой на торте. В Новосибирской области от CoVid19 за все время эпидемии умерло 146 человек. А общая смертность в июне 2020 на 900 чел. больше, чем была в июне 2019.
              Интересно, да?

                0
                Это еще че, в Украине вообще официально количество заболевших за день уменьшается, а неофициально — в западных областях нет мест в больницах.
        0
        Итого, если я правильно понял, личные риски заразится сейчас небольшие и постоянно снижаются.
        Верно? )
          0
          Это было бы так, если бы после 15 мая действительно был пик заболеваемости.
          И, что очень важно, не было бы массовых мероприятий и общего снятия карантина в июне.

          На данный момент невероятно сложно оценивать реальное количество заболевших человек в день исходя из официальных данных.

          Можно только прикинуть, посмотрев на количество человек на улице без каких-либо средств защиты, что все… не очень хорошо.
            0
            А что произошло со статистикой после 15 мая?
              –1
              Ничего не произошло, просто она не укладывается в модель автора — данные не укладываются выбрасываем!
                0
                Вы не совсем правы. Начиная с 15 мая не данные перестали укладываться в модель, а стали заведом неприменимыми исходные предположения модели. Произошло это вследствие начашегося снятия карантинных мер. В модели используется почти постоянное и даже медленно спадающее значение c(t) (в данной статье я формулу для него, к сожалению не увидел — то ли она пропущена, то ли спрятана под какой-то спойлер, — но ее можно найти в оригинальном препринте), в то время как снятие карантинных мер означает скачкообразное увеличение коэффициента q_1, входящего в эту формулу, и, соотвественно — значения c(t).
                На самом деле, модель в этой части, скорее всего, была неадекватна российской действительности и до 15 мая — в силу известной особенности этой самой действительности: «строгость российских законов смягчается необязательностью их выполнения». Значение c(t) после начала рассматриваемого периода на практике, скорее всего, росло, по мере того, как меры изоляции для незараженных и необноруженных зараженных стали исполняться все хуже. Свидетельством этому стал, например, рост транспортных потоков, отображаемый «индексом самоизоляции» Яндекса. А этого явления использованная модель (исходно сделанная для Китая, где этой российской особенности нет), похоже, не отражает.
                  0
                  Получается, для нас ( Россия ) эта модель представляет больше академический интерес.
                    0
                    Disclaimer 3:
                    Говоря о России и её регионах, мы сознательно будем убирать последние данные (начиная, примерно, с 15 мая) из-за целого ряда причин. Кратко опишем это как: Изменение методики подсчета заболевших. Однако, это тема для отдельной статьи и мы не будем вдаваться в эти дискуссии сегодня.

                    Тогда нужно исправить в статье, не «изменение методики подсчета заболевших», а «снятие карантина».
                      0
                      Ну, насчет снятия карантинных мер как причины отказа от дальнейшего моделирования — это всего лишь мои предположения, не более. Автор статьи это прямо не пишет. Я его понял именно так, но я мог ошибиться.
                      Изменение методики — подсчета заболевших (данные Минздрава) — где-то в это время (не помню число) тоже было: к числу больных перестали относить бессимпомных зараженных.
                      Но для моделирования важно не это число, а число выявленных зараженных (которое предоставляет Роспотребнадзор) — то, которое оглашается в ежедневной сводке. А для него, судя по тому, что там по-прежнему оглашается существенный процент бессимптомных, методика существенно не поменялась.
            0
            Позвольте объяснить очень важный момент.
            СамоИзоляция, карантин и подобные меры, это не для того, что бы Вы не заболели. Это для того, что бы Вы заболели позже.
            Характер вируса такой, что переболеют 90% населения планеты, но лечить сразу всех невозможно… банально, потому что нет койка-мест.
            Именно по этому, начали вводить карантины, что бы замедлить заражения и тем самым выиграть время для строительства дополнительных мед-блоков, что бы позже люди могли спокойно переболеть и получить должное лечение.
              0
              Просто исходя из количественных соображений это не совсем верно.

              У нас в России проживает около 140М человек. А 90% это — 129М человек. При этом госпитализация необходима в 15% слечав (пруф). Итого, потребуется около 19М коек.

              Давайте возьмем, очень оптимистично, что сейчас в России развернуто 2М коек (примерно тенденцию, например, можно глянуть тут число больничных коек), причем, можно понимать, что коек с 'кислородом' или аппаратами ИВЛ намного меньше. +Никуда не пропали люди с другими заболеваниями, которым тоже нужна госпитализация. Пусть (опять же, очень оптимистично) 1М коек единомоментно можно выделить больным covid-19.

              И прикинем, что человек, в среднем, нуждается в койке всего две недели — т.е. все люди у нас имеют дикий иммунитет.

              В итоге, по очень примерным прикидкам, нужно в течении 10 месяцев поддерживать ежедневный прирост в допустимых границах.

              П.С. При этом, умрет около 1-5М человек (1-4% от заболевших), что выглядит как-то не очень.
              — В действительности, эпидемии возможно перебарывать без получения 'коллективного иммунитета'. Не вдаваясь в дискуссию, можно взять за гиперболизированный пример Испанский Грипп 1918 года. Да, переболело за 2 года около 30% населения Земли c летальностью 5-20%, однако, эта болезнь намного страшнее и опаснее covid-19.
                0
                Да ладно. Есть (много) людей которые больше месяца занимают койки и (средне) людей по 2 месяца+.
                  0

                  Да, для этой прикидки брался ну ооооочень оптимистичный вариант

              0

              А модель учитывает сверхраспространителей? Они то первые болеют, а потом через время уже повторно не могут стать распространителями, от чего эпидемия идет на спад быстрее, чем предсказывали ранние модели.

                0
                Не учитывает, мы берем усредненные показатели.
                  0

                  Ну вот по новым данным получается, что средние показатели не очень хорошо работают. Один человек может заразить 30, а второй двух, а вместе они заразят 16.
                  При этом те, кто заразят по 30 это чаще всего какие нибудь публичные люди, переболев, они потеряют такую суперспособность. От чего r0 сильно просядет.

                0

                Было бы интересно узнать, насколько связано нарушение самоизоляции отдельным человеком с его возможностью умереть. Т. е. верно ли, что нарушают одни, а умирают другие?

                  0
                  Не совсем понимаю сути вопроса, если честно.

                  При активном нарушении изоляции одним конкретным человеком у него увеличивается личный шанс заразиться (поверх наложите смертность в 1-4%).
                  И очевидно, он повышает общий уровень заболеваемости тем, что какое-то время, пока будет бродить заболевшим, можешь 'начихать' ещё на n человек, тем самым повысив их возможность умереть.

                  Так же стоит учитывать, что, косвенно, он будет влиять не только на прямое заражение, но и на общее наплевательское настроение общества.
                  0
                  Благодарю вас, что вы потрудились, провели моделирование и написали эту интересную статью по его результатам.
                  Однако сейчас, при имеющихся данных (тоже вполне официальных), уже становится ясно, что такое моделирование имеет весьма ограниченную ценность. Причина — большая и неустранимая неточность исходных данных.
                  Когда я писал про имеющиеся данные, я имел в виду результаты исследований на долю людей в популяции, имеющих антитела к новому короновирусу — то есть, так или иначе заражавшихся. Эти исследования — естественно, выборочные, но объем выборки достаточно большой (десятки тысяч людей), и при составлении выборки были приняты меры ее по рандомизции, чтобы сделать ее репрезентативной.
                  Наилучшие данные есть, естественно, по Москве (они есть здесь, со ссылкой на официальный источник). Согласно этим данным, в Москве в первой половине мая антитела к новому короновирусу имели 12,5% обследованных, в начале июля — 21,7%. В пересчете на население Москвы (~12,5 млн.) это дает 1,56 млн. и 2,7 млн. зараженных соответственно. В то же время число выявленых зараженных было в те же периоды (примерно) 130 тыс. и 220 тыс. То есть отношение числа реально зараженных к числу выявленных — примерно 12 раз.
                  По Московской области данных у меня меньше: есть только одна цифра, на 3 июля — 17,7% обследованных, имеющих антитела. В пересчете на численность населения Московской области (~7,8 млн.) это дает примерно 1,38 млн. зараженных, при том что число выявленных на 3 июля было 58,5 тыс — т.е. разница уже почти в 24 раза.
                  Какой из этого можно сделать вывод. Только один — число реально зараженных отличается от числа выявленных на большой (не менее порядка величины) коэффициент, меняющийся, к тому же, в широких пределах даже между соседними субъектами РФ. Т.е. — и величина коэффициента неизвестна. А это означает, что данные по числу выявленных зараженных для сколь-нибудь точного моделирования динамики развития эпидемии не годятся.
                  PS Такая ситуация с выявлением — разница на порядок имеющих антитела с числом выявленных зараженных — она обнаруживается не только в РФ, а по всему миру (я видел аналогичные данные по очагам эпидемии в Германии, Италии, Испании, по штату Нью-Йорк в США). Так что простым смертным, например — хаброжителям, в такой ситуации IMHO надлежит проявить смирение: ничего правдоподобного они промоделировать не смогут.
                  PPS Ещё один результат: оценку летальности короновирусной болезни (помимо устранения особенностей национальной статистики) следует ещё и поделить на этот самый коэффициент — большой и, вообще говоря, неизвестный.
                    0

                    Спасибо за развернуты комментарий!


                    Сразу стоит оговориться, что в этой статье мы опираемся и 'предсказываем' именно что количество выявленных случаев T(t) — т.е. то, что должно попасть в статистику какой-либо страны. Это число подавляющим большинством состоит из симптомы больных, но включает в себя и бессисптомных, равно как и людей без особых осложнений. Для предсказания общего числа заболевших в стране/мире, считая, и выявленные, и пропущенные случаи — мы используем переменные I(t) и A(t) для симптомных и бессимптомных больных соответственно. И действительно, эти показатели в разы выше.
                    Мы не стали в рамках этой статьи концентрироваться на них из-за невозможности (тем более на момент написания статьи) проверки полученных результатов.


                    большая и неустранимая неточность исходных данных.

                    Говоря про это — да, тут вопросов нет, только слезы. Эта неточность, её, так сказать, дисперсия, будет варьироваться от страны к стране. Мы старались проверять модель на более 'доверительных' странах, когда статистика имеет, скажем так, 'адекватный вид' (как раз таки вид 'ёжика' с периодом в неделю).
                    Но если говорить про неточность в плане не выявления части асимптомных больных, то такая модель должна учитывать это.


                    Действительно, скрининговые исследования показывают гораздо больший процент зараженных при экстраполяции результата на всё население. Но к такой простой математики в виде взять процент полученный в исследовании и умножить все население на него — это, скорее всего, не совсем верный подход. Исходя их таких соображений — Люди, которые добровольно согласились пройти исследование уже не составляют полностью репрезентативную выборку по всей Москве.


                    П.С. Говоря про смертность — мы сознательно избегали анализа этого показателя, так как методика подсчета смертности в России и, допустим, в Италии совершенно разнится.

                      0

                      А если просто в лоб моделировать избыточную смертельность?

                        0
                        Так избыточную смертность не промоделируешь. Избыточная смертность при эпидемии возникает не только из-за прямой (пневмония со смертельным исходом) или косвенной (из-за обострения хронического заболевания по причине заболевания короновирусом) смертности из-за заражения, но и из-за избыточной смертности по другим причинам — из-за перегрузки здравоохранения, перепорфилирования лечебных учреждений на борьбу с эпидемией с прекращением плановой медпомощи и ухудшением качества экстренной, задержкой с обращением за помощью из-за страха заражения… Есть данные, что в очагах эпидемии в Италии и Испании полная избыточная смертность была в разы выше, чем смертность от короновируса (картинки есть, например у Ющука). А какова эта доля в других странах — заранее сказать нельзя.
                        Кроме того, чтобы промоделировать смертность на основе обнаруженного числа зараженных, нужно знать, кроме истинной летальности, ещё и обнаруживаемую долю полного числа зараженных. А эта доля, по данным анализа на антитела, оказывается, как минимум, на порядок меньше полного числа зараженных. Причем её нельзя определить априори — она зависит от многих параметров реальной процедуры выявления, а потому может непредсказуемо различаться для разных стран (да что там стран — даже регионов: к примеру, разница в этой доли между Москвой и Подмосковьем — двукратная). Более того, эта доля может меняться со временем — как это и произошло в РФ: ускорение процедуры проведения анализов дало всплеск обнаруженного числа зараженных в районе 1-го мая, при том, что хоть сколько-нибудь пропорционального всплеска случаев госпитализации не было.
                    0
                    Подскажите пожалуйста, что у вас значит «Среднее число контактов в день на человека, значение на начало периода»? Просто количество людей, прошедших мимо на расстоянии около 2 метров?
                      0

                      Со сколькими людьми в среднем контактирует человек: в магазине, на улице, транспорте, дома и тд.
                      Под 'контактирует' имеется ввиду — находится в прямом контакте, возможном для заражения. Например, в магазине на расстоянии 2х метров, где могут накашлять или в транспорте на соседнем сиденье. (сюда косвенно включен параметр заражение через поверхность)

                        0
                        Ну тогда это очень маленькие цифры. Попробуйте посчитать как-нибудь, даже не весь день, а маленькую часть. Я (уже во время ослабленного карантина) пока дошел до магазина, на таком расстоянии встретил больше 100 человек, потом считать надоело.
                          0
                          уже во время ослабленного карантина

                          Ага) Поэтому говорим именно про период карантина. Начиная с n заболевших, когда он начинался, и заканчивая ~15ым числом.
                          В плане времени снятия карантина — Россия безоговорочный чемпион.

                            0
                            Да, я понимаю что он был уже ослабленный, но время, за которое я их встретил — это было около 40 минут на улице. Не в транспорте, не в метро, просто на улице в спальном районе.

                    Only users with full accounts can post comments. Log in, please.