Статистический анализ vs COVID19

Коронавирус SARS-Cov19 продолжает свое шествие по планете. В открытом доступе имеется огромное количество данных о распространении вируса, смертности и количестве вылечившихся. Что же могут рассказать эти данные? В этом посте мы применим статистические методы чтобы понять что же на самом деле происходит.

Стоит отметить, что я не врач и не вирусолог, а просто человек немного знающий статистику и умеющий искать данные.

Итак, для начала определим по какой модели растет кривая. На данный момент она растет по экспоненте, но в целом распространение вируса подчиняется сигмовидной кривой. Предположим что распространение ускоряется в начале быстрее чем замедляется в конце. Такая модель называется функцией Гомперца. Она имеет вид:



где с — верхняя асимптота, а — темп роста и t0 — время для достижения максимальной скорости роста.



Для Китая мы видим, что направление кривой изменилось после объявления строгих мер. То есть любые неожиданные вести, будь то объявление карантина или открытие/закрытие границ, отражается на кривой. То есть реальная динамика следует функции Гомперца, но в случае непредвиденных мер может откланяться.

Что если смоделировать кривую для мировых данных, где асимптота еще не достигнута? На каком значении рост прекратится? Можно ли предсказать максимальное возможное количество зараженных при нынешней динамике и принятых мерах?



Если смоделировать кривую по имеющимся данным по Миру, увидим что с = 84 миллиона, а = 0,02 и t0 = 164 дня. Здесь, оранжевые точки — реальные данные (которые при таком масштабе выглядят прямой, но на самом деле это экспонента), а синяя линия — предсказанная динамика.

Такая же динамика прослеживается и для количества смертей.



Здесь, с = 278 тысяч, а = 0,04, и t0 = 111 дней.

Но это не похоже на ту кривую, которую призывают «сгладить». Возьмем производную от предыдущей модели. Получим:



Вот она. Ширина этой кривой зависит от параметра а. Таким образом, если смоделировать сигмовидную кривую, и рассчитать ее параметр а, можно понять как страна справляется со «сглаживанием» кривой. Но мы не можем их сравнивать напрямую, так как у стран разная плотность населения и уровень развития медицины. Возьмем ВВП на душу населения как показатель уровня развития медицины, из-за доступности данных по ним. То есть чем больше страна зарабатывает, тем больше тратит на медицину.

Теперь запустим регрессию, где зависимой переменной будет темп роста с, а независимыми будут ВВП и плотность населения. Полученная плоскость тренда отражает предсказанный темп роста на основе ВВП и плотности населения. Разность между плоскостью тренда и реальными данными покажет насколько хорошо страна справляется со «сглаживанием кривой».

Итак, рейтинг стран выглядит так:



Здесь показано насколько эффективны меры стран по противодействию заражению и по понижению смертности. Тайвань, Вьетнам и Сингапур уже встречались с SARS, а действия Омана, ОАЭ и Ирака весьма успешны. Стоит отметить что в топе имеются страны с недостаточным количеством данных, такие как Джибути и Сальвадор. Что касается понижения смертности, Япония, США, Тайланд и Иран эффективно предотвращают новые смерти. Здесь так же есть страны с недостаточными данными как Буркина-Фасо и Коста-Рика.

Посмотрим на нижнюю часть рейтинга:



Здесь больше стран без достаточных данных, но можно сказать что европейские страны как Словения, Швеция и Эстония принимают недостаточно строгие меры для сдерживания пандемии. Южная Корея исходя из результатов исследования так же не справляется со «сглаживанием» кривой. Возможно, из-за Пациента 31 распространившего вирус тысячам людей.

А если смоделировать количество смертей и вылечившихся на месяцы вперед и сопоставить с количеством зараженных? Можно ли предсказать конец пандемии?

Динамика роста количества выздоровевших выглядит так:



Количество медработников и медучреждений конечно, и относительно постоянно. Поэтому количество вылечившихся будет расти линейно, но прежде короткое время по экспоненте.

Исходя из этой динамики количество вылечившихся уровняется с количеством зараженных примерно через 80 лет, так как верхняя асимптота зараженных равна 80 миллионам а рост количества выздоровевших равен 2525 в день.

То есть, можно подытожить, что на данный момент не хватает медработников для победы над пандемией. Кривая все еще недостаточно «сглажена». Но при этом, эта модель отражает только динамику развития пандемии при нынешних мерах и нынешних ресурсах. Если же будут приняты строгие меры в большинстве стран, люди будут следовать рекомендациям ВОЗ и строить новые больницы все может измениться.

А пока мойте руки и сидите дома.

Данные получены от:
news.sky.com/story/coronavirus-79-000-people-worldwide-have-recovered-from-covid-19-11958398
ourworldindata.org/coronavirus-source-data

Модель тут
Tags:
коронавирус, covid-19, визуализация данных, <cut/>

You can't comment this post because its author is not yet a full member of the community. You will be able to contact the author only after he or she has been invited by someone in the community. Until then, author's username will be hidden by an alias.