Как стать автором
Обновить

Комментарии 22

Учитывают-ли данные модели географию? Симулируют-ли они поведение людей?

Я спрашиваю потому, что все модели, что описывались в популярных статьях это какая-то фикция. Чем могут помочь графики без привязки к географии? На мой делитантский взглят тут больше подходят модели типа погодных, движения воздуха/жидкости или симуляции ядерных взрывов. Другой перспективный (опять-же на мой взгляд) подход будет симуляция систем частиц. Все такие модели схожи требованием огромных вычислительных мощьностей.

Проблема не в самой модели. Модель содержит максимально абстрактные вероятностные переменные. Проблема в том, для каких групп величина этих переменных считается одной и той же, и из статистики какого качества эта величина берётся. Естественно, при ленивом моделировании, оказывается, что выборка — заведомо велика, и получается, почти в прямом смысле, средняя температура по больнице, включая морг.

Да, Вы правы. Степень разделения на группы, то есть степень принятия допущений одинаковости индивидов, является одним из самых сложных моментов моделирования. Этот этап требует реальной статистической оценки разделения популяции на выбранные группы.
Все эти SIR грешат одним крайне спорным допущением, что каждый инфицированный может с одинаковой вероятностью заразить любого неинфицированного. Т.е. допускается, что все люди общаются между собой.

На практике же инфекция может достаточно свободно распространяться внутри некоторых кластеров и крайне неохотно передается между кластерами, что существенно замедляет ее распространение.

У нас на работе два отдела (абонентский и производственно-технический) переболели осенью практически в полном составе и почти одновременно. А других отделов это не коснулось. Во всяком случае — в тот раз.

Здесь на Хабре один автор показал, что в условиях ограниченного числа знакомств скорость распространение инфекции быстро замедляется и из экспонентной сначала становится линейной, а потом — константной.
Собственно говоря, по статистике большинства стран это прекрасно видно — сначала экспотенциальный рост сменяется линейным, а потом после прохождения пика несколько успокаивается и долго тянется «толстый хвост». И это не затухание эпидемии, а именно ее тлеющее распространение.
Классическое семейство SIR моделей действительно грешит этой однородностью восприимчивых. Однако я говорю о применимости всей широты компартментальных моделей. То о чём Вы говорите про кластеры (в частности пример с офисом) на раз два может быть реализован с помощью усложнения моделей.
Для этого мы добавляем соответствующие компартменты на каждый отдел офиса. Допустим два отдела. Тогда изначально будет две группы S (S1 и S2) и две группы I (I1 и I2), а R оставим одну (она не на кого не влияет). Из S1 индивиды попадают в I1, а потом в общую R. Из S2 в I2, а потом в общую R. На интенсивность перехода из S1 в I1 будет сильно влиять сама I1 и совсем немного I2 (так как контакт между отделами всё таки возможен). И соответственно наоборот: на интенсивность перехода из S2 в I2 сильно влияет I2 и слегка I1.
Так получается описываемая Вами кластеризация. Вот, что у меня быстро получилось по такой схеме. Эпидемия возникает только в одном отделе. В другом отделе она начинается после (просачивается таки).
image
Про тлеющее распространение могу сказать только, что замечал подобное явление в моделях, в которых каким-либо образом восстанавливается пул восприимчивых. Либо когда иммунитет не образуется вовсе (SIS), либо утрачивается со временем (SIRS), либо модели с рождаемостью (новорожденные по умолчанию восприимчивы).
В том-то и дело, что этот подход требует усложнения модели.

Если отдела два, то между ними возникает канал передачи инфекции. если три, то таких каналов уже три. Если четыре — то уже шесть.

А ведь кроме отделов одного предприятия существуют другие предприятия, с которыми данное предприятие может контактировать, а может и нет. И семьи работников, которые работают на этих других предприятиях и ходят в общественные места.

Т.е. простое усложнение структуры — тупиковая ветвь. Потому что по мере усложнения структуры модель усложняется нелинейно.

Значит, модель должна описывать сложную иерархическую структуру, но при этом быть сама простой. Вроде как фрактальные объекты — описываются просто, но имеют бесконечно сложную структуру.

Так и тут — система представляет собой фрактал — люди взаимодействуют между собой. Но каждый человек за время инфицирования может инфицировать ограниченное число контактов. И то только с некоторой вероятностью.
Но он входит в кластер, который взаимодействует с другими кластерами. И эти кластеры тоже заражают друг-друга. Причем вероятность заражения нелинейна во времени — чем больше иефицированных в кластере, темм больше вероятность передачи заразы в другие кластеры. Но тоже не во все — ведь число контактов каждого кластера тоже ограничено.
И т.д. от уровня к уровню.

Но мне кажется, что сначала стоит попробовать создать модель для ограниченного числа контактов между людьми. И посмотреть, как это скажется. Только надо учесть, что пространство общения псевдоэвклидово. Т.е. число общих контактов у контактирующих друг с другом выше, чем у неконтактирующих.
Действительно, возможных вариантов моделирования очень много, начиная от чисто математического анализа временных рядов или предсказания динамики изменений с использованием глубокого обучения до имитационных моделей. То, что Вы предлагаете, наверное, стоит относить именно к имитационным моделям и, думаю, действительно может применяться в эпидемиологических целях, надо поискать и разобраться. Но как Вы правильно заметили, подобные модели требуют больших вычислительных мощностей. Компартментальные модели в свою очередь это максимально простые по вычислениям системы. Имитационные или индивидуум-ориентированные модели — это хорошая вещь и, думаю, они максимально точные. Однако иногда стоит сделать допущения, экономящие ресурсы, но не влияющие существенно на точность. Например, объединение индивидов в группы по схожим свойствам, чтобы не просчитывать каждого конкретного по отдельности, как это и происходит по факту в компартментальных моделях.

Ваш вопрос натолкнул меня на хорошую идею, благодарю. Конкретно описанные в статье модели не могут учитывать географию. И за это как раз часто и ругают SIR модель. Однако я хотел сказать, что компартментальные модели — это неисчерпаемый источник новых моделей, которые могут учитывать различные, необходимые в конкретной ситуации факторы.

Например, географию. Можно условно разделить моделируемый географический участок на такие же группы. Допустим на страны/регионы/города или ещё мельче. Для каждого региона будет свой компартмент S и соответственно I и R, которые имеют свои вероятности переходов и коэффициенты воздействия на другие географические участки.
С поведением также. Объединяем индивидов популяции в группы по схожему поведению. Например, носящие маски и игнорирующие маски. Каждая группа, конечно, имеет свой коэффициент заразности и восприимчивости.
Графики же самый простой способ визуализации. Действительно, если будет географическое разделение, можно визуализировать распространение цветами на карте.
Структура таких моделей более или менее хорошо известна, главная сложность — это подбор параметров модели в соответствии с известными статистическими данными. Рекомендую эту статью, в которой приведена программа для Matlab, позволяющая подобрать параметры на основе данных о смертности, количестве новых случаев заболевания и количестве выздоровевших. Вот результат применения этой программы к анализу эпидемии COVID-19 в Украине, правда, сейчас данные уже устарели (модель строилась по данным на 15 ноября 2020 года)

"

https://commons.wikimedia.org/wiki/File:COVID-19_Ukraine_epidemic_dynamics_model.gif
Да, описанные структуры классические и хорошо известные. Хотел показать именно возможности создания (придумывания) новых моделей.
Благодарю за ссылку. Оценка параметров и правда самый сложный момент. Боюсь даже за него браться.

А откуда берутся вторая волна, третья?.. Хотя бы на качественном уровне. Типа начался спад, све расслабились… Или как?

Учитывается ли группа не переболевших, но по не выясненной ещё причине не восприимчивые?

Да вполне возможно создание такой группы. То есть группа, индивиды которой изначально не восприимчивы, вне зависимости от распространения эпидемии.
Хороший вопрос. Возможны различные варианты. Например, на графике SIRS, показанном в посте. Здесь у индивидов со временем пропадает иммунитет. То есть инфекция не успевает полностью пройти, когда у основной части заражённых начинает исчезать иммунитет и они снова становятся восприимчивы и возникает вторая волна эпидемии. И так далее.
Но я думаю, это не та причина, которая обуславливает волны COVID.
image
Если модель учитывает рождаемость и смертность, то волны происходят из-за появления новорожденных, у которых нет иммунитета. Но это тоже пока не про COVID — слишком мало времени ещё прошло, чтобы говорить о таких волнах.
Классической причиной возникновения волн гриппа являются сезонные колебания температуры, которые изменяют возможности распространения вируса. Также возможно влияет введение карантинных мер на определённый период. Их эффективность это отдельный разговор и повод для споров. Сейчас, конечно, не об этом. В любом случае меняется эффективность заражения.
Я правильно понимаю что в этих моделях «умер»==«выздоровел» )).
Конкретно в модели SIR не учитывается смерть. Если болезнь смертельна, то можно добавить компартмент смерти D, в который можно попасть из I. То есть переход может быть с некоторой вероятностью в R (выздоровле), а с некоторой вероятностью в D (умер).
Либо используют модель, учитывающую общую рождаемость и смертность (то есть некоторые добавления/вычитания индивидов из нужных компартментов), и делают смертность на стадии болезни больше чем на других.

И где хоть одна модель, которая объясняет "волны"?

Модель не может объяснить никакие волны. Объяснить волны должна гипотеза, по которой подбирается эмпирический закон изменения параметров модели.
Модель не в состоянии заменить понимание механики процессов, которые она моделирует. Она служит только задаче получения одних возможных данных из других, имеющихся.

Скажем, эмпирическая модель колебания пружинного маятника в виде затухающей синусоидальной функции координаты от времени, построенная на основании только наблюдения за маятником, никак не объясняет, под воздействием каких сил эти колебания происходят и почему затухают. Она может только показать, сколько времени понадобится для прекращения колебаний конкретного маятника, если оттянуть его в некое положение. А вот предсказать поведение любого маятника мы сможем только если будем знать, почему он колеблется (соответственно, как действующие на груз силы зависят от свойств пружины и положения маятника в пространстве относительно планеты).

Среди графиков в посте есть SIRS. Также смотрите комментарий про волны:
habr.com/ru/post/551682/#comment_22908330
Такие модели, могут продемонстрировать волны заболеваемости.
Ага, но там же написано что быстрое уменьшение иммунитета — вряд ли тянет на объяснение. Про сезонность тоже вряд ли. Волны есть и в Индии, и в южном полушарии, в разных странах смещены друг относительно друга при одинаковом климате

Чисто интуитивно это выглядит так, как будто после высокого пика эпидемия должна взять передышку. Видимо должны постепенно изменится круги общения людей, чтобы появились новые связи
Я пока не пытался моделировать ковид. Все представленные модели пока абстрактные, просто показывающие возможности моделирования.
О факторах реально влияющих на волны ковида вопрос отдельный. Я указал возможность влияния карантинных мер. Всё таки я не исключаю сезонность температуры и действительно интересна Ваша идея про круг общения. Стоит подумать как реализовать это в рамках компартментов.
Думаю, здесь работает совокупность факторов, поэтому получается примерно одно и то же время спада эпидемии по странам.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории