Привет, Хабр.
На связи Институт междисциплинарных медицинских исследований ЕУСПб. Мы провели первое в стране независимое исследование эффективности вакцины Gam-COVID-Vac. Хабр уже видел пост на эту тему от редакции площадки и дискуссию, которая началась после. Пока наше исследование на рецензии, предлагаем обсудить препринт.
К вакцинам против COVID-19 относятся скептически – об этом говорит, например, статистика вакцинации в России. Согласно Our World in Data, доля вакцинированных сограждан ниже среднемирового уровня. Кажется, что одна из причин недоверия – отсутствие независимых исследований, которые доказывали бы, что вакцины работают (или не работают). Мы получили данные, которые позволили нам оценить, насколько эффективно Gam-COVID-Vac защищает от тяжелого течения COVID-19.
Источник: Our World in Data
Кратко: мы взяли данные о петербуржцах, попавших в сортировочные центры с симптомами и подтвержденным COVID-19; посмотрели, сколько из них вакцинированы, сколько из привитых госпитализированы/ лечились дома, какова степень поражения легких. Оказалось, что людей с COVID-19, привитых «Спутником V», реже госпитализируют. По нашим подсчетам, эффективность вакцинации составляет 81%, а вероятность тяжелого течения болезни снижается в 5 раз.
Немного о дизайне – это наблюдательное неинтервенционное случай-контроль исследование. То есть мы не говорили участникам, что им нужно делать, а только изучали данные о пациентах. Мы наблюдали, как развивается ситуация в «дикой природе» – смотрели, что происходит со случайными людьми, а не отобранными добровольцами, а также изучали эффективность вакцинации против Дельта-штамма, распространенного во время проведения исследования (с 3 июля по 9 августа 2021 года).
Источник: Данные таксаметра исследователя Георгия Базыкина. Проект объединяет данные о вариантах мутаций SARS-CoV-2 в разных регионах России. Дельта-вариант обозначен красным цветом.
«Случай-контроль» значит, что мы сравнивали людей из нашей выборки: те, что были госпитализированы, оказались в группе «случаев», а пациенты, отправленные домой под амбулаторное наблюдение, стали контрольной группой. ВОЗ рекомендует «случай-контроль» исследования как раз для того, чтобы оценивать эффективность вакцинации против COVID-19 в естественных условиях.
Обычно пары «случаев» и «контролей» подбирают так, чтобы участники имели приблизительно одинаковые рост, вес, социальное положение, сопутствующие заболевания, привычки. Мы были ограничены параметрами, которые определили сортировочные центры. То есть не могли подобрать для каждого госпитализированного человека его двойника из контрольной группы.
Наконец, это ретроспективное исследование – начинается уже после заболевания и госпитализации и изучает возможные факторы, действовавшие в прошлом.
Вакцинированные часто старше невакцинированных. Это ожидаемо: пожилые люди в группе риска, среди них больше тех, кто регулярно обращается к врачу и, соответственно, мог получить рекомендацию вакцинироваться. Пожилые нередко тяжелее переносят болезнь из-за сопутствующих хронических заболеваний. В этом смысле важно оценить защитный эффект вакцинации для людей старшего возраста.
Какие данные мы использовали
Данные мы получили от соавторов из Медицинского института имени Березина Сергея (МИБС). Это частное медицинское учреждение, которое во время пандемии оказывает медицинскую помощь населению половины районов города по соглашению с правительством Санкт-Петербурга.
Пациенты с симптомами и подтвержденным ПЦР на SARS-CoV-2 направлялись на амбулаторную сортировку в МИБС. Сортировка включала краткий осмотр, пульсоксиметрию — измерение уровня кислорода в крови, и низкодозную компьютерную томографию легких (НДКТ). Пациентов спрашивали, прививались ли они от COVID-19, завершили ли курс вакцинации. Решение о госпитализации врач принимал на основе симптомов, например одышки, гипоксии, а также общего состояния пациента и повреждения легких по данным НДКТ.
Нас интересовало влияние прививки на госпитализацию, поэтому очевидная и первоочередная зависимая переменная – факт госпитализации (бинарная переменная: 0 или 1).
Второй целью было проверить, защищает ли вакцинация от поражения легких. Здесь мы смотрели на результаты компьютерной томографии и пульсоксиметрии.
Компьютерная томография. Согласно данным НДКТ, можно выделить 5 градаций поражения лёгких — от 0 до 4: 0, <25%, 25–50%, 50–75%, 75–100%.
Оценки 3 и 4 – поражение более 50% объема легких – часто используют в качестве показания для госпитализации. Пациентов с баллом менее 3 при отсутствии серьезных симптомов обычно наблюдают амбулаторно.
Пульсоксиметрия. Насыщение крови кислородом (SpO2) тоже характеризует работу легких. У здорового человека SpO2 стремится к 100%. Мы сгруппировали значения насыщения кислородом в диапазоны по шкале NEWS2 (National Early Warning Score), которая была разработана и опробована еще до пандемии. Она имеет четыре градации (0-3), которые соответствуют категориям: > 95, 94–95, 92–93, <92.
Другие независимые переменные (факторы, которые влияют на исход) – статус вакцинации, пол и возраст, сортировочный центр.
Кого мы считали привитыми? Все наблюдения мы разделили на три категории:
вакцинированные полностью – сделали вторую прививку по крайней мере за 14 дней до направления на сортировку.
вакцинированные частично – сделали две или одну прививку меньше чем за 14 дней до сортировки.
невакцинированные.
На момент исследования в Санкт-Петербурге были доступны три вакцины. Встал вопрос, эффект каких из них мы пытаемся поймать. Однако оказалось, что официальные органы не публикуют статистику по вакцинации с разбивкой по вакцинам. Но нам повезло. Незадолго до даты начала наблюдения депутат петербургского ЗакСобрания Борис Лазаревич Вишневский направил депутатский запрос в комитет по здравоохранению и затем опубликовал полученный ответ. Благодаря официальному ответу на этот запрос мы знаем, что большинство вакцинированных жителей Санкт-Петербурга были привиты «Спутником V».
Источник: телеграм-канал Бориса Вишневского
Данные поступили к нам из двух сортировочных пунктов МИБС, и мы добавили соответствующую переменную, чтобы учесть потенциальный эффект от разных медицинских команд или разницу в оборудовании.
Конечно, мы бы хотели иметь более детальную картину, тем более ВОЗ рекомендует собрать больше информации об отдельных пациентах: рост, вес, социальный статус (работает, не работает, пенсионер), сопутствующие патологии. Другими интересными данными могли бы быть, например, дни рождения. Как показало американское исследование, люди не готовы откладывать празднование дня рождения даже под угрозой заболевания – в семьях, недавно отметивших день рождения домочадца, чаще ставят диагноз COVID-19.
Но сортировка больных – это напряженный процесс, где тяжело и медицинскому работнику, и пациентам. Собирать дополнительную информацию в таких условиях довольно сложно.
Как мы считали
Основной инструмент нашего исследования – логистическая регрессия. Эту модель используют для решения задач классификации. Нас, правда, интересовало не столько предсказание класса, сколько тот вес, с которым рассматриваемый признак участвует в предсказании.
В медицинских исследованиях чаще всего вклад признака формулируют в виде относительного риска (RR) или отношения шансов (OR). Наверное, относительный риск более интуитивно понятен – это отношение риска госпитализации получивших препарат к риску госпитализации среди тех, кто получил плацебо. Но для дизайна «случай-контроль» относительный риск не рассчитать. Так как госпитализация с ковидом – это довольно редкое событие (например в нашей выборке госпитализированы примерно 500 человек из 14 тысяч – меньше 4%), нас выручает допущение о редкости заболевания rare disease assumption – с уменьшением количества случаев «заболевания» значение относительного риска стремится к значению отношения шансов.
Мы использовали безусловную логистическую регрессию для наших первичных и вторичных исходов, чтобы оценить отношение шансов (OR) для статуса вакцинации среди случаев и контрольной группы, что приблизительно соответствует OR для исходов (госпитализация, различные уровни поражения легких и снижение насыщения кислородом) среди вакцинированных и невакцинированных пациентов. Показатель эффективности рассчитывался как 100% × (1-OR) с поправкой на возраст, пол и центр сортировки.
В анализе чувствительности для полного статуса вакцинации мы разделили период после второй дозы на два периода: 14–55 дней и 56 и более дней. Наконец, мы исследовали взаимосвязь между госпитализацией и сплайном возраста пациента по статусу вакцинации в полупараметрической логистической регрессии.
Полупараметрические методы позволяют (если все их предположения удовлетворяются) оптимальным образом достичь компромисса между смещением и дисперсией (bias-variance tradeoff). Если в нашей модели будет много возрастных групп (с шагом в 2 года, например), то мы получим несмещенную оценку зависимости госпитализации от вакцинации в этих возрастных группах, но дисперсия этой оценки будет настолько большой, а доверительные интервалы – настолько широкими, что никаких выводов мы сделать не сможем. Напротив, если мы возьмем очень крупные возрастные группы (скажем, всего две: старше 65 лет и младше), у нас будет небольшая дисперсия оценки средней вероятности госпитализации, но заметная смещенность этой средней.
Вероятность госпитализации в зависимости от возраста и статуса вакцинации.
UPD: тут был неверный график. Загрузили правильный, спасибо внимательным читателям!
Скорее всего, вы когда-то писали курсовую – цитировали статьи, использовали статистику. Если в вашем списке литературы стояли url этих документов – с высокой вероятностью как минимум половина ссылок уже не рабочая. Журнал поменял домен, а сайт статистики решил поменять структуру и не сделал перенаправления. Нам было важно, чтобы исходные данные не потерялись и все, кто хочет, могли воспроизвести нашу работу, поэтому мы разместили исследование (препринт, код и данные) в открытом доступе.