Комментарии 123
Кажется у людей нервы сдают
Не могу поставить плюс, мне кто-то карму заминусил((
И не говори, Хабр в последнее время стал похож на набег школьников...
Некоторых людей жизнь ничему не учит.
Ок, раз вы все такие просвещённые, может расскажете за что люди просто жмакают минус, зачастую никак не аргументируя?
Конечно чтобы постов реально стало меньше нужно, чтобы это сделало 11 человек… да и понятие «дурацкости» у всех разное. Так что работает это не всегда правильно, но… основная идея в этом.
Собственно об этом написано прямо в документации: Карма — это ключевой инструмент внутрисайтового механизма коллективной модерации.
Это не оценка вашей личности. И не почётная грамота. А всего лишь оценка ваших статей и комментариев.
Вот я просмотрел ваши комментарии (статей пока нет) и вижу, что есть несколько интересных замечаний и куча «информационного мусора»… а его на Хабре не любят, так как и без того им весь интернет засран.
Спасибо за аргументированный ответ.
Первый адекватный за сегодня.
А статей нет, потому как особе некогда их писать, либо к к моменту написания она уже становится неактуальной к публикации.
Спасибо за аргументированный ответ.
Первый адекватный за сегодня.
А статей нет, потому как особе некогда их писать, либо к к моменту написания она уже становится неактуальной к публикации.
Соответствует.
Практическое применение отрицательного биномиального распределения и расчет доверительных интервалов в контексте стоящей на повестке дня темы.
Очень даже соответствует.
Но хочу сказать, что ваш анализ(как и попытки анализа у многих других людей) был бы замечательным, если бы он был медицинским.
В вашем случае вы совершаете ровно то же самое упрощение модели, что и авторы других исследований — вы отбрасываете возраст. А потом на основании этих упрощений делаете некие выводы.
В соседних темах я уже писал, что использовать данные о смертности на всем известном круизном лайнере нельзя, если мы только не говорим о возрастной категории 60++ (вернее даже 70+), ведь именно таков средний возраст пассажиров любого круизного лайнера (а все погибшие на нём возраста 70+).
Говоря о статистике смертности в Южной Корее, в большинстве случаев, никак не принимается во внимание тот факт, что большая часть заразившихся в ЮК — люди до 40 лет (преимущественно женщины). А в той же самой Италии — относительно пожилые люди. К слову именно поэтому по уровню смертности Италия обгоняет Китай.
Поэтому возраст заболевших и умерших это именно та часть модели, которую нельзя упрощать. Потому что в данном случае именно она и оказывает наибольшее влияние на протекание болезни в реальном мире.
Почему же нельзя упрощать-то? Простите, но без упрощения нельзя построить никакую модель. При отсутствии необходимых данных, ориентируемся на максимально ожидаемые. Я бы не стал для России делать скидку на то, что у нас доля пожилых меньше, чем в Италии. Тут, знаете ли, год за два считается. В том смысле, что наши шестидесятилетние по уровню здоровья и прочим параметрам едва ли имеют больше шансов, чем итальянские семидесятилетние. Но может быть и нет… К сожалению, мы это скоро узнаем с некоторой степенью достоверности.
Так что оценка летальности берётся, как правило, по нижней границе.
Нижняя граница по Китайским расчётам — 0.2%; по Корейским — 0% для возрастных групп 0-9, 10-19, 20-29 (если ничего не поменялось, справедливо для данных на конец прошлой недели). Максимальная летальность вируса, по Китайским данным, наблюдается у возрастной группы 80+ и для всех случаев составляет 14,8% (для подтверждённых случаев 21,9%). То есть разница почти на два порядка (или на два с лишним).
Почему же нельзя упрощать-то? Простите, но без упрощения нельзя построить никакую модель.
Я знаю, что без упрощений нельзя построить никакую модель, вернее её построение потребует увеличения необходимых ресурсов и поэтому не предлагаю учитывать потребление сигарет в Италии и Корее.
А вот упрощать то, что оказывает наибольшее влияние на результат — нельзя. Например, если не ошибаюсь, в Корее на 2213 заболевших возраста 20-29 лет приходится 0 смертей. В то время как в Италии, как я и говорил, пик заболевших пришёлся на возраст 70-79 лет.
Данные о смертности, впрочем, тоже известны.
Поэтому упрощая модель по возрасту вы делаете её абсолютно недостоверной. Со всеми вытекающими из этого проблемами.
P.s. Да, в том числе поэтому в Корее столь низкий процент смертности — там заразились, в основном, молодые. В каком-то плане это именно обычное везение, а не просто во время принятые меры и состояние системы здравоохранения.
OK, давайте возьмём за разумное допущение, что пока неизвестны дополнительные данные, передача болезни происходит равномерно по всем возрастам?
Давайте допустим.
взвешивая корейские данные на российские демографические пропорции
Так а корейские данные на какие возрастные группы? Ведь именно это важно. Упраздняя в статистике о проценте погибших возраст, вы делаете статистику «не статистикой». После этого она будет годна лишь для пресс-релизов. Я с этого и начал: мешать смертности разных возрастных категорий не стоит.
Проблема в том, что в Корее проверяли всех подряд, поэтому % зараженных в возрастных группах практически одинаков,
Нет, не всех подряд а тех, кто контактировал с зараженными в первую очередь. Так же как и в Китае
в Италии тестируют тяжелых с симптомами, которые преобладают в старшей возрастной группе
Нет, там так же тестируют тех, кто контактировал с зараженными. Просто более медленно.
И да, симптомы появляются у всех возрастных категорий. А вот осложнения — нет. В одном из прошлых постов меня поправили насчет бессимптомного течения болезни (я допускал, что оно есть). Так вот: на текущий момент болезнь практически не встречается в бессимптомной форме.
Ну и про не встречается в бессимптомной хотелось бы видеть источники и что считается за симптомы.
Не совсем так, в Италии на 86т тестов 21т зараженных, можно сделать выводы кого они тестируют.
Можно: больных и тех, кто с ними контактировал, по-моему это очевидно из цифр :)
Так же и в Корее, просто там круг контактов устанавливается лучше в том числе благодаря треккингу сотовых телефонов по вышкам, например.
Ну и про не встречается в бессимптомной хотелось бы видеть источники и что считается за симптомы.
По данным WHO в Китае полученных на основании данных массового скрининга на вирус (примерно 320 тысяч человек) менее 1% доказанных случаев заражения протекают бессимптомно. Причем из этих 1% у более 75% симптомы развились уже после тестирования.
За симптомы считается проявление любых симптомов ОРВИ, специфичных для COVID 19. То есть это не «пневмония + ИВЛ», если вы об этом.
По поводу бессимптомности не все так просто.
Для Кореи написано, что не только тех кто с симптомами.
И тех, кто с ними контактировал)
Ни одна страна мира сейчас не в состоянии проверять просто так всех подряд. Вернее в состоянии, но это займет больше года. Поэтому проверяют тех, кто в группе риска. А это те, у кого симптомы ОРВИ и те, кто контактировал с подтверждёнными больными.
По поводу бессимптомности не все так просто.
Да всё очень даже просто:
But it appears that a Massachusetts coronavirus cluster with at least 82 cases was started by people who were not yet showing symptoms, and more than half a dozen studies have shown that people without symptoms are causing substantial amounts of infection.
И
«Some spread might be possible before people show symptoms; there have been reports of this occurring with this new coronavirus, but this is not thought to be the main way the virus spreads,» according to the website.
На мой взгляд статья абсолютно очевидна: человек становится заразным до того, как у него могут появится симптомы, но при этом это не означает что симптомы у него не появятся в будущем. Поэтому более 99% переносчиков окажется в группе с симптомами и в это время будет отправлено на диагностику.
в Корее проверяли всех подряд, поэтому % зараженных в возрастных группах практически одинаковЯ чего-то не понимаю? У вас на графике на одну из девяти групп (20-29) приходится треть всех случаев, как вы это называете «% заражённых практически одинаков»?
А где вы смотрите за что минусы ставят? Нигде не мог найти ни разу...
Я видел новость. Только я за эти месяцы раз 5 облазил весь личный кабинет, и нигде не нашел этой информации. Всё, что есть: вот такая статистика
Не, мож я слепой, но — не нашел. Поэтому был бы рад получить информацию, где это можно найти.
Кто-то поставил минус монадам за «много рекламы». Очень интересно)
Если мы считаем истинной летальностью вируса 1%, то 1 заболевший даёт нам указание, что мы с 95% вероятностью можем сказать, что общее количество заболевших не менее 6 по состоянию на две недели до момента смерти, если мы считаем, что болезнь достигает летального исхода за 14 дней. Это — нижняя оценка. Автор ориентируется не на нижнюю, а на среднюю, и я не вижу, почему бы ему на неё не ориентироваться. Вот если бы он на верхнюю ориентировался, то получалось бы, что один умерший — это триста выздоровевших…
То, что там дальше — вообще расчётами называть нельзя, не заслуживает такого громкого слова. Вот например:
Мы приблизительно знаем, сколько в среднем требуется времени, чтобы погибнуть с момента получения вируса — это 17,3 дня.Открываем ссылочку, а там 17.3 встречается только в одной таблице и это… максимальное (upper bound) время от попадания в госпиталь до выписки (Time from hospitalization to discharge) по китайским данным. То есть, это и не среднее, и не от заражения, и не до смерти.
17.3 дня там получилось иначе. В данных есть раздел Time from symptom onset to death, там приведено четыре оценки примерно одинакового качества. Если их усреднить, как раз получается 17.3. Косяк автора, что он этот нюанс опустил… А может и не косяк, если каждый шаг разжёвывать, он был бы раза в четыре больше.
Мы имеем три разные оценки одного и того же параметра генеральной совокупности. Это не три средних трёх выборок, которые нужно сложить в одну выборку и получить такую вот мегасупероценку. Это три независимых исследования, в которых получены разные оценки.
Смотрите, что происходит. Допустим у нас есть пять иследователей в пяти точках земного шара, каждый из которых купил градусник на Али. Первый измерил температуру здоровых австралийских женщин 100 случаев и получил среднее 36.62. Второй измерил температуру случайной выборки людей старше 18 лет 200 случаев и получил 36.7, третий измерил температуру случайной выборки школьников 200 раз и получил 36.45, четвёртый исследовал неизвестно кого 400 раз и получил 36.8. Наконец, было ещё одно исследование со случайной выборкой здоровых людей в Германии, где было изучено 1300 человек и получена средняя температура 37.8.
Примерно с такими данными приходится иметь дело, когда делаешь какой-то метаанализ. Что-то ты выкидываешь, как заведомо некачественное и не относящееся к вопросу, что-то оставляешь. Но ты всегда должен предполагать, что у кого-то был сломанный китайский градусник. :-)
Иногда вообще неизвестно, какого размера была выборка, которая привела к какому-то показателю. Но всё равно эти данные, которые стоит как-то учесть, если в принципе данных очень мало и они разнородны.
Мы имеем три разные оценки одного и того же параметра генеральной совокупности. Это не три средних трёх выборок, которые нужно сложить в одну выборку и получить такую вот мегасупероценку. Это три независимых исследования, в которых получены разные оценки.Вы так пишете, будто никогда не слышали про статистическую мощность, effect size и вообще курса статистики у вас не было.
Кстати, если открыть первую же попавшуюся ссылку на источник у этой таблицы, то и числа в таблице непонятно, откуда взяты, т.к. в вот этой, скажем, статье, приведённой как источник к первой строке таблицы, таких чисел тоже нет. В ней написано «time from illness onset to death with a mean of 19.9days (95% CI: 14.9, 29.0)», а в таблице автора — 15,2.
приведете еще один параметр, не буду говорить какойТипичное «я прав, а вы нет, объяснять не буду, вы сами это и докажите».
При величине погрешности больше самой измеряемой величины смысла в измерении нет никакого от слова совсем. Метрология же — погрешность не может быть больше половины величины последнего значимого разряда, соответственно, тут все разряды незначимые.Все эти заученные из школы мантры действуют только для последовательных измерений постоянной величины, отклонения измерений которой подчиняются нормальному распределению.
То есть для очень узкого класса задач, которые не имеют ничего общего с описанным в статье.
Если у нас 10 надежно подтвержденных случаев заражения, но у нас есть смутная догадка, что их может быть в 10 раз больше, какая у нас «погрешность»? 1000%?
Означает ли это, что значение 10 теряет всякий смысл? Нет, у нас все еще есть достоверная нижняя оценка числа заболевших, из которой мы можем выводить конструктивные суждения, что и делается в статье.
Вообще какие-то странные вещи делаются, если на примере пояснить, то изготовили мы 100 деталей, одна вышла с браком, принимаем уровень брака в 1%, выпускается ещё 10 000 деталей, ты находим там всего 5 бракованых, и на этом основании делаем далеко идущий вывод, что ещё 95 бракованых мы не заметили.
Отрицательное биноминальное распределение описывает количество не-успехов для завершенных испытаний Бернулли, у которых есть только два возможных исхода – в нашем случае это либо летальный исход, либо выздоровление.
Таким образом, 3 летальных исхода при 1% летальности сообщает нам лишь о том, что было «завершено» около 300 испытаний, и следует ожидать что в нашей популяции есть 297 выздоровевших. Но мы ничего не знаем о незавершенных испытаниях, по-этому количество заразившихся может быть гораздо больше.
Приведу пример. Допустим одновременно заразилось X человек, и никакого дальнейшего распространения не происходит. Через неделю умирает один человек. Чему равно значение X? На основании ваших рассуждений мы можем лишь утверждать, что при летальности 1% в конечном итоге 99 человек из этих X будут здоровы. Но эта информация не дает нам никакой возможности оценить X, ведь вполне может быть что на следующий день умрет еще 10, и наша оценка увеличится в 10 раз.
Чтобы оценить X нужно дождаться пока все заболевшие определятся со своим статусом – либо умрут, либо выздоровеют.
Если у нас бурный рост количества заболевших, то среди умерших в день X мы имеем некоторое количество заразившихся не 17 дней назад, а 16 или 15 дней, а может и 10 дней назад.А еще среди умерших в день X мы имеем некоторое количество заразившихся не 17 дней назад, а 18 или 19 дней, а может и 24 дня назад.
Таким образом, в ситуации быстрого роста количества заболевших такой обратный расчёт может приводить к завышенным оценкам распространённости заболевания.Не приводит, потому что мы рассматриваем только завершенные эксперименты, а значит все они должны были начаться какое-то время назад. Все те, кто заразился позже, не принимают участия в ваших расчетах, потому что из их выборки еще никто не успел умереть.
Правда, это рассуждение конструктивно только если мы принимаем истинным тот факт, что болезнь развивается продолжительный промежуток времени, и ситуация когда от заражения до смерти проходит всего неделя маловероятна.
К тому же, если я правильно понимаю, 17 дней – это оценка интервала от первых симптомов до смерти, а не от момента заражения до смерти, то есть без учета времени инкубации, так что конечная оценка скорее всего занижена.
Я просто полдня читал комменты неверующих, там в основном повторяется два типа аргументов — автор не вирусолог и "так нельзя". Вот выше как раз Chamie пишет что-то про то, что нельзя делать выводы, когда величина меньше погрешности (о какой величине речь, умалчивается). Это вот тот самый аргумент.
когда величина меньше погрешности (о какой величине речь, умалчивается)Вы серьёзно вот это? Величина смертности/летальности, вот та самая, которая там оценивалась в 33%. Где в моём комментарии это неясно написано?
Но пример с орлами и монетками не очень интуитивен. Представьте себе некий аппарат, выстреливающий шариками со случайной вероятностью 80% белых, 20% чёрных. Из этого аппарата сделано НЕИЗВЕСТНОЕ количество выстрелов в ящик. Вы вынимаете из ящика два шара и они оказываются чёрными. Какова вероятность того, что ящик после этого не пустой?
Трое умерших означают только то, что не менее трёх человек заболели (при условии, что на вскрытии ничего не напутали с диагнозом). А заболеваемость можно оценить только по результатам тестов в репрезентативной выборке, как для живых людей, так и для мёртвых. Если речь идёт про коронавирус, то исключительно биохимических тестов, так как симптоматически этот диагноз не выделяется из других ОРВИ.
Да, переменная. Но можно же использовать какие-то оценки летальности. Если мы принимаем, что летальность не выше определенного значения, то трое умерших дают нам оценку числа заболевших с высокой степенью достоверности большую, чпм три. Об этом собственно впсь мой текст, нет?
На мой взгдяд, ваш текст основан на порочном круге в рассуждениях. Когда вы априорно присваиваете значению летальности, полученному на малой выборке или на нерепрезентативных данных, низкую погрешность (а у вас вообще написано: “допустим, что нам известна летальность”), то из этого можно вывести низкую погрешность всего остального.
Летальность — это отношение умерших к выздоровевшим, а не к заболевшим.
Только ленивый не пишет про вирус.
Хайп такое дело.
Возможно ли сжать общий вывод до 2 битов?
- Все это шумиха, коммерция, скоро пройдёт и забудем
- Все не так плохо, как везде говорят
- Все даже хуже, чем пугают
- Катастрофа.
Тогда какой смысл в карантине? Не как в кино, когда в лесу есть скрытый бункер и там запас еды на 3 года, а обычная квартира, иногда кто-то приходит неизбежно, иногда (ну хоть раз в неделю) надо самому выйти.
Сидеть дома несколько лет — невозможно. Неужели выходит, что заражение неизбежно? (кончится ящик тушенки — пойду за другим, там продавщица на которую полгорода чихало). Реально возможный карантин только позволяет мне отложить дату заражения?
Но небольшой процент от большого числа превращается в большое число, а аппаратов ограниченное количество, не расчитанное на такие ситуации. Что и случилось в Италии, где смертность растет, т.к. нет возможности оказать помощь всем.
Поэтому смысл состоит в уменьшении количества заболевших и растягивании их во времени, чтобы им могла быть оказана помощь.
Поэтому смысл состоит в уменьшении количества заболевших
… в единицу времени.
Как и туберкулёзомДа, туберкулёзом и многими другими болезнями многие большинство никогда не болело. Кто-то в силу климата, кто-то из-за прививок. А вот сто миллионов на планете, населённой семью миллиардами, то есть, если примерно один из семидесяти жителей Земли ни разу за свою жизнь не болел гриппом — то это как раз и будет «практически все на планете гриппом переболели.
Например, мой второй ребёнок, проживший, в 1983 году, чуть больше суток, никогда не болел, и больше никогда не заболеет гриппом. Почему вы считаете, что это повод для оптимизма?
С точки зрения интересов вируса, наиболее эффективным является лёгкое течение заболевания, когда люди распространяют вирус незаметно для себя, т.е. не лечась (если вообще человек не является терминальной ветвью жизненного цикла вируса, куда он попал от летучих мышей по ошибке). Поэтому эволюционный отбор вирусов идёт в сторону уменьшения патогенности. А так как эволюция у микроорганизмов идёт очень быстро, то в короткие сроки патогенность вируса снизится до эволюционно обоснованных величин.
Выздоровевшие-то в Италии есть, просто много из них — это легкие случаи, которых в больницу не кладут (даже если это пневмония — но без симптомов явной недостаточности)…
Большинство болеющих и выздоровевших не учтено. Нет столько тестов, чтобы определить каким вирусом болеют большинство людей. Вся статистика только от тех, кто обратился за помощью. Остальная большая масса не учтена.
По роду своей деятельности, каждый день, я нахожусь в контакте с парамедиками в многомиллионном городе. Чрезвычайное положение в городе уже объявлено. Уже выявляют короновирус среди мед. персонала, «для галочки». Потому, что отследить кто был контакте с заболевшими до выявления у них этого вируса — невозможно. Остальной мед. персонал ходит на работу и возможно проявляется у них этот вирус как обыкновенная простуда. Никто из них специально тесты не делает.
Так что, в реальности — это обыкновенное тяжёлое ОРВИ, которое появляется раз в 15-20 лет. Если сравнить продолжительность жизни сейчас и 20-30 лет назад, то она увеличилась. Однако вирус может её отбросить назад.
www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/Imperial-College-COVID19-NPI-modelling-16-03-2020.pdf
Доверительный интервал для числа заболевших коронавирусом (расчёт по летальности)