Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Ввиду явного несоответствия двух картинок – предсказанных и фактических землетрясений, дальнейший анализ проводить не вижу смысла, можно переходит к выводам.
Краткий анализ качества наших прогнозов землетрясений с оправдываемостью около 70% (точно 69.8% )
Она [выборка] мала — но с учётом большой разницы между ожидаемым и наблюдаемым значением она достаточнаВо-первых, это не объясняет, почему она мала (т.е., фактически, время там отсутствует как степень свободы). Во-вторых, доверять или нет
один из 200.000это, пока что, личное дело каждого. Кроме того, лично вы в самой статье никаких оценок не проводили (спасибо LeonidI). Вы даже толком не опровергли ни это
Из 1118 прогнозов 978 случаев оправдались в тот день, на который они прогнозировалисьни это:
Успешность данных прогнозов составляет около 70 – 80 %.
Для оценки было взято 15 сентября 2016 года
Да, это действительно может быть — неслучайность выборкиЗа что я люблю специалистов по теорверу — так это за такие фразы. Ну действительно, существует вероятность того, что все, что гипотетический я написал — ложь. Бывает с каждым, это же теория вероятности. Главное — сильно не углубляться и считать все случайным.
а может и не быть, доказательств неслучайности тоже нетТам в википедии вторым пунктом идет «извлечь из таблицы случайных чисел столько чисел, сколько нам требуется выборочных единиц». Давайте сюда вашу таблицу, мы все над ней посмеемся. Хоть какой-то прок будет.
Но я исходил из статей авторов — там ни слова не сказано о том, что точность предсказаний может зависить от дня в году.Тут я вижу определенное непонимание. Точность — да, не зависит. Было бы глупо если бы она заведомо зависела — мы бы тогда использовали этот факт и улучшили бы наш прогноз. А вот сами события — зависят от дня в году. У вас есть сомнения? Вы же сами пишете в статье о том, что в (42.82, 13.19) уже неделю как трясёт. Ну давайте, продемонстрируйте свои умения в счете и оцените вероятность того, что случайное пространственно-временное пятно размером 100x100 квадратных км на один день образует последовательность из 9 элементов.
Аналогом будет то, что если какое-то утверждение справедливо для млекопитающих, то оно должно быть справедливо для кошек.Утверждение: с вероятностью в 1% случайно выбранное животное является собакой.
Утверждение: с вероятностью в 1% случайно выбранное животное является собакой.
Подразумеваются утверждения, для которых сужение данных не существенно.Сформулируйте полностью: такие утверждения верны и для «суженных данных»? Если A=B то B=A? В чем мудрость-то?
Для работы автора этой статьи достаточно, чтобы предсказания в рамках одного дня были независимыми, или близкими к этому.Это просто неправда. Предсказания в рамках одного дня основаны на одних и тех же данных:
данных по атмосфере, геодезическим показателям и геомагнитнымПогода, к примеру, вполне себе коррелирует на расстояниях масштаба всей планеты тем более в один и тот же день. Любая производная этих данных тоже будет коррелировать.
Сформулируйте полностью: такие утверждения верны и для «суженных данных»? Если A=B то B=A? В чем мудрость-то?
Погода, к примеру, вполне себе коррелирует на расстояниях масштаба всей планеты тем более в один и тот же день. Любая производная этих данных тоже будет коррелировать.
Но, опять же, дело не в этом. :) Дело в том что -->статистическая выборка не случайна<--. Ведь нам могли бы дать предсказания в виде черной коробки, без каких-либо объяснений. И чтобы проверить качество коробки мы заботимся именно о том, что наш тестовый набор не имеет корреляций.
Если В подмножество А, то факт верный для всех элементов из А, будет верен и для В.Угу, но у нас другое: мы, пока что, знаем, что факт верен для элементов из B. Верен ли он для элеметнов из A? (уже готовлю попкорн).
корреляция даже в 5%-10% принципиально общую картину не изменит, а больше вряд ли может бытьУгу, там в Италии 9 дней подряд трясло а потом внезапно перестало. Давайте сюда расчеты ваших процентов.
Угу, но у нас другое: мы, пока что, знаем, что факт верен для элементов из B. Верен ли он для элеметнов из A? (уже готовлю попкорн).
Угу, там в Италии 9 дней подряд трясло а потом внезапно перестало. Давайте сюда расчеты ваших процентов.
Это не случайные и не независимые события.Землетрясения-то?
Землетрясения случаются в сейсмоопасных зонах и могут длится неделями, как показал автор статьи.Это ошибка игрока. Автор ошибся скорее в этом, чем в своих выводах по статье, в целом.
Если где-то трясет 5 дней подряд, то на вероятность того, что будет трясти завтра, это никак не влияетВ общем, я так не считаю. Давайте посмотрим на эту же Италию в 2014 году: тыц. Одиночные землетрясения несколько раз в месяц. Теперь так: тыц. Огромный кластер с земелтрясеними до 15 числа. В вашем предположении о независимости событий получить обе таких выборки при постоянной вероятности землетрясения маловероятно.
Опишем предсказываемое событие, ограничив его временным и пространственным интервалом.P.S. уже обсуждается выше в ветке.
поэтому учитывать все землетрясения за сутки смысла нет. И статистика «оправдываемости» считается по-другому.Так в статье не говорится же «было N землятресений, из них M предсказано» — там как раз и написано «было предсказано K, из них L сбылось». Или я что-то не так понимаю?
Как делать научные предсказания