Жаль, нам неизвестно рспределение.
Я бы предположил немного другое распределение, как более вероятное. Каждый следующий в два раза меньше, чем предыдущий. То есть, первое место — х, второе — х/2, третье — х/4… Но это лишь предположения.
Да. Из них L сбылось. Но вероятность сбывшихся землетрясений близка к 1 (это я про статью).
Предположим, у нас есть точка, где трясёт постоянно — например, завод перфораторов. Добавляя эту точку в статистику, мы повышаем число правильных предсказаний.
По поводу архивных данных — это действительно могут быть накопленные данные — тогда я не прав. Но анализировать их смысла нет, до тех пор пока я не буду уверен, что это действительно прогноз, и что его никто не менял с момента предсказания.
Пусть присылают табличные данные (хоть с завтрашнего дня) — напишу статью-опровержение, если был не прав. Но именно прогнозные данные. Потмоу что на их сайте (и то, что они выкладывают в фейсбук) это только координаты, и сутки. Другой информации в открытом доступе нет.
Не, так не пойдёт =) Погноз — это информация, которую я получаю до события. То, что они написали сейчас про 15 сентября, это не прогноз.
Спросите их — если им будет интересно, я готов написать ещё одну статью, и публично опровергнуть мои выводы, сделанные здесь.
Для этого мне надо: заранее в течении нескольких дней давать прогноз в табличном виде. В прогнозе указывать прогнозируемое время (я приму интервал +-13 часов, но тогда сам прогноз должен даваться за 13 часов до события) Также сказать диапазон по координатам (например, 2 градуса, или 1 градус — любой диапазон, но он должен быть). Ещё можно сказать вероятность прогноза (если они хотят).
Если они вдруг согласятся — пишите в личку. Свяжемся, и я проведу такой анализ.
Автор прочитал. Но — цифры там можно нарисовать любые, поэтому автор доверяет лишь тем цифрам, которые может проверить сам. Проверить могу только недавние.
И да, повторю кратко идею статьи: выполните предсказания с учётом двух пунктов. Это произойдёт в таком-то диапазоне координат и в таком-то диапазоне времени, с такой-то вероятностью. Всё. Тогда это будет научный подход.
И я нигде не говорил, что надо предсказывать всё, это никак не влияет на точность.
Да, это действительно может быть — неслучайность выборки (а может и не быть, доказательств неслучайности тоже нет). Но я исходил из статей авторов — там ни слова не сказано о том, что точность предсказаний может зависить от дня в году.
Точность зависит, по их словам, от силы предсказнных землетрясений, и от точности метеоданных (у нас нет данных о том, что точность метеоданных зависит от конкретного дня, метеоспутнки летают равномерно). Так что моё предположение основано на их статьях.
Вероятность этой нулевой гипотезы оказалась меньше уровня значимости. В науке уровень значимости принимают обычно 5% или 1%. Если уровень значимости меньше, гипотеза считается опровергнутой.
Это было бы, если бы я рассматривал всю выборку данных. Тогда действительно, можно было бы предположить, что авторы нашли «антипризнак» — характерный признак отсутсвия событий.
Но я рассматриваю лишь частичную выборку из генеральной совокупности данных. Поэтому я лишь опровергаю нулевую гипотезу. В нашем случае нулевая гипотеза — это «вероятность успешного предсказания порядка 70%».
Но опровержение нулевой гипотезы не означает доказательство гипотезы, обратной нулевой (то есть гипотезу Pслуч>>Pпред надо доказывать отдельно). И для её доказательства нужна как раз генеральная совокупность, а не выборка.
Немного уточню: авторы рассматривают (скорее всего, так как в статьях я не нашел этих методов) вообще все события. На графике точности по координатам видно, что на этот график попадают события, находящиеся в 15 градусах от точки. Но всё-таки, исходя из графика, видно что большинство точек попадает в отклонение один градус (поэтому я и взял именно его).
Если бы я взял интервал в 15 градусов (который имеется на графике) то да, событий попало бы больше (собственно, четыре). Но тогда у нас была бы высокая вероятность случайного совпадения.
Насчёт времени — увы, на сайте такой информации нет, у меня есть из данных только дата.
Да, насчёт этого можно просто спросить у автора, и действительно, если будут таблицы (за вторую половину сентября) — я могу пересчитаь данныые. Более ранние трогать не хотелось бы — так как я не был свидетелем их появления.
То, что я делал — это оценочный анализ данных, и это не противоречит научному методу. Нас учили, что не имеет смысла вычислять точные данные, если оценочный анализ показывает несостоятельность гипотезы.
На примере: могут ли обезьяны случайно напечатать Шекспира за время человеческой жизни? Можно подсчитывать точное количество знаков в тексте, и подсчитать точную вероятность того, что это может произойти. А можно оценить её как заведомо меньшую одной миллиардной даже для одной страницы текста, и не проводить дальнейший анализ, посчитав это «практически невероятным». И это будет вполне научным методом.
Это не экстраполяция, это выборка из генеральной совокупности. Она мала — но с учётом большой разницы между ожидаемым и наблюдаемым значением она достаточна для оценочного анализа. Если бы совпадения были бы более значимыми, я бы не поленился оценить доверительный интервал для этой выборки.
Впрочем, если хотите — можете сделать это сами, все данные и методики открыты. Либо можете просто перевести предсказания (начиная с 15 сентября) в табличную форму и прислать мне — я проведу дополнительный анализ.
Я там табличные данные привёл, чуть ниже кратинок. Чтобы действительно было очевидно. Если из 13 предсказаний — предсказнием не является ни одно (вероятность меньше 8% при заявленной 70%), какой смысл тратить силы? Я проверил прогноз за 17 сентября — там та же картина. А чтобы проверить всё подробно — нужна таблица, автор не выкладывает данные в csv.
И да, предсказания я могу проверять только те, которые сделаны после 15 — так как я должен быть уверен в том, что это именно прогноз.
Лучшей антирекламы придумать сложно =) Спасибо за подтверждение, что положение дел в компании не меняется.
Я бы предположил немного другое распределение, как более вероятное. Каждый следующий в два раза меньше, чем предыдущий. То есть, первое место — х, второе — х/2, третье — х/4… Но это лишь предположения.
Предположим, у нас есть точка, где трясёт постоянно — например, завод перфораторов. Добавляя эту точку в статистику, мы повышаем число правильных предсказаний.
По поводу архивных данных — это действительно могут быть накопленные данные — тогда я не прав. Но анализировать их смысла нет, до тех пор пока я не буду уверен, что это действительно прогноз, и что его никто не менял с момента предсказания.
Спросите их — если им будет интересно, я готов написать ещё одну статью, и публично опровергнуть мои выводы, сделанные здесь.
Для этого мне надо: заранее в течении нескольких дней давать прогноз в табличном виде. В прогнозе указывать прогнозируемое время (я приму интервал +-13 часов, но тогда сам прогноз должен даваться за 13 часов до события) Также сказать диапазон по координатам (например, 2 градуса, или 1 градус — любой диапазон, но он должен быть). Ещё можно сказать вероятность прогноза (если они хотят).
Если они вдруг согласятся — пишите в личку. Свяжемся, и я проведу такой анализ.
.
Вот их картинка (в виде ссылки)
Выглядит красиво, верно? Вроде бы всё совпало?
А вот реальная картина за этот период:
Ссылка на google maps
Видно, что несовпасть оно просто не могло — в предсказанных районах трясёт постоянно.
И да, повторю кратко идею статьи: выполните предсказания с учётом двух пунктов. Это произойдёт в таком-то диапазоне координат и в таком-то диапазоне времени, с такой-то вероятностью. Всё. Тогда это будет научный подход.
И я нигде не говорил, что надо предсказывать всё, это никак не влияет на точность.
Точность зависит, по их словам, от силы предсказнных землетрясений, и от точности метеоданных (у нас нет данных о том, что точность метеоданных зависит от конкретного дня, метеоспутнки летают равномерно). Так что моё предположение основано на их статьях.
Я взял выборку из генеральной совокупности, и по ней опроверг нулевую гипотезу, которая состояла в том, что «вероятность успешного предсказания порядка 70%».
Вероятность этой нулевой гипотезы оказалась меньше уровня значимости. В науке уровень значимости принимают обычно 5% или 1%. Если уровень значимости меньше, гипотеза считается опровергнутой.
К чему именно из этого есть претензии?
Но я рассматриваю лишь частичную выборку из генеральной совокупности данных. Поэтому я лишь опровергаю нулевую гипотезу. В нашем случае нулевая гипотеза — это «вероятность успешного предсказания порядка 70%».
Но опровержение нулевой гипотезы не означает доказательство гипотезы, обратной нулевой (то есть гипотезу Pслуч>>Pпред надо доказывать отдельно). И для её доказательства нужна как раз генеральная совокупность, а не выборка.
Если бы я взял интервал в 15 градусов (который имеется на графике) то да, событий попало бы больше (собственно, четыре). Но тогда у нас была бы высокая вероятность случайного совпадения.
Насчёт времени — увы, на сайте такой информации нет, у меня есть из данных только дата.
Да, насчёт этого можно просто спросить у автора, и действительно, если будут таблицы (за вторую половину сентября) — я могу пересчитаь данныые. Более ранние трогать не хотелось бы — так как я не был свидетелем их появления.
На примере: могут ли обезьяны случайно напечатать Шекспира за время человеческой жизни? Можно подсчитывать точное количество знаков в тексте, и подсчитать точную вероятность того, что это может произойти. А можно оценить её как заведомо меньшую одной миллиардной даже для одной страницы текста, и не проводить дальнейший анализ, посчитав это «практически невероятным». И это будет вполне научным методом.
Впрочем, если хотите — можете сделать это сами, все данные и методики открыты. Либо можете просто перевести предсказания (начиная с 15 сентября) в табличную форму и прислать мне — я проведу дополнительный анализ.
И да, предсказания я могу проверять только те, которые сделаны после 15 — так как я должен быть уверен в том, что это именно прогноз.