Есть более точные науки и менее точные. Вы приводите точные науки, где p может быть в тысячу раз меньше, чем 0.05. Но это ещё пол беды. В медико-биологических науках некоторые модели зависят от большого количества параметров, котрые сложно или невозможно контролировать и они меняются от команды к команде, от эксперимента к эксперименту. Чтобы получить среднее - нужно оч много исследований и денег и контроля. Это и есть тот самый dimentionalty curse и от него никуда не деться.
Позвольте объяснить, слово "по определению" здесь не катит. Есть модель того как появляются данные - это и есть "Дано", из чего мы и исходим. Далее идёт оптимизация MLE в ходе которой, они очевидно, зависят друг от друга.
Возьмите третий член и найдите производные по w0 и w1. Приравняйте к нулю. Получите зависимость w0 от w1.
Помню эту задачку, только в учебнике она наоборот была. Нужно было найти точную формулу расчёта мат ожидания параметров, если даны x1,...xn и t1...tn.
Поскольку максимальный член -квадратичен, это имеет точное решение через Лапласа.
Если берём неправильный праер, равный 1, то E[teta|data] совпадает с teta argmax - это формула линейной регрессии. Но в чуть более общем случае нужно немного поковыряться с Гессианом, ТС слишком легко отделался...
Ладно. Если что, могу сфотать записи - там всё подробно расписано и по-порядку. Я вообще хоббист больше в плане Баесовской статистики, но имею более-менее представление о ней. Может, конда-нибудь буду проф связан.
Тут две задачи можно рассматривать. Сравнение, что bias влево vs вправо и вторая задача biased coin vs нет.
Можно построить P ( P(D|H1)/P(D|H0)<3|N). Оказалось, что даже это не просто и я сдался - сделал это через Монте-Карло и построил графики (кстати красивые)
Мы получили вероятность того, что на шаге N у нас будет "подтверждённая гипотеза 1".
Дальше запал угас, но логика подсказывает, что для второй задачи вряд ли это возможно ( H0 более вероятна почти для всех параметров в плане меры Лебега и выходит сложная зависимость от N). А вторую задачу можно как-то атаковать с того угла, что раз гипотеза подтвердилась, скорее всего она уже не поменяется. Значит, есть недооценка, её нужно как-то оценить.
Прошу прощения, я иногда лчень сумбурно пишу. И мой комментарий был именно сумбуреым. Я хотел сказать, что испытываю некоторый скептицизм по поводу последовательного анализа в том виде в котором я сейчас прочитал.
Остановка. Первая проблема в том, что Допустим мы пока что собрали N точек. И после получения каждой новой точки нетерпеливый статистик считает максимум лайклихуд и постериор параметров. И в какой-то момент, если данные об успешности эксперимента перевешивают - эксперимент останавливают. А какой такой критерий есть в Байесовской статистике? Тут их нет и это суть скептицизма. А дальше мысль: Мы сделали N бросков, мы получили распределение. Точнее самую лучшую версию того что можно было вывести (если наша модель верна).
И тут, что я хотел сказать, что если у нас есть какой-то искусственный рубеж на который мы ориентируемся - то несложно посчитать bias через использование экспоненциального распределения. Но сейчас, я думаю, что тут по-другому решается. Давайте так, и я и Вы попробуем не подглядывая в интернет, аналитически прийти к тому, как можно смоделировать этот bias ранней остановки в эксперименте бросания biased монетки и завтра поделиться вычислениями? У меня уже пара идей, но ... работа.
У меня тоже есть мысль, что когда-нибудь сяду за создание игры (может, и никогда). Я потратил какое-то время в Godot просто узнавая движок и пытаясь собрать вертикальную ... даже не демку, а срез игры, схватывающий стилистику. И я понял, что лучший вариант для того что я хотел - это анимация + 2д рендер 3д анимации.
У 2д намного проще создать приносящий удовольствие, не бесючий геймплей с очень чётким и точным управлением. Хотя, есть пример отличной игры, сделанной в 3д с закосом под 2д. Например (сам не играл, посмотрел видео), Дибло 2 ремастер. Но что-то мне подсказывает, что там 3д модели очень дорогие, сделанные профессионально, максимально оптимизированные и с кучей дополнительного шаманства.
Игры - это такое же искусство, как литература, живопись и пр. Есть те, кто пытаются быть на гребне популярности и создают продукт для максимально большой аудитории. А есть те, кто пытается выразить в этой среде что-то важное - в первую очередь для себя.
А если команда большая и деньги чужие, то автор уже не имеет права быть просто автором, он должен думать о хлебе с маслом и о завязанных на него трудовых отношениях. И искусство тут уходит.
Уравнение Баеса содержит в себе абсолютно все данные, которые только могут быть. А соотнощение правдоподобий достаточно для сравнения двух гипотез. Это фундаментально как 2+2, как подсчёт предметов, как термодинамика, как вообще можно сомневаться в этом?
А научный метод - это просто эвристика. Нет ничего фундаментального в научном принципе. Но с другой стороны, эвристика хорошая. Что касается последовательного анализа, то с помощью уранения Баеса и экспоненциального распределения, должно быть несложно смоделировать bias последовательного анализа, связанный с ранней остановкой.
Ну вот у Вас корректно поставленная задача на комбинаторику. У меня вышло, что вероятность выбрать топового жениха равна
,
где к - это точка после которой берём жениха.
Дальше считать было лень (хотя, признаюсь, не очень внимательно считал, мог ошибиться). Но это в вашей трактовке. А если её привязывать к той, что в посте, в месте, где женихи произвольно выбирают себе число из R - это всё же какая-то магия. И именно она даёт налёт неопределённости, спорности и разных трактовок задаче.
Если по условию задачи, данные по принцам - это iid, то есть независимые, одинаково распределённые случайные переменные, то возникает проблема.
Не существует произвольно случайного распределения. Это какое-то конкретное распределение. По условию задачи, мы не знаем какое. Но оно не может быть неограниченно любым: у pdf есть ограничения в определении. Результирует это в то, что нужно заранее определиться какие распределегия мы рассматриваем. А от этого будет зависеть оптимальная стратегия.
Например, в реальной жизни, лучше принца может быть десяток человек на Земле, и учитывая мат ожидание в два бомжа + принц, поделить на 3 - шанс в них попасть ничтожный.
Если вы хотите взять Бога, и инопланетян и прочее и прочее - по сути, взять неограниченное число кандидатов - вам придётся определить pdf таким образом, чтобы её интеграл сходился. Вот когда каким-то конкретным образом это сделаете, тогда будет еще одна другая, но конкретная задача.
В задаче есть ряд семантических подвохов из-за чего может сложиться ощущение, что она переносится на реальную жизнь. И введение цифр на карточках помогает обмануть читателя.
Когда в реальной жизни мы имеем дело с выбором и числовыми оценками - всегда есть распределение, по которому задана вероятность чисел.
Задача хоть сама по себе и корректна, к этому не имеет никакого отношения, для тервера она вообще была бы некорректной.
Пример: первые два жениха - бомжи-наркоманы, а третим оказался Английский принц. Искать дальше? Всегда есть распределение и всегда есть необходимость его как-то оценить до появления данных, всегда есть для него какие-то границы. А значит всегда выбор оптимальной стратегии будет зависеть от этой оценки.
Есть более точные науки и менее точные. Вы приводите точные науки, где p может быть в тысячу раз меньше, чем 0.05. Но это ещё пол беды. В медико-биологических науках некоторые модели зависят от большого количества параметров, котрые сложно или невозможно контролировать и они меняются от команды к команде, от эксперимента к эксперименту. Чтобы получить среднее - нужно оч много исследований и денег и контроля. Это и есть тот самый dimentionalty curse и от него никуда не деться.
Позвольте объяснить, слово "по определению" здесь не катит. Есть модель того как появляются данные - это и есть "Дано", из чего мы и исходим. Далее идёт оптимизация MLE в ходе которой, они очевидно, зависят друг от друга.
Возьмите третий член и найдите производные по w0 и w1. Приравняйте к нулю. Получите зависимость w0 от w1.
Они становятся зависимыми после получения данных.
Там получается система уравнений, её нужно решить и посмотреть
P.s. я сначала согласился, мол, с точки зрения симметрии они ж должеы быть независимы, а потом осознал глубину ошибки))
Помню эту задачку, только в учебнике она наоборот была. Нужно было найти точную формулу расчёта мат ожидания параметров, если даны x1,...xn и t1...tn.
Поскольку максимальный член -квадратичен, это имеет точное решение через Лапласа.
Если берём неправильный праер, равный 1, то E[teta|data] совпадает с teta argmax - это формула линейной регрессии. Но в чуть более общем случае нужно немного поковыряться с Гессианом, ТС слишком легко отделался...
Ладно. Если что, могу сфотать записи - там всё подробно расписано и по-порядку. Я вообще хоббист больше в плане Баесовской статистики, но имею более-менее представление о ней. Может, конда-нибудь буду проф связан.
Часа 3 потратил, но сделал лишь часть.
Тут две задачи можно рассматривать. Сравнение, что bias влево vs вправо и вторая задача biased coin vs нет.
Можно построить P ( P(D|H1)/P(D|H0)<3|N). Оказалось, что даже это не просто и я сдался - сделал это через Монте-Карло и построил графики (кстати красивые)
Мы получили вероятность того, что на шаге N у нас будет "подтверждённая гипотеза 1".
Дальше запал угас, но логика подсказывает, что для второй задачи вряд ли это возможно ( H0 более вероятна почти для всех параметров в плане меры Лебега и выходит сложная зависимость от N). А вторую задачу можно как-то атаковать с того угла, что раз гипотеза подтвердилась, скорее всего она уже не поменяется. Значит, есть недооценка, её нужно как-то оценить.
Как-то так.
Прошу прощения, я иногда лчень сумбурно пишу. И мой комментарий был именно сумбуреым. Я хотел сказать, что испытываю некоторый скептицизм по поводу последовательного анализа в том виде в котором я сейчас прочитал.
Остановка. Первая проблема в том, что Допустим мы пока что собрали N точек. И после получения каждой новой точки нетерпеливый статистик считает максимум лайклихуд и постериор параметров. И в какой-то момент, если данные об успешности эксперимента перевешивают - эксперимент останавливают. А какой такой критерий есть в Байесовской статистике? Тут их нет и это суть скептицизма. А дальше мысль: Мы сделали N бросков, мы получили распределение. Точнее самую лучшую версию того что можно было вывести (если наша модель верна).
И тут, что я хотел сказать, что если у нас есть какой-то искусственный рубеж на который мы ориентируемся - то несложно посчитать bias через использование экспоненциального распределения. Но сейчас, я думаю, что тут по-другому решается. Давайте так, и я и Вы попробуем не подглядывая в интернет, аналитически прийти к тому, как можно смоделировать этот bias ранней остановки в эксперименте бросания biased монетки и завтра поделиться вычислениями? У меня уже пара идей, но ... работа.
У меня тоже есть мысль, что когда-нибудь сяду за создание игры (может, и никогда). Я потратил какое-то время в Godot просто узнавая движок и пытаясь собрать вертикальную ... даже не демку, а срез игры, схватывающий стилистику. И я понял, что лучший вариант для того что я хотел - это анимация + 2д рендер 3д анимации.
У 2д намного проще создать приносящий удовольствие, не бесючий геймплей с очень чётким и точным управлением. Хотя, есть пример отличной игры, сделанной в 3д с закосом под 2д. Например (сам не играл, посмотрел видео), Дибло 2 ремастер. Но что-то мне подсказывает, что там 3д модели очень дорогие, сделанные профессионально, максимально оптимизированные и с кучей дополнительного шаманства.
Вы говорите так, как будто это что-то плохое.
Игры - это такое же искусство, как литература, живопись и пр. Есть те, кто пытаются быть на гребне популярности и создают продукт для максимально большой аудитории. А есть те, кто пытается выразить в этой среде что-то важное - в первую очередь для себя.
А если команда большая и деньги чужие, то автор уже не имеет права быть просто автором, он должен думать о хлебе с маслом и о завязанных на него трудовых отношениях. И искусство тут уходит.
Уравнение Баеса содержит в себе абсолютно все данные, которые только могут быть. А соотнощение правдоподобий достаточно для сравнения двух гипотез. Это фундаментально как 2+2, как подсчёт предметов, как термодинамика, как вообще можно сомневаться в этом?
А научный метод - это просто эвристика. Нет ничего фундаментального в научном принципе. Но с другой стороны, эвристика хорошая. Что касается последовательного анализа, то с помощью уранения Баеса и экспоненциального распределения, должно быть несложно смоделировать bias последовательного анализа, связанный с ранней остановкой.
Ну вот у Вас корректно поставленная задача на комбинаторику.
У меня вышло, что вероятность выбрать топового жениха равна
где к - это точка после которой берём жениха.
Дальше считать было лень (хотя, признаюсь, не очень внимательно считал, мог ошибиться). Но это в вашей трактовке. А если её привязывать к той, что в посте, в месте, где женихи произвольно выбирают себе число из R - это всё же какая-то магия. И именно она даёт налёт неопределённости, спорности и разных трактовок задаче.
Если по условию задачи, данные по принцам - это iid, то есть независимые, одинаково распределённые случайные переменные, то возникает проблема.
Не существует произвольно случайного распределения. Это какое-то конкретное распределение. По условию задачи, мы не знаем какое. Но оно не может быть неограниченно любым: у pdf есть ограничения в определении. Результирует это в то, что нужно заранее определиться какие распределегия мы рассматриваем. А от этого будет зависеть оптимальная стратегия.
Например, в реальной жизни, лучше принца может быть десяток человек на Земле, и учитывая мат ожидание в два бомжа + принц, поделить на 3 - шанс в них попасть ничтожный.
Если вы хотите взять Бога, и инопланетян и прочее и прочее - по сути, взять неограниченное число кандидатов - вам придётся определить pdf таким образом, чтобы её интеграл сходился. Вот когда каким-то конкретным образом это сделаете, тогда будет еще одна другая, но конкретная задача.
В задаче есть ряд семантических подвохов из-за чего может сложиться ощущение, что она переносится на реальную жизнь. И введение цифр на карточках помогает обмануть читателя.
Когда в реальной жизни мы имеем дело с выбором и числовыми оценками - всегда есть распределение, по которому задана вероятность чисел.
Задача хоть сама по себе и корректна, к этому не имеет никакого отношения, для тервера она вообще была бы некорректной.
Пример: первые два жениха - бомжи-наркоманы, а третим оказался Английский принц. Искать дальше? Всегда есть распределение и всегда есть необходимость его как-то оценить до появления данных, всегда есть для него какие-то границы. А значит всегда выбор оптимальной стратегии будет зависеть от этой оценки.