Comments 17
Тервер действительно нужен всем 100% C++ программистам Яндекса?
Это скорее задачи аналитикам. Не понял только про монеты. Испытания же независимы. Вероятность выпадения решки и орла у монеты одинакова, и не зависит от исходов предыдущих испытаний.
Да, все верно. Задачи для аналитиков.
Вы все правильно написали. В схеме Бернулли испытания независимы. Вероятность, что в 11 раз выпадет орел при условии, что в первые 10 раз выпала решка равна вероятности, что на данной монете выпадет орел в принципе (в любой раз).
При этом априорное распределение вероятностей монетки (с какой вероятностью каждый раз выпадет решка) оценивается и моделируется как распределение p при условии того, что мы 10 раз подряд получили решку.
Лет 8-9 назад собеседовался на с++ в минский офис яндекса. Тервер был обязательным, причем еще до каких-либо вопросов по программированию.
Пример с монеткой кажется неоднозначным. Согласно классическому подходу, вероятность выпадения орла или решки всегда будет составлять 0,5, независимо от предыдущих результатов. Возможно, автор просто не до конца раскрыл свою мысль.
Правильно понимаю, что в данном случае эксперимент с монеткой рассматривается как «чёрный ящик» и мы делаем вывод, что если орел выпал 10 раз подряд, то и в дальнейшем он будет выпадать чаще, так как мы просто не знаем условий проведения эксперимента?
Именно так! Вы все написали верно! В задаче про монетку неизвестно, честная она или нет, и степень честности предлагается оценить на основе одного эксперимента из 10 испытаний.
Вместо монетки могут быть отзывы в интернете. У одного товара 10/10 отзывов положительны. У другого 90/100 положительны.
В этой статье я показываю, что для случая 10/10 распределение положительных отзывов скорее всего (с 95% уверенностью) лежит в интервале (76, 100)%, а в случае 90/100 распределение положительных отзывов скорее всего (с 95% уверенностью) лежит в интервале (84, 96)%
есть мнемоническое правило, которое позволяет прикинуть "честность" бинарного эксперимента: нужно добавить к имеющейся выборке 1 положительное событие и 1 отрицательное (нулевое) и посчитать мат.ожидание полученной выборки. в случае 10 орлов для монетки получаем (11 / 12) ≈ 91% вероятность орла.
может, такой подход и не является математически строгим, но в на практике позволяет быстро получить вменяемую оценку.
Вы совершенно правы! Это мнемоническое правило называется правилом последовательности Лапласа и хорошо описано в видео 3Blue1Brown (ссылка на таймкод). Также в статье Википедии про Бета-распределение есть целый раздел на эту тему.
Данное мнемоническое правило точно оценивает среднее значение Бета-распределения, и я упомянул про него в этой статье в блоке про точную оценку среднего и дисперсии.
Это правило замечательно подходит для оценки априорной вероятности успеха, и я решил показать, как можно вычислить доверительный интервал для такой оценки. В вашем примере среднее, действительно, равно 11/12 = 91 %, но доверительный интервал для нее находится в диапазоне от 76 до 100 %. Зная доверительный интервал, можно обоснованно выбирать между товаром с 90 положительными отзывами из 100 и товаром с 10 положительными отзывами из 10. Если пользоваться только правилом Лапласа, в данном примере можно ошибочно отдать предпочтение товару с меньшим числом отзывов, что будет неверным или, по крайней мере, неверно обоснованным :)
Получал эту задачу на собесе Яндекса. Звучит задача так: "Какова вероятность выпадения монеты 10 раз подряд Орлом? Какова вероятность что в 11 раз так-же выпадет Орел?". Задача была с мини подвохом, что первый Ваш ответ повлияет на Ваше суждение и на второй ответ, но ничего сложного и тем более каких то разборов с формулами не требовала (задача от hr, как мини проверка на соответствие знаний, задается перед тем, как продолжить диалог). Собственно ответ 1 - 0.5 в 10 степени и ответ на 2 вопрос - 50%
Спасибо за ваш комментарий! Вы абсолютно правы, и ваше решение идеально подходит, если заранее известно, что монетка честная.
Однако монетка может быть деформированной, и вероятность выпадения орла или решки в таком случае может отличаться от 50%. Если про "честность" монетки ничего неизвестно, вероятность выпадения орла можно оценить на основе имеющихся данных. В вашей задаче оценка этой вероятности будет находиться в диапазоне от 76% до 100%, как я показал в статье.
Можно утверждать следующее:
"Имеющаяся серия испытаний (10 из 10 раз выпал орел) позволяет с 95%-й степенью уверенности предполагать, что вероятность выпадения орла отличается от 50%. Скорее всего (с вероятностью 95 %) она находится в диапазоне от 76% до 100%. Соответственно, есть основания ожидать, что при новом одиннадцатом броске монетка с большей вероятностью покажет орла, чем решку."
А откуда вы взяли 1.98 ? Почему например не 2.13 ?
Прошу прощения за предыдущую неточность. Я исправил значение коэффициента на более точное — 1.96, которое соответствует 95%-доверительному интервалу. Этот коэффициент обозначает количество стандартных отклонений от среднего значения, определяющих диапазон, в котором находится заданная доля данных (в данном случае 95 %). Вы можете прочитать об этом в статье Википедии про эмпирическое правило "68–95–99.7 rule".
Известно, что для нормального распределения:
— 95.5% данных лежит в промежутке [среднее ± 2 стандартных отклонения]
— 99.7% данных лежит в промежутке [среднее ± 3 стандартных отклонения]
Если мы ограничиваем 95% значений распределения, то это количество значений находятся в промежутке [среднее ± 1.96 стандартных отклонений] (см. отрывок в статье Википедии про Нормальное распределение).
Оцените предсказательную силу осьминога.
Предсказательная сила осьминога есть предсказательная масса на предсказательное ускорение осьминога. Что это за термин вообще? Он не математический. Это что то на философском. Формулировать математическую задачу с использованием размытых философских терминов это какой то позор!
Предсказательная сила (англ. predictive power) — это термин, который используется в статистике и машинном обучении для обозначения способности алгоритма или метода делать точные предсказания.
Например, когда говорят о предсказательной силе осьминога, имеют в виду вероятность того, что его предсказания окажутся верными. Если осьминог действительно способен предсказывать результаты, вероятность его правильных предсказаний будет выше 50% (то есть выше случайного угадывания). Если же такой способности нет, вероятность успешного предсказания останется на уровне случайного выбора — 50%.
Хотя термин не имеет строгого математического определения, он активно используется в литературе, посвященной статистике и машинному обучению, например, в статье от Open Data Science про метрики машинного обучения, а также в статье о ROC-кривой в Википедии.
когда говорят о предсказательной силе осьминога, имеют в виду вероятность того, что его предсказания окажутся верными
Я сходил по вашей ссылке в Википедию и не смог понять, как из того, что там написано следует, что предсказательная сила (predictive power) есть вероятность события, что предсказание окажется верным. Приведите пожалуйста цитату, из которой это непосредственно следует, иначе непонятно на каком основании вы так решили, тем более, что математического определения термину нет.
И почему если надо было оценить вероятность события того, что предсказание окажется верным, вы вместо этого в статье искали доверительный интервал? Доверительный интервал и вероятность события это хоть и термины из одной дисциплины, но всё же разные вещи.
Действительно, как я написал выше, термин "предсказательная сила" (predictive power) не имеет строгого математического определения и может интерпретироваться по-разному в зависимости от контекста. Указанные мной ссылки являются примерами, что данное понятие, несмотря на свою нестрогость, активно используется в ресурсах, посвященных статистике и машинному обучению, и по этой причине не должно удивлять читателей.
На одном из собеседований я получил задачу именно с формулировкой "предсказательная сила". Под этим термином подразумевалась вероятность того, что предсказание осьминога окажется верным, что является интуитивно понятным. Если на собеседовании или в другом контексте вас просят оценить "предсказательную силу", но вам не кажется очевидным, что именно под этим термином подразумевается, я рекомендую задавать уточняющие вопросы. Это поможет избежать недоразумений и сосредоточиться на той интерпретации, которая важна для собеседующего.
Что касается вашего вопроса про доверительный интервал, он был приведён для оценки вероятности совершить верное предсказание, то есть как интервал, в котором с заданной уверенностью может находиться эта вероятность. Я согласен, что доверительный интервал и сама вероятность — это разные понятия, но в данном случае интервал служит способом выразить степень неопределённости относительно этой вероятности. Использование доверительного интервала для оценки вероятности является стандартным подходом в статистике.
Решаем задачи по теорверу с собеседований в Яндекс и Авито: считаем доверительный интервал для Бета-распределения