Каков вопрос — таков ответ: формализуя задачу мы уже предопределяем возможный ответ

В интересной и поучительной статье «Случайный трамвай посреди незнакомого города» предлагается такой эксперимент:
Представьте себе, что некто взял полоску фотографической пленки длинной N см и решил пронаблюдать за тем, как на ней будут оставлять свой след приходящие из космоса частицы. В масштабах эксперимента плотность вероятности попадания частиц на пленку будет описываться равномерным распределением на отрезке от 0 до N. В этом опыте экспериментатор сообщает вам расстояние k между левым краем пленки и точкой, куда угодила первая зарегистрированная частица. Как и прежде, от вас требуется дать приемлемую оценку для неизвестного вам N.

Для решения этой задачи было сделано такое предположение:
Представьте теперь, что в одном эксперименте расстояние от места попадания частицы до левого края фотопленки было равным Р1, а в другом эксперименте — Р2, причем Р1<Р2. Не будет ли тогда разумным, длине фотопленки в первом эксперименте дать меньшую оценку, чем во втором?

Мне стало интересно в цифрах — всегда ли и насколько это разумно?

Эти заметки не продолжение и не обсуждение статьи из которой взята цитата, это попытка посмотреть как сама постановка задачи, введенные ограничения, допущения и условия принимаемые на этапе формализации отразятся на полученном ответе. Я не буду приводить формулы и постараюсь не использовать специальные термины, мне кажется так будет отчетливей видна сама проблема зависимости результата от принятых или не принятых допущений.

Для начала, я изменю, упрощу и приземлю эксперимент


Судьба или наш помощник имеет мешочек в котором лежат пронумерованные по порядку бочонки, как в лото. Помощник (мне его представить легче чем судьбу) в тайне от нас достает наугад бочонок и насыпает в первый сундук пронумерованных шаров по числу на бочонке. Затем он повторяет процедуру случайного извлечения бочонка и насыпает соответствующее число пронумерованных по порядку шаров во второй сундук. Перед нами стоят два сундука с неизвестным количеством шаров в каждом из них. Мы достаем наугад один шар из первого и один шар из второго сундука, и делаем разумное предположение, что шару с большим номером соответствует сундук с большим количеством шаров.
Оценим насколько предположение разумно?

Формализуем и уточним задачу


1. Раз уж бочонки лежат в мешочке, то они должны быть ограничены каким-то числом. Помня о первоисточнике про число трамвайных линий, ограничил пока число бочонков в 30.

2. А как поступить если мы вынули из сундуков шары с одинаковыми номерами? У нас есть варианты:

2.1 признать исход неудачным, не принимать решения и попросить помощника сделать новое заполнение сундуков.

2.2 бросить монетку и наугад решить в каком сундуке шаров больше. В этом варианте не будет неудачных исходов.

2.3 решить что раз номера одинаковые, то и количество шаров в сундуках тоже одинаковое. В этом варианте тоже не будет неудачных исходов.

Тут я хочу заметить, что я не выбираю какой вариант лучше. Моя цель посмотреть как разные варианты скажутся на полученном ответе.

3. Раз у нас появилось разное количество исходов, то встает вопрос: «А от какого количества исходов считать долю правильных ответов?» От всех опытов или только от удачных исходов? Посчитаем оба варианта.

4. Вот вынул помощник первый бочонок, посмотрел номер, насыпал соответствующее число шаров в первый сундук. Стоп! А что он сделал с вынутым бочонком затем? У него два варианта: положить бочонок назад в мешок, а можно не класть назад в мешок. Или что тоже самое, — помощник мог достать сразу два бочонка и насыпать шары в сундуки по вынутым числам на бочонках, помощники бывают ленивые, а мы не видим что он там творит. В этом случае у нас никогда не будет равное число шаров в сундуках, и следовательно неудачных исходов. Этот пункт явным образом отступает от задачи из цитаты, там бочонок возвращается назад в мешок, но у меня другие цели, да и невозвращение бочонка это типичная ситуация в жизни, посчитаем и такой вариант.

Итак, у нас есть три варианта как считать исходы опыта при которых номера шаров одинаковы, два варианта подсчета доли правильных ответов и два варианта наполнения сундуков шарами. Итого 12 вариантов результатов эксперимента!

Как вероятность правильного ответа будет зависеть от количества бочонков в мешке судьбы, то есть от максимально возможного числа шаров в сундуке? Может быть все варианты будут одинаковыми? Может быть варианты будут иметь одинаковую тенденцию? Вот в этот момент я попробовал проверить свою интуицию заполнив такую табличку:



Оказалось, забегая вперед, что тренировать и тренировать мне еще интуицию. Я подчистил табличку от многих своих соображений.

Чтобы не утомлять формулами, которые хоть и красивы, но рекуррентны, а свести рекуррентные формулы к замкнутым мне не под силу, опишу общий алгоритм расчета:

1. Для каждого числа бочонков в мешке, мы можем составить список всех вариантов наполнения сундуков шарами.

Пример: Если число бочонков 4, то получим 16 вариантов наполнения двух сундуков по количеству шаров: 1и1, 1и2, 1и3, 2и1, 2и2… 4и4.

2. Для каждого варианта наполнения сундуков подсчитываем число правильных ответов для трех вариантов подсчета равных шаров.

Пример: Для наполнения сундуков 2и3, (в первом сундуке 2 шара, во втором 3) получится следующая таблица.



3. Для выбранного числа бочонков складываются все правильные ответы для каждого варианта наполнения сундуков.

4. Вычисляем долю правильных для двух вариантов подсчета (по отношению к общему числу опытов и к числу успешных).

5. Считаем так же пункты с 3 по 4 для варианта когда бочонок не возвращается в мешок, то есть когда у нас не может быть равное число шаров в сундуках.

Я подсчитал для числа бочонков с 1 до 8 и 30, чтобы была видна тенденция. Приведу графики.

Сначала для варианта когда бочонок возвращается в мешок




При увеличении числа бочонков в мешке, а следовательно увеличении возможного числа шаров в сундуках вероятность правильной оценки растет и разница между вариантами уменьшается. Любопытно, что вероятность не всегда выше 0,5. Так же любопытен желтый график, на нем есть спад и только потом подъем. Вообще, диапазон от 1 до 7 оказался не очевидным для меня.

Получается, что если шаров меньше 8, то для варианта подсчета «Равные считаются неудачей. Доля правильных считается от всех опытов» случайный ответ даст лучший результат чем следование правилу «Больше номер шара, — значит сундук содержит больше шаров».

Графики для варианта когда бочонок не возвращается в мешок и следовательно в сундуках не может быть одинаковое число шаров




Графика три, так как два совпадают, они обозначены красным цветом.

Для четырех вариантов вероятность правильного ответа падает и стремится, видимо, к 0,5!(?) Другими словами, в этих вариантах для большого числа шаров в сундуках, можно вообще не проводить опыта, а просто подбрасывать монетку — результат одинаков. Собственно, вот ради этого я и решил просчитать различные варианты, я ждал каких-то неожиданностей. Я не имею строгого доказательства, что вероятность стремится именно к 0,5. Это опять моя интуиция, а она часто подводит.

Хочу еще раз подчеркнуть, что эти заметки не посвящены выбору правильной стратегии или оценке какой вариант лучше. Интерес заключался в том чтобы посмотреть влияние разных вариантов задания условий на получаемый результат.

P.S. Как и хотелось, мне удалось не использовать формул и употребить специальный термин — рекуррентная формула всего один раз.

P.P.S. Если лень смотреть Википедию, то рекуррентная формула — это когда вам требуется прийти в дом №30, но вы обязаны предварительно посетить все предыдущие дома с номерами от 1 до 29.
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее
Реклама

Комментарии 8

    0
    Хотел поставить плюс — но по политическим причинам не могу даже комментировать.

    В качестве одобрения хотя бы «поставил флажок».
      +3

      "по политическим причинам не могу даже комментировать"
      Некоторое противоречие вижу я в вашем комментарии.

        0
        … начиная с самого факта. Да.

        Тем не менее, почтение оказал, внимание публики привлёк — цель достигнута.

        Даже без возможности (как все путние сволочи) просто ткнуть мышкой «в плюсик».
      +1
      Уважаемый автор, мне очень лестно видеть такое внимание к моей шуточной статье.
      Ваша публикация заставила меня кое-что проверить и посчитать несколько интегралов по области. Мое утверждение таково: если бочонков очень много, то все варианты Вашей задачи асимптотически тождественны друг другу и правило: «больший номер на случайном шаре = большее число шаров в сундуке» будет давать верный результат сравнения содержимого двух сундуков с предельной вероятностью 75%.

      Для малых значений числа бочонков Ваш результат выглядит достаточно неожиданно, чтобы его стоило проверить еще раз.

      Искренне желаю удачи.

        0
        Уважаемый Сергей! В каждой шуточной статье, есть только доля шутки.
        Возможно, я ошибаюсь. Асимптоту я не считал, было бы интересно посмотреть Вашу интегрируемую функцию. Ваше утверждение красивое, оно мне нравится больше моего решения, но ошибки я у себя найти не могу, увы. Будем искать.
        Если можете указать где по Вашему мнению ошибка, буду очень признателен.
        Спасибо, Вам тоже удачи и ждем новых статей!
          +2
          Давайте попробуем. У меня дома нет сканера, поэтому будет к сожалению без картинок.

          Пусть количество бочонков N в мешке велико. Я рассмотрю случай, когда бочонок возвращают в мешок: все равно вероятностью достать один и тот же бочонок два раза подряд будет принебрежимо мала. В принятых условиях пространство элементарных исходов выборки двух подряд бочонков можно представить на плоскости OXY целочисленным «квадратом» дискретных точек с вершинами (1,1), (1,N), (N,N), (N,1). Все целочисленные точки (a,b) этого квадрата имеют одинаковый вероятностный вес в 1/N2. Чтобы вычислить вероятность, с которой правило: «больший номер на шаре = больше шаров в сундуке» дает верный ответ, нужно вычислить с какой вероятностью оно будет справедливо для каждого элементарного исхода на «квадрате», а затем проинтегрировать результат.

          Пусть на первом бочонке выпало a, а на втором b и a>b. Во первых, все подобные пары (a,b) находятся ниже диагонали первого квадранта: y(x) = x. Во вторых каждая такая пара определяет новый случайный эксперимент — выборку шаров из двух сундуков.

          Пространством элементарных исходов каждого из этих экспериментов будет целочисленный прямоугольники с вершинами (1,1), (1,b), (a,b), (a,1) и равномерной вероятностной мерой на нем. Правильный результат сравнения будет происходить на исходах, которые лежат ниже диагонали первого квадранта y(x) = x, то есть принадлежат трапеции с вершинами (1,1), (b,b), (a,b), (a,1). Таким образом вероятность получить правильный ответ при заданных a и b, когда они оба велики, с большой точностью будет равна отношению площади трапеции к площади прямоугольника, то есть величине [(a+(a-b))/2 ⋅ b] / a⋅b = 1 — b/2a = 1 — (b/N) / 2(a/N).

          Понятное дело, что случай a<b приведет к симметричному выражению: 1 — (a/N) / 2(b/N). Получается, что по целочисленным почкам квадрата (1,1), (1,N), (N,N), (N,1) в области, которая лежит ниже диагонали y(x) = x, нам нужно «просуммировать» выражение 1 — (b/N) / 2(a/N), а по той, что лежит выше — выражение 1 — (a/N) / 2(b/N). Поскольку выражения симметричны, я могу посчитать только одну сумму, а затем просто умножить на 2 ее результат. Посчитать сумму значений 1 — (b/N) / 2(a/N) можно сведя ее к интегралу функции 1 — y/2x по единичной мере в треугольнике (0,0), (1,1), (1,0).
          Методом повторного интегрирования вы найдете находим результат: 1/2 — 1/8, а после умножения на 2, как раз и получаем заветные 1 — 1/4 = 3/4.
            0
            Спасибо за столь наглядный пример! Очень удобно!
            Нарисовал схему для Без возвращения, Равные делим 50/50.
            Взял ее так как уже при N=3 вероятность опускается ниже 0,75.

            Все-таки отсутствие равного количества шаров в сундуках, при выборке без возвращения имеет влияние, по всей видимости больше чем кажется на первый взгляд. Если общее количество вариантов у нас N^2, то мы лишаемся N вариантов ( варианты с равным числом шаров в сундуках).
              0
              Все-таки отсутствие равного количества шаров в сундуках, при выборке без возвращения имеет влияние, по всей видимости больше чем кажется на первый взгляд. Если общее количество вариантов у нас N^2, то мы лишаемся N вариантов


              Видимо это влияние и приводит к аномалиям при небольших N. Когда N растет, то отношение N к N2 стремиться к нулю и влияние возможности совпадения сходит на нет.

      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

      Самое читаемое