
Есть одна довольно любопытная задачка, она уже давно вошла в математический фольклор, а так же стала излюбленным испытанием на собеседованиях. Ее условия просты, а решение, кажется напрашивается само собой, однако не будем торопиться с выводами. Берите карандаш, чистый лист бумаги, усаживайтесь поудобней и давайте во всем разбираться.
В чем же, собственно, задача
Итак представьте, что Вы приехали в абсолютно незнакомый город и первый трамвай, который вам там повстречался, следовал под номером 17. Как оценить, сколько всего в этом городе трамвайных маршрутов?
Для простоты считайте, что трамвайные маршруты в городе пронумерованы без пропусков числами от 1 до N и изначально каждое из этих чисел с равными шансами могло оказаться номером трамвая, который вы бы увидели первым.
Впервые задачу о «Случайном трамвае» я услышал от Николая Николаевича Васильева, моего знакомого питерского математика. Тогда же он поделился со мной наблюдением, что среди тех, кому он рассказывал эту задачу, а затем просил дать ответ не задумываясь, большинство людей назвало число 34, то есть "x2" от 17. На моем опыте самым экстравагантным был ответ моего товарища с «мехмата»: 17. Только через неделю я догадался, что им двигал спавший где-то на подкорке его мозга принцип максимизации правдоподобия. Хорошо, но 17 и 34, другими словами "x1" и "x2" — это наивные и необдуманные ответы, а какой тогда правильный ответ, и вообще, существует ли он у этой задачи.
Подводные камни и область фантазии
Почему же стоит сомневаться насчет существования универсально-правильного ответа? К такой мысли легко прийти, если рассмотреть несколько простых, пускай и вымышленных вселенных. К примеру представьте, что на Земле в каждом городе ровно по 30 трамвайных маршрутов. Будет ли в этой вселенной «30» — единственно верным ответом? Теперь представьте, что в другой вселенной на Земле 1000 городов, причем в 999 из них действует по 30 трамвайных маршрутов, а в оставшемся одном — их ровно 17. Какой на сей раз ответ будет правильным и как на него повлияет то обстоятельство, что городов с 30-ю маршрутами очень много, а с 17-ю — всего один? Сразу скажу, что пользоваться вероятностными соображениями здесь очень трудно, ведь человек, которого просят оценить число маршрутов, не знает, был ли город, в котором он сейчас гостит, выбран на карте случайно, или в этом выборе кроется некая причина и присутствует чей-то расчет.
Принцип крайнего математического пессимизма
Несмотря на заявленные трудности, в математике имеется принцип, при помощи которого для нашей задачи можно дать ответ, остающийся осмысленным даже в самых причудливых мирах.
Когда дело касается игр, этот принцип называют максимизацией гарантированного выигрыша,
и чтобы понять в чем кроется его суть, давайте рассмотрим один простой пример.
Представьте себе игру: скрытно от вас в один из своих кулаков я прячу маленький предмет, пусть это будет сухая горошина, затем вытягиваю руки вперед и прошу вас угадать, в какой из них эта горошина находится. Пусть у нас есть время, чтобы сыграть очень долгую партию игр, причем изначально вам не известно, пытаюсь ли я вас в ней обыграть, стараюсь намеренно поддаться, или сохраняю безразличие к вашему успеху. Предположим, что перед вами стоит цель: выиграть как можно больше игр. Какой стратегии вам в таком случае стоило бы придерживаться?
Для начала давайте попробуем проанализировать, преимущества и недостатки следующих четырех простеньких стратегий:
- Всегда выбирать правую руку.
- Начать с правой, а затем выбирать ту руку, в которой горошина была найдена в последний раз.
- В каждой игре перед тем, как сделать выбор, бросить на стол игральную кость. Если выпало «1» или «2», то выбрать правую руку, на «3», «4», «5» и «6» — левую.
- Как и в предыдущей стратегии, в каждой игре бросить кость. В тех случаях, когда выпавшая грань оказалась «четной», выбрать правую, а когда «нечетной» — левую.
Если вы решите воспользоваться стратегией 1) и при этом я буду прятать горошину всегда в правой руке, то все игры завершатся в вашу пользу. Можно сказать, что сценарий развития партии, при котором я прячу горошину исключительно в правую руку, является для 1)наилучшим. Однако в своем наихудшем сценарии, сценарии, где я прячу горошину исключительно в левой руке, стратегия 1) не позволит вам выиграть ни одной игры, какой бы долгой не была наша партия.
Легко догадаться, что стратегия 2) страдает тем же «пороком», а именно в наихудшем для нее сценарии, когда я начинаю с левой руки и затем в каждой из следующих игр чередую руки, она не позволит вам выиграть ни разу, как бы долго ни длилась наша партия.
Займемся теперь стратегией, которая идет в нашем списке третьей. Если вы ею воспользуетесь, то ваши шансы на победу в каждой игре, где горошина будет спрятана в правую руку, составят 1/3, а в играх, в которых горошина будет находиться в левой, — 2/3. Понятное дело, что наихудший сценарий для 3) — это, когда я имею привычку прятать горошину исключительно в правой руке. Однако даже в этом случае в любой достаточно длинной партии игр, примерно треть из них завершится вашей победой. Теоретически вам конечно может и не повезти, и правильную руку вы не отгадаете ни разу, но практически, скажем в партии из 1000 игр, почти не вероятно, чтобы количество ваших побед было меньше, чем
Если вы воспользовались четвертой в списке стратегией, то наша игра приобретает интересную особенность: по сути для вас перестает быть важным, на сей раз я спрятал горошину в правой руке или положил ее в левую, потому как в обеих ситуациях ваши шансы на победу будут одинаковы и составят ровно 50%. Можно даже сказать, любая намеченная мною очередность рук, где я собираюсь прятать горошину, для вас будет являться одновременно и наилучшим и наихудшим сценарием развития партии. Получается, что при любых раскладах в достаточно долгой партии игр примерно половина из них должны закончиться вашей победой. В этом смысле стратегия 4) дает вам самые большие гарантии, по сравнению со всеми остальными стратегиями, которые мы уже успели здесь рассмотреть.
Принцип максимизации гарантированного выигрыша предписывает вам перебрать все возможные стратегии игры, для каждой из них вычислить величину выигрыша в наихудшем для нее сценарии и объявить оптимальной ту стратегию, для которой величина этого выигрыша окажется наибольшей. Можно показать, что в игре с угадыванием местоположения горошины, оптимальной, а не только лучшей из списка, является стратегия под номером 4. По своей сути максимизация гарантированного выигрыша аналогична жизненному кредо тех людей, которые всегда склонны рассчитывать на худшее, но при этом все еще пытаются как-то улучшить свое положение в жизни.
Задача о «случайном» трамвае приобретает свой окончательный вид
Формализм
Чтобы воспользоваться принципом максимизации гарантированного выигрыша, представьте, что судьба играет с вами в игру: она раз за разом посылает вас в неизвестный город, расположенный в какой-то неизвестной вселенной, ждет пока вы не повстречаете там первый трамвай, а затем вопрошает, сколько же в этом городе всего трамвайных маршрутов. Будем считать, что ваш ответ считается приемлемым и игра заканчивается в вашу пользу, если только названное вами число отличается менее чем в два раза от истинного, причем как в большую, так и в меньшую стороны. Будем также считать, что это очень долгая партия игр, длиною в целую жизнь.
Теперь вполне правомерно задать вопрос: «Какая стратегия в описанной игре будет для вас оптимальной в том смысле, что сможет обеспечить максимальное число гарантированно приемлемых ответов?»
Подробный анализ простейших стратегий
В качестве «первого боя» с только что поставленной задачей попытаемся выяснить, насколько хороши для нее наивные стратегии "x1" и "x2".
Итак, судьба забросила нас в очередной незнакомый нам город. Как и прежде, буква
Согласно стратегии "x1" оценкой
Теперь предположим, что мы решили использовать стратегию "x2". По правилам этой стратегии, увидев на трамвае номер
Сквозь тернии к звездам
Перед тем, как приступить к главной части повествования, где мы займемся поисками оптимальных стратегий, я слегка видоизменю условия задачи и буду считать, что
Представьте себе, что некто взял полоску фотографической пленки длинной
В качестве простого упражнения покажите, что несмотря на изменившиеся условия стратегия "x1" по-прежнему гарантирует вам примерно 50%, а стратеги "x2" — все те же примерные 75% приемлемых оценок соответственно, вне зависимости от того, какой сценарий выберет судьба.
Долгий путь к совершенству
Предварительный отсев
Наконец-то все приготовления завершены и в этом параграфе мы можем заняться поисками оптимальных стратегий. Для простоты, правда, мы будем рассматривать не все стратегии, а ограничимся теми, в которых оценка
Представьте теперь, что в одном эксперименте расстояние от места попадания частицы до левого края фотопленки было равным
Если проанализировать, какие ответы мы считаем приемлемыми, то получится еще одно
ограничение на
Ее величество формула
Сейчас мы займемся тем, что для произвольной стратегии постараемся выразить величину гарантируемого ею выигрыша в виде некой общей аналитической формулы.
Итак, в очередном эксперименте по регистрации космических частиц используется фотопленка длины
Поскольку

Рис. 1
Теперь нетрудно сообразить, что максимальным значением
или более подробно:
Должно быть очевидно, что наихудшим для для
Теперь мы можем утверждать, что любая оптимальная стратегия должна максимзировать
Итак, проблема отыскания оптимальных оценок свелась к вопросу о том, как выглядит функция
максимум в классе всех непрерывных строговозрастающих функций, определенных
на интервале
Искусство правдоподобных рассуждений
Пожалуй, самое простое, с чего можно начать — это выяснить, какая из функций вида
Как вы видите,
Давайте теперь подумаем, что произойдет, если отсчитывать расстояние не в сантиметрах, а, скажем, метрах, дюймах или световых годах — как тогда изменится вид функции
Пусть в сантиметрах оценка
В общем случае мы будем иметь дело со шкалой длин
Вид последнего уравнения говорит о том, что функции
Как вы считаете, правдоподобно ли, что мы и какой-нибудь представитель далекой космической цивилизации получим для решаемой здесь задачи разные ответы лишь потому, что у нас с ним разные единицы измерения длины? Наверное, нет! Отсюда следует, что для любого
Смотрите, что выходит: если все наши многочисленные предположения верны, то оптимальная функция
Строгие выводы: оптимальность x2
Хорошо, у нас есть много намеков на то, что оценка, заданная функцией
Возьмем произвольную непрерывную строго возрастающую функцию

Рис. 2
Если на графике функции
Теперь уже не сложно показать, что функция
Рассуждения я начну с двух предварительных замечаний:
, поэтому
то есть график функции
лежит не выше графика
- величина значения
не зависит от
и равна
, производная
во всех точках равна
.
Чтобы потом прийти к противоречию, сначала предположим, что
Для какого-нибудь
Поскольку производная

Рис. 3
В то же самое время нужно вспомнить, что вершины ломаной
Строгие выводы: единственность
Что будет, если в только что изложенном доказательстве построить ломанную по такой последовательности вершин, которая вместо того, чтобы бесконечно удалятся от оси
Предположим, что существует функция

Рис. 4
Обозначим символ
- в точке
значение
совпадает со значением функции
- производная
при всех
одинакова и равна
Давайте проследим, как будут изменяться значения функций
Поскольку
Дискуссионные вопросы
Постарайтесь самостоятельно приспособить решение задачи о «случайной частице» к условиям задачи о «случайном трамвае». Какой у вас получился результат?
Представьте, что мы решаем задачу о «случайной частице» во вселенной, где фотопленка
не может быть короче 10 сантиметров. Покажите, что этих условиях оценка
К принципу максимизации гарантированного выигрыша появляется масса претензий, если заведомо известно, что ваш оппонент не имеет стремления вас обыграть. Этот принцип, например, трудно считать оправданным, когда партия игр ведется «против» погодных условий или «против» мирового рынка ценных бумаг. Какие принципы отбора стратегий в этих случаях вы бы могли предложить взамен, какие из них применимы к задаче о «случайном трамвае»?
Буду рад вашим мыслям и замечаниям.
Сергей Коваленко
2020 год
magnolia@bk.ru