celen Jan 11 at 19:58

Управление рисками на примере Санкт-Петербургского парадокса

Medium

11 min

14K

Finance in ITMathematics * Start-up developmentInfographicsReading room

+22

Comments 23

sic Jan 11 at 20:42

UPD: игнорируйте это, я решал немного другую задачу!

Скрытый текст

Вот как раз после исходной статьи стало интересно провести небольшое моделирование, и я удивлен, что у Вас получилось B_mean = 16.52, а у меня в среднем 36 (на 2^32 исходов). Даже для ста миллионов игр, уже в среднем 30 получается. Возможно ошибка в:

B[offset:offset + size] = -np.log2(rng.random(size))

log2 не находит положение первого взведенного бита корректно, ну для примера log2(1000b) очень близок к log2(0111b) но вот только в первой игре выигрышь все 32 рубля, а во второй всего 16 (или 0, если считать trailing нули, а не ведущие). На самом деле я не вполне понимаю еще из-за наличия минуса перед логарифмом, но в любом случае 2 ** B не соответствует выигрышу никаким образом. Ожидается что-то похожее на:

static long PlayGame()
{
    ulong x = rng.NextUInt64();
    int tosses = TrailingZerosBinary(x);
    return 1L << (tosses + 1); // prize value
}

Скрытый текст

Совсем говнокод, у меня древний .NET и нет нормальной TrailingZeros, но как-то так:

static int TrailingZerosBinary(ulong x)
    {
        if (x == 0) return 64;
        int n = 63;
        if ((x & 0x00000000FFFFFFFFUL) > 0) { n -= 32; } else x >>= 32;
        if ((x & 0x000000000000FFFFUL) > 0) { n -= 16; } else x >>= 16;
        if ((x & 0x00000000000000FFUL) > 0) { n -= 8; } else x >>= 8;
        if ((x & 0x000000000000000FUL) > 0) { n -= 4; } else x >>= 4;
        if ((x & 0x0000000000000003UL) > 0) { n -= 2; } else x >>= 2;
        return n - (int)(x & 1);
    }

Еще раз все у себя перепроверил, в среднем B_meanуже после 20000 игр достигает вашего значения (но на таком небольшом количестве игр оно не очень хорошо стабилизируется). По сути конечно мало меняет, а по факту - много.

celen Jan 11 at 20:49

Не может быть у вас средний выигрыш 36 для серии из 2^32 исходов. Это невозможный уровень удачи. Может быть, у вас другая модель, например вы "выплачиваете" в своей симуляции агенту вдвое больший выигрыш, чем я? Тогда это то же что и выигрыш у меня 18, что в принципе допустимо.

На серии в 20000 ~ 2^14 по моей модели ожидается средний выигрыш 7 +- 3. Выход за этот диапазон явно показывает численную несогласованность наших моделей. Но если вы достигли моего значения (16) выплачивая игроку вдвое больше, то на самом деле вы достигли 8.

sic Jan 11 at 21:05

Это так, я взял игру из статьи на которую Вы ссылаетесь, а там стартовый выигрыш 2 рубля :) Гоняю теперь с таким же условием, что у Вас, теперь в среднем что-то близкое получается, можно сказать тоже самое, потому что от запуска к запуску в диапазоне 10% гуляет. Теоретически на некоторых запусках совсем все что угодно может быть.

Скрытый текст

Буквально на десятый прогон словил джекпот.

[10^10] Игр: 4 100 000 000
Средний выигрыш: $153,02
Максимальный выигрыш: $549 755 813 888

Если этот выброс исключить (вот насколько реален кстати), то да, средний средний выигрыш это 18 с небольшим.

Но я не понял этого трюка с логарифмом все равно. Он же вещественный, как-то должен к целому приводиться, отбрасыванием бит? И почему со знаком минус записывается?

celen Jan 11 at 21:24

Хехе, it's magic.

Надеюсь, мой комментарий ниже про гистограмму убеждает в том, что это *работает*.
Технически, B[offset:offset + size] = -np.log2(rng.random(size)) осуществляет следующую цепочку операций: генерацию случайного числа float64 из равномерного распределения [0;1], взятие от этого логарифма и приведение этого логарифма к целому uint8 (с минусом) через отбрасывание дробной части. Это эквивалентно честной игре Бернулли, но гораздо быстрее. Ещё это эквивалентно тому, что бы взять равномерно распределенный float64 из [0;1], оторвать от его записи экспоненциальную часть и сконвертировать её в uint8. Причем так было бы даже ещё быстрее, но в python я не смог быстро придумать, как эту побитовую операцию грамотно осуществить.

funca Jan 11 at 21:38

Было бы лучше сперва показать наивный алгоритм, отражающий формулировку задачи. А уже потом делать оптимизации. Сейчас статья выглядит как набор глав, между которыми пропущены ключевые связки.

celen Jan 11 at 21:46

Когда я публиковал код из jupyter notebook, я это делал не сколько для чтения непосредственно кода, сколько для его проверки на вашей стороне при наличии такого желания. Для этого коду лучше быть быстрым, то есть немного магическим, с чанками и логарифмическими операциями. Статья достаточно сильно описывает логику происходящего текстом и формулами, что бы разобраться в происходящем вообще без анализа кода.

А вообще эта новая фича хабра sourcecraft достойно справляется с задачей объяснения кода.

funca Jan 11 at 22:36

не сколько для чтения непосредственно кода, сколько для его проверки на вашей стороне

Зависит от того, что понимать под проверкой кода. В представленном варианте не понятно как этот код вообще согласуется с исходной задачей. В статье нет таких формул, которые бы доказывали эквивалентность оптимизированной версии исходному алгоритму. Что тут можно проверить?

Смущает ещё то, что сам по себе питон не ограничивает разрядность целых и позволяет работать с бесконечными последовательностями. В самой задаче вроде нет ни чего, что бы вынуждало держать в памяти результаты всех игр. Поэтому описанние возникших проблем с памятью и разряднотстью в numpy выглядит как какой курьез не по делу. Можно-ли было обойтись вообще без numpy?

sic Jan 11 at 23:21

Ну считайте что я все проверил. У меня по-другому сделано, но результаты совпадают. Вплоть до того, что небольшой недочет и у меня и автора одинаковый, больше 2^64 выигрыши не учитывются. Но, у меня уже больше часа программа работает и только 2^41 выбилось и вот уже триллиарды игр. До 2^64 я все равно не досчитаю никогда (порядка сотен лет с такой скоростью, да и смысла никакого в этом нет, log2(T)/2 там и есть).

А в памяти нужно держать из-за того что автор по этим данным несколько исследований делает, и результаты должны быть согласованны. Кроме того питон не ахти как быстро данные игр генерит даже после его оптимизаций, а наивный подход был бы еще на порядки медленее. И если LLM спросить, про трюк с логарифмом она расскажет.

celen Jan 11 at 23:29

2^41? Мое уважение.

celen Jan 12 at 18:11

UPD. Провел дополнительные исследования для уточнения поправки к S_T за счет влияния редких событий. Оказывается, шансы выбросить аномально большое среднее на длинной серии существуют, хотя и малы. То есть я было неправ ранее насчет того, что 32 - это совсем уж невероятно.

celen Jan 11 at 21:12

Мой оптимизированный код для вычисления B может сбивать с толку, но он дает корректную гистограмму B. Вот какое распределение я получаю :

>> print(B_values)
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32],
      dtype=uint8)
>> print(B_counts/T)
array([4.99996199e-01, 2.50013790e-01, 1.24990516e-01, 6.25037584e-02,
       3.12467129e-02, 1.56276303e-02, 7.81149906e-03, 3.90555570e-03,
       1.95188215e-03, 9.76342708e-04, 4.87847719e-04, 2.44213734e-04,
       1.22004421e-04, 6.09667040e-05, 3.05534340e-05, 1.52424909e-05,
       7.60983676e-06, 3.83588485e-06, 1.91642903e-06, 9.79984179e-07,
       4.75673005e-07, 2.36090273e-07, 1.16880983e-07, 5.98374754e-08,
       2.56113708e-08, 1.39698386e-08, 8.38190317e-09, 3.72529030e-09,
       1.62981451e-09, 6.98491931e-10, 2.32830644e-10, 2.32830644e-10,
       2.32830644e-10])

То есть, с хорошей точностью, у меня половина - нули, четверть - единицы, восьмая часть - двойки и так далее. Код суммы так же правильный, он согласуется с теорией и достаточно простой.

UFO landed and left these words here

artptr86 Jan 12 at 04:38

Астрологи провозгласили день Санкт-Петербургского парадокса?

Femistoklov Jan 12 at 04:51

Вероятно, основное здесь - ограничение времени? Необходимость играть бог знает сколько триллионов раз для выигрыша сводит на нет всю практическую пользу игры.

RoasterToaster Jan 12 at 05:15

Человек странная штука, ради скидки в 1000 р на джинсы он готов посетить несколько торговых центров, но скидка в 1000 р на холодильник уже не повлияет на его выбор

hira Jan 12 at 06:15

Джинсы покупаются часто, а холодильник - лет на 10-15...

RoasterToaster Jan 12 at 06:38

Да но нет, это вопрос мотивации в моменте, искать дальше или сделать выбор.и человек ориентируется на относительные величины. Как на процент от выигрыша

А фразой про годы он уже объясняет себе свое подсознательное решение.

funca Jan 12 at 11:09

При этом человек готов платить по 100 р за попытки достать копеечную безделушку из игрального автомата - ведь сам факт игры и выйгрыша он ценит больше, чем предмет.

RoasterToaster Jan 12 at 12:11

теория ЙГР у нас в подсознании прошита

vadimr Jan 12 at 13:10

Задача с двумя кнопками полностью объясняется тем фактом, что матожидание неприменимо к единичному событию. Когда мы нажимаем на кнопку один раз, то не можем рассуждать о матожидании и просто не знаем, что будет; поэтому мы выбираем меньшую сумму, как гарантированный выигрыш против неизвестности. Если же нам предложат нажать на кнопку 100 раз подряд, то мы выберем большую сумму, так как в таком случае законы статистики уже работают и выигрыш практически гарантированно будет близок к своему матожиданию.

Тут встаёт, правда, интересный вопрос: в игре из 100 попыток не будет ли разумно последние один или несколько раз нажать на меньшую кнопку? Ведь последнее нажатие сводит нашу задачу к задаче для одной попытки.

celen Jan 12 at 14:47

Нет, не совсем.

Задача двух кнопок эквивалентна задаче, где вам нужно поставить огромную, для вас, сумму ради шанса выиграть кратно большую.

В этом смысле, вы не будете второй раз жать кнопку в случае проигрыша, потому что у вас уже более не будет денег.

То, что событие единично здесь сказывается, но из-за довольно большого шанса в 50% сказывается не так уж значительно. Возвращаясь к моей модели, играть при S> S_T не прямое самоубийство, просто это сильно повышает риск. Я сейчас подумал, что нужно ввести туда аддитивный коэффициент R_T<5, который бы позволил рисковым парням играть при S=S_T + R_T и рассчитать статистический диапазон риска для R_T. Иначе получится, что играть в одну игру не выгодно при любом положительном S, хотя это очевидно выгодно при S=1 и вроде бы имеет равновесные риски при S=2.

vadimr Jan 14 at 09:05

Я всё-таки придерживаюсь мнения, что понятие шанса неприменимо к единичному событию в своём обычном смысле. Какая вам разница, шанс был 1/2 или 1/1000000, если вы проиграли?

Играть в одну игру невыгодно при любом S. Надо договариваться с организатором о распиле выигрыша и тем самым придании игре детерминированного характера.

celen Jan 12 at 18:08

Прочитав ваш комментарий и подумав про единичное событие ещё немного, я пришел к выводу, что формула для ограничения времени у меня неправильная и нуждается в добавке, и даже эмпирически вывел эту добавку (добавив в статью как UPD). Я предлагаю добавить к S_T число R_T от 1 до 2, которое отразит некоторую медианную удачу толпы игроков. Это более честное ограничение времени, так как в ситуации, когда у вас ровно одна игра, получается, что S_T = R_T и вы вполне можете попытать удачи со ставкой S=2, оставаясь в рамках допустимого риска, даже если не считаете себя настолько везучим, что бы с одной попытки выбросить пять орлов подряд. При S=2 игра честная с точки зрения матожидания, если вы учитываете шансы до 4 орлов. Интересно, что шанс на 4 орлов составляет 1/16 = 6.25% - вполне допустимый в бытовой жизни шанс, как раз превышающий 5% психологический порог критической удачи.