Вадим 老陆 Румянцев@vadimr
Разработчик аппаратно-программных комплексов
Информация
- В рейтинге
- 1 448-й
- Откуда
- Санкт-Петербург, Санкт-Петербург и область, Россия
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Менеджер проекта, Архитектор программного обеспечения
Ведущий
Управление проектами
Разработка ТЗ
Управление рисками
Управление разработкой
Автоматизация процессов
Дипсик лучше владеет китайским :) Это на 美式中文。
В этом есть некоторое рациональное зерно, но многие ведь и за деньги пытаются вместо результатов своей работы подсунуть нейрослоп. Более того, если человек выдаёт нейрослоп бесплатно, то он точно хотя бы попытается выдать его и за деньги.
Предположение Б о том, что Г обязательно согласится на предложение Б, противоречит условию о рациональности В. Тогда с тем же успехом можно предполагать и другие нерациональные действия пиратов.
Иными словами, вы в дереве вариантов выбираете противоречащий условиям задачи.
Если В выберет голосование против и никто не станет совершать запрещённых условиями ходов, то ход В тоже тем самым окажется разрешенным.
Рассуждения А: мою логику изложил автор. Сделаю предложение 98-0-1-0-1.
Рассуждения Б и Г: нам ничего не предложили, мы против.
Д голосует за, так как это его единственный шанс вообще что-то заработать. Но может и против, неважно.
Рассуждения В: допустим, я соглашусь. Тогда я получу одну монету. Теперь, допустим, я буду против. Тогда Б увидит, что А убили, и должен будет сделать своё предложение. Что предложит Б в этой ситуации? Он может действовать по логике автора и предложить 99-0-1-0, но тогда он обязан задаться вопросом, чем он лучше А, которого убили. Б ничего не знает о стратегии Г, которому пока ничего не предлагали. Зато Б знает, что В рассчитывает получить больше 1 монеты, так как был против предложения А. Деньги к В могут придти либо в результате согласия на предложение Б, либо в результате гибели Б и согласия Г и Д на собственное предложение В. Второй случай (ВГД) полностью детерминирован, как описано у автора, при этом В получает 99 монет (иначе все деньги достанутся Г без голосования). Таким образом, Б должен сделать В лучшее предложение, то есть отдать ему 100 монет и остаться без денег, но живым.
Поэтому В, представляя себе такой анализ Б, голосует против предложения А и получает от Б 100 монет, что несомненно наиболее рационально для В.
Хорошо, но мог ли Б наплевать на произошедшее убийство А и всё равно сделать предложение 99-0-1-0? Или мог ли Б вообще искать поддержку у других пиратов, кроме В? Нет, потому что такое развитие событий противоречило бы условию о рациональности В (которое в данном случае можно рассматривать как самосбывающееся пророчество).
Итог: А умер, потому что ему не повезло стоять первым. Б не получил денег, но остался жив, что наилучший вариант для него при такой стратегии В. В остался жив и получил все деньги благодаря своему контринтуитивному голосованию. Г и Д остались живы и ничего не получили, так как Г никто ничего и не предлагал, а голос Д ни на что не повлиял.
Где я неправ в этом рассуждении?
Не так.
А не имеет никакой информации о стратегии других пиратов, поэтому умереть ему простительно, если рациональная стратегия не единственна или не детерминирована (например, если В кидает монетку).
Может быть, что рациональная стратегия других пиратов такова, что А надо убить вне зависимости от сделанного им предложения, просто чтобы напугать Б.
Но ваше возражение ценно в том плане, что раскручивает логику дальше в третий порядок.
Крайне сомнительная логика. Обычно для конференций разрешение выдаётся не на "что-то такое", а именно на конкретный материал, публикуемый в конкретном месте.
Сам принцип раскрутки справа налево подразумевает отсутствие учёта предыстории.
Распишите, пожалуйста, подробно рассуждения Б в том случае, если Б видит, что А фактически убит. Предложенный анализ совершенно обходит этот вопрос, что, на мой взгляд, выглядит подобно делению правой и левой частей уравнения на ноль в ходе рассуждений. Нет аккуратной логической связи.
По логике автора, Б должен сделать вид, что произошла какая-то ошибка и никакого А по сути вообще не было. Но это противоречит условию о рациональности пиратов.
Я пират В, и я хочу рассмотреть рассуждения Б в том случае, если я не соглашусь с А на одну монету, на что потенциально имею полное право.
Если пират В рационален (по условию) и, тем не менее, проголосовал против предложения А (предположим, что так произошло), то Б обязан сделать вывод, что его первоначальный анализ неверен и предпринять, видимо, какие-то другие действия. Другими словами, в предложенной формулировке задачи пираты своими голосами передают информацию друг другу, а не только перераспределяют добычу.
Особенно явно эта проблема становится видна, если удлинить цепочку ещё на несколько шагов. Например, пусть на корабле тысяча пиратов, а на кону миллион монет. Следуя логике автора, первый пират должен всё так же предлагать по одной монете нечётным пиратам. В то время как в другой логике каждый из пиратов, находящихся в середине цепочки, на каждом втором шаге играет в игру "забрать минимальную ставку или рискнуть в надежде на повышение?", а для пирата с минимальным номером это, в свою очередь, гораздо более интересная игра "достаточное предложение или смерть?". Обе носят вероятностный характер.
В Китае так и делают.
Тут я ошибся, конечно, Г и Д не равны в эндпиле, так как в ВГД для Г нет смысла в выживании В.
Тем не менее, всё же видя смерть А, рационально мыслящий Б не станет повторять его опыт. Б будет рассуждать таким образом: "Мой расчёт показывает, что коллектив должен был согласиться с предложением А, однако, как видим, это не так. Расчёт моих товарищей имеет какую-то другую природу. Что мне надо сделать, чтобы не повторить судьбу А?"
Как я уже сказал, вычисление правильного хода за Б в таком случае выше моих способностей. Однако это и не нужно, потому что рационально мыслящий А не должен довести дело до своей смерти.
Думаю, что тут надо расписывать всё дерево игры и считать, сколько какие ходы кому принесли. Может быть, можно сократить при этом общее количество монет, однако тоже не факт – возможна какая-то экспоненциальная зависимость ставок.
Можно сказать короче: предложение Б:99-0-1-0, рассмотренное в авторском решении, противоречит условиям задачи, так как подразумевает нерациональность А.
Вроде бы как статья 13.11 везде подразумевает прямой умысел в нарушении требований законодательства по обработке данных, поэтому применять её к самим по себе последствиям взлома нельзя. Неприятная история, конечно, но нигде в законе не прописана периодичность смены паролей.
А нас, например, в школе учили разнице между тире и дефисом.
Али-баба vs Али – баба.
Только если алгоритм единственный.
Г никогда не остаётся с нулём, в худшем случае у него 50% шанс получить минимальную ставку (так как в эндшпиле ВГД - Г и Д равны). Даже если он прокатит Б, то всё ещё мог бы получить от В. Более того, со стороны В логично предпочесть именно Г, которому он обязан выигрышем. А минимальная ставка в этом варианте развития событий должна быть не меньше 2, чтобы Б был уверен в принятии своего предложения.
Это как в преферансе выгоднее валить играющего, чем вистующего.
Допустим, А предлагает вариант 98-0-1-0-1. Тогда Б, Г и Д, руководствуясь моей логикой, голосуют против (Б и Г – потому что ничего не получают, а Д – потому что ему некуда торопиться), и А убивают. Тогда Б понимает, что, если он предложит 99-0-1-0, то возможно Г будет против, Б убьют, а выигрыш распределится либо 0-0-99-1-0, либо 0-0-99-0-1. Тогда Б вынужден был бы предлагать Г или Д такую сумму, которая заведомо сделает одного из них его союзником, то есть минимум 2. А это уже безусловно лучше для Б и в матожидании не хуже для Г и Д, чем предложение А (у каждого из Г и Д получается 50% вероятность получить 2 вместо 100% вероятности получить 1).
Возвращаемся назад. Понимая всё это, А видит, что его скорее всего убьют, если он предложит 98-0-1-0-1, и получат лучшее предложение от Б. Тогда А должен предложить такое распределение, которое не только не даст оснований отвергнуть его, просто чтобы запугать Б, но и будет лучше распределения В, что (схватка А с В), вообще говоря, непросто для А.
Короче говоря, убивая А с предложением 98-0-1-0-1, тройственное большинство БГД ничего не теряет, а поэтому такое предложение неприемлемо для А.
Так суть любой игры можно выхолостить до распасов. Если он будет соглашаться на 1 монету, то он больше и не получит. Тут действует антипричинность.
Но в варианте с 5 игроками обычная причинность.
В формулировках в Википедии говорится, что пираты при принятии решения ограничиваются только предложенным планом раздела. Это существенное уточнение.
Единственно верное решение у такой задачи может быть только в том случае, если заранее обязать пиратов пользоваться одним алгоритмом, известным друг другу.
Большинство игровых задач вероятностны.
Неправильно. Гораздо лучше будет на месте Г, например, подбросить монетку. Допуская, что Г будет подбрасывать монетку в случае 99-0-1-0, Б скорее всего предложит ему больше, например пусть 20 монет. Тогда матожидание выигрыша Г будет больше 1. Тут есть какой-то оптимум, но он явно отличается от 99-0-1-0.
Этого нет в условиях задачи.
В условиях задачи "рациональное" решение. Рационально тут склонить Б к более-менее справедливому дележу показательной казнью А. И А в таких условиях надо очень немало поразмыслить, чтобы остаться в живых и оставить себе хотя бы 1 монету.
Мы же вроде как матожидание выигрыша максимизируем, а не находим гарантированный локальный максимум?