>какова вероятность закончить игру за К шагов при оптимальной стратегии? Для вычисления вероятности, нужно пройтись по огромному числу деревьев решений. Вряд ли это интересно. Мой опыт говорит, что средняя длина игры составляет около 5,3-5,4.
>Зависит ли длина игры от исходной комбинации? Скажем, 0000 и 1234? Первая комбинация нелегитимна, повтор цифр не допускается. В общем случае, не зависит, если только я не предполагаю, какие-то предпочтения комбинаций у моего оппонента.
>Доступна ли общая формула для алфавита размера N и слова длиной M? Общая формула чего? "Вероятности закончить игру за К шагов при оптимальной стратегии"? Нет. Если про формулу Шеннона, то она универсальна, но... требуется знать вероятности различных ответов.
>Я так и не понял, что за формулы предложил написать чатгпт в Эксель? Формулы в приложенном файле Excel. Например такая: =BYROW(C4#; LAMBDA(y; СУММ(--(BYROW(GenerateUniqueFourDigitNumbers; LAMBDA(x; CountBullsAndCows(x; D1))) = y))))
Согласен. Интуитивно мне тоже кажется, что алгоритм минимакса близок к теории информации, за исключением "концовки", которую я описал в заметке. Знаний, чтобы доказать это мне не хватает, поэтому попросил ИИ. Ответ мне понравился)) https://baguzin.ru/wp/wp-content/uploads/2025/08/Otvet-na-komment-1.docx
Любопытно)) Сейчас подобная игра есть в открытом доступе для 5-буквенных английских слов на платформе The New York Times Games. И клон на русском языке https://wordly.org/ru?
Спасибо за замечание)) Я не задумывался об этом, а сейчас посмотрел, как заверстаны формулы и увидел, что в атрибуте alt действительно есть упоминание СЛМАССИВ
Алексей, спасибо за комментарий)) Я когда писал статью, озаботился тем, какой алгоритм генерации случайных чисел (ГСЧ) использует Excel. Это алгоритм Mersenne Twister. Его период порядка Е+6000. Так что в Excel описанная вами проблема не возникла бы. Правда, Excel не справился бы с генераций миллиардов случайных чисел. Подробнее об эксельном ГСЧ https://chatgpt.com/share/67ab2aae-1f68-800f-b57d-1bf6578312e7
Но где же я могу найти авторитетный источник, в котором бы обсуждался совершенно тривиальный и очевидный для математиков факт, что случайный процесс и случайная величина - это разные вещи?!
С одной стороны, вы правы. Если распределение не будет нормальным, формулы расчета стандартного отклонения и стандартной ошибки не изменятся. С другой стороны, статистические инструменты и статистический вывод могут потерять адекватность, к которой мы привыкли, работая с данными, распределенными нормально.
Если я правильно понял, вопрос относится к рис. 8. Для распределения Коши матожидание не существует. Но по набору выборок среднее значение чему-то будет равно.
Интересное замечание. Спасибо. Я ранее не использовал робастные методы. Почитал подробнее про оценочную функцию Тейла-Сена, и выполнил расчеты для данных на рис. 18. Поскольку выбросов нет, можно было ожидать, что наклоны по методу Тейла-Сена и наименьших квадратов (МНК) будут близки. Действительно метод Тейла-Сена дал чуть большее m = 0,8947. На 3,5% больше чем МНК.
Спасибо за ссылки. Ранее не сталкивался со стандартом IBCS. Обязательно почитаю. Думаю, что и указанные вами статьи, и моя статья полезны для аудитории.
>Если честно, когда открывал заголовок - думал статья будет для разработчиков - как рисовать красивые диаграммы доступными им средствами и не на EXCEL. Странно. Я специально в заголовке указал Excel, чтобы не возникали ложные ожидания.
>какова вероятность закончить игру за К шагов при оптимальной стратегии?
Для вычисления вероятности, нужно пройтись по огромному числу деревьев решений. Вряд ли это интересно. Мой опыт говорит, что средняя длина игры составляет около 5,3-5,4.
>Зависит ли длина игры от исходной комбинации? Скажем, 0000 и 1234?
Первая комбинация нелегитимна, повтор цифр не допускается. В общем случае, не зависит, если только я не предполагаю, какие-то предпочтения комбинаций у моего оппонента.
>Доступна ли общая формула для алфавита размера N и слова длиной M?
Общая формула чего? "Вероятности закончить игру за К шагов при оптимальной стратегии"? Нет. Если про формулу Шеннона, то она универсальна, но... требуется знать вероятности различных ответов.
>Я так и не понял, что за формулы предложил написать чатгпт в Эксель?
Формулы в приложенном файле Excel. Например такая:
=BYROW(C4#; LAMBDA(y; СУММ(--(BYROW(GenerateUniqueFourDigitNumbers; LAMBDA(x; CountBullsAndCows(x; D1))) = y))))
Согласен. Интуитивно мне тоже кажется, что алгоритм минимакса близок к теории информации, за исключением "концовки", которую я описал в заметке. Знаний, чтобы доказать это мне не хватает, поэтому попросил ИИ. Ответ мне понравился))
https://baguzin.ru/wp/wp-content/uploads/2025/08/Otvet-na-komment-1.docx
Любопытно)) Сейчас подобная игра есть в открытом доступе для 5-буквенных английских слов на платформе The New York Times Games. И клон на русском языке https://wordly.org/ru?
Спасибо за замечание)) Я не задумывался об этом, а сейчас посмотрел, как заверстаны формулы и увидел, что в атрибуте alt действительно есть упоминание СЛМАССИВ
Спасибо за комментарий! Google справился с поиском))
Алексей, спасибо за комментарий))
Я когда писал статью, озаботился тем, какой алгоритм генерации случайных чисел (ГСЧ) использует Excel. Это алгоритм Mersenne Twister. Его период порядка Е+6000. Так что в Excel описанная вами проблема не возникла бы. Правда, Excel не справился бы с генераций миллиардов случайных чисел. Подробнее об эксельном ГСЧ https://chatgpt.com/share/67ab2aae-1f68-800f-b57d-1bf6578312e7
Картинка ближе к началу текста задвоена.
Алексей, спасибо за великолепный комментарий!
Рекомендую книги и научные статьи Нассима Талеба. В частности, Статистические последствия жирных хвостов.
С одной стороны, вы правы. Если распределение не будет нормальным, формулы расчета стандартного отклонения и стандартной ошибки не изменятся. С другой стороны, статистические инструменты и статистический вывод могут потерять адекватность, к которой мы привыкли, работая с данными, распределенными нормально.
Спасибо! Поправил комментарий.
Если я правильно понял, вопрос относится к рис. 8. Для распределения Коши матожидание не существует. Но по набору выборок среднее значение чему-то будет равно.
Интересное замечание. Спасибо. Я ранее не использовал робастные методы. Почитал подробнее про оценочную функцию Тейла-Сена, и выполнил расчеты для данных на рис. 18. Поскольку выбросов нет, можно было ожидать, что наклоны по методу Тейла-Сена и наименьших квадратов (МНК) будут близки. Действительно метод Тейла-Сена дал чуть большее m = 0,8947. На 3,5% больше чем МНК.
Вы использовали данные в приложенном Excel-файле?
Я проверил наклон регрессионной кривой расчетом в лоб по формуле:
Подтвердил значение m = 0,8646.
Проверьте ваши расчеты.
Нашел ссылку на гайд IBCS в формате pdf https://antonz.ru/dataviz-guide/
Спасибо за ссылки. Ранее не сталкивался со стандартом IBCS. Обязательно почитаю. Думаю, что и указанные вами статьи, и моя статья полезны для аудитории.
Эта книга несколько раз упоминается в статье))
>Если честно, когда открывал заголовок - думал статья будет для разработчиков - как рисовать красивые диаграммы доступными им средствами и не на EXCEL.
Странно. Я специально в заголовке указал Excel, чтобы не возникали ложные ожидания.