altors Dec 15 2024 at 12:26

Опасность наивности

Easy

7 min

C# * Algorithms * Reading roomProgramming *

Translation

+24

Comments 23

Ydav359 Dec 15 2024 at 13:53

Это выглядит довольно бесхитростно, хотя хотелось бы, чтобы в C# была команда Swap()

https://learn.microsoft.com/ru-ru/dotnet/api/system.random.shuffle?view=net-9.0

Разве Shuffle в данном случае не делает то же самое?

mekegi Dec 16 2024 at 17:48

Да - под капотом всех шаффлов - перестановки Кнута.
Алгоритм работающий за линию и на выходе дающий честные* 1/n вероятности попадания для каждого элемента в любое место на выходе.
У Кнута в его "Искусстве программирования" есть доказателство.
*настолько честные - насколько ваш рандом "честен"

п.с. лет 10 на собесах давал эту задачу и следом "а как бы вы протестили что ваше решение дает честные 1/n"

accsentive Dec 15 2024 at 13:57

Спорна сама уверенность в "лучшести" некого алгоритма генерации случайного числа. Бросая кости, вы же не мыслите логикой. что следующее число очков будет зависеть от результата предыдущего броска.

BugM Dec 15 2024 at 15:36

Почему? Если желаемое распределение выхлопа этой функции. Смотрим результат и сравниваем с желаемым распределением. Оцениваем хорошесть.

accsentive Dec 15 2024 at 16:02

Кроме диапазона и процессорной логики разве не должен быть какой-то фактор из материального мира

BugM Dec 15 2024 at 16:07

/dev/urandom вам точно не подойдет?

kinall Dec 15 2024 at 14:08

Немного завидую людям, способным настолько упарываться в простые, на первый взгляд, и, честно говоря, не особо важные вопросы

Alexandroppolus Dec 15 2024 at 15:05

Автор не умеет в лаконичность. Например, весь параграф про недостаток наивного алгоритма можно выразить одним предложением, что n^n не делится на n!, потому что n и (n-1) взаимно просты, и значит перестановки распределятся не поровну по исходам.

В древней Спарте такая подача материала не сошла бы автору с рук.

Wladislavich Dec 16 2024 at 05:48

Ох уж эти математические дискурсы на кулаках, которыми известна древняя Спарта. Вы допускаете, что автор написал понятнее для тех, кто лучше понимает формулы + текстовые описания? Тем более это перевод.

ABConymous Dec 16 2024 at 15:22

А причем тут кулаки, если речь про лаконичность

SystemOutPrintln Jan 20 at 10:00

не особо важные вопросы

Что, простите? Это корректная-то генерация случайных чисел - "не особо важный вопрос"?

Которая используется во множестве важных отраслей, от разработки игр до криптографии и науки.

Вот из-за таких "специалистов" нас и окружают тысячи кривых программ, сервисов и сайтов. "Ачётакова, и так сойдёт, сделаю как попало, это не особо важный вопрос". Вот и имеем, что имеем, из-за наплевательского отношения ко всему, что "специалисту" показалось "не особо важным вопросом".

ImagineTables Dec 15 2024 at 14:35

var shuffledcards = cards.OrderBy(a => Guid.NewGuid());

Я представил, что было бы, если бы нынешние оптимизаторы сишных компиляторов добрались до дотнета. Они бы всем показали. Если Guid.NewGuid() не является полем a, значит программист сам не знает, чего хочет, а дальше было бы как в анекдоте про return 4; // Random enough.

Gromilo Dec 16 2024 at 06:38

Нам ещё везёт, что OrderBy кэширует значение NewGuid().

А если бы делегат вызывался при каждом сравнении внутри сортировки?

Jijiki Dec 15 2024 at 14:49

написано синхронизация по времени и далее предлагается очень нагрузный алгоритм KFY - я посмотрел на картинке его алгоритм первое о чем подумал что он еще проще предсказуем, перечитал еще раз участок текста с синхронизацией посмотрел граффик и пока ничего не понял(чтобы сделать ту синхронизацию наверняка надо всё понимать еще лучше чем с такой сортировкой)

Jijiki Dec 15 2024 at 15:28

low (50<) :30496
high (50>) :29504

наивный бросок монетки уложился в 50 процентов или должно быть иначе?

domix32 Dec 15 2024 at 15:27

сортировать по некоторому Guid

Так Guid сам под капотом использует рандом, разве нет? Общей энтропии конечно больше ест, но при размере массива в 52 элемента уровень случайности перемешивания лучше едва ли станет.

dom1n1k Dec 15 2024 at 18:03

Вспоминается университетская лабораторная по криптографии — всех подробностей уже не восстановить, но среди прочего тоже нужно было случайно перемешать массив.

Я придумал, как мне тогда казалось, ловкое и практичное решение: завёл второй массив той же длины, заполнил его случайными числами, а потом отсортировал, при этом зеркально повторяя все перестановки в основном массиве.

posledam Dec 15 2024 at 21:02

Кто-то нашёл в статье чёткий критерий "качества" перемешивания?

BugM Dec 15 2024 at 22:30

Там раза три написано. Перемешано качественно означает что вероятность любого расклада (порядка карт в колоде) одинакова.

h0tkey Dec 16 2024 at 05:40

Ещё один эквивалентный критерий, который иногда удобнее в доказательстве — это то, что каждый элемент на каждой позиции окажется равновероятно.

SagePtr Dec 16 2024 at 12:29

каждый элемент на каждой позиции окажется равновероятно

Не назвал бы эквивалентным. Пример таблицы вероятностей:

Скрытый текст

123 - 33.(3)%
132 - 0%
231 - 33.(3)%
213 - 0%
312 - 33.(3)%
321 - 0%

Каждый элемент на каждой позиции встречается равновероятно, но при этом вероятность у отдельных комбинаций совершенно разная.

netch80 Dec 16 2024 at 21:10

К замечанию про рандом-из-миллисекунд хочу добавить, что давно пора форсировать, что все random-ы по умолчанию используют максимально честный криптографический недетерминированный рандом (если не аппаратный генератор, то хотя бы Yarrow или Fortuna), а детерминированные оставить для математиков с явно помеченными именами.

Ну а наивный переставлятор... изначально плохо пах. Но чтобы это из ощущения превратить в твёрдый вывод, тут и нужна математика.

michael_v89 Dec 22 2024 at 18:11

К правильному решению можно прийти проще. Что нам надо сделать? Перемешивание. Точнее, модель реального перемешивания. Как выглядит реальное перемешивание? Берем несколько карт из случайной позиции, и помещаем в другое место среди других карт. Для лучшего перемешивания надо брать по одной. Что означает "берем"? Что мы физически убираем карту из колоды. Когда она перемещается в другую позицию, она находится в руке, а не в колоде.

Значит в коде, который моделирует процесс перемешивания, должно быть 2 списка карт. Второй изначально пустой. Берем случайный индекс от 0 до длины первого списка, убираем карту из первого списка, добавляем во второй. Суммарная длина двух списков всегда равна длине исходного, поэтому можно оптимизировать и использовать конец первого списка как второй список. А вместо сдвигов нескольких карт в первом списке на 1 элемент можно ставить на пустое место последнюю карту, все равно индексы случайные.