valemak Oct 18 2013 at 14:44

Непрактичные сортировки – бессмысленные и беспощадные

7 min

100K

Abnormal programming*Java*Algorithms*

+69

Comments 54

x4fab Oct 18 2013 at 14:58

А что насчёт Sleep Sort?

+36

maximw Oct 18 2013 at 15:13

Я так понимаю сложность O(n)

kirksa Oct 18 2013 at 15:27

O(max-value + n)

Tully Oct 18 2013 at 16:20

Если max-value — константа, то то что вы написали равно O(n).
О() определяет то, как увеличится нужное кол-во операций при увеличении числа сортируемых элементов.

O(C) = 0 так как изменение числа элементов не влияет на результат (например время обращения к элементу массива по индексу не зависит от размера массива)

O(C+N)=O(C)+O(N) = O(N)

-3

kirksa Oct 18 2013 at 16:39

max-value — максимальное значение элемента. И это не константа. И да, я знаю что такое O-большое.

Tully Oct 18 2013 at 16:48

Если это не константа, как оно зависит от числа сортируемых элементов?

-1

kirksa Oct 18 2013 at 16:51

Почему оно должно зависеть от числа сортируемых элементов? О-нотация может включать в себя несколько параметров. n и max-value — не зависящие друг от друга

nile1 Oct 18 2013 at 17:24

Все-таки max-value не константа, это максимальное значение во входном массиве. И от него действительно зависит время выполнения алгоритма. Для примера, что рост времени выполнения алгоритма нелинеен от n, можно рассмотреть массивы {1, 9999999999999999} и {1, 2, 3, ..., 1000, 9999999999999999}. Оба массива будут сортированы за одинаковое время (если не учитывать время на инициализацию потоков).
Так что приведенная выше формула верна, O(m + n).

SergeyBankevich Oct 18 2013 at 17:31

1) А если n константа, то вообще O(1).
2) Если max-value константа, то O(max-value + n) = O(n)
Так что странное возражение.

AraneusAdoro Oct 18 2013 at 23:20

O(C) = 0 так как изменение числа элементов не влияет на результат (например время обращения к элементу массива по индексу не зависит от размера массива)

O(C+N)=O(C)+O(N) = O(N)

Серьёзно? За O(C) = 0 вообще по рукам бить надо.

O(C) = O(1)
C + n = O(n)

Tully Oct 18 2013 at 16:00

SleepSort не зависит от N. Время работы алгоритма константное. Зависит от максимального размера сортируемых чисел и времени задержки.

wataru Oct 18 2013 at 16:09

А как же затраты на создание процессов?

Jimilian Oct 18 2013 at 16:23

Речь идет об алгоритмической сложности. Ей чужды такие низменные вещи, как процессор, память, диск…

wataru Oct 18 2013 at 16:51

А вот и нет, эта операция, сколь бы мало времени она не занимала в асимптотической оценке должна участвовать. При достаточно больших n, и малых значениях чисел, время работы будет вести себя линейно по n.

burdakovd Oct 18 2013 at 21:47

Не могу смотреть на такую несправедливость, так что поддержу.

В SleepSort всё равно нужно из главного потока создать N вспомогательных, ну или, если переиспользовать вспомогательные потоки, как ниже предлагают, то N раз передать информацию о наличии числа в нужный поток.

Следовательно даже если пренебречь временем работы шедьюлера ОС, мы должны сделать минимум N операций в основном потоке.

Интересен тот факт, что если мы задумаемся как мог бы быть реализован шедьюлер (очередь с приоритетами = куча например), то получим O(ln(N)) на вставку, и общее время работы сортировки в привычные O(N ln(N))

Tully Oct 18 2013 at 16:42

Можно заранее создать тредпул с количеством тредов равным максимальному размеру сортируемых чисел. Время его создания будет константным и не зависит от числа сортируемых элементов.

-3

wataru Oct 18 2013 at 16:53

Сама команда sleep имеет не нулевую задержку. Кроме того операция передачи команды потоку тоже является действием и ее нельзя игнорировать.

Tully Oct 18 2013 at 16:48

В некотором смысле SleepSort это временнОе представление radix sort. Только вместо индекса в массиве у вас секунды.

-2

wataru Oct 18 2013 at 16:56

Только не radix sort, а сортировка подсчетом. И у нее сложность будет именно O(n+k): википедия

kirksa Oct 18 2013 at 16:49

Время работы алгоритма константное

Очевидно, что это не так. Доказательство — наличие цикла while с количеством итераций равным количеству элементов.

Tully Oct 18 2013 at 17:19

Да. Согласен. Количество сортируемых элементов может быть любым. А значит время запуска алгоритма не ограничено и линейно растет с числом элементов.
Спасибо.

Tully Oct 18 2013 at 17:26

Да, видимо в этом и есть причина спора. Считать ли операцию запуска алгоритма частью алгоритма?
Если да, то линейное. Если нет — константа.

-2

nile1 Oct 18 2013 at 17:33

Дело не только в запуске. Потоки не завершают свое выполнение мгновенно, и Sleep не занимает строго заданное количество времени.
Например, сортировка массива из 10 одинаковых элементов и 1000 одинаковых элементов с теми же значениями займет разное время. Хотя в этом случае зависимость вряд ли будет линейной.

Mrrl Oct 18 2013 at 21:03

Задержку придётся задавать в единицах, пропорциональных N — чтобы массив из двойки и N-1 единиц отсортировался правильно (для этого нужно, чтобы все N значений попали в очередь быстрее, чем за 1 единицу задержки). Так что время при правильной реализации будет O(N*max_value) :(

WGH Oct 18 2013 at 17:52

Так зависит все от планировщика ОС. Он собственно и занимается сортировкой, решая, какой процесс пора пробудить. Может он в очередь с приоритетом их выстраивает, тогда это будет по сути heapsort.

valemak Oct 18 2013 at 17:17

Получалась слишком долгая анимация, пришлось отказаться )))

dimkagfx Oct 18 2013 at 15:08

А как же StackSort?

+24

pda1983 Oct 18 2013 at 15:56

Бабушкин рулит — все-таки наш человек. :)))

-2

ParkeTg Oct 18 2013 at 19:31

Вот вы смеетесь, а вычислиние числа Бабушкина весьма тривиальная задача.

Решение

Для этого я предлагаю использовать дополнительный, третий массив. Отсортируем 1-й массив QuickSort-ом, например. Результат запишем в 3-й массив. Далее, мы можем построить таблицу соответствия, из которой мы и получаем число Бабушкина.

Пример:
Массив-1:

3 1 2 5

Массив-3 (уже заполненный):

1 2 3 5

Таблица соответствия:

[0] > [2]
[1] > [0]
[2] > [1]
[3] > [3]

(поскольку один разряд указывает на один элемент массива, при формировании таблицы индексы необходимо перевести в систему счисления с основанием n, где n — длина сортируемого массива)

Несложно заметить, что числом Бабушкина является 2-й столбец (при чтении сверху вниз). Запишем его:

(не забываем, что число у нас в четверичной системе счисления)

Для вычисления чисел, при делении которых, дробная часть равна числу Бабушкина, нам необходимо вычислить логарифм этого числа по основанию n, где n — длинна массива (d). Теперь, если возвести n в степень d+1, получим делитель. Число Бабушкина же будет делимым.

Все, можно приступать к сортировке Бабушкина.

nochkin Oct 18 2013 at 20:46

Есть ещё вариант вычислить число Бабушкина — надо позвонить Бабушкину по телефону и спросить это число.
По своему опыту скажу, что лучше всего звонить поздно ночью, тогда шанс что Бабушкин будет занят чем-то другим очень низок и это будет сильно способствовать увеличению общей производительности алгоритма.

valemak Oct 19 2013 at 00:05

«Иммунитет» хорошо проявляет себя в паре с другим антивирусом. (Бабушкин)

Сортировка Бабушкина особенно эффективна в симбиозе с другой сортировкой.

valyard Oct 18 2013 at 20:57

А как же Quantum Bogosort?!

Алгоритм, в котором предполагается, что теория о множестве вселенных верна. Тогда алгоритм получается следующий:
1. Проверить отсортирован ли массив?
2. Если нет, уничтожить вселенную.
В конце останется лишь вселенная, в которой массив изначально был отсортирован.

Мой любимый.

+13

UFO just landed and posted this here

valyard Oct 19 2013 at 00:11

Наихудший вариант, же

UFO just landed and posted this here

Mrrl Oct 19 2013 at 01:20

Она не одна. Все Вселенные, в которых массив был отсортирован, продолжат существовать.
Кстати, вместо Вселенной достаточно уничтожать Наблюдателя. Тогда, с его точки зрения, массив будет отсортирован (по принципу квантового бессмертия).

Skywrtr Oct 19 2013 at 11:12

Сортировка Шредингера. Пока наблюдатель не видит массив, он одновременно отсортирован и не отсортирован.

deNULL Oct 19 2013 at 01:16

Просто это работает только на тех платформах, где присутствует инструкция «уничтожить Вселенную».

spacediver Oct 19 2013 at 05:02

valyard Oct 18 2013 at 20:58

А вообще, перевели бы www.reddit.com/r/programming/comments/thtx/my_new_favorite_sorting_algorithm/

valemak Oct 19 2013 at 17:18

Спасибо за наводку. Как дойдут руки через пару недель сделать продолжение этой темы, то метод сортировки «Разумного замысла» туда обязательно войдёт.

burdakovd Oct 18 2013 at 21:39

> Клоун Бозо™ сортирует со средней временной сложностью O(n x n!) и это же является и верхней границей по времени.

Как такое может быть? Ведь в худшем случае мы будем постоянно переставлять одни и те же два элемента, так что верхняя граница — бесконечность. Или вы как-то по другому определяете верхнюю границу для рандомизированных алгоритмов? Верхняя граница только по входным данным, с усреднением по выдаче ГПСЧ?

valemak Oct 19 2013 at 13:03

Вы абсолютно правы. В соответсвующем месте текста добавил примечание по этому поводу.

antarx Oct 18 2013 at 21:58

Кстати зря смеётесь над алгоритмом Бабушкина: как ни странно он даёт вполне пристойную сортировку.
Алгоритм: строим цепную дробь для числа Бабушкина. В какой-то момент либо цепная дробь закончится (т.к. конечна), либо ошибка будет меньше последнего разряда (и поскольку отклонение приближения цепными дробями на каждом шаге меняет знак, эта либо следующая дробь подойдёт под условие «совпадает с точностью до последнего знака»). Каждый шаг цепной дроби сводится к обращению длинного числа (разделить 1 на него).
Рост знаменателя приближения цепной дробью, насколько я помню, оценивается как y^k, где k — количество шагов, y — константа. При этом отклонение от искомого числа Бабушкина не больше 1/(квадрат знаменателя).

Сложение-вычитания длинных чисел — линейны, количество шагов — логарифм. Таким образом, оценка скорости поиска пары чисел для числа Бабушкина: O(сложность деления длинных чисел * logn). Сложность деления 1 на длинное число по этой статье сводится к сложности умножения
citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.71.7394&rep=rep1&type=pdf
т.е. O(n * logn).

Таким образом, алгоритм будет работать за O(n*log^2(n)) — что весьма неплохо.

ncix Oct 18 2013 at 23:19

Когда в детстве только знакомился с программированием, довольно быстро придумал свой алгоритм сортировки. Создаем второй массив такого же размера. Обходим исходный массив в поиске наименьшего элемента. Записываем в новый. Снова обходим первый массив в поиске наименьшего но большего чем предыдущий и т.д. Сложность очевидно O(n x n). Причем стабильно при любом раскладе.
О каноничных алгоритмах сортировки узнал почему-то только в универе.
PS: сейчас подумал, что в алгоритме очевидный баг: если в исходном массиве есть одинаковые элементы, то в результирующем они будут в единственном экземпляре.

blueboar2 Oct 19 2013 at 08:13

Может вы не в курсе, но ваш алгоритм — самая что ни на есть каноничная «сортировка выбором», о которой написано даже на википедии

valemak Oct 19 2013 at 14:04

Ну, «изобрести» в детстве то что уже давно придумано — это святое. Если в юном возрасте есть желание и попытки «вносить свой вклад в науку» то можно только поприветствовать. Лишь бы в дальнейшем это не приобретало клинических форм как у некоторых.

Кроме того, приведённый способ не является «самой что ни на есть каноничной «сортировкой выбором». Об этом свидетельствует и честно признаваемая автором применимость только к массивам с неповторяющимися элементами. А также использование дополнительного массива (в классической selection sort расходов на дополнительную память нет).

UFO just landed and posted this here

lex_t Oct 19 2013 at 12:23

Бабушкин опять на пике популярности. Я все жду, когда он изобретет свои структуры данных типа «деревьев Бабушкина». Так же очень жду открытий в теории графов — «граф Бабушкина», «критерий Бабушкинности графа» и т.д…

Keyten Oct 19 2013 at 22:50

Добавлю аналог Bogo: сортировка болотным пузырьком.

Если упрощённо, то:
function BogoSort2(array){
array.sort(function(){ return Math.random() > 0.5; });
if( !isSorted(array) ) return BogoSort2(array);
return array;
}
function isSorted(array){
for(var i = 1, l = array.length; i < l; i++){
if(array[i] < array[i-1]) return false;
}
return true;
}

// заранее хочу извиниться за то, что 1. саму сортировку пузырьком лень писать, тем более, что во многих языках она есть. 2. не на Java, как в посте, а на JS. 3. отсутствие тега source, карма не позволяет.

valemak Oct 19 2013 at 23:03

Для заинтересовавшихся оформлю в более наглядном виде:

function BogoSort2(array) {

    array.sort(function() {

        return Math.random() > 0.5; 

    });

    if (!isSorted(array)) return BogoSort2(array);

    return array;

}

function isSorted(array) {

    for(var i = 1, l = array.length; i < l; i++) {

        if(array[i] < array[i-1]) return false;

    }

    return true; 

}

Fak3 Oct 20 2013 at 00:09

По этому поводу был даже выпуск xkcd http://xkcd.com/1185/

Ckpyt Oct 20 2013 at 03:05

А знаю еще более худший и варварский способ!
Называется — генетический алгоритм :-)
Берем начальный массив, массив генома — порядок расположения элементов в сортированном массиве.
А дальше тупо перебираем ВСЕ геномы и постоянно сохраняем лучший.
Можно оптимизировать, но тогда упадет временная сложность :-)
Итак, все то же, но по шагам:
1)задаем массив последовательными значениям от 1 до n. Говорим, что он лучший
2)проходимся по orig[genom[i]] и проверяем на неубываемость
3)сверяем количество неубывающих элементов текущего массива с количеством неубывающих элементов лучшего массива. Если текущий массив лучше лучшего, то он становится лучшим :-)
4)Если можем, формируем новую последовательность(перебором) и идем на шаг 2. Если не можем, выходим.
5) формируем итоговый массив.

Итоговая сложность — n*(2n+2)

mayorovp Dec 26 2014 at 21:22

Также отмечу, что тем не менее BozoSort в среднем всё равно будет сортировать быстрее чем BogoSort. Просто потому, что после каждого обмена массив проверяется на упорядоченность. В BogoSort часты случаи, когда массив находится в упорядоченном состоянии, однако если в этот момент не произвести проверку, а перемешивать далее, то вожделенное состояние осортированности на время утрачивается.

Что за бред? Сам процесс проверки массива на упорядоченность слишком медленный. Поэтому BozoSort работает медленнее, просто за счет более частых проверок.

Show the best of all time