valemak Nov 10 2013 at 03:53

ABC-сортировка

6 min

48K

C++*Algorithms*Perfect code*

+29

Comments 24

Anexroid Nov 10 2013 at 05:08

Платный алгоритм сортировки? С учетом того, что сорцы доступны, я что-то сомневаюсь, что все, у кого есть этот алгоритм в программах платили за него деньги

Mrrl Nov 10 2013 at 05:18

Про сложность не уверен. Если у всех строк первые 10^7 символов совпадают, не придётся ли алгоритму проверить их все, прежде чем перейти собственно к сортировке? И не будет ли память для вспомогательных массивов зависеть ещё и от длины строк?

valemak Nov 10 2013 at 09:53

>>> Если у всех строк первые 10^7 символов совпадают, не придётся ли алгоритму проверить их все, прежде чем перейти собственно к сортировке?

Линн Д. Ярбро и так и сяк тестировал сортировку, о чём он более-менее подробно описал здесь.

Действительно, худшая временная сложность у сортировки O(n * k), где k — количество обрабатываемых разрядов. Как раз относится к предложенному Вами варианту.

Немного подкорректировал таблицу характеристик алгоритма, добавил худшую и лучшую временную сложность.

>>> И не будет ли память для вспомогательных массивов зависеть ещё и от длины строк?

Трекер слов (основной пожиратель дополнительной памяти) — точно не будет. Сортировка устроена так что при любых раскладах в качестве word tracker достаточно только одномерного массива из n элементов.

От длины строк прямо зависит трекер букв, но если сортировать список из миллиона элементов то его размерами можно пренебречь при оценке памяти.

akamajoris Nov 10 2013 at 06:55

Ну вот, лишили магистра богословия денег на постройку крайне важного храма.

mejedi Nov 10 2013 at 07:20

Так это же сортировка при помощи trie, просто с оптимизированным представлением trie. Патент анулировать.

valemak Nov 10 2013 at 11:30

Я пытался пообщаться с Бичиком по поводу «уникальности» алгоритма, но он меня проигнорировал. :)

alexeykuzmin0 Nov 10 2013 at 08:27

Казалось бы, это полностью эквивалентно поразрядной сортировке

valemak Nov 10 2013 at 11:25

Полная эквивалентность — нет. Улучшенная (оптимизированная) версия — да.

В классической radix sort просматриваются все разряды. В ABC-сортировке перебор разрядов прекращается как только список упорядочен.

chersanya Nov 10 2013 at 11:53

Но ведь сортировка со средним временем работы O(n) невозможна, не так ли? Из статьи совсем непонятно, откуда взялась эта оценка именно для среднего (а не лучшего) случая.

valemak Nov 10 2013 at 12:21

Я с Вами соглашусь, средняя временная сложность O(n) — это последствия моего куцего перевода с английского.
Средняя временная сложность у этой сортировки — O(n * k), где k — количество обрабатываемых разрядов. Внёс изменения в статью, спасибо за замечание.

VenomBlood Nov 10 2013 at 13:07

Ну почему же невозможна? Например можно 32 разрядные числа сортировать за линейное время (в худшем случае), можно и 64 разрядные, и 128 разрядные и т.д…

starius Nov 10 2013 at 15:52

Числа и строки подходят для блочной сортировки, которая может происходить за линейное время, так как их можно не только сравнивать, но и распределять по «корзинам».

VenomBlood Nov 10 2013 at 16:38

Это как-то опровергает то что я написал? Я тоже самое и имел ввиду.

starius Nov 10 2013 at 17:26

Я хотел понять, думаем ли мы об одном и том же, а не оспорить.

chersanya Nov 10 2013 at 16:48

Ограничивая диапазон значений — конечно можно. Но в общем массив чисел или строк сортировать за линейное время нельзя.

VenomBlood Nov 10 2013 at 16:53

Я именно об этом и говорю. Для целых, например, ограничения на размер элемента достаточно чтобы отсортировать за линейное время. Также если строки ограничить по длине — то сортировку можно выполнять за линейное время.
Никто и не говорит что в общем случае можно, т.к. в общем случае только чтение будет зависеть не только от размера массива, но и от размера элементов в этом массиве.