catstail1954 Nov 3 2020 at 18:43

Цена естественности или как обогнать QuickSort

5 min

7.8K

Algorithms *

+10

Comments 28

lair Nov 3 2020 at 19:57

Но всегда ли QuickSort является «абсолютным чемпионом»?

Нет, не всегда.

Мне вот интересно, вы про timsort слышали?

catstail1954 Nov 3 2020 at 20:20

А Вы первый абзац сообщения прочитали?

lair Nov 3 2020 at 20:23

Когда я читал, там был TeamSort, который мне неизвестен.

А если вы про него знаете, то странно, что вы не обсуждаете его, потому что он обладает описанным качеством (и в пределе на отсортированных данных имеет линейное время выполнения), но при этом имеет худший случай с n log n.

catstail1954 Nov 3 2020 at 20:33

Это я ошибся в названии timsort — не так написал.

catstail1954 Nov 3 2020 at 20:34

Так я с QuickSort сравниваю…

lair Nov 3 2020 at 20:35

… а зачем?

catstail1954 Nov 3 2020 at 20:55

Было интересно. Забыл спросить разрешения у вас…

Svoa Nov 3 2020 at 20:20

Что то вспомнилось выступление Андрея Александреску www.youtube.com/watch?v=FJJTYQYB1JQ Там примерно о том же, но подробнее.

Siemargl Nov 3 2020 at 20:24

Он еще статью написал, см мой коммент.

Siemargl Nov 3 2020 at 20:23

А еще есть вариант Квиксорта с разбиением Ломуто, которое, как показано тут в блоге D Александреску, можно сделать с минимизацией условных переходов в коде и выиграть >20%.

kovriga25 Nov 3 2020 at 21:05

Поздравляю, вы открыли адаптивные сортировки, упомянутый timsort как раз из этих ребят.

catstail1954 Nov 4 2020 at 06:47

Ха-ха!..

UFO landed and left these words here

catstail1954 Nov 4 2020 at 06:47

Сложность QuickSort, тем не менее — n*log(n). ru.wikipedia.org/wiki/%D0%91%D1%8B%D1%81%D1%82%D1%80%D0%B0%D1%8F_%D1%81%D0%BE%D1%80%D1%82%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B0

Sdima1357 Nov 4 2020 at 07:54

Худшее время у него -квадратичное, Вы хотя бы сами читали то, на что ссылаетесь

catstail1954 Nov 4 2020 at 08:00

Худшее — да. Среднее — нет. Я рассматривал QuickSort в выгодной для нее области.

Sdima1357 Nov 4 2020 at 08:21

В выгодной области сортировка у меня занимает о(1). Обычно все таки принято указывать худшее время для алгоритмов, а не среднее, когда говорят о теоретической производительности.

catstail1954 Nov 4 2020 at 09:12

Какая универсальная сортировка у вас выполняется за O(1)?

Sdima1357 Nov 4 2020 at 10:30

«Ничего не делать» — это универсальный метод, переоткрытый лично мной. Возможно напишу статью на эту тему. Работает за 0 времени. В случае уже отсортированных данных работает отлично за О(1). В других случаях — хуже, может сортировать за О(inf). Но важна ведь удобная для него область…

catstail1954 Nov 5 2020 at 15:55

А… Ну понятно. Уровень возражения чувствуется.

cadovvl Nov 5 2020 at 09:24

Ну тут все, конечно, можно притянуть за уши.

Есть такая теорема, что если мы считаем QuickSort недетерминированным (случайный выбор элемента для partition на каждом шаге), а потом посчитаем среднее время для всех возможных стартовых сидов этого случайного алгоритма, то мы действительно получим n log(n). Тоесть, в каком-то смысле QS «всреднем» эффективен, а «неудобная область» для него довольно мала.

Но в этом случае:
1) Нужно обговорить что мы имеем ввиду под «показатель производительности». Это может быть и не сложность алгоритма.
2) Нельзя использовать O-нотацию.
3) Вообще, упомянуть эти вещи

Ну и еще могу набросать претензий. А пока статья выглядит как школьная домашняя работа в духе «посмотрите, что я узнал за летние каникулы».

Sdima1357 Nov 5 2020 at 09:52

Да я знаю, что я не совсем прав, но автор статьи так забавно поставляется под троллинг и так на него ведётся…
А О нотация — это просто нотация. Ей можно характеризовать и теоретическую и практическую производительность, но с оговорками.
Обычно они совпадают и оговорок не требуется.
А статья — да, согласен, школьная. Другие у автора получше.

catstail1954 Nov 5 2020 at 15:57

А некоторым читателям и школьные знания будут нелишиними…

catstail1954 Nov 5 2020 at 15:58

«Ну и еще могу набросать претензий» — у вас, часом, не юридическое образование?

wataru Nov 6 2020 at 10:40

Вообще говоря, теоретически, можно выбирать медиану за O(n) и тогда квиксорт работает за O(n log n) в худшем случае. Этого никто не делает, потому что на практике получается сильно медленнее из-за офигенно большой константы линейного поиска медианы.

Если тупо выбирать случайный pivot, то вероятность быть заметно медленее n log n пренебрежимо мала.

Sdima1357 Nov 6 2020 at 11:16

Речь шла о том, что не стоит ссылаться на источник, в котором написано ровно противоположное. А вариация с медианой медиан это все таки не совсем тот же алгоритм., Но интересный, поскольку медиана медиан -это необязательно медиана и как раз медиану за о(п) выбрать таким способом не получится. Так что читайте внимательней источники :)

wataru Nov 6 2020 at 11:25

Нет, алгоритм по ссылке — именно находит медиану (вернее любую к-ую порядковую статистику) за O(n). Медиана медиан в нем используется в качестве разделителя, чтобы две половины были достаточно равные.

Sdima1357 Nov 6 2020 at 12:00

Не убедили.Ни относительно порядка, ни относительно медианы… Будет время, проанализирую повнимательней.