SharplEr8 июн 2017 в 12:47

Дополнение к анализу алгоритмов

6 мин

Математика *

Из песочницы

+16

Комментарии 7

alexeykuzmin0 8 июн 2017 в 13:50

Спасибо, интересная статья!
Я правильно понимаю, что оценка применима только для линейных нормированных пространств входных данных? То есть, скажем, для алгоритма Дейкстры нельзя посчитать smoothed оценку, хотя на множестве графов и можно ввести корректную метрику.
И перепроверьте, пожалуйста, формулу — в ней точно x и r не перепутаны местами? А то получается, что r — это элемент входных данных, и он умножается на коэффициент sigma, на норму x, потом складывается с x и получается новый элемент входных данных.
И, кстати, к какому множеству принадлежит r? Если это единичный шар в пространстве входных данных (что было бы логично предположить для большинства применимых на практике случаев), то формулу можно переписать в 100 раз понятнее через понятие эпсилон-окрестности. Заодно, кстати, и требование линейности пространства входных данных пропадет, останется лишь метричность.

SharplEr 8 июн 2017 в 14:23

Тут действительно есть некоторое лукавство т.к. для большинства задач ввести близость решений можно по разному, что будет менять smoothed оценку. Например можно взять все возможные входы, отсортировать по времени их обработки и тогда всегда smoothed оценка будет близка к максимуму. Насколько я понимаю (но это не точно) здесь делается неявно такое предположение, что выбранная функция расстояния не будет скоррелирована с временем работы. И если у алгоритма smoothed оценка близка к худшей, значит подобрать группу плохих задач для него достаточно легко. И наоборот если она ближе к среднему, то подобрать такую группу сложно. Думаю можно даже доказать теорему, что выбранные случайным образом две функции расстояния дают в среднем не слишком разные оценки. Но формула действительно написана так, что должна существовать операция сложения на входных данных и умножения на коэффициент, кажется из этого следует линейность.

x — это центр шара в котором мы считаем среднее, r действительно некоторый случайный вектор по которому мы берем среднее (он чисто по размерности должен быть из пространства поиска). По идее его длина не очень важна т.к. у нас есть сигма для нормировки. К слову в статье вектор берут по всему пространству поиска, но распределен он нормально от длины.

basilbasilbasil 8 июн 2017 в 17:29

Несмотря на то, что чтение из L1 кэша примерно в 200 раз медленнее

быстрее

SharplEr 8 июн 2017 в 18:20

Спасибо. Исправил.

popolznev 26 июн 2017 в 19:10

Тут нарисовано распределение времени по множеству входных данных для некоторого n.

Пардон, я не понял: что значит "нарисовано распределение", почему области двумерные?

SharplEr 27 июн 2017 в 12:02

Области не двумерные. Тут нарисовано просто абстрактное множество всех возможных входов длины n (из формул так же вытекает, что оно нормированное, но никаких предположений о его размерности не делается). А оценки времени работы на конкретном входе выделены на множестве цветом. Это не распределение вероятности, тут слово «распределение» употреблено в обычном своем значении, а не в вероятностном.

popolznev 3 июл 2017 в 19:39

Да, синонимия сбила меня с толку.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий