Comments / Profile of prg / Habr

Первое приближение создано, чтобы быть приближением к финальному алгоритму…
стразу после этого приближения описывается, насколько оно неэффективно

Альтернатива брутфорсу. Текстовый поиск с хеш-функцией

prg Jan 4 2009 at 05:29

м-м-м… как бы сказать :)

берём брутфорс: два вложенных цикла. Сложность перемножается. То есть O(n*m), где n — длина строки, а m — длина шаблона.

берём алгоритм Рабина-Карпа: Предварительные вычисления сложности O(m) и потом опять два цикла, причём вложенный практически не запускается в холостую. Если взять base и q очень большими (но всё же простыми) числами, влазящими в int32, то на практике внутренний цикл можно не запускать — с огромной вероятностью совпадение хеш-значений будет свидетельствовать о совпадении строк.

Таким образом, сложность алгоритма в среднем случае O(m+n), что меньше O(m*n). В худшем случае сложность будет O(n*m), хотя вероятность такого случая на практике крайне мала.

Альтернатива брутфорсу. Текстовый поиск с хеш-функцией

prg Jan 3 2009 at 15:47

«умножение кода символа на экспоненциально зависящее от позиции этого самого символа»
извините, имел в виду «умножение кода символа на экспоненциально зависящее от позиции этого самого символа число»

Альтернатива брутфорсу. Текстовый поиск с хеш-функцией

prg Jan 3 2009 at 15:45

Пожалуйста, читайте внимательнее.

private int GetHashOfString(string s, int q, int b)

{

int result = 0;

int length = s.Length;



for (int i = 0; i < length; i++)

result = (b * result + s[i]) % q;

return result;

}

Разве умножение кода символа на экспоненциально зависящее от позиции этого самого символа может дать симметричную хеш-функцию?

Альтернатива брутфорсу. Текстовый поиск с хеш-функцией

prg Jan 3 2009 at 15:18

на главной сразу после habrahabr.ru/linker/go/48275/ смотрится отвратно, ИМХО.

Альтернатива брутфорсу. Текстовый поиск с хеш-функцией

prg Jan 3 2009 at 13:19

про то, как перейти от брутфорса к МП, а от МП к КМП хотел в следующий раз обзор сделать… вот только не знаю — есть ли смысл, поскольку:
1) есть хорошие визуализации, вроде этой (спасибо el777 )
2) немногим это будет полезно

хотя…
я конечно стараюсь писать то, как я это представляю, ознакомившись с другими источниками. может быть кому-то будет интересна мелочь, которую он не замечал (в принципе это и есть повод писать и читать статьи — менять систему отсчёта для знакомых вещей так сказать).

одним словом — попробую написать что-то интересное или неочевидное в давно известном алгоритме

Введение в поиск по тексту

prg Jan 2 2009 at 10:33

я написал, что это лишь вступление, а быстрые и эффективные методы интересны и самому. Но не начинать же с мегакрутых алгоритмов? хочется постепенно… с примитива

Введение в поиск по тексту

prg Jan 2 2009 at 08:02

я пока попробую пописать (это моё первое), а как немного научусь — вынесу в отдельный блог текстового анализа…
наверное…

Введение в поиск по тексту

prg Jan 2 2009 at 06:51

Спасибо конечно… :)
Но это всего лишь введение, которое планируется продолжать более быстрыми и эффективными алгоритмами