Pull to refresh
  • by relevance
  • by date
  • by rating

Нечеткий поиск в словаре с универсальным автоматом Левенштейна. Часть 1

Search enginesAlgorithmsNatural Language Processing
Sandbox


Нечеткий поиск строк является весьма дорогостоящей в смысле вычислительных ресурсов задачей, особенно если вам необходима высокая точность получаемых результатов. В статье описан алгоритм нечеткого поиска в словаре, который обеспечивает высокую скорость поиска при сохранении 100% точности и сравнительно низком потреблении памяти. Именно автомат Левенштейна позволил разработчикам Lucene повысить скорость нечеткого поиска на два порядка
Читать дальше →
Total votes 53: ↑51 and ↓2 +49
Views54.2K
Comments 7

Нечеткий поиск в словаре с универсальным автоматом Левенштейна. Часть 2

Search enginesAlgorithmsNatural Language Processing


В первой части статьи мы рассмотрели универсальный автомат Левенштейна — мощный инструмент для фильтрации слов, отстоящих от некоторого слова W на расстояние Левенштейна не более заданного. Теперь пришло время изучить способы применения этого инструмента для эффективного решения задачи нечеткого поиска в словаре.

Читать дальше →
Total votes 32: ↑32 and ↓0 +32
Views20.2K
Comments 3