Comments 6
вполне пригодная для вставки в SELECT
здесь попахивает regex injection
А в сторону soundex не смотрели? Мы сохраняем дополнительно к полям с возможными ошибками (именена, улица, город) их представление в форме soundex. При поиске поисковый запрос тоже в soundex переводим и простому селекту скармливаем.
Да, смотрели. Но во-первых, штатно soundex дружит только с английским, для которого, собственно и целился.
Безусловно, его можно попытаться адаптировать к великому и могучему — но, во-первых, необходимо более точное попадание в согласные и, во-вторых, soundex в оригинале кастрирует фонему до первых трёх слогов (согласных, если быть точным).
Безусловно, его можно попытаться адаптировать к великому и могучему — но, во-первых, необходимо более точное попадание в согласные и, во-вторых, soundex в оригинале кастрирует фонему до первых трёх слогов (согласных, если быть точным).
Soundex не всегда давал нужный результат в моём случае, пришлось переделать велосипед — сочетание алгоритмов Beider-Morse и Daitch-Mokotoff. Сработало для случаев, когда одно и то же название (или фамилия) транслитерировались по-разному: Железный, Železnij (латышский), Zeleznij (обрезанная диакритика) и Zheleznij (фонетическое транслитерирование). В данном конкретном примере общим ключом становится 484600. Форк доступен на гитхабе
Не уверен насчёт Sybase IQ, но Sybase ASE поддерживает вот такое: ссылка на мануал — не совсем регулярка, просто перечисление символов.
Sign up to leave a comment.
Поиск различных вариантов транслитерации русских текстов (ФИО) латиницей для выборок в MySQL