Pull to refresh
2
0
Send message
)))) ну так то да, но пока я сам вводил все это в систему я был в шоке от разнообразных вариаций на тему коверкай название улицы )))
Не не не пишите ка статью Пипец как интересно!
Я не тру программист ). ОБЯЗАТЕЛЬНО напишите ппц как интересно! кстати я помоему ранее видел статья про анализ ДНК на хабре, может даже ваши.
да но ошибка в слоге откажет в совпадении слога, а если ошибок 3 в 8 мибуквенном слове то это -3 слога из области совпадения, а при сравнении букв мы имеем еще 5 символов для сравнения, когда 3 слога это уже минимум максимум 4 символа, при длинне слога в 2 буквы. Незнаю правда как эжто будет работать в комбине с другими алгоритмами. Фактически данный алгоритм уже работает 2 года — пока все впорядке, вроде )))
По поводу поиска MYSQL напишу отдельнуюж статью как я обошелся без Фултекста при неточном поиске в базе данных )
Да я что то неправильно заметил, но суть в том что совпадение по слогам уменьшит количество совпавших процентов т.к. слог может быть из 4х символов. надо много додумывать относительно этого.
О да вот это крутая штука, пасиба. Но опять же не спасет если в корне слова допущена ошибка, если я не ошибаюсь
Хотя нет я прав, мне казалось неправильно по слогам написал ))) Деление слова на слоги (перенос слова): аб-ри-кос
Ой блин я еще не проснулся извиняюсь )
если я не ошибаюсь ваш код выдаст АБ РИК ОС
АБ РИ КОС — как алкоритм поймет что первый слог кончается на согалсную а второй на гласную? )
Если знаете хорошую статью про суффиксные деревья я бы почитал
тоесть предлагаете писать лингвистический парсер? и сколько это займет по времени и чем обоснован такой подход?
А он и был реализован для коротких строк, адрес из нас пункта и номера строения скорее будет коротким, чем длинным, хотя у меня предположение что и с длинными строками все будет отлично работать.
Спасибо, «Егорьевская» и «Егеревская» я расчитывал что такого рода исключения уже возлагают ответственность на юзера, хотя есь выод, исакть в базе улицу сначала с точно таким же адресом и если таковой нет то искать похожие, делов то доработать. А по поводу первых букв, то если даже написать орынинская то при превышении порога мы все равно попадем куда надо. Спасибо за комент.
Готовый код может быь в студию? А то у мен яощющение что в моем коде разберется и ребенок, не говоря о том, что тут ненужны знаничя в математике.
Я не интересовался чужими алгоритмами, хотел реализовать сам. + у нас нету 10-й парковой их там уже некуда городить ))

Information

Rating
Does not participate
Registered
Activity