Комментарии 37
Oго, не зря зашел почитать.
На первой картинке неправильность запроса определяется тем, что слово «битва» пишется с двумя «т»? Не, ну так конечно ничего не найдётся.
Так нашлось или не нашлось? На картинке написано «не найдено», вы в комментарии говорите «нашлось» — что за разброд и шатания??
И почему я должен играть в логическую игру «угадай в чём неправильность запроса». Хорошо, я понимаю, что автор хотел показать движок слева (типа лучше ищет) и справа (типа хуже ищет).
Так вот я и думаю, почему движок ищет лучше: потому что обратный порядок слов (это прямо бросается в глаза), а потом вдруг присматриваюсь и вижу: «Ба! Да там слово написано неправильно».
Ну вот и объясняйте теперь, почему справа лучше ищет:
1. Потому что порядок слов неправильный
2. Потому что там слово написано неправильно
3. Потому что одновременно пункт 1 и 2
4. Потому что справа настраивали крутые специалисты и как не пиши — слева будет хорошо, а справа не найдётся ))))
А то вместо этого вы пишете, что нет, уважаемый, в первом столбце всегда ищется — а во втором столбце один раз тоже нашлось!!!
В общем, взрыв мозга. Дихотимии поделены пополам слишком криво: люди делятся на левшей, правшей и голубоглазых. Аналогия понятна?
И почему я должен играть в логическую игру «угадай в чём неправильность запроса». Хорошо, я понимаю, что автор хотел показать движок слева (типа лучше ищет) и справа (типа хуже ищет).
Так вот я и думаю, почему движок ищет лучше: потому что обратный порядок слов (это прямо бросается в глаза), а потом вдруг присматриваюсь и вижу: «Ба! Да там слово написано неправильно».
Ну вот и объясняйте теперь, почему справа лучше ищет:
1. Потому что порядок слов неправильный
2. Потому что там слово написано неправильно
3. Потому что одновременно пункт 1 и 2
4. Потому что справа настраивали крутые специалисты и как не пиши — слева будет хорошо, а справа не найдётся ))))
А то вместо этого вы пишете, что нет, уважаемый, в первом столбце всегда ищется — а во втором столбце один раз тоже нашлось!!!
В общем, взрыв мозга. Дихотимии поделены пополам слишком криво: люди делятся на левшей, правшей и голубоглазых. Аналогия понятна?
вы похоже недопоняли что и зачем в таблице )
Возможно. И пять человек поставили минус, не захотев объяснить — и вы тоже не собираетесь ничего объяснять, хотя и смайлик поставили. Ну хорошо, я знаю, что я не всезнающий — я спокойно отношусь к тому, что я видимо лишний в этой беседе. Надеюсь, что другим всё будет понятно. Прошу прощения, что глупость написал.
Да тут и объяснять то особо нечего. Запросы слева неправильные из-за наличия в них ошибок, о чем вам сообщили отдельно. И не находится по ним нигде кроме максим-онлайн из-за настроек поиска, об улучшении которых и идет речь далее в статье. Вроде бы все если не очевидно, но трудностей точно не вызывает.
Нужно сделать масштабируемый проект — используем MongoDBНужно сделать масштабируемый проект — не используем Монгу.
Меня из-за вас уволили.
omg!!! приходите к нам http://corp.mail.ru/career/vacancies/
Дочитав до конца статью, начал сомневаться, на техническом ли я ресурсе хабрахабр.
Не думаю, что эту статью заминусуют — но следующий кто захочет повторить этот приём в ближайшем времени рискует в нехилый минус уйти.
Не думаю, что эту статью заминусуют — но следующий кто захочет повторить этот приём в ближайшем времени рискует в нехилый минус уйти.
Спасибо, почитал.
Если без шуток, статья интересная, спасибо. У меня возник вопрос, не связанный напрямую с содержанием. Не боитесь, что на вас maximonline наедут за использование фото с сайта? Они в правилах запрещают брать материалы без письменного согласования. Я без претензий — правда интересно, почему вас это не смущает.
На последней фотке — Кисегач!
Нужен тег NSFW
Про исправление ошибок: в своё время реализовал технику из этой статьи habrahabr.ru/company/sphinx/blog/61807/ — на удивление хорошие результаты показало www.1aauto.com/search?words=menyfold (пример работы)
Про исправление ошибок: в своё время реализовал технику из этой статьи habrahabr.ru/company/sphinx/blog/61807/ — на удивление хорошие результаты показало www.1aauto.com/search?words=menyfold (пример работы)
Основная идея следующая. Генерируем для каждого слова из словаря набор триграмм, те. 3 последовательно идущих символов.
Что то мне подсказывает что получился алгоритм сравнения похожести двух документов по шинглам http://habrahabr.ru/post/65944/
И вот доказывай потом коллегам, что читаешь статью на тему текущего рисерча :)
Пожалуйста, улучшите встроенный в почту поиск. Сколько раз им ни пользовался — ни разу ничего не нашёл, приходилось искать в списке, тратить время. Если там есть поиск — он должен работать.
представим, что его напишут неправильно «Лос Анжелес биттва». Как видно, пользователь не знает точно, как пишется имя города
И видимо никогда не узнает, так и будет писать «Лос Анжелес». А потом люди удивляются откуда берётся столько безграмотных.
В своё время реализовывали с другом поисковый движок — обходились лишь стандартными алгоритмами СУБД MySQL. Ваш «Лос Анженес Бидва» нашелся бы прекрасно, как не коверкай. Краткая суть:
1. Режем «плохие» слова (союзы, описания, и т.п.)
Боль в галаве -> галаве
2. Переводим строку в транслит
galave
3. Осуществляем поиск по SOUNDEX каждого слова
OR ( SOUNDEX( r.phrase ) LIKE SOUNDEX( '$word' ) )
Этот поиск вытягивает из базы «правильные» слова и заменяет ими «неправильные», тем самым нормализуя запрос (двумя зайцами можно убить и склонение существительных)
galave G410 -> голова (golova) G410
4. Теперь осуществляем релевантный поиск через MATCH AGAINST
1. Режем «плохие» слова (союзы, описания, и т.п.)
Боль в галаве -> галаве
2. Переводим строку в транслит
galave
3. Осуществляем поиск по SOUNDEX каждого слова
OR ( SOUNDEX( r.phrase ) LIKE SOUNDEX( '$word' ) )
Этот поиск вытягивает из базы «правильные» слова и заменяет ими «неправильные», тем самым нормализуя запрос (двумя зайцами можно убить и склонение существительных)
galave G410 -> голова (golova) G410
4. Теперь осуществляем релевантный поиск через MATCH AGAINST
вопрос только один — почему пост не в пятницу опубликовали.
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как это сделано: префиксный поиск