Как стать автором
Обновить

Понимаем с полуслова: как работает поиск товаров в СберМаркете

Время на прочтение7 мин
Количество просмотров3.4K
Всего голосов 15: ↑14 и ↓1+13
Комментарии18

Комментарии 18

Сбером не пользуюсь, но вот на Маркете и в Озоне безумно не хватает точного поиска. Без всех этих изысков, а как было раньше, когда слово в кавычках просто искалось и всё. Предполагаю, что на Сбере то же самое.

Например, я знаю артикул товара. Я его вбиваю в поиск и получаю выборку из 1000 позиций, 5 из которых содержат искомый артикул, а остальные 995 подобраны какими-то странными алгоритмами, типа "этот товар тоже красненький", "этот товар тоже начинается с буквы А" или "этот товар тоже из категории оргтехника". Иногда вообще непонятно откуда оно берется.

Причем (спасибо хоть на этом!) эти странные алгоритмы умудрились засунуть мои искомые 5 позиций в начало списка. Но я-то хочу купить не первый попавшийся, а самый дешевый, и жму "отсортировать по цене". После чего искомые позиции растворяются в остальных 995 единицах хлама и найти их уже не представляется возможным. Финиш. Как говорится, бери что нашлось в первый заход и не выпендривайся.

UPD: недавно заказывал модули к фильтру, сейчас решил на их примере на всех трех площадках поискать комплект с артикулом РР5-В510-04-02.

Сбер выдал три позиции, из них только одну верно и все три отсутствуют в продаже.

Маркет выдал свыше 50 очень отдаленно похожих предложений, точно в соответствии с вышеприведенным описанием проблемы.

А вот Озон приятно удивил. Выдал три позиции и все правильно. Зачет!

"Неистово плюсую" (с)

Ищешь, например, карту RTX3060. Без сортировки по цене все нормусик, но как только нажал по этой самой цене - в топе что? Правильно,

Видеокарта AGP Super S3 Trio 3D/2X 4MB

И где связь?

СберМаркет — это преимущественно про продкты питания (e-grocery), поэтому вопрос артикулов для нас менее остро стоит, чем у колег из e-com. Вероято, вы модули к фильтру искали на МегаМаркете.

Мы как раз экспериментируем с «ослабленными запросами» (сейчас ни и вовсе отключены), чтобы много лишнего не опопадало в выдачу :)

Ну на мой взгляд с брендированием у Сбера беда. Вы как пару лет назад выкатили два маркетплейса с одинаковыми названиями, только один мега а другой обычный, так я до сих пор не выучил какой возит еду, а какой - барахло :-)

Тоже улучшаю поиск на своем сайте, номенклатуры много и лишние результаты хочется отсечь, вышло такое "ослабление запроса" (если не нашлось на текущем шаге, то к следующему):

  • Если поиск по артикулу вернул 1 товар - это то что надо;

  • Ищем по началу строки (первое слово дороже второго. Если совпадение, то дальше стоп, и так на каждом шаге);

  • Ищем в первых 5 словах наименования (иначе например "Скобы для степлера" - у вас находится и степлер, т.к. в конце наименования есть приписка про размер скоб. А не должно, очевидно нужны только скобы);

  • Только в наименовании (иначе мусор из описания и т.д.);

  • Во всех полях;

  • Пробуем чинить раскладку, исправлять опечатки;

  • Еще ослабляем поиск - выкидываем слова из запроса. Сначала одно слово по очереди каждое, потом два, потом три, пока не найдем что-то. На каждом уровне смотрим максимум и минимум найденных sku. Вот тут дилемма - если оставить минимум - вроде бы более точный поиск, если максимум - вроде бы остались в запросе слова, результатов по которым много. Как лучше - не ясно, в разных ситуациях выглядит по разному, пока оставил минимум - для артикулов лучше. Жалобы на поиск всё равно есть.. Синонимы вводим постепенно, становится получше..

Спасибо, что делитесь своим опытом :) Согласна, что поисковые системы - это всегда сложно и неоднозначно.

Чаще стараются показывать больше товаров в выдаче, чем меньше. Потому что чем больше показываем, тем больше вероятность, что пользователь что-то купит. Но здесь важно не сильно уронить качество и не показывать совсем мусор, чтобы у покупателя была возможность все же найти желаемое.

Мне выдал только одну:

Система для фильтрации воды "Аквафор" Трио норма, РР5/В510-04/В510-02, умягчающий, 3-х сту

Это не то?

Уж не знаю, "мегамаркет" вы же делаете или нет, но там многие товары только по ссылке с яндекса найти и можно. Например, долгое время был уверен, что наполнителя "Everclean" там нет, а оказалось, что есть, если "Ever clean" написать))

Мы только СберМаркет делаем :)

Вы просто наступили на больной мозоль, и поэтому отдуваетесь за всех

Допустим, название нужного товара — «сок вишневый “Добрый”». Синоним слова сок – нектар

Не допустим, потому что это ни разу не синонимы, поскольку "химический состав" разный - первый 100% сок, второй - от 25% до 50% собственно сока (остальное лучше не знать).

“Сок" - это сок, а не "нектар", и не (прости Господи) "соксодержащий напиток".

А "Вишнёвый" - это вишнёвый, а не "вишнёво-яблочный" или "со вкусом вишни"

был уверен, что наполнителя "Everclean" там нет, а оказалось, что есть, если "Ever clean" написать

Это вы еще поделиями aliexpress_russia не пользовались, вот уж где - "мы лучше знаем, что вы ищете".

Например провести поиск mini pc intel n100 в принципе невозможно, потому что они считают, что "В запросе «mini pc intel n100» исправлена опечатка" и выдаётся результат по "mini pc intel n 100" (т.е. условно говоря все mini pc с любыми процессорами intel)

многие товары только по ссылке с яндекса найти и можно

Угу, но в поиске yandex/google невозможно провести сортировку по цене и(ли) количеству заказов

¯_(ツ)_/¯

По поводу невозможности выполнить поиск по запросу «mini pc intel n100» - возможность поиска по оригинальному запросу все-таки есть, достаточно нажать на ссылку в появившемся тексте «В запросе «mini pc intel n100» исправлена опечатка». Кажется обычные поисковики предоставляют аналогичный функционал.

Немного забавно, что обработка поискового запроса начинается с фильтрации нецензурных слов.

А какие ещё ограничения есть? Например, минимальная/максимальная длина, набор символов...

Кроме фильтрации нецензурной лексики больше никаких специальных ограничений нет. Нецензурную лексику фильтруем, чтобы случайно не показать по ней никаких товаров, это расстраивает производителей товаров, которые находятся по ругательству.

Набор символов не ограничиваем.

Количество символов мы на своей стороне также никак не ограничиваем, однако есть ограничения для размера URL в браузере (это примерно 2к символов, значение немного варьируется в зависимости от самого браузера).

Я не очень понимаю, зачем ругательства отфильтровывать. Чтобы эластик не оскорбился?

@anna_vlasova

Иногда бывает такое, что нецензурный поисковый запрос может преобразоваться как-то так, что по нему находятся товары, а мы считаем это этически некорректным, производители недовольны. Поэтому было принято решение показывать по таким запросам пустую выдачу.

Как много документов у вас в поисковом индексе? Поисковый индекс один или несколько?

Документов несколько миллионов, индекс один, но он шардированный.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий