Как стать автором
Поиск
Написать публикацию
Обновить

Как отличить шампунь от шампиньонов, а шампуры от шампанского… Elasticsearch — поиск товаров в магазинных базах данных

Время на прочтение10 мин
Количество просмотров12K
Всего голосов 24: ↑24 и ↓0+24
Комментарии6

Комментарии 6

Как я ненавижу любителей показать "молоко 2.5", когда я явно указал "молоко 3.5". Я, наверное, это сделал потому что хотел именно "молоко 3.5", поискал просто "молоко", удивился набрал более конкретный запрос "молоко 3.5", и внезапно увидел, что система полностью проигнорировала мои действия и выдала то, что мне точно не нужно.
Вот, блин, огромное спасибо.


ЗЫ
При поиске слов "Страпонтен" или "пипидастр" система тоже проявит повышенный интеллект?

НЛО прилетело и опубликовало эту надпись здесь
Мы использовали метрику ndcg, которая при определенных параметрах учитывает не только точность, но и полноту (с помощью присвоения отрицательного веса (а не нулевого) неподходящим элементам в резульатах поиска).
К сожалению, не могу сказать точных чисел сейчас
«Экспериментальным путем была выявлена лучшая комбинация анализаторов и весов.»

Как в итоге выбрали правильные веса? Вручную или ML использовали?
Вручную меняли параметры и 'архитектуру' запроса, смотрели на метрику, сравнивали с другими моделями.
Столкнулся с похожей задачей — сопоставление в полуавтоматическом режиме товаров (техника и электроника) от разных поставщиков. Использую Сфинкс читаю за Эластик и пока в плане релевантности не нашел в Эластике особых плюшек, а вот предложенную схему безусловно стоит обдумать. Спасибо.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации