Как стать автором
Обновить
167.02

Продуктовый матчинг, или туда и обратно с миллионами товаров

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.3K

Привет, Хабр! На связи команда продуктового матчинга ecom.tech. В серии статей мы расскажем о разработке матчера для маркетплейса Мегамаркет. Первым делом – давайте вместе  посмотрим с разных сторон на задачу продуктового матчинга и разберёмся, почему любому маркетплейсу критически важно уметь её решать (и решать хорошо).

Часть 1. Братство товаров.

Disclaimer: все названия вымышлены, все совпадения случайны. Кроме Мегамаркета – он настоящий.

Вы точно уже занимались матчингом

Все мы знакомы со старыми добрыми маркетплейсами – онлайн-рынками, на которых продается абсолютно все: от булавок до автомобилей. Каждый маркетплейс имеет свой джентльменский набор: уникальное название (желательно запоминающиеся), сайт (где можно заказать товар), мобильное приложение (чтобы сделать заказ было еще проще и удобнее), службу логистики (чтобы привести заказ покупателю как можно скорее), дальше через запятую.

Когда вы приходите на обычный рынок, то вряд ли покупаете что-то с первого раза, правда? Вы ходите, торгуетесь, пробуете, выбираете лучшее. С онлайн-рынками все точно так же. Допустим, вам надо срочно купить стиральную машинку. Вы открываете приложение Мегамаркета‎, вбиваете в поисковую строку запрос и видите, например, Indesit EWSD 51031.

Как опытному покупателю, вам хочется посмотреть, а что могут предложить другие продавцы и рынки. Вы заходите на второй маркетплейс, вбиваете в поисковой строке заветное “Indesit EWSD 51031”.

Названия похожи, цены отличаются. 
Названия похожи, цены отличаются. 

Как дела на каком-нибудь ещё маркетплейсе?

Что-то похожее.
Что-то похожее.

Тогда, засучив рукава, вы принимаетесь за дело. Открываете характеристики Indesit EWSD 51031 и начинаете сравнивать их со всеми предложенными стиральными машинками, которые выпали в поиске на всех маркетплейсах. После определенного количества времени вас неизбежно будет ждать успех: вы отберете предложения-финалистов, сравните цену, название, изображение, атрибуты и, наконец, сделаете долгожданный заказ — лучшие характеристики за оптимальную стоимость и на самых удобных для вас условиях.

Поздравляем! Вы только что решили задачу продуктового матчинга.

Продуктовый матчинг: что за зверь?

Наш сегодняшний главный герой — это процесс сопоставления товаров на основе различных критериев. Кажется, это тот случай, когда определение звучит обманчиво просто.  Давайте разбираться.

Продуктовый – (от английского “product”) – товар/продукт/изделие. Всё то, что мы сравниваем.
Матчинг – (от английского “to match”) – сопоставлять/сравнивать. Это то, что мы делаем
Итак, в продуктовом матчинге мы сравниваем товары, но как мы это делаем?

Это самая важная часть – сравнение/сопоставление всегда делается на основании каких-то критериев. Любой товар на маркетплейсе – это набор характеристик, которые его определяют. Например: фото, название, цена, параметры товара, отзывы и остальное.

Теперь собираем все вместе и получаем продуктовый матчинг. Решить задачу продуктового матчинга – это значит сопоставить характеристики товаров между собой и найти наиболее похожие, а желательно идентичные товары.

Зачем продуктовый матчинг маркетплейсу?

Разберем на примере Мегамаркета. Здесь на витрине – миллионы товаров. На примере стиральной машинки мы видели, что один и тот же товар продается на различных маркетплейсах. Если говорить о Мегамаркете, то для его ассортимента есть около 100 миллионов товаров на площадках конкурентов, которые хочется найти и сопоставить, чтобы решить задачу динамического ценообразования.

Представим, что точно такая же стиральная машинка на другом маркетплейсе будет стоить вдвое дешевле, чем на Мегамаркете. Прагматичный покупатель пойдет туда, а не к нам. А мы не хотим терять клиента. Значит, есть смысл следить за ценами всех схожих товаров на других маркетплейсах, а для этого их нужно найти и сопоставить. 

Если бы продуктовый матчинг использовался только для решения задачи динамического ценообразования, он уже был бы критически важен для маркетплейса. Однако есть и другие причины.

На Мегамаркет ежемесячно заходят миллионы новых продавцов. Они присылают описания новых товаров, а маркетплейсу важно понять: насколько эти товары новы и уникальны, нужно ли заводить новую карточку товара или в нашем ассортименте уже есть точно такой же товар? Узнать это можно, сравнив новый товар с текущим ассортиментом. Тут матчинг помогает решить задачу добавления новых карточек товаров. 

Ок, пусть мы завели много новых товаров. Все они имеют какие-то общие свойства, по которым их можно было бы объединить в группы (с помощью матчинга). Ведь когда мы приходим на рынок, то помидоры разных сортов лежат с помидорами, а огурцы с огурцами, потому что похожие товары должны держаться вместе. Это гораздо удобнее, как для покупателя, так и для продавца. Наконец, сравнивать товары – полезно даже внутри только своего ассортимента, например, для поиска и удаления дубликатов.

Таким образом, мы можем выделить основные направления, где продуктовый матчинг крайне полезен и позволяет значительно увеличить прибыльность маркетплейса: 

  • динамическое ценообразование;

  • добавление товаров от новых продавцов;

  • объединение товаров в группы.

Насколько сложно матчить и что для этого нужно?

Первое, что приходит в голову – это просто взять и сравнить каждый товар с каждым. В математике такая операция называется декартовым произведением. Допустим, мы хотим провести сравнение нашего текущего ассортимента с конкурентами. Берем ассортимент Мегамаркета и делаем декартово произведение 50 миллионов товаров на 100 миллионов товаров. 

И тут у нас начинаются проблемы: вычисление такой огромной матрицы займет внушительное количество времени и ресурсов. Кажется, более разумным будет поиск определенного малого числа кандидатов для каждого товара и анализ только их. Ведь сравнивать стиральную машинку и огурцы – не имеет особого смысла. Это слишком разные товары (хотя…). Сравнивать каждый товар с каждым – слишком затратно да и не нужно.

Давайте теперь посмотрим, насколько сложно в принципе проводить сравнение атрибутов товаров? Перед вами две карточки товаров, как думаете: это один и тот же товар?

На первый взгляд — да. Ведь картинки абсолютно идентичны. Но внимательный читатель может заметить, что у товаров отличается цвет, о чём написано в карточке товара. Из чего можно сразу сделать вывод, что полагаться только на изображения нельзя.

Атрибуты почти идентичны, название тоже. Но видим сильное различие по ценам. Из чего можно заключить, что один из товаров является репликой, другого, а значит, это разные товары. На Мегамаркете, разумеется, реплик нет.

Цены очень близкие, атрибуты идентичны. Но посмотрите внимательно на фото: на товаре слева внизу на упаковке указано, что зерна полной обжарки, а на товаре справа, что средней. Да, это тоже разные товары. Дьявол кроется в деталях. А теперь представьте, что таких товаров – десятки миллионов и для каждого нужно найти похожий. 

Итак, подведем итог. Решение задачи продуктового матчинга крайне важно для любого маркетплейса. Сама задача продуктового матчинга – сложная и многоуровневая. Для того, чтобы грамотно сопоставлять товары, необходим детальный анализ как текстовой информации, так и изображений, что подводит нас к мысли о том, что мы должны уметь эффективно работать сразу в двух модальностях. Для эффективного матчинга необходимо для каждого товара находить определенное количество кандидатов.

Давайте считать, что вводных понятий нам на этом будет достаточно, чтобы дальше углубиться в технические подробности.

В следующей части мы расскажем, с помощью чего решаем задачу продуктового матчинга для Мегамаркета и обходим обозначенные выше проблемы. Не переключайтесь!

Теги:
Хабы:
Всего голосов 18: ↑14 и ↓4+12
Комментарии10

Публикации

Информация

Сайт
ecom.tech
Дата регистрации
Численность
1 001–5 000 человек
Местоположение
Россия
Представитель
Алексей Долгушев