Комментарии 7
ждем prod2vec в гитхабе?
Хороший подход. Я делаю похожее для слов и текстов. У вас следующим шагом может быть кластеризация пользователей с использованием векторов просмотренных товаров. Могу подсказать вариант как сделать.
с нетерпением жду кода посмотреть как реализовали.
еще вопрос к вам, раз вы так глубоко погрузились в тему, можно ли использовать технологию для определения 2-х одинаковых товаров?
к примеру только по названию, допустим названия сильно по разному написаны, некоторые слова названия стоят на разных местах, есть или нет разные не значащие символы типо точек в разных местах, сокращения слов и т.д.
еще вопрос к вам, раз вы так глубоко погрузились в тему, можно ли использовать технологию для определения 2-х одинаковых товаров?
к примеру только по названию, допустим названия сильно по разному написаны, некоторые слова названия стоят на разных местах, есть или нет разные не значащие символы типо точек в разных местах, сокращения слов и т.д.
Привет, спасибо за вопрос! Действительно, можно придумать как использовать этот алгоритм для определения одинаковых товаров, но в нашем случае нужно товары матчить раньше (когда их только заводят на сайте и для них нет никакой статистики). Для этого можно как раз использовать признаки извлеченные из названия, текстового описания, бренда, характеристик товара итд. Но это уже совсем другая история…
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Векторные представления товаров, или еще одно применение модели Word2Vec