Как стать автором
Обновить

Комментарии 7

ждем prod2vec в гитхабе?
Мы в процессе написания продакшн кода для модели, не планировали выкладывать код, пока он не будет до конца нами внедрен и протестирован.

Зачем его ждать. В керасе есть embeddings layer уже готовый. Готовите данные и учите что хотите.

Хороший подход. Я делаю похожее для слов и текстов. У вас следующим шагом может быть кластеризация пользователей с использованием векторов просмотренных товаров. Могу подсказать вариант как сделать.

Классно что у тебя есть идеи по поводу этого, будет интересно послушать :) Моя телега: @artembochkarev.
с нетерпением жду кода посмотреть как реализовали.

еще вопрос к вам, раз вы так глубоко погрузились в тему, можно ли использовать технологию для определения 2-х одинаковых товаров?
к примеру только по названию, допустим названия сильно по разному написаны, некоторые слова названия стоят на разных местах, есть или нет разные не значащие символы типо точек в разных местах, сокращения слов и т.д.
Привет, спасибо за вопрос! Действительно, можно придумать как использовать этот алгоритм для определения одинаковых товаров, но в нашем случае нужно товары матчить раньше (когда их только заводят на сайте и для них нет никакой статистики). Для этого можно как раз использовать признаки извлеченные из названия, текстового описания, бренда, характеристик товара итд. Но это уже совсем другая история…
Зарегистрируйтесь на Хабре, чтобы оставить комментарий