All streams
Search
Write a publication
Pull to refresh

Comments 3

Статья интересная, спасибо, но..

Точность 0.8 по классификации всего на 6 категорий - не очень-то и много.. Каждый пятый ответ - ошибочный - для продакшена не подойдет..

И потом - можно ли в-принципе чего-то добиться классифицируя только по названию продукта? Почему не полная карточка товара?

К датасету к которому есть аннотации классов, нет описаний товаров, только заголовки. Для простоты я использовал для обучения 30% датасета.

0.8 точность смотря для какой задачи, на международных рыках там где нет специализированного готового датасета очень хорошее решение базовое для нового языка. От которого можно оттолкнуться и уже сгенерировать специализированный датасет под язык и получить точность выше.

Заголовки - это есть набор аттрибутов? Склеить их в одно синтетическое поле + название туда же - и по нему эмбеддинги считать.

Sign up to leave a comment.

Articles