Как стать автором
Обновить

Комментарии 2

Спасибо, хорошая статья! Возник такой вопрос, а насколько catboost устойчив к появлению слов не из датасета?

Конкретно в этом примере я не проверял, при разбиении состав словарей. Но в целом, думаю, поведение не будет отличаться от других случаев работы с текстом, когда появляется новый токен во время инференса. В целом, тема на поизучать, да.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории