sagol Apr 29 2021 at 10:25

Нетрадиционный анализ тональности текста: BERT vs CatBoost

6 min

12K

Python * Natural Language Processing * Machine learning *

Comments 2

Zachar_5 Apr 30 2021 at 11:11

Спасибо, хорошая статья! Возник такой вопрос, а насколько catboost устойчив к появлению слов не из датасета?

sagol Apr 30 2021 at 12:28

Конкретно в этом примере я не проверял, при разбиении состав словарей. Но в целом, думаю, поведение не будет отличаться от других случаев работы с текстом, когда появляется новый токен во время инференса. В целом, тема на поизучать, да.