@sagol29 апр 2021 в 10:25Нетрадиционный анализ тональности текста: BERT vs CatBoostВремя на прочтение6 минОхват и читатели12KPython * Natural Language Processing * Машинное обучение * Всего голосов 2: ↑2 и ↓0+2Добавить в закладки32Комментарии2
@Zachar_530 апр 2021 в 11:11Спасибо, хорошая статья! Возник такой вопрос, а насколько catboost устойчив к появлению слов не из датасета?
@sagol30 апр 2021 в 12:28Показать предыдущий комментарийКонкретно в этом примере я не проверял, при разбиении состав словарей. Но в целом, думаю, поведение не будет отличаться от других случаев работы с текстом, когда появляется новый токен во время инференса. В целом, тема на поизучать, да.
Нетрадиционный анализ тональности текста: BERT vs CatBoost