![](https://habrastorage.org/r/w780/getpro/habr/upload_files/5d0/e08/d7e/5d0e08d7ec255f2213ba65a6af5e9d56.jpg)
Большие языковые модели это конечно хорошо, но иногда требуется использовать что-то маленькое и быстрое.
DS
Большие языковые модели это конечно хорошо, но иногда требуется использовать что-то маленькое и быстрое.
Иногда возникает необходимость провести анализ большого количества текстовых данных, не имея представления о содержании текстов. В таком случае можно попытаться разбить тексты на кластеры, и cгенерировать описание для каждого кластера. Таким образом можно в первом приближении сделать выводы о содержании корпуса текстов.
Файнтюнинг русскоязычного BERT для задачи классификации. Туториал для быстрого старта без лишних подробностей.