![](https://habrastorage.org/r/w1560/getpro/habr/upload_files/4c3/d38/16b/4c3d3816bb502f95351e9f38bba4bb0d.png)
В этой статье я хочу разобрать отдельный сегмент предобработки данных, а именно показать, насколько балансировка тренировочных данных может качественно повлиять на конечный результат, а также чуть глубже погрузиться в суть работы механизма взвешивания слов TF-IDF