Articles / Profile of detimokhin / Habr

detimokhin Apr 19 2023 at 13:00

Autobinary: библиотека для простого обучения «деревяшек» — Part 2

Medium

7 min

1.3K

ВТБ corporate blogMachine learning*Data Engineering*

Opinion

С ростом количества источников данных, методов генерации и извлечения признаков возникает вопрос: «А надо ли нам столько информации? Не ухудшит ли каждый новый фактор предсказательную силу модели?» И правда, для решения большинства задач нет необходимости использовать все доступные нам признаки в финальной модели, так как часть из них не несет в себе никакой информации и даже может запутать алгоритм. Для того, чтобы решить эту проблему и сократить признаковое пространство, были придуманы методы отбора факторов в задачах машинного обучения. О некоторых методах, которые мы внедрили в библиотеку Autobinary расскажем в этой статье.

Поехали

Autobinary: библиотека для простого обучения «деревяшек» — Part 2

Information

Specialization