Pull to refresh
5
0
Дмитрий @detimokhin

Senior Data Scientist команды «Моделирование ЖЦК»

Send message

Autobinary: библиотека для простого обучения «деревяшек» — Part 2

Level of difficultyMedium
Reading time7 min
Views1.3K

С ростом количества источников данных, методов генерации и извлечения признаков возникает вопрос: «А надо ли нам столько информации? Не ухудшит ли каждый новый фактор предсказательную силу модели?» И правда, для решения большинства задач нет необходимости использовать все доступные нам признаки в финальной модели, так как часть из них не несет в себе никакой информации и даже может запутать алгоритм. Для того, чтобы решить эту проблему и сократить признаковое пространство, были придуманы методы отбора факторов в задачах машинного обучения. О некоторых методах, которые мы внедрили в библиотеку Autobinary расскажем в этой статье.

Поехали
Total votes 6: ↑6 and ↓0+6
Comments0

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity

Specialization

Data Scientist
Senior
Git
Python
SQL
Pytorch
Computer Science
Machine learning
Deep Learning
Natural language processing
Neural networks
Big data