Статьи / Профиль All

@All_Pri

ML-инженер

ПрофильСтатьи4ПостыНовостиКомментарии1

All_Pri 16 дек 2025 в 10:00

Борьба с дисбалансом классов. Ансамблевые и комбинированные методы

Средний

11 мин

5.9K

Блог компании KozhinDevМашинное обучение * Python *

Туториал

Привет, Хабр! На связи KozhinDev и ml-разработчик Приходько Александр. Это четвертая часть цикла о борьбе с дисбалансом классов. Предыдущие статьи:
- В первой статье мы рассказали про суть проблемы дисбаланса классов и стандартные методы борьбы с ним;
- Во второй статье обсуждались методы undersampling - удаление данных из распространенного класса;
- В третьей статье рассматривались методы oversampling - генерация примеров редкого класса.

В данной части мы рассмотрим комбинированные и ансамблевые методы библиотеки Imbalanced Learn.

All_Pri 25 ноя 2025 в 10:00

Борьба с дисбалансом классов. Oversampling

Средний

10 мин

5.6K

Блог компании KozhinDevPython * Машинное обучение *

Туториал

Привет, Хабр! На связи KozhinDev и ml-разработчик Приходько Александр. Это третья статья в цикле публикаций по теме борьбы с проблемой дисбаланса классов в машинном обучении. В первой статье мы обсудили актуальность данной проблемы в машинном обучении, а также сравнили методы борьбы с ним, без внесения изменений в сами данные: изменение весов классов и порога принятия решения моделью. Во второй статье мы сравнивали undersampling-методы, которые удаляли представителей частого класса.

В данной части мы протестируем методы балансировки данных методом oversampling из библиотеки imblearn. Суть данного метода заключается в том, что мы пытаемся бороться с дисбалансом классов генерируя данные для редкого класса. Мы рассмотрим разные способы генерации таких данных и протестируем их на синтетических данных.

All_Pri 10 окт 2025 в 11:48

Борьба с дисбалансом классов. Undersampling

Средний

10 мин

4.9K

Блог компании KozhinDevМашинное обучение * Python *

Туториал

Привет, Хабр! На связи KozhinDev и ml-разработчик Приходько Александр. Это вторая статья в цикле публикаций по теме борьбы с дисбалансом классов в машинном обучении. В предыдущей статье мы рассмотрели актуальность данной проблемы и сравнили методы борьбы без внесения изменений в данные: балансировка весов классов и изменение порога принятия решения моделью. В данной части будем тестировать балансировку данных методом undersampling из библиотеки imblearn.

All_Pri 3 окт 2025 в 12:19

Борьба с дисбалансом классов. Стандартные методы

Средний

17 мин

5.9K

Блог компании KozhinDevМашинное обучение * Python *

Туториал

Привет, Хабр! На связи KozhinDev, а именно ml-разработчик Приходько Александр. Этой статьей я начну цикл публикаций по теме борьбы с дисбалансом классов. В первую очередь этот гайд предназначен для ml-разработчиков уровня junior/middle. Мы ознакомимся с различными подходами к решению проблемы дисбаланса классов и проведем их сравнительный анализ на сгенерированной выборке: коснемся метрик качества, встроенных в классификаторы методы борьбы с дисбалансом классов, методы модификации выборки, а также комбинированные техники. В последней части мы расскажем про наш опыт применения кастомных метрик точности, как еще один метод борьбы с дисбалансом.

Борьба с дисбалансом классов. Ансамблевые и комбинированные методы

Борьба с дисбалансом классов. Oversampling

Борьба с дисбалансом классов. Undersampling

Борьба с дисбалансом классов. Стандартные методы

Информация

Специализация