Comments 5
А теперь такой вопрос. Что эффективнее: увеличить количество батчей в эпохе (путем увеличения num_samples) или увеличить количество эпох (не меняя num_samples)?
Я думаю, если нет LR-scheduler-a, который вызывается по окончании эпохи, то эффект будет примерно одинаковый.
Всё зависит от деталей задачи, конечно, от пропорций классов, от архитектуры сети...
А если Вы про показ всех данных за первую эпоху, то я пробовал разные множители у num_samples: x2, x3, до х10. Всех данных семплер не выбрал даже при х10
Я думаю, что множество эпох - лучше, т.к. early stopping не даст переобучиться
Sign up to leave a comment.
Устранение дисбаланса классов в PyTorch с помощью WeightedRandomSampler