Бывают случаи, когда есть небольшая часть размеченных данных с аномалиями; такое допущение было сделано, чтобы в статье можно было оценить accuracy алгоритма. На самом деле, при тех же данных вполне можно прогонять алгоритмы обучения без учителя и оценивать их точность.
Да, спасибо, я забыл четко отразить это в описании алгоритма. Мне хотелось выделить что-то общее в работе ансамблей, поэтому потерял в детализации