Как подготовить данные к анализу: очистка и предобработка, без которых всё остальное не имеет смысла

Ваши данные врут. Не потому, что кто-то хотел вас обмануть, а потому, что вы им это позволили.
Всё выглядит правильно: модель обучилась, метрики зелёные, дашборд аккуратный. А потом бизнес-решение, принятое на основе этих данных, приводит не туда. В этот момент начинают проверять алгоритм, гипотезу или эксперимент. Но в большинстве случаев проблема была раньше — в данных, которые никто толком не подготовил.
Даже аккуратный дашборд может скрывать проблемы в данных, если этап подготовки был сделан формально.