А можно еще раз сто повторить одно и тоже? Неужели нельзя было поинтересней и подробнее рассказать про способы разделения данных, критерии степени разделения, про кроссвалидацию, переобучение и недообучение, регуляризацию. Какие то у скиллфактори убожеские статьи.
Самая важная идея в Data Science