Обновить

Комментарии 1

Спасибо! Статья неплоха, но:
1. (Самое, на мой взгляд, главное). Получилось несколько двузначно. Для специалиста в области - много лишнего (и так хорошо известного), а для новичка - по многим пунктам нужны пояснения и подробности;
2. Про p-value можно, наверное, указать, что граница 0,05 не является догмой (она исторически вообще случайно вылезла);
3. Вероятность наличия кластеров, при которых регрессия будет сильной, но ложной (условно - одно облако на графике внизу слева, второе - вверху справа, внутри облаков хаос и анархия);
4. Про скорость - да, обучается быстро, но разведочный анализ и препроцессинг данных могут отнять уйму времени (впрочем, как и почти везде);
5.

предполагает линейную связь, если связь нелинейная, нужно либо преобразовывать переменные (полиномы, сплайны), либо использовать другие методы

либо просто попробовать другую форму зависимости (это не линейная регрессия, но реализуется просто);
6. Про кредитный скоринг - это, КМК, скорее про деревья решений.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации