iukash Apr 6 2022 at 12:46

Линейная регрессия. Разбор математики и реализации на python

3 min

29K

Mathematics * Machine learning *

From sandbox

Comments 6

orrollo Apr 6 2022 at 21:29

Аналитическое решение получено, переходим к реализации на python

плохо лишь, что умножение на транспонированную матрицу дает симметричную плохо определенную, а потому мы с неизбежностью приходим к необходимости регуляризации.

Либо, в альтернативном варианте, для линейной регрессии можно написать итерационный алгоритм, вообще без расчета матриц - исходя из формул в начале статьи. Кроме того, плюсом для него будет и отсутствие необходимости пересчета полноразмерных матриц при дополнении данных (частая ситуация для МНК на практике).

iukash Apr 6 2022 at 21:40

На счет дополнения данных - градиентным спуском также придется еще раз итерационно проходить и я не уверен, что это будет быстрее чем расчет матриц, а вот вырожденность после умножения дествительно может быть проблемой, наверное в идеале сначала считать определитель матрицы полученной в результате умножения X*X^T и если он равен нулю выбирать градиентный спуск. Но я не претендовал на идеальную реализацию, цель была лишь разобрать именно данный метод расчета. Спасибо за уточнение!

UFO landed and left these words here

Cryptomathic Apr 7 2022 at 07:05

...необходимо к таблице добавить столбец слева с фактором f0 все значения которого равны 0.

Наверное единичный столбец.

Почему в МНК сумма не делится на количество значений? В одной статье вообще видел деление на 2n.

iukash Apr 7 2022 at 07:14

Весьма справедливые замечания, жаль нельзя откорректировать статью! Спасибо!!!

iukash Apr 9 2022 at 07:41

Сразу не увидел возможность редактирования - внес изменения! Спасибо за уточнение!