В статье рассматривается несколько способов определения математического уравнения линии простой (парной) регрессии.
Все рассматриваемые здесь способы решения уравнения основаны на методе наименьших квадратов. Обозначим способы следующим образом:
- Аналитическое решение
- Градиентный спуск
- Стохастический градиентный спуск
Для каждого из способов решения уравнения прямой, в статье приведены различные функции, которые в основном делятся на те, которые написаны без использования библиотеки
NumPy и те, которые для проведения расчетов применяют
NumPy. Считается, что умелое использование
NumPy позволит сократить затраты на вычисления.
Весь код, приведенный в статье, написан на языке
python 2.7 с использованием
Jupyter Notebook. Исходный код и файл с данными выборки выложен на
гитхабе
Статья в большей степени ориентирована как на начинающих, так и на тех, кто уже понемногу начал осваивать изучение весьма обширного раздела в искусственном интеллекте — машинного обучения.
Для иллюстрации материала используем очень простой пример.