Как стать автором
Обновить

От алгебры школьной — к университетской

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров14K

В статье даётся краткий обзор курса алгебры, призванный помочь тем, кто собирается изучать её самостоятельно, с репетитором или на курсах.
Университетский курс алгебры условно можно разбить на три части:
• элементарная алгебра (комплексные числа, многочлены, делимость, вычеты, ...);
• линейная алгебра (системы линейных уравнений, теория размерности, матрицы, линейные отображения, билинейные и квадратичные формы, тензоры, ...);
• высшая алгебра (алгебраические структуры: группы, кольца, поля, ...).

Для большинства наук и приложений, в машинном обучении, computer science прежде всего нужна, конечно, линейная алгебра. Для её успешного освоения нужно уверенно владеть элементарной алгеброй. На школьном уровне она (не)проста и скучна. Но при переходе в университет алгебра резко становится абстрактной и потому для многих сложной и непонятной: больно много аксиоматических определений — примеры еле поспевают. Как исторически произошёл этот скачок? Что нужно/полезно всем, изучающим математику, из высшей алгебры? Как лучше освоить азы линейной алгебры с прицелом на приложения, machine learning, не упустив что-то важное, но и не перетрудившись зря? Эти вопросы мы обсудим в статье.

Алгебра в школе обычно ассоциируется с «раскрытием скобок» — так собирательно мы назвали целый пласт школьной математики, состоящий из бесконечных выкладок и преобразований, зачастую, скучных и, увы, бессмысленных. За испорченное детство школьники могут сказать „спасибо“ Франсуа Виету — именно он ввёл в конце XVI века удобную математическую символику, близкую к современной. Вклад Виета в науку гораздо больше. Отметим лишь, что большинству он известен своими формулами, связывающими корни и коэффициенты квадратного уравнения. На самом деле, он вывел аналогичные формулу для уравнений любой степени nпричём пресловутым «раскрытием скобок». Например, при n = 3имеем

(x − a)(x − b)(x − c) = x^3 − (a + b + c)x ^2 + (ab + ac + bc)x − abc.

Вообще, алгебра в ту эпоху вплоть до начала XIX века была наукой о решении уравнений. Грустно и смешно, но содержательные задачи современной школьной алгебры умели решать ещё в Древнем Вавилоне во втором тысячелетии до нашей эры (квадратные уравнения и задачи, к ним сводящиеся). Из школьной программы давно убрали комплексные числа, которые появились в XVI веке и входили в советские учебники первой половины XX века. Без комплексных чисел невозможно представить современную математику и физику. Сейчас их изучают в матшколах, на кружках, факультативах и т. д. Если вам нужна алгебра, обязательно изучите комплексные числа на базовом уровне (включая формулы Муавра и формулировку основной теоремы алгебры). А если у вас есть время и желание, насладитесь богатством применения комплексные чисел и удивительными явлениями, связанными с ними. Вот лишь один „шокирующий“ пример из [2]:

x^6 + x^3 + 1 = (x^2 − 2 cos \frac {2π}9 x + 1) \; (x^2 − 2 cos \frac{4π}9 x + 1) \; (x^2 − 2 cos \frac{8π}9 x + 1).

Современная алгебра в широком смысле слова — это наука о множествах с определёнными на них операциями — так называемых алгебраических структурах. Революцию в алгебре совершил выдающийся французский математик Эварист Галуа (1811–1832). Решив давнюю проблему о разрешимости уравнений в радикалах, он заложил основы теории групп и полей — основных алгебраических структур. Как и другие структуры, они определяются формально аксиоматически, однако сформировались постепенно в результате изучения и обобщения естественных структур, часто встречающихся в математике и естественных науках. Так, основной источник групп — биективные (взаимно однозначные) преобразования. Группу образуют перестановки конечного множества, движения плоскости или любого евклидова пространства, линейные невырожденные отображения векторного пространства.

Поля — это очень частный случай колец. В отличие от групп — систем с одной операцией, в кольцах две операции — сложение и умножение, причём по сложению всякое кольцо — коммутативная группа. Класс колец слишком разнообразен, так как на умножение в общем случае не накладывается других ограничений, кроме дистрибутивности относительно сложения (то самое раскрытие скобок). Грубо говоря, поля — это множества с четырьмя арифметическими действиями, подчиняющимися обычным правилам. Например, рациональные, действительные, комплексные числа образуют цепочку полей: \mathbb Q ⊂ \mathbb R ⊂ \mathbb CЦелые числа образуют кольцо, но не поле (не всегда можно делить). Квадратные матрицы над полем образуют кольцо, но умножение в нём не коммутативно. Это объясняется некоммутативностью композиции отображений, ведь правило умножения матриц («строка на столбец») проистекает именно из композиции линейных отображений, которые задаются этими матрицами.

Если вам не нужна высшая, слишком абстрактная алгебра, а достаточно овладеть основами линейной алгебры, то имеет смысл по крайней мере выучить язык алгебры — разобраться с основными понятиями (группы, кольца, поля, векторные пространства, алгебры), знать их базовые свойства и иметь запас примеров (группы перестановок, алгебра матриц, поле комплексных чисел, группа обратимых матриц, ...). Обо всём этом очень «дружелюбно» написано в первой главе замечательного учебника Э. Б. Винберга [1].

Перейдём к обзору курса линейной алгебры. По нему существует огромное количество литературы на разных языках. Подходы у разных авторов разные даже в самом начале курса. Мне ближе всего учебник Винберга — как пишет автор, в книге [1] почти нет технически сложных доказательств, а выкладки, где это возможно, заменены идеями. В целом изложение очень геометричное. Опираясь на эту и другие книги, на свой опыт преподавания на мехмате, в ШАД Хелпер и др., поделюсь своими соображениями по курсу линейной алгебры. Как лучше изучать.

1. Теория размерности. Системы линейных уравнений, метод Гаусса. Арифметические векторные пространства ( \mathbb R^nили, более общо, K^n, где K— любое поле). Рекомендую не бояться абстрактных полей и абстрактных векторных пространств — определений совсем чуть-чуть, зато вы охватите гораздо больше и не будете привязаны к координатам. Далее: линейная зависимость, линейные оболочки, базис, координаты. Затем — размерность как число векторов в любом базисе. Почему в одном пространстве не может быть двух базисов — из пяти и из шести векторов — следует из (несложной) основной леммы о линейной зависимости: если «много» векторов выражается через «мало», то «много» линейно зависимы (Э. Б. Винберг). Здесь же — ранг матрицы (равенство ранга по строкам и по столбцам), связь с размерностью пространства решений линейной однородной системы. Очень полезно воспринимать последнюю как линейное соотношение между столбцами матрицы, а также как поиск ядра линейного отображения. Вообще, один из ключей к успеху — говорить об одном и том же на разных языках. Всё это хорошо изложено в [1] (глава 1, §6 и глава 2, §1-3).

2. Линейные отображения и матрицы. Наряду с пространствами, это важнейшие объекты линейной алгебры (на языке теории категорий: пространства — объекты, линейные отображения — морфизмы; но это замечание можно опустить). В этой теме две составляющих: техническая и идейная. Конечно, нужно овладеть техникой умножения матриц, но знать не только формальное правило, но и некоторые типичные приёмы (умножение на элементарные матрицы, умножение матричных единиц, запись билинейных форм X^TAY, ...). Не менее важно понимать произведение матриц как матрицу композиции линейных отображений. Это упрощает понимание и сводит многие доказательства, скажем, о рангах произведения матриц до 1-2 строк.

3. Определители. Запомните, определитель матрицы n × nнад полем \mathbb R— это плюс-минус объём n-мерного параллелепипеда, натянутого на строки этой матрицы (или, что то же, на столбцы). В частности, при n = 2

\begin{vmatrix} a & b \\ c & d \end{vmatrix} = ad − bc

— это ориентированная площадь параллелограмма, натянутого на векторы (a, b)и (c, d)(или на столбцы (a, c)^Tи (b, d)^T). Знак определителя в случае невырожденной матрицы совпадает со знаком ориентации базиса (из строк или столбцов). Формулу при n = 2легко вывести геометрически, а также она возникает при решении системы линейных уравнений

\begin{cases} ax + by = e \\ cx + dy = f \end{cases}

(формулы Крамера). При n = 3чуть сложнее, хотя аналогично, получается уже нетривиальная формула объёма параллелепипеда (из 3! = 6слагаемых). В общем случае определитель часто определяют по страшной формуле

|A| = \sum\limits_{σ∈S_n} (−1)^σ a_{1σ(1)} . . . a_{nσ(n)} ,

больше напоминающую теорему. И правда, эту формулу можно вывести (как при n = 2, 3) из базовых свойств определителя:
1) определитель матрицы линеен по каждой строке;
2) если две строки матрицы равны, то определитель равен 0 (параллелепипед «схлопывается», его объём равен 0);
3) определитель единичной матрицы равен 1 (объём правильно ориентированного единичного кубика равен 1).
Вообще, геометрическое определение через объём формально дано над полем \mathbb Rно непригодно над любым полем (не говоря уже о размерности n > 3Однако, оставив геометрию как фон, можно определить определитель как функцию матрицы, удовлетворяющую свойствам 1)– 3). Тогда «страшная формула» выводится однозначно и заодно доказывает существование такой функции.
Эти три большие темы лежат в преддверии линейной алгебры. На мехмате МГУ, например, это часть первого семестра, а собственно линейная алгебра занимает весь второй семестр. Вот самое главное, что нужно из неё знать.

4. Спектральная теория. Линейные операторы, их собственные векторы и собственные значения. Как привести матрицу оператора к наиболее простому виду (и что значат эти слова; формула A' = C^{−1}AC). Всякий ли оператор диагонализируем? Нет! И даже над полем \mathbb C— нет! Однако над \mathbb C«почти любой» — заведомо диагонализируемы операторы с простым спектром (у которых все собственные значения различны), а таковы «почти все», ибо кратные корни у многочлена — редкость. Но именно из-за этой «редкости» строится теория жордановой нормальной формы, часто оказывающаяся студентам не по зубам. Спешу успокоить: на первых порах достаточно иметь лишь представление о жордановой форме, уметь обращаться с жордановыми клетками, но доказательство теоремы о приведении к жордановой форме можно опустить (кстати, самое простое я нашёл в пособии [5] — рекомендую).
О приложениях: собственные векторы и значения используются в методах машинного обучения, прежде всего в метод PCA главных компонент. Для него нужно также сингулярное разложение матрицы, которое, несмотря, на своё важное значение, часто упоминается в вузовских учебниках лишь вскользь.

5. Евклидовы пространства — пространства над \mathbb Rсо скалярным умножением, наделяющим их истинной геометрией — длинами и углами. Основные вещи: ортонормированные базисы, ортогональные матрицы, ортогональное разложение V = U⊕U^⊥ортогональные проекции, ортогонализация Грама–Шмидта, матрица Грама и её геометрический смысл. Особое внимание следует уделить важным классам операторов в евклидовых пространствах — ортогональным и самосопряжённым — их каноническим формам. Отмечу, что для этого вовсе не обязательно сначала изучать общее понятие сопряжённого оператора, о которое порой спотыкаются студенты, особенно если сопряжённый к оператору A : V → Wопределяется как оператор между сопряжёнными пространствами A^∗ : W^∗ → V^∗. Это грамотное общее определение можно отложить на будущее, как и все (не)канонические изоморфизмы V \cong V^∗ , ...в случае евклидовых и произвольных пространств.

6. Билинейные и квадратичные формы. Скалярное произведение, помимо билинейности и симметричности, обладает замечательным свойством положительной определённости. Именно благодаря ему евклидовы пространства столь (просты и) привычны. Но также естественно возникают псевдо-скалярные произведения, где квадрат «длины» вектора равен не сумме квадратов координат (теорема Пифагора), а знакопеременной их сумме. Главный пример – четырёхмерное пространство Минковского в теории относительности с квадратичной формой c^2 t ^2 − x^ 2 − y^ 2 − z^ 2(t— время, c— скорость света). Поэтому изучают симметричные билинейные и соответственно квадратичные функции произвольной сигнатуры (почитайте [1] про закон инерции, метод Якоби, критерий Сильвестра). Сигнатура, кстати, отвечает за вид коники. Так,

\frac{x^2} {a^ 2} + \frac{y ^2} {b^ 2} = 1— уравнение эллипса, \frac{x^2} {a^ 2} - \frac{y ^2} {b^ 2} = 1— уравнение гиперболы.

Как обычно, есть общие (простые) свойства произвольных билинейных форм (не обязательно симметричных) над любыми полями. Важную роль играют кососимметричные формы: f(x, y) = −f(y, x).
В классический курс линейной алгебры входят также тензоры — обобщение векторов, линейных и билинейных форм, линейных операторов. Тензоры играют важную роль в механике (откуда они родом; tensus — напряжённый; тензор напряжений в механике), алгебре (где они обобщены на гораздо более широкий класс объектов, нежели векторные пространства), теории вычислений. Однако на первых порах тензоры можно глубоко не изучать, если для ваших целей достаточно освоить операторы и билинейные формы. Их в любом случае следует основательно разобрать, прежде чем переходить к тензорам — их обобщениям.

Список литературы
[1] Э. Б. Винберг. Курс алгебры. МЦНМО, 2019.
[2] А. Л. Канунников. Магия комплексных чисел. Квант, 2017, выпуски 5, 6.
[3] А. Л. Канунников. Алгебра и геометрия комплексных чисел. Квант, 2017, выпуски 5, 6.
[4] А. И. Кострикин. Введение в алгебру (в трёх частях). Часть II. Линейная алгебра. 2000.
[5] В. Д. Кряквин. Линейная алгебра. Пособие к решению задач и большая коллекция вариантов заданий. Вузовская книга, 2004.
[6] В. В. Прасолов. Теоремы и задачи линейной алгебры.


Автор: Андрей Канунников, к. ф.-м. н., мехмат МГУ, преподаватель ШАД Хелпер

Теги:
Хабы:
Всего голосов 13: ↑11 и ↓2+10
Комментарии9

Публикации

Истории

Ближайшие события