dfreev Jun 12 2024 at 16:35

Ковариантность и контравариантность в тензорном исчислении

Medium

57 min

15K

Mathematics*Physics

Записки «чайника», травмированного тензорным исчислением

Существует поразительная возможность овладеть предметом математически, не поняв существа дела. /А. Эйнштейн/

.......................................................... Пособие для тех, кто хочет понять

Тема, заявленная в названии, пожалуй, самая запутанная в тензорном исчислении. Высокоучёные авторы мудрых книг в большинстве случаев ограничиваются только формальными определениями понятий ко- и контравариантности, не опускаясь до подробного пояснения их геометрической и физической сути. Похоже, в этом вопросе они сознательно или бессознательно воспроизводят ситуацию, характерную для квантовой физики: «Не старайтесь понять, просто считайте!». Но если в квантовой физике подобный подход безальтернативен, то в данном случае – вряд ли.

Подзаголовок даже комплиментарен для меня, поскольку в своём восприятии математики я даже не «чайник», а, скорее, «валенок». По этой причине мне очень хорошо понятны проблемы «чайников», с которыми они сталкиваются в попытках постичь математические абстракции. Поэтому материал предназначен не для «продвинутых», они и без меня разберутся, а для… В общем, для таких же, как я, «задвинутых» в математике (только в ней!). При этом предполагается хотя бы «шапочное» знакомство с тензорным исчислением.

Математика остаётся непонятной для многих потому, что нам её объясняют люди, которые понимают её на интуитивном уровне, или, выражаясь более изящно, «на уровне интуитивных образов» [1-7 ≡ Л.1, с. 7]. Нам же, нематематикам, для того, чтобы что-то понять, надо это «что-то» увидеть не в абстрактном («интуитивном»), а в реальном, физически представимом пространстве (по-научному это – «визуализация») или, ещё лучше, поковырять его пальцем (научный термин пока еще не придумали. Открыт приём предложений).

Целью этого текста является обсуждение именно «физического» содержания указанных понятий при предельно возможной минимизации количества математических формул. Он представляет собой в основном компиляцию отрывочных сведений из разных источников, представленных как единое целое. Текст открыт для конструктивной критики. По её итогам, смотришь, и станем мы, «чайники» (всем «чайникам» пламенный привет!!) чуть лучше понимать тему ко- и контравариантности.

Пример определения

Для начала стоит, наверное, привести пример того, как математики объясняют нам, нематематикам, ковариантность. Цитата из многомудрой Википедии: «Ковариантный вектор на многообразии M – это гладкое отображение тотального пространства касательного расслоения M в R, ограничение которого на каждый слой – это линейный функционал на касательном пространстве».

Это определение уникально тем, что в нём с каждым следующим словом туман не рассеивается, а, наоборот, сгущается. В финале и до того бледные, едва различимые контуры ковариантного вектора поглощает непроглядная тьма. Сознание затухает…

Давайте попробуем разобраться в ковариантности без «гладких отображений», «касательных расслоений» и прочих математических извращений, при этом применительно не к абстрактным «многообразиям», а имея в виду в основном общую теорию относительности (ОТО). При таком подходе, не исключено, могут пострадать присущие математике строгость доказательств и общность выводов. Зато будут торжествовать обычная логика и здравый смысл.

И ещё одно предварительное замечание. Трактовка понятия «вектор» в физической литературе может отличаться от таковой, принятой в математике. С точки зрения математика вектор А – абстрактный объект в пространстве, у которого ни длина, ни направление не зависят от выбора системы координат (он – инвариант). Изменение базиса приводит к изменению координат (компонент) вектора Аⁱ и A_i, то есть меняется представление вектора в конкретной системе координат, но не сам вектор. (Вектор обозначаем жирным шрифтом – А, его компоненты курсивом – Аⁱ, А_i). Физики предпочитают думать по-другому: для них набор компонент Аⁱ и A_i и есть вектор [2]. (Впрочем, некоторые математики местами присоединяются к физической трактовке понятия вектора).

Эти различия следует иметь в виду при изучении любого текста по обсуждаемой теме. (Замечание в Замечании. Если исходить из упомянутых отличий, физики переплюнули математиков: их «вектор», понимаемый просто как набор компонент, то есть, чисел(!) Аⁱ (они же A_i), мало похож на реально существующий объект в физическом пространстве и потому выглядит куда более абстрактным, чем «вектор» математиков). В этом тексте по мере возможности соблюдается математическая трактовка понятия «вектор». За пределами этой возможности – физическая.

Зачем всё это надо?

Конечно, главный вопрос, требующий ответа: а зачем вообще сдалась эта ковариантность?! Мы что, не можем без неё обойтись? (Тем более, что действительно можем). Ведь без неё жизнь студентов станет намного легче. (А вот это заблуждение!). Именно этот вопрос лежит в основе непонимания проблемы: я по себе знаю, насколько трудно заставить себя прилагать усилия для изучения сложного вопроса, практическая ценность которого непонятна, неизвестна и вообще неочевидна. (Каюсь, у меня так было даже с дифференциальным исчислением. А чего удивляться? Я же объяснил, что для меня «чайник» – почти комплимент).

Безусловно, логично было бы ответить на заданный вопрос в конце текста, уже после выяснения сути и деталей. Однако с точки зрения людской психологии начать отвечать на «зудящий» вопрос следует уже здесь, рассчитывая на некоторый уровень осведомлённости в тензорном исчислении.

Одна из причин ввода ковариантности, возможно, даже главная – упрощение записи тензорных выражений [3-8 и др.]. (Ниже «выплывет» и вторая причина, но пока она останется «за скобкой»). Упрощение возникает вследствие того, что мы легко, через свёртку с метрическим тензором, можем сделать контравариантный тензор ковариантным, и наоборот:

А_i = g_ikА^k; Аⁱ = g^ikА_k.

(Обратите внимание, уже тут приходится отступать от строго математической трактовки понятия «вектор»). И вот оказывается, что в результате запись тензорных выражений сильно упрощается. Например, если мы выражаем компоненты обоих векторов в одном и том же базисе е_i, то запись скалярного произведения (оно обозначается знаком «∙») в неортогональной системе координат выглядит достаточно тяжеловесно и «отягчена» присутствием метрического тензора:

А∙В = (А¹е₁ + А²е₂+ А³е₃)∙(В¹е₁ + В²е₂ + В³е₃) =

= А¹В¹е₁∙е₁ + А¹В²е₁∙е₂ + А¹В³е₁∙е₃ +

+ А²В¹е₂∙е₁ + А²В²е₂∙е₂ + А²В³е₂∙е₃ +

+ А³В¹е₃∙е₁ + А³В²е₃∙е₂ + А³В³е₃∙е₃ =

= А¹В¹g₁₁+ А¹В²g₁₂+ А¹В³g₁₃ +

+ А²В¹g₂₁+ А²В²g₂₂+ А²В³g₂₃ +

+ А³В¹g₃₁+ А³В²g₃₂+ А³В³g₃₃ =

= g_ikAⁱB^k [4-72].

В этой абракадабре сходу и не разберёшься, тем более, если бы всё было записано «в строчку», а не «в столбик». Пояснение для ускорения чтения: сначала мы в скобках записали векторы в разложении по базису, затем тупо перемножили компоненты, получив аж 9 членов, после чего заменили скалярные произведения базисных векторов е_i∙е_k на компоненты метрического тензора g_ik и, наконец, записали результат в краткой форме. И того 8 строк.

Если же один из векторов (в данном случае B) мы выражаем в другом (втором, дуальном) базисе е^k, запись выражения упрощается благодаря тому, что е_i∙е^k = δ^k_i, то есть, равно 1 при i = k и равно 0 при i ≠ k. (Более подробно это скалярное произведение будет разобрано ниже). Поэтому в формуле остаются только одноимённые (при i = k) компоненты векторов, разноимённые (при i ≠ k) исчезают (обнуляются):

А∙В = (А¹е₁ + А²е₂+ А³е₃)∙( В₁е¹ + В₂е²+ В₃е³) =

= А¹В₁ + А²В₂ + А³В₃ =

= АⁱВ_i [4-72].

Вместо восьми строк мы получили только три, а смысл (результат) тот же самый! (Как и в первом случае, после свёртки получим скаляр). При этом метрический тензор вообще пропал. В этом ещё одно преимущество ввода ковариантности: скалярное произведение «обычного» вектора и ковектора не требует участия метрического тензора. То есть, ковариантный вектор свёртывается с «обычными» векторами без участия метрики. Впрочем, мысленно мы всё равно имеем в виду, что B_i = g_ikB^k.

И дело даже не в лишних пяти строках, а в их содержании – в нагромождении букв и индексов, в которых легко запутаться. Просто представьте, что вам придётся повторять эти 8 строк каждый раз при вычислении скалярного произведения.

Этот пример представляется убедительным – в том смысле, что даёт стимул всё-таки разобраться, чем бескомпромиссная контра- отличается от соглашательской ко-. А если для облегчения жизни требуется ввести вторую систему координат – да хоть десять, в чём проблема?

Общековариантность

Было бы неправильным начинать слишком уж издалека, но всё-таки следует коротко упомянуть факты, безусловно известные всем, кто имел несчастье получить лёгкую контузию на фронте борьбы с ~~ненавистным~~ тензорным исчислением.

Как мы помним, главное достоинство тензоров состоит в том, что уравнения, представленные в тензорной форме, обладают свойством общековариантности, то есть, имеют одинаковый вид в различных системах координат. «Дело в том, что в природе не существуют объективно выделенные системы координат. Они всегда задаются исследователем. Однако законы природы не могут зависеть от субъективного выбора исследователем той или иной системы координат, поэтому физические законы должны формулироваться посредством величин, не зависящих от систем координат. К таким величинам относятся, в частности, скаляры, векторы и тензоры» [5-42].

Отсутствие свойства общековариантности настолько усложняет запись уравнений, что может просто блокировать развитие соответствующих областей науки. Сказанное, в частности, в полной мере относится к ОТО: она «не может быть изложена иначе, как в тензорной форме» [3-8], поскольку тензорное исчисление «позволяет строить математические выражения, не зависимые от случайного выбора координатных систем» [4-112]. «В ОТО выбор системы отсчёта ничем не ограничен; тремя пространственными координатами х¹, х², х³ могут являться любые величины, определяющие расположение тел в пространстве, а временная координата х⁰ может определяться произвольно идущими часами» [6-303]. В такой ситуации, если в каждой системе координат пришлось бы записывать свои, особенные физические уравнения, тензорное исчисление мы вспоминали бы с ностальгией.

В связи с этим, поскольку мы хотим всё-таки представить уравнения в общековариантном виде, возникает задача выражения тензора, то есть математического (геометрического, физического) объекта, в разных системах координат и разных базисах. При этом принципиально, что «при определении тензора ни одной из координатных систем не оказывается ни малейшего предпочтения; составляющие тензора определяются сразу для всех систем координат, причём эти составляющие при переходе от одной системы координат к другой преобразуются по определённым формулам преобразования» [7-346].

«Тензоры, как алгебраические и геометрические объекты (как и любые векторы), от базиса не зависят — разные наборы координат в разных базисах представляют один и тот же объект» [8]. Но компоненты тензора (эти самые наборы координат в конкретном базисе) изменяются при изменении системы координат. Они, как уже сказано в предыдущем абзаце, преобразуются по определённым формулам преобразований.

Преобразование координат

В основу различий, определяющих принадлежность векторов/тензоров к ко- или контравариантному типу, положены те самые законы преобразования (изменения) компонент вектора при смене системы координат, о которых шла речь в предыдущем параграфе: логично один раз определить значения компонент, а потом их просто пересчитывать. Причём возможны только два вида формул преобразований, структура которых и определяет принадлежность вектора к ко- или контравариантному типу.

Разные авторы по-разному и с различной степенью доходчивости вводят понятия контра/ковариантности. Если их всех «проинтегрировать», оптимальная схема выглядит примерно так.

Начинаем с простого – с евклидова трёхмерного пространства. Введём в нём две прямолинейные ортогональные (декартовы) системы координат – Ох₁х₂х₃ и Оʹхʹ₁хʹ₂хʹ₃ʹ. (Пока мы не делаем различия между контра- и ковариантными обозначениями). Начальные точки систем координат О и Оʹ могут не совпадать, а их одноимённые оси не параллельны, то есть, системы ориентированы друг относительно друга самым произвольным образом [7-28]. Чтобы их как-то различать, назовём первую (нештрихованную) систему старой, а вторую (штрихованную) – новой.

Очевидно, что если по какой-либо причине потребуется перейти от старой системы к новой, мы сможем выразить координаты объекта (например, произвольной точки в пространстве, вектора или тензора) в новой системе хʹ₁, хʹ₂ хʹ₃ через координаты х₁,х₂, х₃ в старой:

хʹ₁ = α₁₁х₁ + α₁₂х₂ + α₁₃х₃;

хʹ₂ = α₂₁х₁ + α₂₂х₂ + α₂₃х₃;

хʹ₃ = α₃₁х₁ + α₃₂х₂ + α₃₃х₃ [7-345]. (1)

Здесь α_ik – числовые коэффициенты. (Примечание. Формулы (1) это и есть типичные «формулы преобразования координат». Причём, хотя формул три, считаем, что это одно преобразование).

Геометрический смысл коэффициентов α_ik интуитивно понятен из геометрии декартовых систем координат в евклидовом пространстве. Если же не тревожить без нужды интуицию, то α_ik представляет собой косинус угла между i-той осью новой системы Оʹxʹ_i и k-той осью старой системы Ох_k [7-28]. Например, α₃₁ = cos(Оʹxʹ₃, Оx₁). Поэтому вместо α_ik мы для прояснения их смысла могли бы в (1) подставить косинусы соответствующих углов, но это «перегрузило» бы формулы, усложнив их восприятие.

Косинус угла между Оʹx_iʹ и Ох_k, в соответствии со своим геометрическим определением, показывает численное отношение координат xʹ_i и х_k, поэтому коэффициенты α_ik в преобразовании координат (1) можно представить в виде производных:

Мы опять вместо α_ik можем подставить в (1) соответствующие производные. После этого можно свернуть все три уравнения (1) в краткую (индексную) форму:

По дважды встречающимся индексам (в данном случае по k), согласно правилу Эйнштейна, производится суммирование, то есть, каждой координате хʹ_i (слева) в правой части соответствует не единственная комбинация величин, а сумма трёх однотипных комбинаций. Другими словами, в формуле текущая i-тая компонента в новой штрихованной системе хʹ_i (в левой части) последовательно «перебирает» все k компонент х_k в старой нештрихованной (в правой части), затем история повторяется для (i+1)-ой компоненты и т. д.

Подчеркнём: и исходный вектор, и штрихованные и нештрихованные величины в формуле связаны с одной и той же точкой пространства (то есть, соседние точки не при чём). Пример: если мы имеем вектор, «привязанный» к некой точке, и его компоненты представлены в (старой) декартовой системе, то по формуле (2) мы можем определить компоненты в другой (новой) декартовой системе (вектор при этом остаётся на месте), надо только рассчитать по формулам геометрии значения производных в (2).

От (1) можно двинуться не к (2), а пойти по другому пути и, как водится в математике, собрать все производные в матрицу:

По смыслу М – матрица преобразования координат, она содержит информацию о всех коэффициентах α_ik, поэтому (1) можно записать в матричной форме:

хʹ_i = М х_k (4)

В итоге формулы преобразования координат мы представили в развёрнутой форме (1) и в двух кратких – (2) и (4), попутно выяснив геометрический смысл коэффициентов α_ik. Следовало привести эти рассуждения столь подробно по той причине, что при изложении темы контра- и ковариантности авторы делятся на две группы – одни предпочитают индексную форму (2), игнорируя матричную (4), другие имеют прямо противоположные предпочтения, а потому нужно быть готовым ко всему!

До сих пор всё было просто и наглядно, потому что пространство евклидово, трёхмерное, а системы координат декартовы (спасибо школе!). Теперь, следуя логике изложения тензорного исчисления, будем усложнять геометрию.

Формулы преобразования (1) являются линейными. В тензорном исчислении «не ограничиваются линейными преобразованиями координат вида (1), а рассматривают самые общие преобразования координат вида

хʹ₁ = f₁ (х₁, х₂, х₃),

хʹ₂ = f₂ (х₁, х₂, х₃),

хʹ₃ = f₃ (х₁, х₂, х₃)» [7-345]. (1А)

Кроме того, от трёхмерного пространства переходим к n-мерному, а от евклидова к неевклидовым. В ОТО пространство криволинейное, а потому и системы координат тоже криволинейные.

Собственно говоря, ну и что?! Изменилась геометрия пространства, но суть(!) уравнений (2) или (4) осталась неизменной, разве что в (2) производные теперь не косинусы углов, а более сложные функции, что отражается и на компонентах матрицы (3). Но в любом случае системы координат мы ввели сами, своим произволом, а значит, интересующие нас составляющие в формулах (2) и (4) мы можем рассчитать, даже если этот расчёт представляет собой довольно сложную процедуру. (Загоняем формулы в компьютер, машина эта тупая, но трудолюбивая, пусть она и считает).

Преобразование компонент контравариантного вектора

Теперь от преобразования абстрактных координат (любых) объектов переходим к преобразованию (конкретных) компонент вектора. Некоторые авторы различают эти понятия, что представляется разумным, поскольку позволяет досконально разобраться с первым преобразованием (что сделано в предыдущем параграфе) и после этого сходу, уже без лишних объяснений, ввести формулы преобразования компонент вектора. (Примечание. Сделаем это на примере вектора, но полученные выводы естественным образом распространяются на тензоры более высокого ранга).

Действительно, для вектора понятия «координата» и «компонента» просто равнозаменяемы [7-25], поэтому мы можем в выражениях (2) и (4) заменить координаты на компоненты вектора и заодно, согласно общепринятому правилу, поднять индексы вверх:

Теперь, наконец, можно дать определение, выбрав из возможных вариантов самый короткий, а потому менее путаный: «Совокупность n величин Aⁱ (i = 1÷n), которые при преобразованиях координат преобразуются по закону

называются контравариантным тензором первого ранга, или контравариантным вектором» [5-27]. Это определение легко распространяется на тензоры более высоких рангов. (Примечание. Это определение придумали физики, потому понятие вектора здесь «физическое»).

В определении использована формула (5), но другие авторы вместо неё вставляют в определение равноценную ей формулу (6), что не изменяет сути: обе формулы задают контравариантный закон преобразования компонент вектора при переходе к новой системе координат.

Как понимать эти формулы? Их «физический» смысл определяют, конечно, значения производных. Элементарные перемещения dxʹⁱ и dxⁱ в (5) пропорциональны длинам базисных векторов, поэтому производная показывает, по сути, степень изменения базиса в новой системе координат eʹ_i (индексы векторов базиса здесь указываются внизу) по отношению к базисным векторам старой системы e_i.

Это что касается смысла производной. Осталось выяснить, в какую сторону производная изменяет значение контравариантных компонент, то есть, как она влияет на соотношение Аʹⁱ и Aⁱ. Проще всего показать это на числовом примере. Пусть базисные векторы в новой системе в пять раз длиннее таковых в старой: eʹ_i = 5∙e_i. При этом сам вектор А (не забудем, он – тензор!) имеет одинаковую длину что в старой, что в новой системах. Всё это означает, что в новой системе (eʹ_i) исходный вектор выражает значения своих компонент в единицах длины, в 5 раз больших, чем в старой (e_i), и, соответственно, отношение элементарных перемещений обратное: ∂xʹⁱ/∂xⁱ = 1/5. Аналогично, если eʹ_i = (1/3)∙e_i, получим для производной опять обратное значение: ∂xʹⁱ/∂xⁱ = 3. Алгебраически эти выводы также получаются просто, но менее понятно, чем при объяснении «на пальцах». (Примечание. В общем случае базисные векторы нового базиса eʹ_i могут отличаться от векторов старого базиса e_i не только длиной, но и направлением).

Как мы видим из примеров, «компоненты контравариантного вектора изменяются как бы противоположно [«контра»] изменению векторов базиса (отсюда название)» [3].

Таким образом, обычный вектор/тензор естественно контравариантен. (Позже обсудим и «необычный»). Классический пример обычного вектора – вектор перемещения dxⁱ (геометрический вектор). Он подчиняется контравариантному закону (5), поскольку при преобразовании координат его компоненты преобразуются по формулам

Эта формула получается из формул (1А) по правилу составления дифференциала сложной функции [7-353], она является частным случаем (5), и в отношении неё действует тот же «пальцевый» механизм, что описан выше.

Итак, в этом параграфе мы дали определение контравариантному вектору/тензору и сформулировали контравариантный закон преобразования его компонент: при переходе к новой системе координат его компоненты изменяются с помощью преобразования, обратного преобразованию базиса.

Дуальная система координат

Переходим к вводу понятия ковариантного вектора/тензора, но начинать приходится издалека.

Сначала о терминах. Условимся ту систему координат, в которой вектор/тензор принимает свои контравариантные значения, называть основной, а ту, в которой он принимает свои ковариантные значения, дуальной. (Последнюю также называют взаимной, двойственной, сопряжённой, кобазисом. Кстати, закономерный вопрос: эту гроздь синонимов придумали с некой тайной целью?). В этом параграфе будет обсуждаться дуальная система координат.

Опять может возникнуть вопрос: зачем это надо? Дело в том, что вне дуальной системы трудно (я думаю, просто невозможно) понять суть ковариантного тензора. А поэтому, даже поперёк нежеланию слишком уж погружаться в мутные воды математики, надо разобраться с дуальным базисом: хочешь-не хочешь, а хотеть придётся!

Вводить понятие ковариантного тензора можно по-разному. Некоторые авторы, например, [6; 7; 9] вообще обходятся без понятий «дуальная система координат» и (даже!) «базис», другие, напротив, их активно используют. (Примечание. Это является следствием различия подходов к изложению тензорного исчисления – координатного в первом случае и прямого векторного во втором. Оба этих подхода обсуждаются в Приложении-2 в конце текста. Но здесь мы не собираемся вязнуть в деталях). Позиция последних авторов безусловно более предпочтительная, так как позволяет дать геометрическую интерпретацию контра- и ковариантности тензоров, «увидеть» их в реальном пространстве. Без геометрической (а при возможности, и физической) интерпретации эти понятия пребывают в некоем неосязаемом и бесплотном эфире (который в математике называют «множество»), превращаясь в столь любезные сердцу математиков абстракции, ещё более «далёкие от народа» (от нас), чем известные ниспровергатели в прошлом.

Поэтому, стремясь к наглядности, прежде чем вводить ковариантный вектор/тензор, следует разобраться с системой координат, в которой он чувствует себя естественно, которая для него «родная».

Определённость любой системе координат придают базисы, так как базисные векторы (их длины) задают масштаб длины вдоль соответствующей координатной оси. Ведь что такое проекция вектора? Это всего лишь отрезок на оси, её кусок. Чтобы выразить его в единицах длины, придать ему количественное значение, мы должны задать масштаб вдоль соответствующей оси. В принципе, масштабы длины вдоль каждой из осей могут различаться, но всё равно в собственной системе координат все базисные векторы считаются единичными. Но в другой системе они, как правило, имеют неединичную длину. Пример: в косоугольной системе её базисные вектора единичны, но они же во вспомогательной декартовой системе могут быть неединичными.

Поэтому – для определённости – следует в обеих системах ввести базисы (базисные векторы) – e_i в основной системе координат и eⁱ в дуальной. (В ОТО i = 0, 1, 2, 3). Здесь нет ошибки: в основной системе у базисных векторов индекс именно внизу, а в дуальной системе вверху. Это кажется нарушением логики, но на это приходится идти ради упрощения записи скалярных произведений, в данном случае индексы выполняют исключительно роль обозначений, и не более того; e_i не является ковариантным вектором, а eⁱ контравариантным.

В основной системе (как мы увидим ниже, только в ней) базисные векторы касательны к координатным осям. Это не обязательное правило, но отступление от него не приносит никаких преимуществ, а только создаёт г… В смысле, головную боль, только гораздо ниже. В ОТО базисный вектор лежит в поверхности, касательной к криволинейному пространству в данной точке. По большому счёту, эта касательная поверхность не принадлежит криволинейному пространству, она выходит за его пределы. Для лучшего понимания следует вспомнить, как изображается производная функции y=f(х), построенной на плоскости в декартовых координатах. Функция y=f(х) представляет собой одномерное пространство, производная dy/dx находится в пространстве (тоже одномерном), касательном к основному в некоторой точке. В случае двумерного пространства (пример – сфера) касательное пространство будет уже двумерным (плоскостью). В ОТО всё то же самое, только само пространство четырёхмерное, а касательная поверхность к нему трёхмерная (и потому уже не плоскость). Причём касательное пространство может быть построено в любой точке пространства ОТО, точно так же, как касательная прямая может быть проведена в любой точке функции y=f(х).

Будем считать, что в пространстве введена метрика, то есть задан метрический тензор g_ik. Ввод базисов позволяет получить несколько важных формул. Первая из них связывает компоненты метрического тензора и скалярное [4-74; 10-13] произведение базисных векторов каждой системы координат:

g_ik = e_i∙e_k. (7)

g^ik = eⁱ∙e^k. (8)

(Здесь мы «забежали вперёд», уже на этом этапе различив ковариантный g_ik и контравариантный g^ik метрические тензоры, но это нарушение последовательности ввода понятий оправдано тем, что позволяет не отклоняться от логики изложения темы).

Вывод формул можно посмотреть в [4-67; 10-13]. В развёрнутом виде:

Матрица g^ik заполняется аналогично.

Из формул (7) и (8) вовсе не следует, что метрический тензор определяет базис или, наоборот, базис через g_ik определяет геометрические параметры пространства. Первичны не они, а как раз пространство, его геометрия. Но между матрицей метрического тензора и линейными размерами базисных векторов имеется вполне однозначное соответствие: «Метрический тензор представляет собой набор коэффициентов g_ik, привязанный к определённой системе координат. Если мы переходим к другой системе, то в общем случае будем иметь и другие коэффициенты метрического тензора» [4-67]. Выбрав, например, основной базис e_i, по формуле (7) можно рассчитать значения компонент метрического тензора, но нельзя повлиять на геометрию пространства. Пример: на евклидовой плоскости мы можем выбрать любую косоугольную систему координат, во вспомогательной декартовой системе задать длины базисных векторов, по формулам (7) рассчитать значения компонент g_ik. Изменив длины базисных векторов, мы поменяем значения компонент g_ik. Но и в этом случае g_ik будет описывать геометрию евклидовой плоскости, и никакую другую. Те же рассуждения можно повторить относительно eⁱ и g^ik. Тем самым, через g_ik и g^ik обе системы координат и оба базиса как бы получают привязку к конкретному пространству.

Ввод метрики позволяет ввести в оборот ещё более важную формулу, раскрывающую суть дуального базиса:

еⁱ = g^ike_k . (9)

В развёрнутом виде:

е⁰ = g⁰⁰e₀ + g⁰¹e₁ + g⁰²e₂ + g⁰³e₃;

е¹ = g¹⁰e₀ + g¹¹e₁ + g¹²e₂ + g¹³e₃

и т. д. Здесь g^ik – компоненты матрицы метрического тензора из (8), в данном случае, контравариантного. Вывод формулы (9) можно посмотреть в [4-75; 10-14].

Выше основная и дуальная системы координат и соответствующие им базисы e_i и еⁱ введены независимо друг от друга, на них не накладывалось никаких ограничений. Важность формулы (9) обусловлена тем, что она задаёт связь базисов (и систем координат). Причём эта связь осуществляется через посредство метрического тензора, а он не просто какой-то там абстрактный тензор, он отражает геометрию пространства. (Самое короткое изложение геометрического и физического смысла метрического тензора см. в [11]). Выбор основной системы координат – наш произвол, но выбрав её, мы теряем «свободу воли», поскольку базисы дуальной системы однозначно определяются формулой (9). Подтверждающая цитата: «Выбирая основную систему координат мы автоматически определяем и дуальную систему координат» [4-75]. Основная и дуальная системы связаны друг с другом, говоря словами Маяковского, как «близнецы-братья». Именно это и отражает формула (9).

Из (9) вытекает третья важная формула. По сути, это та же формула (9), но записанная в другом виде. Она получается, если обе части (9) умножить на e_j:

еⁱ∙e_j = g^ike_k∙e_j,

еⁱ∙e_j = g^ikg_kj = δⁱ_j.

Окончательно:

еⁱ∙e_j = δⁱ_j. (10)

Здесь принято, что e_k∙e_j=g_kj в соответствии с (7), а δⁱ_j получается в результате свёртки произведения g^ikg_kj. (Свёртка – ещё одно опережение событий, так как это понятие следует рассматривать после ввода контра/ковариантности, но вывод формулы (10) всё-таки приведён, чтобы показать связь (9) и (10). При желании вывод можно пока проигнорировать – важен полученный результат).

Слева в (10) стоит скалярное произведение – произведение модулей базисных векторов на косинус угла между ними:

еⁱ∙e_j = |еⁱ|∙|e_j|∙cos(еⁱ, e_j). (11)

Но самая информативная часть формулы (10) – символ Кронекера δⁱ_j. Он представляет собой единичную матрицу:

Структура матрицы δⁱ_j говорит о том, что:

– если i = j, то δⁱ_j= 1;

– если i ≠ j, то δⁱ_j= 0.

Таким образом, формула (10) задаёт правила построения базиса еⁱ дуальной системы координат. Вместе две формулы, (9) и (10), в полном объёме её описывают: «Дуальная система координат полностью определяется основной системой [об этом формула (9)] и условиями (10), которые словами можно выразить так:

1. Каждый базисный вектор дуальной системы ортогонален ко всем разноимённым с ним базисным векторам основной системы» [4-73].

Разноимённость еⁱ и e_j означает, что i ≠ j, при этом условии δⁱ_j= 0, а это может быть, если в скалярном произведении (11) cos(еⁱ, e_j) = 0, то есть, векторы взаимно перпендикулярны – об этом и идёт речь в правиле-1.

Продолжим цитату.

«2. Длина базисного вектора дуальной системы выбирается таким образом, чтобы скалярное произведение его на одноимённый вектор основной системы равнялось единице» [4-73]:

еⁱ∙e_i = 1. (12)

Одноимённость еⁱ и e_j означает, что i = j, при этом δⁱ_j= δⁱ_i=1. Угол между векторами еⁱ и e_i может быть любым, в (11) он считается заданным, так же как и модуль вектора основного базиса |e_i|. При этих вводных, согласно правилу-2, модуль вектора дуального базиса |еⁱ| выбирается (рассчитывается) так, чтобы обеспечить результат скалярного произведения (11), равный единице: еⁱ∙e_i =1. Из правила-2 следует, что длины (модули) одноимённых векторов основного |е_i| и дуального |eⁱ| базисов находятся в обратно пропорциональной зависимости, так как cos(е_i, eⁱ) не меняется при изменении длин векторов. То есть, если мы увеличим длину векторов основной системы е_i в 5 раз, это автоматически (см. (12)) приведёт к уменьшению длины векторов eⁱ в те же 5 раз.

Итак, из формулы (10) следуют правила 1 и 2. Для лучшего понимания можно поменять логику на обратную: если разноимённые векторы ортогональны, а скалярное произведение одноимённых векторов равно 1, то в этом случае имеет место формула (10). Эта логика работает не только для пары основная-дуальная системы координат. Поэтому, если хотите выяснить, применима ли в том или ином случае формула (10), проверьте систему/системы координат на соответствие правилам 1 и 2.

Пожалуй, главное (но не всё!) про дуальную систему координат уже сказано:

формулы (7) и (8) связывают базисные векторы с метрическим тензором, а через него с пространством,
(9) определяет связь базисов между собой,
а (10) через правило-1 и правило-2 задаёт способ построения дуального базиса.

Наговорено сверх всякой меры, пора переходить к примерам.

На рис. 1 показаны базисные векторы основной (красные) и дуальной (синие) систем координат, обе системы косоугольные. Вектор е¹ перпендикулярен е₂, а е² перпендикулярен е₁, следовательно, правило-1 построения дуального базиса соблюдено. Во вспомогательной декартовой системе векторы основного базиса имеют координаты

Имеется несколько способов расчёта координат векторов дуального базиса [1-56; 4-73,74], исходя из значений координат е₁ и е₂ (полезная подсказка: в качестве серьёзного подспорья можно использовать калькуляторы в Интернете), но здесь расчёт опущен, поскольку для данного текста он не важен. В результате получилось:

Проверим соответствие полученных координат правилу-2. Для этого надо скалярно перемножить одноимённые векторы обеих систем в матричной форме. Поскольку координаты e_i и eⁱ представлены в ортогональной (декартовой) системе, это возможно [4-67; 12]:

Таким образом, правило-2 тоже выполняется, и в целом доказана дуальность базиса е¹, е² по отношению к базису е₁, е₂. Рис. 1 полезно держать в голове, поскольку он простенький, но одновременно очень наглядно раскрывает суть дуального базиса.

В трёхмерном пространстве, в принципе, всё то же самое.

На рис. 2 [13] координатная система криволинейная, её оси q₁, q₂, q₃. Оба базиса – основной (жёлтые векторы) и дуальный (синие векторы) построены в одной и той же точке пространства, но на рисунке разнесены для лучшего его восприятия (может, и зря). Базисные векторы е₁, е₂, е₃ касательны к криволинейным координатным осям. Принципиально: они не ортогональны друг другу.

Векторы дуального базиса, как им и положено по правилу-1, ортогональны разноимённым векторам основного базиса: е¹ перпендикулярен е₂и е₃, е² – е₁и е₃, е³ – е₁и е₂. В трёхмерном криволинейном пространстве это означает, что векторы дуального базиса еⁱ ортогональны координатным поверхностям. Каждая координатная поверхность проходит через две криволинейные оси, а значение координаты, отсчитываемой по третьей оси, остаётся неизменной (см. правую часть рис. 2). Например, е¹ перпендикулярен координатной поверхности, включающей е₂и е₃. Безусловно, на рис. 2 соблюдается и правило-2, визуально это не очень заметно (так как cos(е_i, eⁱ) близок к 1), но поверим автору рисунка.

В четырёхмерном пространстве всё то же самое, только координатные поверхности там трёхмерные.

Почему выше отмечена взаимная неортогональность векторов основного базиса е_i? Потому, что, если е_i ортогональны, основная и дуальная системы совпадают. То есть, неортогональность векторов е_i является необходимым условием существования дуального базиса еⁱ. Это доказывается аналитически, но можно понять и из геометрии. Например, согласно правилу-1 вектор е¹ должен быть перпендикулярен разноимённым с ним векторам основной системы е₂и е₃. Но, если векторы основного базиса е_i взаимно ортогональны, то правило-1 выполняется автоматически и для е₁, он по определению перпендикулярен е₂и е₃. Поэтому вектор дуального базиса е¹, также подчиняющийся правилу-1, совпадает (до неузнаваемости) с одноимённым вектором основного базиса е₁. Другими словами, в описываемом случае каждый из векторов основной системы е_i перпендикулярен соответствующей координатной плоскости, то есть они не оставили места векторам дуального базиса еⁱ, слившись с ними. Для декартовой системы на плоскости это ещё более очевидно: только переход в косоугольную систему на рис. 1 породил дуальный базис.

Рис. 2 позволяет проиллюстрировать ещё один важный для понимания вопроса факт: «Отметим существенную разницу этих базисов. Если векторы е_i связаны непосредственно с системой координат (являются касательными к координатным линиям), то векторы еⁱ вводятся формально по формулам:

еⁱ∙e_j = δⁱ_j. (10)

[а также по вытекающим из (10) правилам-1 и -2] и, вообще говоря, не являются касательными векторами ни к каким координатным линиям (неголономный базис)» [10-15]. (Замечание. Опять нам засоряют голову всякими «голономными» терминами! А что это означает, «догадайся, мол, сама!». Короче: если базисные векторы представляют собой производные по координатам вдоль криволинейных осей [10-11], то есть, являются касательными к осям (аналогия: касательная к кривой y=f(x) на плоскости), то базис – то самое упомянутое выше нехорошее слово. Если они касательными к координатным линиям не являются и проведены по другому принципу (например, перпендикулярно неким поверхностям, как синие векторы на рис. 2), то они не достойны даже того слова).

Ну, теперь, кажется, про дуальную систему координат сказано действительно всё. Точнее, это авторы первоисточников сказали всё, жалко только, что вразнобой. Здесь их заставили говорить хором. Получилось, может, и многословно, но зато полно и, надеюсь, понятно. (Не надо жалеть слов!).

Ввод понятия ковариантного тензора

Различие в названиях заставляет предположить, что ковариантный вектор/тензор обладает некоторой особенностью по сравнению с контравариантным. Так оно и есть: «Приставка ко- указывает на двойственность векторам» [14-9]. Двойственность (она же дуальность) означает, что ковектор – это тоже вектор, но, в отличие от «обычного» вектора, рассмотренного выше, он обладает специфическим, нетрадиционным (не подумайте плохого!) свойством.

В чём заключается «особость» ковектора?

Ввод понятия вектора в математику и физику позволил наделить объекты (абстрактные математические или реальные геометрические и физические) количественными свойствами, то есть описать эти объекты. «Но проблемой описания величин потребности науки и практики никогда не исчерпываются. Любая теория прежде всего исследует связи или зависимости между изучаемыми величинами. Для отражения связей между различными величинами в математике вводится понятие функции» [4-99]. Вводя понятие ковектора, мы из «мира описания» попадаем в «мир связей».

Следует пояснить смысл цитаты. Величина, определяемая как функция координат и характеризующая объект в некой точке пространства, формально также является функцией, но никаких взаимосвязей с другими объектами (такими же функциями координат) она не отражает. Наличие взаимосвязей требует введения нового понятия – линейного функционала. Функционал тоже вектор, но не обычный – это, по-простому, функция от функции, то есть, аргументом функции является не простое число (например, координата точки), а функция, пусть она тоже выражается числом (см. ниже). Линейный – потому, что для него выполняются условия аддитивности и однородности (кому интересно, пусть найдут в литературе, что это такое, для данного текста это не существенно). Таким образом, обычный вектор позволяет задать численную характеристику объекта в принятой системе координат – его величину и направление, но он не отражает его функциональную связь с другими объектами. А линейный функционал эту связь как раз и призван отразить. (Примечание. Для порядка следует заметить, что понятие линейного функционала имеет ограниченную область применения, его расширениями являются понятия линейного оператора, о нём ниже, и полилинейной функции).

Ясно, для чего всё это сказано: ковектор – не обычный вектор, а линейный функционал. Теперь можно перейти непосредственно к вводу этого понятия.

Рассмотрим классический пример линейного функционала – градиент скалярного поля, в частности, гравитационного. Количественной характеристикой гравитационного поля в каждой его точке служит гравитационный потенциал φ (потенциальная энергия частицы единичной массы), то есть φ – функция координат:

φ = φ(хⁱ).

Так как значение φ выражается числом, то φ скаляр, и поле скалярное. Принципиально: значение φ в конкретной точке никак не связано со значениями φ в соседних точках, не зависит от них. Градиент этого скалярного поля представляет собой производную φ по координатам, то есть, «изменение величины поля вдоль соответствующего направления на единицу протяжённости» [3-8]

grad φ = dφ/dxⁱ,

и поэтому получается, что он функция от функции φ, то есть функционал, причём линейный (последнее утверждение принимаем без доказательства). В отличие от φ градиент не скаляр, а вектор, и его значение зависит от значений φ в соседних точках.

Вспомним, что ранее мы ввели две системы координат – старую (нештрихованную) и новую (штрихованную). Для авторов [6-298] этого оказалось достаточно. Там обошлись без дуального базиса, а просто взяли частную производную скалярного поля по координатам согласно правилу дифференцирования сложной функции:

Обозначив градиент (вектор) слева как А_iʹ, а справа как А_k (индексы внизу), мы получаем ковариантный закон преобразования компонент вектора при смене системы координат:

Этот закон в матричной форме:

Аʹ_i = М^-¹А_k,

где М^-1 – матрица, обратная той, что присутствует в (6).

Осталось только дать определение: «Совокупность n величин A_i, которые при преобразованиях координат преобразуются по закону

называются ковариантным тензором первого ранга, или ковариантным вектором» [9-28].

(Замечания.

1. Из определений и формул (5) и (14) вытекает, что, и в самом деле, возможны только два типа формул преобразования координат, как об этом и сказано выше. Тип зависит от вида производных – ∂xʹⁱ /∂x^k в контравариантном законе и ∂x^k/∂xʹⁱ в ковариантном.

2. Ранее названа причина, побудившая математиков к вводу понятий контра- и ковариантности – стремление упростить запись тензорных выражений. Теперь можно назвать вторую причину – сущностное различие между обычными векторами и линейными функционалами. Суть «классовых противоречий» между контрой- и ко- именно в этом, а формулы (5) и (14) – не более чем формальный способ различить их на практике, сами же формулы не несут в себе никакого серьёзного «физического» смысла. Например, как доказывают, что некий А_ik – ковариантный тензор второго ранга? Да стандартным образом: с помощью сложных или несложных математических выкладок получают, что он подчиняется ковариантному закону преобразования координат (аналога (14) для тензоров рангом больше единицы) – ч. т. д. Формулы (5) и (14), выходит, лишь выполняют роль формальных критериев, по которым векторы/тензоры причисляются к тому или иному типу, и позволяют правильно разместить индексы – вверху или внизу обозначения тензора. При этом они ни в коей мере не определяют сущность понятий.

3. Можно усилить вывод, полученный в Замечании-2. В криволинейном пространстве ОТО, вообще-то, нет необходимости отказываться от старой системы координат и вводить новую. Поэтому формулы (5) и (14), формальный характер которых отмечен в Замечании-2, в ОТО превращаются в предельно формальные: они описывают поведение тензора при смене системы координат, а практическая необходимость в этой смене отсутствует).

Изложенный выше ввод понятия ковариантности полностью соответствует присущему математике принципу минимализма, и если бы этот текст писался для «продвинутых» и «передвинутых» математиков, на этом можно было остановиться – им уже всё ясно: формулы получены, с ними можно работать, что ещё надо? Но чем нам, остальным, помог в постижении понятия ковариантности вывод формулы (14)? Можем ли мы, опираясь только на формулы (13) и (14), «увидеть» ковариантный вектор A_i в реальном пространстве, пусть даже двумерном? Представляется очевидным, что формула (14) ничего не поясняет, она сама нуждается в пояснении.

Сначала дадим физическую интерпретацию формулы (13). (Формула (14) непосредственно вытекает из неё). Как и ранее, введём новую систему координат, в которой базисные векторы будут в пять раз длиннее таковых в старой: eʹ_i = 5∙e_i. (Изменяется базис основной системы). Это означает, что единица (масштаб), в которой измеряется протяжённость вдоль поля, увеличилась тоже в 5 раз, то есть, на прежнем расстоянии теперь укладываются в 5 раз меньше единиц длины. Например, укладывалось пять старых единиц e_i, а теперь только одна новая eʹ_i: xʹⁱ = x^k/5. (Индекс k в правой части показывает, что удлинению подверглись все без исключения векторы e_i). Но само-то поле при этом не изменилось, значение φ во всех точках осталось прежним – с какой стати поле будет реагировать на наши манипуляции с базисами? Поэтому изменение поля в пересчёте на новую, сокращённую единицу длины будет соответственно меньше (мы теперь «движемся» вдоль поля более мелкими шажками):

Выражение (15) – частный случай (13) при значении производной ∂x^k/∂xʹⁱ равном 5, заменой обозначений получаем (14). Эти рассуждения показывают, что в основе (13) и (14) лежат не формальные математические выкладки, нет, (13) и (14) имеют вполне осязаемую физическую основу – то есть, дело отнюдь не только в правиле дифференцирования сложной функции.

Но самую наглядную иллюстрацию работы ковариантного закона даёт геометрическая интерпретация формулы (14) – с использованием дуального базиса. Обратимся снова к рис. 1, дополнив его вектором А (рис. 3).

Считаем, что А – линейный функционал, то есть он по своей природе ковариантный вектор.

(Предупреждение. Некоторые спецы из Интернета утверждают, что ковектор неправильно геометрически изображать в виде «палочки со стрелочкой» [15]. Но другие специалисты уверяют своих читателей, что обычный вектор и ковектор это один и тот же вектор, но представленный в разных системах координат. Боюсь, мы не дождёмся, когда они между собой договорятся. А потому я считаю себя вправе изобразить на рис. 3 ковариантный вектор традиционным способом: может и неправильно, но зато наглядно!).

В силу своей родовой принадлежности А прежде всего представлен в дуальной системе координат eⁱ (спроецирован на синие базисные векторы), его ковариантные компоненты A_i. (Непростые отношения ковариантного вектора с основной системой будут рассмотрены далее). То, что происходит при смене базиса, лучше описать по пунктам.

1. В основной системе координат вводятся новые базисы: eʹ_i = 5∙e_i (на рис. 3 не показаны – места не хватает). При этом с вектором А, естественно, ничего не происходит – он инвариант, поэтому сохраняет длину и направление в пространстве.

2. В соответствии с правилом-2 (см. (12)) длины базисных векторов дуальной системы изменяются в обратном направлении: eʹⁱ = (1/5)∙eⁱ, то есть, их длина сокращается в 5 раз. (На рис. 3 опять не показано).

3. Если понимать под проекциями А отрезки на осях дуальной системы координат, то они (отрезки) остались неизменными. Но, так как масштабы вдоль осей дуального базиса уменьшились в 5 раз, компоненты вектора A₁ и A₂ (те же проекции на óси, но измеренные в единицах длины, задаваемых базисными векторами) теперь численно выражаются в более мелких единицах, то есть, они численно выросли по сравнению со старыми значениями: Aʹ_i = 5∙A_i. В результате мы получили, как и ожидали, аналог формулы (15) (с точностью до обозначений), то есть, частный случай (14), а вместе с последней – ковариантный закон преобразования компонент вектора.

(Примечание. Для простоты и наглядности можно представлять себе компоненту вектора A_i как проекцию вектора на соответствующую i-тую координатную ось, и не заморачиваться на этот счёт. Например, ковариантная компонента вектора А:

А_i = (Проекция А на ось eⁱ дуального базиса)/|eⁱ|.

В развёрнутом виде:

А₀ = (Проекция А на ось e⁰ дуального базиса)/|e⁰|;

А₁ = (Проекция А на ось e¹ дуального базиса)/|e¹|

и т. д., до исчерпания размерности пространства.

Однако, вообще говоря, компоненты вектора не всегда представляют собой проекции вектора на оси. Например, вектор скорости в сферических координатах r, φ, Θ имеет три компоненты, две из которых – те, которые связаны с изменением углов dφ и dΘ – «не могут быть проекциями, в обычном смысле этого слова» поскольку представляют собой не линейную, а угловые скорости [7-353]. Информация в этом Примечании приведена, опять же, для лучшего понимания).

Следует обратить внимание, что в собственной – дуальной – системе координат ковариантный вектор А подчиняется «вражескому» контравариантному(!) закону преобразования своих компонент. Действительно, в п. 3 компоненты изменяются обратно изменению собственного базиса: векторы дуального базиса уменьшились в 5 раз, а компоненты вектора увеличились в 5 раз, это контравариантный закон. Таким образом, ковариантный закон преобразования обеспечивается в п. 2, именно он является ключевым в этой схеме – без п. 2, в котором реализуется правило-2, не было бы никакого ковариантного закона и ковариантности как таковой. Поэтому, хотя ряд авторов умудряется вводить понятие ковариантности, начисто проигнорировав существование дуальной системы координат, последняя всё равно неявно, незримо, по умолчанию (авторов), но неизбежно присутствует в их рассуждениях и формулах – даже там, где её вроде как и нет. (Примечание. В книге по ОТО [9] авторы также обошлись без дуальной системы координат. Но это отнюдь не означает, что в «тензорном исчислении для физиков» она и в самом деле отсутствует).

В заключение этого параграфа можно указать на отличие контравариантных тензоров от ковариантных, которое дружно упоминают практически все авторы первоисточников. А именно: контравариантные и ковариантные тензоры различаются направлением изменения своих компонент по отношению к изменению базисных векторов основной системы координат (извиняюсь за столь тяжеловесную фразу, но проще не получается):

– компоненты контравариантного вектора изменяются обратно направлению изменения базисных векторов основной системы координат;

– компоненты ковариантного вектора изменяются в том же направлении, что и базисные векторы основной системы координат.

«При этом не имеет значения, какое преобразование является прямым, а какое обратным. Важно, что эти преобразования являются взаимно обратными по отношению друг к другу» [4-63].

Эти выводы уже проиллюстрированы примерами. Не забудем только, что, как указано выше в Замечании-2, это не сущностное, а сугубо формальное, внешнее отличие.

Взаимная трансформация тензоров

Однако, как нам сообщают в учебниках, «одна и та же векторная физическая величина может быть представлена как в контра-, так и в ковариантных компонентах» [6-299]. Для большей убедительности подкрепим этот тезис ещё одной цитатой: «Всякий вектор А может быть разложен как по векторам базиса е_i (тогда компоненты его разложения являются контравариантными), так и по векторам базиса еⁱ (с ковариантными компонентами):

А = Аⁱe_i = А_ieⁱ» [10-15].

В качестве примера можно привести уравнения Эйнштейна в ОТО – они записываются и в контравариантной, и в ковариантной, и в смешанной форме [9-105], причём во всех трёх случаях тензоры (как физические величины) одни и те же, а изменение их компонент осуществляется свёрткой с соответствующим метрическим тензором. Что же получается? Для того, чтобы стать ковариантным вектором, не обязательно быть линейным функционалом? А градиент скалярной функции только притворяется ковариантным тензором, а на деле он, как и все остальные тензоры, «и нашим, и вашим»?

Можно подумать: ну вот, говорили-говорили про контравариантный и ковариантный тензоры, а оказывается, это почти одно и то же. На самом деле в этом «почти одно и то же» и состоит весь смысл. Вспомним, как в начале текста мы «лёгким взмахом руки» превратили рождённый контравариантным вектор Bⁱ в ковариантный B_i (опять можно привести аналогию, но боюсь, редакторы забанят). В этой лёгкости и состоит главное преимущество представления тензоров в двух системах координат – приведённый там пример это наглядно демонстрирует.

Осталось разобраться с этим самым «почти». Дело в том, что, если мы можем сделать контравариантный тензор ковариантным и наоборот, это вовсе не означает, что они действительно «одно и то же» (без «почти»). Задачу усложняет то обстоятельство, что авторы первоисточников не поясняют «физику» взаимной трансформации контравариантных и ковариантных тензоров, ограничиваясь в основном только констатацией факта такой трансформации.

Что авторы сообщают, так это то, что вектор в своих контравариантных Aⁱ и ковариантных A_i координатах это один и тот же вектор А (это мы уже и так поняли). С формально математической («беспощадно формальной», как выражается один автор) точки зрения, лишённой какого бы то ни было физического содержания, различие между ковариантными и контравариантными векторами отсутствует. Действительно, абстрактный вектор мы можем представить через компоненты в контравариантном базисе Aⁱ, а затем через посредство метрического тензора превратить его компоненты в ковариантные A_i – см. (16). А можем «отзеркалить» ситуацию в (17):

А_i = g_ikА^k; (16)

Аⁱ = g^ikА_k. (17)

«Содержательно же векторы и ковекторы различают лишь по тому, какое из представлений для них естественно. Естественным для обычного вектора является контравариантное представление» [13], а для ковектора (линейного функционала) ковариантное. Можно подумать, что указание на «естественность» всё объясняет и закрывает вопрос. Однако оно только провоцирует следующий вопрос: а какое содержание вкладывается в эту «естественность»? Этот термин сам нуждается в подробном пояснении, раскрывающем его суть. Без этого ссылки на естественное и противоестественное не могут рассматриваться в качестве научных аргументов (по крайней мере, в математике и физике).

Алгебраическую иллюстрацию взаимной трансформации тензоров (16) и (17) можно подкрепить геометрической: в самом деле, какая разница, на какие координатные оси проецировать вектор А – оси основной или дуальной систем координат? Ничто не мешает на рис. 3 спроецировать вектор А на оси основной системы (красные; там этого не сделано, так как рис. 3 про другое). Отрезки на осях – это только отрезки, ничем друг от друга они принципиально не отличаются.

Но эти, вроде как понятные, интерпретации оставляют без ответа важные вопросы. Например, выражение (13) получено строго математическим путём, и оно показывает, что градиент, как линейный функционал, подчиняется ковариантному закону преобразования своих компонентов. (Это факт!). А какому закону преобразования будет подчиняться после трансформации (17) контравариантный градиент? Ведь, по определению (14), в базисе основной системы координат он обязан следовать контравариантному закону. Так какому закону из двух он будет подчиняться?! Вот главный вопрос, провоцирующий непонимание при изучении процесса взаимной трансформации тензоров. Раз авторы молчат (им-то, будем надеяться, всё понятно), приходится от «беспощадно формальной» логики до понимания вопроса добираться без их помощи. Тем более, что путь не такой уж и длинный.

Очевидно, что исходный пункт – выражения (16) и (17). Именно они отражают суть процесса взаимной трансформации тензоров. Поиск ответа затрудняется тем, что эта суть скрыта «туманом» метрического тензора, поэтому необходимо разогнать "туман".

Будем рассуждать применительно к выражению (17), а то, что получится, легко распространить на (16):

Аⁱ = g^ikА_k. (17)

Запишем (17) в развёрнутом виде:

А⁰ = g⁰⁰А₀ + g⁰¹А₁ + g⁰²А₂ + g⁰³А₃;

А¹ = g¹⁰А₀ + g¹¹А₁ + g¹²А₂ + g¹³А₃;

А² = g²⁰А₀ + g²¹А₁ + g²²А₂ + g²³А₃;

А³ = g³⁰А₀ + g³¹А₁ + g³²А₂ + g³³А₃.

Следует обратить внимание на участие в процессе метрического тензора. Выше была отмечена его определяющая роль в формировании дуального базиса и, значит, ковариантности в целом. Но в данном случае он затемняет картину, и чтобы её прояснить, воспользуемся формулой (8):

g^ik = eⁱ∙e^k. (8)

Получаем:

А⁰ = e⁰∙e⁰А₀ + e⁰∙e¹А₁ + e⁰∙e²А₂ + e⁰∙e³А₃;

А¹ = e¹∙e⁰А₀ + e¹∙e¹А₁ + e¹∙e²А₂ + e¹∙e³А₃;

А² = e²∙e⁰А₀ + e²∙e¹А₁ + e²∙e²А₂ + e²∙e³А₃;

А³ = e³∙e⁰А₀ + e³∙e¹А₁ + e³∙e²А₂ + e³∙e³А₃.

Вынося за скобки:

А⁰ = e⁰∙(А₀e⁰ + А₁e¹ + А₂e² + А₃e³);

А¹ = e¹∙(А₀e⁰ + А₁e¹ + А₂e² + А₃e³);

А² = e²∙(А₀e⁰ + А₁e¹ + А₂e² + А₃e³);

А³ = e³∙(А₀e⁰ + А₁e¹ + А₂e² + А₃e³). (18)

Во всех четырёх скобках справа присутствует одно и то же выражение, это вектор А собственной персоной:

А = А₀e⁰ + А₁e¹ + А₂e² + А₃e³.

Именно так вектор А выражается в дуальной системе координат – через свои ковариантные компоненты (А₀, А₁, А₂, А₃) и дуальный базис (e⁰, e¹, e², e³). Выделения курсивом призваны подчеркнуть, что в правой части мы имеем величины, связанные исключительно с дуальной системой координат. (Примечание. В источниках вместо А_i часто пишут а_i).

Можно при желании записать (18) в краткой форме:

Аⁱ = eⁱ∙А. (19)

Аналогичная по смыслу формула присутствует, например, в [1-53; 10-11,13], но там она получена из других предпосылок и с другой целью.

В общем-то, мы уже получили формулы, вскрывающие суть взаимной трансформации тензоров, показывающие, что при этом происходит – это формулы (18). Что позволяет сделать такой вывод? А то, что в (18) показано, как контравариантные компоненты вектора (слева) выражаются (вычисляются) через компоненты и базисные векторы дуальной системы координат (справа). Для этого достаточно выразить исходный вектор А в дуальной системе координат (получаем скобки справа в (18)) и умножить его скалярно на eⁱ (при данном значении i).

Это означает, что ковариантный от природы тензор (градиент, линейный функционал) естественно выражается, как ему и положено, в дуальной системе координат и подчиняется ковариантному закону преобразования своих компонент (14), и никакому другому. А трансформация его компонент из ковариантных А_i в контравариантные Аⁱ сводится к скалярному умножению на базисный вектор дуальной системы eⁱ. В итоге в левой части (18) мы получаем число, каковым компонента и является. При этом сам градиент остаётся верен дуальной системе и свято чтит свой закон преобразования компонент. Одним словом, формулы (18) показывают, что вся суть ковариантного тензора представлена в правой части (18), а слева стоит лишь число, формально выражающее значение компоненты тензора в другой, основной системе координат.

До сих пор все рассуждения строились вокруг формулы (17). Но их можно «зеркально» повторить и для формулы (16), для этого в выкладках потребуется всего лишь «перевесить шильдики» – где индексы внизу, их надо поднять, и наоборот. В конце мы получим формулы, аналогичные (18) и (19), в частности:

А_i= e_i∙А.

Таким образом, вывод такой. Как контравариантный, так и ковариантный векторы представляются в «родных» для них системах координат, и только в них. А суть формул (16) и (17), описывающих трансформацию векторов, сводится лишь к формальной процедуре расчёта компонент вектора в другой системе координат.

Для полного понимания необходимо сделать некоторые пояснения.

1. Формулы (18) и (19) получены из (17), по существу это одна и та же формула. Но форма записи (17) такова, что в ней «физика» процесса взаимной трансформации тензоров скрыта, тогда как в (18) она проступает более явственно.

2. В формуле (19) вектор А (по определению) инвариант, поэтому изначально он не связан ни с одной системой координат. Это мы по своему желанию выражаем его в основной или дуальной системах. В (18) он представлен в дуальной системе координат (в базисе еⁱ). Что будет, если выразить А в основной системе (в базисе е_i):

А = e₀А⁰ + e₁А¹ +e₂А² + e₃А³?

Тогда вместо (18) мы будем иметь:

А⁰ = e⁰∙(А⁰e₀ + А¹e₁ + А²e₂ + А³e₃) = А⁰;

А¹ = e¹∙( А⁰e₀ + А¹e₁ + А²e₂ + А³e₃) = А¹;

А² = e²∙( А⁰e₀ + А¹e₁ + А²e₂ + А³e₃) = А²;

А³ = e³∙( А⁰e₀ + А¹e₁ + А²e₂ + А³e₃) = А³. (20)

Результат в правой части (20) получен в соответствии с формулой (10): еⁱ∙e_j = δⁱ_j. (Это повод ещё раз вспомнить добрым словом умных учёных, придумавших дуальную систему координат). Как мы видим, представление А в основном базисе приводит к банальному результату: Аⁱ = Аⁱ. Таким образом, формула (19) имеет содержательный смысл только в том случае, если вектор А выражен в дуальной системе координат. Этот вывод является следствием того, что (18) получена из формулы (17), в которой компоненты А_i в правой части сугубо ковариантны.

3. Градиент скалярной функции естественно ковариантен – тому свидетельством формула (13), выражающая именно ковариантный закон преобразования компонент градиента при смене системы координат. Это своё свойство градиент реализует в дуальном базисе – в этом можно убедиться из рис. 3 и описания к нему. Аналогично обычный вектор, например, вектор перемещения dxⁱ (геометрический вектор) подчиняется контравариантному закону (5), поэтому он естественно представим в основном базисе (это было показано в начале текста). Именно так надо понимать термин «естественно»: векторы естественно выражаются в той системе координат (основной или дуальной), в которой они реализуют неотъемлемо присущий им закон преобразования своих компонент. Трансформация векторов в соответствии с (16) и (17), как мы обнаружили в этом параграфе, не изменяет связь вектора с его законом преобразования компонент, которая остаётся нерушимой. С этой точки зрения контра- и ковариантность можно интерпретировать как свойство самого тензора – обычного или линейного функционала. А закон преобразования компонент в таком случае не более чем формальный признак принадлежности к первому или второму типу. (Об этом уже было сказано выше, но всегда полезно зайти ещё раз, но с другой стороны).

Смешанный монстр

Есть еще один, пожалуй, самый сложный(!) вопрос в рамках обсуждаемой темы – тензор смешанного типа.

Первая реакция: что это за дурь?! Что за монструозное «дитя» (справа) приличных с виду «родителей» (слева):

АⁱB_k = Аⁱ_k [16-29]? (21)

(Формула (21) записана в координатной форме).

В предыдущем параграфе речь шла о трансформации тензоров – контравариантный тензор Aⁱ можно превратить в ковариантный A_i, и наоборот. Но как тензор Aⁱ_k может быть одновременно(!) представлен и в основной, и в дуальной системах координат? Как он умудряется стоять «враскорячку» сразу в двух базисах, в одном из которых он естественно контравариантный, то есть «обычный», а в другом ковариантный, то есть – «потомок» линейного функционала? Как в нём могут сочетаться эти два несочетаемые качества? Как смешанный тензор может одновременно подчиняться двум разным законам преобразования координат? Слишком много «каков», явно назрел последний вопрос: как всё это понимать?

Обобщая претензии к тензору смешанного типа: если мы хотим раскрыть его суть, мы должны ответить на следующие вопросы.

1. Как смешанный тензор может быть одновременно представлен в двух системах координат и двух базисах?

2. Как смешанный тензор может сочетать свойства аналога обычного вектора и аналога линейного функционала?

3. Это не вопрос, но было бы неплохо изобразить смешанный тензор графически (на рисунке).

Попытаемся, основываясь на отрывочных данных литературы, найти ответы на поставленные вопросы.

(Примечание. Я попытался получить консультацию по тензорному исчислению на профильном сайте. Заявку просмотрели более 50 специалистов. Опуская подробности, приходится констатировать, что квалифицированной консультации я так и не получил. Специалисты самоустранились до (большинство) или после ознакомления со списком вопросов. Сложилось впечатление, допускаю, ошибочное, что тензорным исчислением в полной мере не владеют даже те, кто позиционирует себя в качестве знатока. Похоже, они потому и считают себя знатоками, что не пытаются ставить сущностные вопросы. Это – предупреждение: не надейтесь, что кто-то осветит вам тёмные закоулки тензорного исчисления).

Тензор второго ранга

Для начала надо разобраться с тензором второго ранга, каковым и является смешанный тензор Aⁱ_k из правой части (21). Как известно, ранг тензора и размерность пространства никак друг с другом не связаны. Размерность пространства определяет число строк/столбцов в матрице тензора. Например, матрица метрического тензора в двумерном пространстве имеет 2 строки и 2 столбца, в трёхмерном 3 и 3, в ОТО 4 и 4, но во всех этих пространствах g_ik остаётся тензором второго ранга.

Ранг это число индексов у тензора, другого определения, как и ясного понимания этого понятия ни один из известных мне авторов не даёт. В первом приближении можно принять, что ранг определяется числом независимых признаков, которые необходимо задать для описания объекта. Например, для полного описания вектора (его модуля и направления) в трёхмерном пространстве требуются три числа, но все они определяют единственный независимый признак – координаты вектора в базисе, поэтому вектор – тензор первого ранга.

Напряжение в некоторой точке твёрдого тела требует задания пары векторов n и τ_(n), из которых первый вектор (нормаль) задаёт ориентацию площадки, а второй – действующую по этой площадке силу, отнесённую к единице площади. Эта пара векторов составляет единое целое. Каждый вектор по отдельности не характеризует i-тую составляющую напряжения, то есть, его величину и направление; адекватное описание требует объединения двух векторов в единый объект. Для полного описания напряжения в точке необходимы три пары векторов: три ортогональных между собой нормали n_i определяют три взаимно ортогональные площадки, в которых действуют векторы напряжения τ_(ni). Совокупность этих трёх пар векторов является примером нового тензорного объекта [1-88]. Таким образом, описание напряжения в твёрдом теле требует задания двух признаков – n_i и τ_(ni), поэтому тензор напряжения имеет второй ранг. Описание кривизны пространства в общем случае предполагает, судя по всему, задание четырёх независимых признаков (мечтаю узнать, каких), в результате имеем у тензора Римана четыре индекса.

Таким образом, ранг определяет размерность не пространства, а матрицы тензора. Например, матрица метрического тензора g_ik двумерна (размещается на плоскости), а матрица тензора Римана R_ijkl четырёхмерна (размещается отнюдь не в любой голове).

Физики, да и большинство математиков тоже, при вводе понятия тензора второго ранга поступают просто – добавляют ещё одну производную в законы преобразования компонент и после этого удовлетворённо выдыхают:

Аналогично вводится и тензор смешанного типа:

В (22) первая производная взята из контравариантного закона (5), а вторая из ковариантного (14). Как указано выше, эти определения являются сугубо формальными, поэтому ничего нам не сообщают о специфике тензора второго ранга, а она есть.

В механике дело обстоит иначе. Там тензоры второго ранга – инструмент первостепенной важности при анализе механических процессов: «именно механика деформируемых тел давала содержательные импульсы для развития тензорного исчисления» [16-5]. По этой причине тензоры второго ранга выделяются в особую группу и им даже посвящаются отдельные монографии. Так что, если и искать разгадки «секретов» тензоров второго ранга, так у механиков.

В чём состоит принципиальное отличие тензоров второго ранга от всего того, что было сообщено выше относительно векторов? Оно в базисе: если базис вектора составляют отдельные базисные векторы:

А = Аⁱe_i = А_ieⁱ,

то «всякий тензор [второго ранга] может быть представлен в виде линейной комбинации диад e_i⊗e_j. Диады e_i⊗e_j образуют базис {e_ie_j} в пространстве тензоров» [5-25]:

А = A_ike_i⊗e_k.

Знак «⊗» указывает на то, что в данном случае мы имеем дело не со скалярным, а с тензорным произведением векторов. (Разница в том, что в результате скалярного произведения двух векторов в единственной итоговой строке мы складываем все компоненты, пример можно посмотреть под рис. 1; при тензорном произведении получаем квадратную матрицу, описывающую тензор второго ранга, пример приведён ниже). Диада e_i⊗e_j должна рассматриваться как единое целое [17-35].

Из приведённой цитаты очевидно, что базис пространства тензоров второго ранга образуют именно диады, составленные из базисных векторов, взятых попарно. В принципе, диады могут быть образованы из векторов единственного базиса (именно этот случай описан в цитате из [5-25]). Однако «подобно тому, как в пространстве векторов мы вводили сразу же и на паритетных началах два базиса (основной e_i и дуальный eⁱ), так же и в пространстве тензоров второго ранга удобно одновременно пользоваться четырьмя базисами, порождёнными базисами e_i и eⁱ:

e_i⊗e_k, eⁱ⊗e^k, eⁱ⊗e_k, e_i⊗e^k.

…С использованием этих базисов тензор второго ранга может быть представлен в четырёх эквивалентных видах:

А = A^ike_i⊗e_k = A_ikeⁱ⊗e^k = A_i^keⁱ⊗e_k = Aⁱ_ke_i⊗e^k» [1-104; 17-42]. (23)

Откуда берутся диады? Да из того же выражения (21), то есть, из тензорного произведения двух векторов. Левую часть (21) для удобства следует записать в векторной форме (векторный и координатный способы изложения тензорного исчисления обсуждаются в Приложении-2 в конце текста), указав при этом знак «⊗», тогда получаем:

А⊗В = (Aⁱe_iВ_ke^k) = AⁱВ_ke_i⊗e^k = Aⁱ_ke_i⊗e^k.

В текущем контексте в (23) нас интересуют два последних выражения, для определённости будем рассматривать только правое. (Примечание. Последовательность векторов и индексов важна: A_i^keⁱ⊗e_k ≠ Aⁱ_ke_i⊗e^k. Но мы не будем увязать в деталях, нам хотя бы в основном немного разобраться). Обозначение тензора в координатной форме Aⁱ_k может сбить с толку, поэтому вернёмся к векторному представлению тензоров, в котором Aⁱ_k не тензор, а координаты тензора А относительно базиса e_i⊗e^k [17-43], то есть, числа. Каждую компоненту принято обозначать буквой. А вот какие индексы мы к этой букве пришпандорим, не имеет никакого значения, они вводятся просто для удобства, обозначая номер столбца и номер строки в матрице компонентов.

Итак, в отличие от векторного базиса e_i или eⁱ базис тензора второго ранга представляет собой комбинации двух базисных векторов. (Аналогично, базис тензора третьего ранга составляют комбинации трёх базисных векторов – триад, и т. д. [16-13]). Разложение тензора смешанного типа по базису в развёрнутом виде:

A = A⁰₀e₀⊗e⁰ + A⁰₁e₀⊗e¹ + A⁰₂e₀⊗e² + A⁰₃e₀⊗e³ +

+ A¹₀e₁⊗e⁰ + A¹₁e₁⊗e¹ + A¹₂e₁⊗e² + A¹₃e₁⊗e³ +

+ A²₀e₂⊗e⁰ + A²₁e₂⊗e¹ + A²₂e₂⊗e² + A²₃e₂⊗e³ +

+ A³₀e₃⊗e⁰ + A³₁e₃⊗e¹ + A³₂e₃⊗e² + A³₃e₃⊗e³ . (24)

Результат каждого тензорного произведения в правой части представляет собой матрицу 4×4. (Важная цитата: «Знак “+” в (24) следует понимать так же как знак “+” в записи комплексного числа x+iy, то есть как символ объединения» [17-37], то есть (24) – «это именно совокупность пар векторов [а не их сумма], являющаяся примером нового объекта – тензора второго ранга» [1-88,91; 17-37]).

«Физическая» сущность смешанного тензора

Разобравшись с главным «секретом» смешанного тензора – его базисом, можно попытаться ответить на сформулированные в начале параграфа вопросы. Собственно говоря, на первый вопрос (как смешанный тензор может быть одновременно представлен в двух системах координат и двух базисах?) ответ уже получен: это возможно потому, что таков базис смешанного тензора e_i⊗e^k, от которого он получает контра- и ковариантный индексы. Но как теперь стало понятно, сам вопрос сформулирован неправильно: нельзя сказать, что смешанный тензор одновременно представлен в двух базисах – в основном e_i и в дуальном eⁱ. Его базис – композиция e_i и eⁱ, поэтому он не принадлежит e_i или eⁱ, взятым по отдельности.

На второй вопрос (как смешанный тензор может сочетать свойства аналога обычного вектора и аналога линейного функционала?) ответить сложнее. Из принадлежности смешанного тензора базису e_i⊗e^k ответ отнюдь не вытекает, поскольку в данном случае дело не в геометрии, в вопросе речь идёт об одновременном сочетании двух различных качеств.

Сначала, как всегда следует поступать в подобных случаях, надо разобраться с понятиями.

Линейный функционал, о котором шла речь выше, принадлежит векторному пространству. В пространстве тензоров второго ранга используется расширение (аналог) этого понятия – линейный оператор. (В общем случае оператор может быть и нелинейным). Разница между ними не только в ранге, но и в результате их скалярного произведения с вектором: если в случае линейного функционала (того же градиента) его скалярное произведение с вектором (например, dxⁱ) даёт в результате скаляр (количественное изменение функции на участке dxⁱ), то результат скалярного произведения оператора с вектором – вектор.

Сам по себе тензор второго ранга ещё не является линейным оператором, он становится таковым в скалярном произведении с вектором. Например, пусть в евклидовом пространстве существует прямая L с единичным направляющим вектором (ортом) вдоль этой прямой е. (Прямую L можно рассматривать как аналог некой оси в системе координат). Абсолютно формально, даже не подозревая о последствиях своих действий, образуем тензор второго ранга (диаду) Р=e⊗e. И вот оказывается, что результатом скалярного произведения тензора Р на любой вектор u (то есть, Р∙u) является проекция исходного вектора u на прямую L. Таким образом, тензор второго ранга Р является проектором – «тензором (оператором) проецирования [любого вектора] на прямую L» [5-19]. Аналогичным образом могут быть получены (линейные) операторы проецирования вектора не только на ось, но и на плоскость, операторы поворота, операторы растяжения вдоль осей и множество других. Причём, что принципиально, роль линейного оператора может выполнять тензор второго ранга любого типа – дважды контравариантный, дважды ковариантный и смешанный.

Как всё это понимать? Конечно, можно опять вернуться к выражению (21) АⁱB_k=Аⁱ_k и представить смешанный тензор как результат тензорного произведения контравариантного и ковариантного векторов. Если нам достаточно лишь формального объяснения, когда всё можно свести к перемещениям индексов, то этим можно и ограничиться. Но для понимания «физической» сути смешанного тензора этого маловато. Остаётся уповать на счастливый случай. Дело в том, что, хотя высокомерные математики и подражающие им физики редко нисходят с сияющих вершин своего знания до нас, «чайников», с понятными объяснениями, но иногда они всё-таки проговариваются. Вот и здесь, явно не озадачиваясь вопросом-2 этого параграфа, они на него всё-таки (неявно) ответили.

В [5] сформулирована и доказана теорема, устанавливающая «взаимно однозначное соответствие между множеством тензоров и множеством линейных операторов» [5-15,16]. Из этого однозначного соответствия вытекает, что «термины “тензор [второго ранга]” и “линейный оператор” могут применяться как взаимозаменяемые» [5-16]. Всё это означает, что в пространстве тензоров второго ранга различие между «обычными» тензорами и линейными операторами стирается(!). Любой тензор второго ранга (по отношению к векторам) может выполнять функцию линейного оператора.

Действительно, мы только что видели, как обычный, заурядный, ничем не примечательный тензор второго ранга Р=e⊗e в скалярном произведении становится линейным оператором (проектором). Обычный тензор изначально готов выступить в роли линейного оператора, ему недостаёт только вектора в качестве «напарника». Поэтому в том, что он сочетает свойства обычного тензора и линейного оператора нет никакого противоречия – это сочетание заложено в нём с «рождения». Линейный оператор и тензор второго ранга – не синонимы. Но в пространстве тензоров второго ранга эти термины, как сказано выше, взаимозаменяемы. А взаимозаменяемость означает, что это, по существу, одно и то же.

Таким образом, ответ на вопрос, как в смешанном тензоре сочетаются свойства обычного тензора и линейного функционала, звучит примерно так: эти свойства заложены в нём изначально, и они не противоречат друг другу.

Графическое представление смешанного тензора

Одна из причин, почему математические абстракции так тяжело до нас, «чайников», «доходят», заключается в том, что их графические интерпретации в подавляющем большинстве случаев отсутствуют. А насколько рисунки облегчают понимание, видно хотя бы на примере этого текста.

Поэтому очень хотелось бы привести иллюстрацию тензора второго ранга, желательно смешанного типа. Но, насколько можно понять из литературы, этих иллюстраций не существует. (Метрический тензор не в счёт: геометрическую интерпретацию получил не сам тензор, а его определитель). Чтобы закрыть тему, следует разобраться с причиной такого положения, тем более, что по ходу дела прояснятся важные особенности тензоров второго ранга.

Векторное пространство – «обычное», привычное нам пространство, изображаемое графически вплоть до его четырёхмерности. Мы оперируем в нём его элементами – скалярами и векторами. Корень проблемы в том, что пространство тензоров второго ранга не «обычное»(!). Оно представляет собой результат тензорного произведения двух «обычных» пространств (одинаковой размерности). Например, если мы имеем евклидово пространство Т₁ с базисом e_i, то оно порождает пространство тензоров второго ранга Т₂: Т₂=Т₁⊗Т₁ и базис e_i⊗e_k. Тензоры второго ранга являются элементами пространства Т₂, а не Т₁ [1-92], поэтому они и не могут быть изображены графически в Т₁. Не имея возможности физически выйти за пределы «обычного» пространства, элементы пространства Т₂ мы можем отразить только средствами математики (в виде матриц тензоров второго ранга), но не графики.

О самом пространстве Т₂можно сказать только то, что это «множество» (приходится употребить это противное слово), его размерность совпадает с размерностью Т₁. Мы не можем изобразить его графически, поэтому и принадлежащий ему тензор второго ранга также остаётся «бесплотным», лишённым собственного изображения. То же самое относится ко всем тензорам высших рангов. Каждый такой тензор – результат тензорного перемножения нескольких векторных пространств (пространств тензоров первого ранга). Вряд ли даже самый гениальный математик способен графически изобразить получающиеся пространства, хотя бы приблизительно.

Получается, что смешанный тензор – это объект в пространстве, которое мы не в состоянии себе представить физически или графически.

Но это всё теория, а как всё сказанное выглядит на практике? В качестве примера возьмём простейший случай – декартову систему на евклидовой плоскости. Базис составляют орты (векторы единичной длины) i₁ и i₂. (Орт i₁ отложен вдоль абсциссы, i₂ вдоль ординаты). Поскольку система координат ортогональна, дуальная система отсутствует (точнее, совпадает с основной), поэтому не делаем различия между контра- и ковариантными индексами. Тензор второго ранга в этом случае представляется в виде:

А = A_iki_i⊗i_k.

Разложение А по базису:

А = A₁₁i₁⊗i₁ + A₁₂i₁⊗i₂ + A₂₁i₂⊗i₁ + A₂₂i₂⊗i₂.

Координаты ортов в декартовой системе:

Вычисляем тензорные произведения ортов:

Итоговые матрицы 2×2 описывают тензоры второго ранга (как результаты тензорных произведений). В двух столбцах они содержат компоненты двух векторов, но один из них, на наше счастье, во всех случаях нулевой. (Поскольку случай простейший).

Итак, после проведённых расчётов исходная формула выглядит так:

А = (A_iki_i⊗i_k = A₁₁i₁⊗i₁ + A₁₂i₁⊗i₂ + A₂₁i₂⊗i₁ + A₂₂i₂⊗i₂) =

= A₁₁i₁ + A₁₂i₂ + A₂₁i₁ + A₂₂i₂. (26)

Проблема в том, что в (26) мы получили не два члена в итоговом выражении (что было бы нормально для двумерной плоскости), а четыре. Можно подумать: ну, и что? Сейчас мы приведём подобные члены и получим совсем уж простое выражение для тензора, вполне себе графически представимое в декартовых координатах на плоскости. Однако, не тут-то было! Вспомним то, о чём было сказано выше: знак «+» это не символ сложения, его следует понимать как символ объединения. Мы вычислили значения диад, но смысл знака «+» в разложении тензора А это обстоятельство никак не изменило. А значит, приводить подобные мы не имеем права. (Это всё равно, как складывать действительную и мнимую часть в комплексном числе). Поэтому (26) – это результат, не подлежащий дальнейшему упрощению. В более сложных случаях будет всё то же самое, только, как можно догадаться, последние матрицы в выражениях, аналогичных (25), будут давать уже не один, а несколько векторов – в соответствии с размерностью пространства.

Как можно интерпретировать полученный результат? Выражение (26) описывает тензор второго ранга в пространстве Т₂, котороеявляется результатом тензорного произведения евклидовой плоскости Т₁ на саму себя: Т₂=Т₁⊗Т₁. Поскольку пространство Т₂ мы можем выразить только в математической форме, при всём желании мы не способны отобразить выражение (26) в графическом виде. Впрочем, это повторение уже сказанного, но на конкретном примере.

Таким образом, получен ответ на последний из вопросов, заданных по поводу тензора смешанного типа.

Приложение 1. Ко- и контравариантность в единственном базисе

Как мы выяснили выше, не любая система координат является дуальной, а только та единственная, которая жёстко и однозначно связана с основной системой формулой (9) и строится по строгим правилам (10).

Однако для полноты картины следует привести пример нетрадиционного способа ввода понятий ко- и контравариантности – при наличии лишь единственного базиса. Этот случай описан в [10]. Суть отражена на рис. 4 [10-9].

На рис. 4 мы видим косоугольную систему координат с единственным(!) базисом е_i. В ней вектор А через свои координаты задан двояко:

– он разложен, как и в декартовой системе, по векторам базиса е₁ и е₂ и получил координаты А¹ и А²,

– также он разложен с помощью ортогональных проекций на оси, получив уже другие значения координат, А₁ и А₂.

Целью автора было, видимо, показать читателям, что координаты вектора можно задавать разными способами. Всё бы ничего, но координаты А¹ и А² названы контравариантными, а А₁ и А₂ ковариантными. А это уже сбивает с толку: ведь вектор получает свои ковариантные компоненты в дуальной системе, и только в ней, а она в данном случае отсутствует. Не совпадает с е_i, а именно отсутствует – сравните с рис. 1: там дуальный базис строится, как и положено, по правилам (10). Получается, что признаком ко- и контравариантности вектора является способ проецирования его на координатные оси – в направлении, задаваемой другой осью (получается параллелограмм), или ортогонально. В связи с этим возникает закономерный вопрос: а что мешает нам договориться проецировать вектор не ортогонально, а под любым другим углом? (Это называется проецированием по направлению). Сколько тогда пар «ковариантных» компонент мы получим? Или для каждой пары придётся придумывать новое название? Это к вопросу обоснованности такого способа ввода понятия ковариантности.

Одним словом, на рис. 4 мы имеем единственную систему координат, дуальная система отсутствует. Поэтому называть координаты вектора А¹ и А² контравариантными, а А₁ и А₂ ковариантными нет никаких оснований. Но это всё забавы математиков, у них, возможно, на этот счёт имеются свои соображения. Пример приведён на случай, если кто-нибудь набредёт на первоисточник.

(Замечание. Этот случай – косоугольная система координат на евклидовой плоскости – один из простейших. В [18] показано, как для него получить компоненты метрического тензора. В этом нет ничего удивительного: задав координаты базисных векторов в дополнительной декартовой системе, мы легко получаем компоненты, просто скалярно перемножая векторы в соответствии с (7): g_ik = e_i∙e_k).

Приложение 2. Способы изложения тензорного исчисления

При изучении тензорного исчисления необходимо иметь в виду и учитывать следующее важное обстоятельство.

Перефразируя классика, тензоры – «объективная реальность, данная нам (в том числе и) в ощущениях». Поэтому тензорное исчисление – оно и в Африке тензорное исчисление. Однако существуют два способа изложения тензорного (и, в равной мере, векторного) исчисления:

– (прямой) векторный (инвариантный)

– и координатный (арифметический) [1; 5; 16; 17].

Эти два способа, хотя и рассказывают об одном и том же, существенно различаются манерой подачи материала.

Можно указать на внешние признаки, по которым можно различить векторный и координатный варианты изложения. При векторном способе «тензор задаётся как самостоятельный математический объект» [5-3], зачастую получающий реальную интерпретацию, особенно в механике. Вводится понятие базиса, и оно широко используется. Как следствие, вектор разлагается по базису, присутствуют основная и дуальная системы координат. Проводится чёткое смысловое различие между вектором А и его компонентами Aⁱ, A_i, Aⁱ_k и т. д. (Пример: в строго векторной форме метрический тензор должен(!) изображаться как g, а g_ik в этом случае – обозначение его компонент. В координатной форме через g_ik обозначается и сам вектор, и его компоненты). Векторы здесь «направленные [геометрические] отрезки, но отнюдь не совокупности троек чисел» [1-24], как в координатной версии. Широко используется матричная (а не только индексная) форма тензорных выражений. Авторы по мере сил стараются приводить примеры и включать иллюстрации.

«Координатная форма тензорного исчисления была разработана, главным образом, математиками, далёкими от сфер деятельности, в которых, собственно, и зарождались первые представления о векторах и тензорах высших рангов» [1-22]. Примером предельной реализации координатного подхода может служить [9]. В этой книге, посвящённой, в общем-то, ОТО, авторы по ходу дела достаточно подробно (но это не означает, что понятно) рассказывают о тензорах, предполагая, видимо, знание основ векторного исчисления. При этом они допускают фактическое смешение понятий «тензор» и «компоненты тензора». (На это обстоятельство было указано в начале данного текста, который сам не свободен от этого). Понятие «базис» отсутствует «как класс»: «базисы при координатном (арифметическом) подходе остаются как бы за кадром» [1-21]. Поэтому, хотя постоянно речь идёт о координатах, формулы разложения вектора по базису отсутствуют(??!), понятия об основной и дуальной системах координат, естественно, тоже. В представлении компонент в виде матрицы отказано даже метрическому тензору. Тензоры высших рангов вводятся опять же сугубо формально – никаких полиад (аналогов диад) и их линейных комбинаций. Авторы не опускаются до каких бы то ни было пояснений, они сумели обойтись без единого примера (и это в книге по физике!) и рисунка. При таких самоограничениях всё изложение поневоле свелось к математическим манипуляциям, предельно далёким (с виду) от геометрической интерпретации или физической реальности. Вместе с тем «профессионал обязан свободно владеть координатной формой тензорного исчисления, поскольку на его основе написаны очень многие книги по физике и механике» [1-22].

Векторный способ представляет собой, по сути, неизбежный синтез обоих подходов, так как невозможно обойтись без координатного представления тензоров. Поэтому многие авторы пытались как-то примирить оба подхода. Наиболее яркий пример – книга [4]. В ней автор попытался изложить основы векторного и тензорного исчислений более-менее человеческим языком. Он старается объяснить всё как можно понятнее, но вынужден(!) использовать настолько сложную и путаную систему обозначений, что продраться через неё – как через заросли колючего кустарника, в которые за автором полезут только самые отчаянные. Кроме того, неизбежный для монографии академизм изложения (общий и неустранимый недостаток, нет, слабо сказано, изъян(!) всех монографий) не позволяет до конца разрушить стену непонимания, возникающую между автором и его читателями. Поэтому, как мне кажется, по этой причине попытка примирить непримиримое не удалась, но книга всё равно полезная.

В общем, моё мнение такое. Тензорное исчисление следует изучать в три этапа. Начать лучше всего с книг, в которых авторы пытаются хоть что-то объяснять. Среди таких могу указать [3; 4] (с учётом их недостатков). На втором этапе надо прочитать хотя бы одну из книг, написанную в русле векторной версии тензорного исчисления. Причём начать лучше с «механиков» [1; 5; 16; 17], но надо иметь в виду, что они ограничивают изложение в основном трёхмерным евклидовым пространством и декартовой системой (это облегчает понимание, но явно не достаточно для будущих физиков). Потом перейти к «математикам» [7; 10]. И только после этого, уже в значительной мере разобравшись с основами тензорного исчисления, можно браться за книги, написанные авторами, придерживающимися координатного способа изложения, например, [9]. Предупреждение. Можно проигнорировать первый этап и начать сразу со второго. Но крайне не советую начинать изучение тензорного исчисления с третьего этапа, это будет пустой и бесполезной тратой умственных усилий и времени – проверено на себе!

Счастливые обладатели хорошей памяти и математических способностей (первое в данном контексте даже важнее второго) вполне могут по лекциям и книгам быстро изучить тензорное исчисление на уровне сугубо формального знания. Следует заметить, что именно знание материала (то есть, прежде всего память!) тестируют преподаватели на зачётах и экзаменах. Но для понимания тензорного исчисления, другими словами, для глубокого проникновения в его основы, для постижения его сути в деталях, одного знания недостаточно. (Надеюсь, читатели, дочитавшие до этого абзаца, согласятся, что цель этого текста – добиться понимания обсуждаемой темы, а не просто формального знания).

Попытаемся добавить немного оптимизма: можно достичь стадии понимания и при заурядной памяти и в отсутствие математических способностей. (Тоже проверено на себе). Но для этого необходимо обладать одним неограниченным ресурсом. Этот ресурс – время. Книги надо не просто читать, а штудировать, что означает неоднократное перечитывание текста и постоянное возвращение к уже прочитанному, открывая всякий раз новые нюансы смысла. Боюсь, большинство читателей этого опуса вынуждены изучать тензорное исчисление как раз в условиях ограниченности времени, которое могут уделить этому процессу.

Не хочется завершать на столь печальной ноте. Извините за многословие, но я не виноват – тема такая. «Лучше быть занудным, чем непонятым» [16-7]. Вот этой мудрой мыслью и поспешим закончить. (А то, ведь, есть ещё свёртка...).

П. С. Все публикации автора: https://vk.com/id608846425

Там полезная (и во все времена актуальная) информация.

Список литературы

1. Жилин П.А. Векторы и тензоры второго ранга в трёхмерных пространствах. – СПб.: Нестор, 2001. – 275 с.

http://www.teormeh.net/Zhilin_New/pdf/Zhilin_Vectors_Tensors_Book.pdf

2. https://avva.livejournal.com/1944537.html

3. С. Гаврилов. Тензорное исчисление для «чайников».

https://caxapa.ru/thumbs/757847/tensor.pdf

4. Речкалов В.Г. Векторная и тензорная алгебра для будущих физиков и техников: учеб. пособие для вузов. – Челябинск, 2008. – 140 с.

https://www.susu.ru/sites/default/files/rechkalov.pdf

5. Волков А.Е, Волкова Н.А., Шихобалов Л.С. Тензоры второго ранга. – СПб: СПГУ, 2020. – 46 с.

6. Ландау Л.Д., Лифшиц Е.М. Теоретическая физика: Учеб. пособие. В 10 т. Т. II. Теория поля. – М.: Наука, 1988. – 512 с.

7. Кочин Н.Е. Векторное исчисление и начала тензорного исчисления. Изд 9-ое. – М.: «Наука», 1965. – 426 с.

https://ikfia.ysn.ru/wp-content/uploads/2018/01/Kochin1965ru.pdf

8. Википедия, статья «Тензор».

9. Алексеев С.О. и др. Общая теория относительности: Введение, современное развитие и приложения. – М.: ЛЕНАНД, 2019. – 400 с.

10. Победря Б. Е. Лекции по тензорному анализу: 3-е изд. – М: Изд-во МГУ, 1986. – 264 с.

https://ikfia.ysn.ru/wp-content/uploads/2018/01/Pobedrya1986ru.pdf

11. https://habr.com/ru/articles/756604/

12. http://twt.mpei.ac.ru/math/larb/Euclidesp/LA_03070000p.html

13. Википедия, статья «Ковариантность и контравариантность (математика)».

14. Фоменко А.Т. Дифференциальная геометрия и топология. (Конспект лекций). – М. – 137 с.

https://teach-in.ru/file/synopsis/pdf/difgeom-and-topology-fomenko-M.pdf

15. https://dxdy.ru/topic154702.html

16. Пальмов В.А. Элементы тензорной алгебры и тензорного анализа: Учебное пособие. – СПб: Изд-во Политехн. ун-та, 2008. – 109 с.

https://fea.ru/spaw2/uploads/files/Palmov/p_109.pdf

17. Жилин П.А. Векторы и тензоры второго ранга в трёхмерном пространстве. – СПб: СПГТУ, 1992. – 90 с.

http://mech.spbstu.ru/images/8/86/Zhilin_VT2.pdf

18. https://habr.com/ru/articles/261421/

Hubs: