Теория категорий на JavaScript. Часть 1. Категория множеств

  • Tutorial


Абстракция – это одна из основных техник в ИТ. Любой язык программирования или моделирования, любая парадигма программирования (процедурная, функциональная, ООП, …) дают ответ на вопрос, как и от чего нужно абстрагироваться. Причём, адепты каждого подхода предлагают какой-то свой вариант абстракции.

Если вы хотите увидеть истинную, универсальную абстракцию, то вступайте в нашу… изучайте теорию категорий. В статье на примере категории множеств с картинками и JavaScript-кодом объясняются самые базовые понятия теории категорий: пределы, универсальное свойство. Рассматривается вычислительный аспект теории категорий.

Также немного говорится про классы, примеси и смеси в JavaScript.

Примеры из статьи можно посмотреть тут.

Введение


Я думаю, что все слышали о теории категорий. Слышали, что это крутая silver-bullet теория, с помощью которой можно единообразно описывать очень разные вещи. Слышали, что она активно применяется в функциональных языках программирования. Кто-то возможно даже слышал о языках программирования или системах компьютерной алгебры, в значительной степени основанных на теории категорий.

В Интернете много книг и статей на эту тему. Но обычно они ориентированы либо на математиков, либо на ИТшников, занимающихся наукой и странными вещами типа Haskell, ML (ирония – не надо мне ставить минус в карму, как это обычно бывает после упоминания святого Haskell всуе).

А для простых работяг, которые каждый день зарабатывают себе на кусок хлеба фигаченьем на JavaScript, польза от теории категорий мало понятна. Я не обещаю, что после прочтения этого цикла статей она станет понятней. Но если всё получится, то возможно мы даже запилим приложение, которое будет делать что-то полезное.

Сразу предупреждаю, что у меня инженерное, а не математическое образование. Поэтому если вы ожидаете увидеть в статье строгие определения, доказательства теорем и т.п., то не увидите. Скорее наоборот, всё будет описываться «на пальцах». Если вы увидите какие-либо неточности, пожалуйста, пишите, я могу в чём-то ошибаться.

Что такое категория?


Категория – это всё что угодно, для чего определены:

  • класс объектов,
  • класс морфизмов (стрелочек) между объектами (причём, для каждого объекта существует тождественный морфизм),
  • операция композиции морфизмов,
    • которая является ассоциативной:
      (h ∘ g) ∘ f = h ∘ (g ∘ f)
    • для которой тождественные морфизмы являются нейтральными элементами:
      f ∘ idA = idB ∘ f = f

Символ ∘ иногда опускают: (h g) f = h (g f)

Также вместо композиции иногда используют конкатенацию морфизмов, чтобы в формуле они шли в том же порядке, что и на диаграмме: (f ; g) ; h = f ; (g ; h) Но такая запись не так удобна как кажется, поэтому редко встречается. Если мы будем рассматривать элементы в следующих статьях, то вы в этом убедитесь.

Чтобы сконструировать категорию чего-то, необходимо

  • придумать какие в этой категории будут объекты и морфизмы,
  • не забыть про тождественные морфизмы,
  • придумать, что представляет собой операция композиции морфизмов,
  • доказать, что композиция обладает необходимыми свойствами,
  • profit.

Морфизмы должны иметь в точности один исходный и один целевой объект. Они не могут соединять 3 или более объектов, не могут «висеть в воздухе». (Категории высших порядков мы не рассматриваем.)

Применять операцию композиции можно только к совместимым морфизмам. Пусть есть морфизмы f : A → B, g : B → C и h : C → D. Композиция g ∘ f (или f; g) допустима. А следующие композиции недопустимы: h ∘ f, f ∘ f, f ∘ g.

Теперь рассмотрим пример категории. Представьте элементарный топос, он является категорией. Если представили, то вряд ли вы найдёте в этой статье для себя что-то новое. Лучше почитать что-нибудь более фундаментальное.

Пример свободной категории, порождённой графом


Если всё-таки продолжаете читать, то попробуем сконструировать более понятную категорию. Представьте вашу страницу вконтакте, а также страницы ваших друзей, подписчиков и тех, на кого вы подписаны – всех, с кем вы непосредственно связаны. Это будет класс объектов:


Для всех, на кого вы подписаны, нарисуйте стрелку от вашей страницы к странице этого человека. Для всех, кто подписан на вас, нарисуйте стрелку от их страниц к вашей. А для всех ваших друзей нарисуйте стрелки в обоих направлениях:


Теперь проделайте то же самое для остальных страниц:


Будем считать, что если один человек подписан на другого, то 1-ый знает 2-го. Если два человека подписаны друг на друга (они друзья), то они знают друг друга. Т.е. морфизм в нашей категории – это отношение «знает».

Будем считать, что все знают сами себя и нарисуем тождественные морфизмы:


Определим операцию композиции морфизмов следующим образом.

Пусть f – это морфизм, обозначающий, что A знает B, а g – это морфизм, обозначающий, что B знает C. Тогда g ∘ f – это морфизм, который обозначает, что A опосредованно знает C.

Таким образом, класс морфизмов в нашей категории включает в себя не только отношение «знает», но и «опосредованно знает».

Ассоциативность операции композиции очевидна. Если А знает B, который знает C, который знает D, то как не группируй тут морфизмы, всё равно A опосредованно знает D.

То, что тождественные морфизмы являются нейтральными элементами композиции тоже очевидно. Если A знает B, то то, что они знают сами себя, ничего не меняет.

Мы построили свободную категорию, порождённую графом. С одной стороны, этот пример показывает, как из чего угодно можно построить категорию. С другой стороны, показывает, что категории строятся по определённым правилам.

Пример предпорядка


В предыдущем примере объекты и морфизмы относительно простые, мы считаем, что у них отсутствует внутренняя структура.

Теперь представьте, что все страницы (ваша и людей, с которыми вы связаны) – это один объект. Множество страниц, имеющих отношение к другому человеку – это другой объект и так далее:


Какие морфизмы могут быть в такой категории?

Например, отношение «подмножество». Если каждый друг, подписчик и т.п. человека A является также другом подписчиком и т.п. человека B, то рисуем морфизм от A к B. В этом случае мы получим предпорядок, который является категорией:


Или, например, в качестве морфизмов можем использовать функции, которые в качестве аргументов принимают страницы и возвращают для них некоторые другие страницы. В этом случае мы получим категорию множеств. Точнее, её подкатегорию, потому что категория множеств содержит все множества, а не только множества страниц вконтакте.

Коммутативные диаграммы


В рассмотренных примерах я отождествлял диаграммы с категориями. Но, вообще, это разные вещи. Строго говоря, диаграмма – это функтор. Что такое функтор нам пока неважно.

В одной из предыдущих статей мы уже отмечали, что модель и её представление в некоторой нотации (диаграмма, текстовое представление или ещё какое-то) – это разные вещи. Аналогично и с категориями.

Пока будем считать, что диаграмма – это некое визуальное представление фрагмента категории, в котором объекты изображаются в виде узлов, а морфизмы – в виде стрелочек между узлами. Впрочем, на диаграмме иногда можно изобразить всю категорию целиком, а не только её фрагмент. Бывают категории, содержащие всего один или несколько объектов и морфизмов.

Диаграммы могут быть коммутативными или некоммутативными.

Коммутативная диаграмма – это диаграмма, на которой для любой пары объектов результат композиции морфизмов не зависит от выбора направленного пути между этими объектами.

Лично я не сразу понял, как диаграмма может быть некоммутативной. Посмотрите на примеры свободной категории, порождённой графом, и предпорядка выше. Если между двумя объектами есть несколько путей, то явно все эти пути эквивалентные – они начинаются одним объектом и заканчиваются одним объектом. Как эти пути могут быть неэквивалентными?

Дело в том, что в предпорядке от некоторого объекта A к некоторому объекту B может идти максимум один морфизм. В свободной категории между парой объектов может быть более одного морфизма (см. обсуждение в комментариях), но в данном примере интуитивно понятно, что эти морфизмы эквиваленты: всегда отражают факт того, что человек A прямо или опосредованно знает человека B. Но, например, в категории множеств между одной и той же парой объектов может быть несколько совершенно разных морфизмов. Рассмотрим в качестве примера очень простую диаграмму с двумя объектами и двумя параллельными морфизмами. Коммутативна ли она?


Она будет коммутативна тогда и только тогда, когда выполняется равенство f = g. Вообще, в теории категорий коммутативные диаграммы часто используются как альтернатива записи систем уравнений. Можно написать «следующие равенства выполняются» и перечислить их. А можно написать «следующая диаграмма коммутативна» и нарисовать диаграмму, соответствующую системе уравнений.

Коммутативность данной диаграммы зависит от того какие множества и функции стоят за нарисованными объектами и морфизмами. Пусть объект A – это множество чисел, объект B – это множество геометрических фигур, морфизм f – это функция, которая для некоторого числа возвращает круг с радиусом равным этому числу, морфизм g – это функция, которая для некоторого числа возвращает квадрат с длиной стороны равной этому числу. Очевидно, что эти две функции не равны, а, значит, диаграмма некоммутативна:


Пусть вас не смущает, что в одной категории смешиваются множества чисел и множества фигур. В этой же категории могут быть множества страничек вконтакте, множества множеств, графов, котиков и чего угодно – всё это одна категория множеств. Рассмотрим её более детально, но сначала немного общих сведений об исходном коде.

Общая информация по исходному коду


Исходные коды доступны тут, а примеры из статьи тут.

Сразу предупреждаю, что большую часть кода я писал 3 года назад, когда ещё не было ES6, и в стандартной библиотеке не было нормальных коллекций. Мне пришлось тогда реализовать свой Set. И, в целом, код наверняка организован не очень оптимально. Я, честно, пытался разложить всё по модулям, прочитал статью и понял, что теория категорий выглядит гораздо проще, чем вся эта жесть.

В файле Helpers.js наряду с другими вспомогательными функциями определены функции extend и combine. Функция extend уже давно придумана, она позволяет унаследовать один класс от другого и подробно описана тут. Единственное, моя реализация может добавлять в класс примеси. Очень рекомендую прочитать эту статью про примеси, где они рассматриваются как фабрики подклассов, описывается как их можно компактно описывать на ES6. Вообще, взгляд на примеси как на более общий случай наследования, при котором неизвестен заранее суперкласс, достаточно интересен.

Лично я не хочу заморачиваться с Babel и т.п., поэтому исходные коды написаны на ES5 и понадобились две эти функции. Примеси нельзя наследовать как классы с помощью extend, их можно только смешивать с помощью метода combine.

В файле Category.js определен абстрактный класс «категория», от которого должны наследоваться специфические категории. Также в нём определены примеси «полная категория» и «кополная категория» и их смесь «биполная категория». Категория множеств, которую мы будем рассматривать далее, как-раз является биполной категорией и к ней «примешиваются» некоторые универсальные алгоритмы, которые могут использоваться в любой биполной категории. Они реализованы именно в виде примесей, потому что JavaScript не поддерживает множественное наследование. Далее всё это объясняется подробнее.

В файле Set.js определена 1) категория множеств, 2) сами множества, 3) функции и 4) некоторые пределы категории множеств. Теоретически класс Set можно заменить на Set из ES6. Функции реализованы в виде так называемых графиков, т.е. в них в явном виде хранятся:

  • допустимое множество входных элементов – домен (область определения);
  • допустимое множество результирующих элементов – кодомен (область значений);
  • множество пар: входной элемент и соответствующий ему результирующий элемент.

Домен и кодомен хранятся в явном виде, чтобы можно было проверять допустима ли композиция двух функций. Она допустима только если домен 1-ой функции совпадает с кодоменом 2-ой. Также домен используется при проверке того действительно ли функция является полной или это частично определенная функция. Если вы посмотрите код, там очень много подобных проверок (вызовы assert).

Наверное, возможно хранить функции именно в виде функций, а не их графиков, но это пока не принципиально.

В файле SetCategoryView.js рисовалка диаграмм для категории множеств, основанная на d3. Почти все иллюстрации в статье нарисованы с её помощью. К слову, в 4-ой версии d3 усовершенствовали Force Layout, теперь там можно самостоятельно определять произвольные силы. Усовершенствовали drag'n'drop, если я не ошибаюсь, то раньше он работал только для svg, а сейчас легко поддерживается и для canvas. В этой рисовалке вы теоретически можете найти что-то интересное, но она требует полного рефакторинга.

В файле Set.html все примеры из данной статьи.

Реализация категории множеств


Далее я буду описывать различные конструкции из категории множеств и как они реализуются в коде. Сама она реализована в виде следующей фабрики:

function SetCategory() { }
extend(SetCategory, Category, BicompleteCategory);

SetCategory.prototype.object = function (elements) {
  return new Set(elements);
};
SetCategory.prototype.morphism = function (A, B, mapping) {
  return new TotalFunction(A, B, mapping);
};
SetCategory.prototype.id = function (A) {
  return this.morphism(A, A).initId();
};
SetCategory.prototype.compose = function (g, f) {
  return g.compose(f);
};

Категория множеств наследуется от абстрактной категории и к ней примешивается поведение биполной категории.

Данная фабрика позволяет создавать

  • объекты (которые являются множествами);
  • морфизмы (которые являются функциями, отображающими элементы некоторого множества A на элементы некоторого множества B);
  • тождественные морфизмы (которые являются тождественными отображениями некоторого множества A на себя);
  • композиции двух морфизмов.

Честно говоря, я не сразу осознал почему категории должны быть фабриками. Скажем, множества, списки, стеки, деревья, графы и другие структуры обычно в явном виде хранят все свои элементы. Категории – это вроде аналогичные математические структуры, но почему они реализуются иначе? Почему нельзя реализовать категорию как хранилище её объектов и морфизмов? Потому, что в общем случае категория содержит бесконечное количество объектов и морфизмов. Причём, из них нам нужны всего лишь несколько. И их нужно не столько хранить, сколько конструировать на их основе новые объекты и морфизмы.

Создадим несколько объектов и морфизмов:

var setCat = new SetCategory();
var obj123 = setCat.object([1,2,3]);
var objAB = setCat.object(['a','b']);
var objABCD = setCat.object(['a','b','c','d']);
var f = setCat.morphism(obj123, objABCD, {1: 'c', 2: 'c', 3: 'd'});
var g = setCat.morphism(objABCD, objAB, {'a': 'a', 'b': 'b'});
var h = setCat.morphism(objAB, obj123, {'a': 1, 'b': 1});
showSetCategoryView('diagram1', setCat, {'A': obj123, 'B': objABCD, 'C': objAB},
  {'f': {dom: 'A', codom: 'B', morphism: f},
   'g': {dom: 'B', codom: 'C', morphism: g},
   'h': {dom: 'C', codom: 'A', morphism: h}});


Жаль, что нельзя вставлять в статью выполняемый JavaScript код. Поэтому придётся вставлять картинки, но повторюсь, что подвигать всё это можно тут.

Эпиморфизм, мономорфизм, изоморфизм


Ок, мы умеем создавать объекты, морфизмы и красиво их рисовать. Что дальше?

Объекты и морфизмы могут обладать различными свойствами и значительная часть теории категорий посвящена описанию и изучению этих свойств. Наша реализация теории категорий должна уметь проверять эти свойства и должна уметь конструировать объекты и морфизмы с определенными свойствами. Начнём с самых простых свойств.

Напомню, что морфизмы в категории множеств – это функции. Из школы вы наверняка помните, что функции могут быть сюръекциями, инъекциями, биекциями. Я обещал, что не будет строгих определений и всё будет объясняться на пальцах, поэтому получайте:

Сюръекция – это функция, которая принимает все значения из своей области значений. Скажем, функция возведения в квадрат, определенная на множестве целых чисел, не является сюръекцией, потому что она не принимает значения 2, 3, 5, …


Инъекция – это функция, которая отображает разные элементы исходного множества в разные элементы результирующего множества. При этом область значений функции может содержать некоторые дополнительные элементы, у которых нет прообраза в области определения.


Биекция – это отображение один-к-одному. Функция является биекцией тогда и только тогда, когда она является одновременно сюръекцией и инъекцией.


Для других математических объектов (например, графов) существуют некие аналоги сюръекций, инъекций и биекций. Поэтому в теории категорий, раз эта теория обо всём, решили эти понятия обобщить и ввели соответственно эпиморфизмы, мономорфизмы и изоморфизмы.

В чём же заключается это обобщение? В том, что в теории категорий мы полностью абстрагируемся от внутреннего устройства объектов и морфизмов. Вместо того, чтобы определять эти виды морфизмов через кружочки и стрелочки, как это сделано на рисунках выше, они определены через соотношения с другими морфизмами.

Эпиморфизм – это морфизм e : A → B, такой что из всякого равенства f ∘ e = g ∘ e следует f = g (другими словами, на e можно сокращать справа).


Чтобы было понятно о чём идёт речь, приведу пример НЕ эпиморфизма:


Диаграмма выше коммутативна (f ∘ h = g ∘ h). Чтобы в этом убедиться, вы можете пройти по стрелочкам от каждого элемента множества A и, независимо от выбранного пути, вы всегда придёте к одному и тому же элементу множества C. Т.е. функции f ∘ h и g ∘ h для одинаковых аргументов возвращают одинаковые результаты. Но(!) из этого не следует равенство функций f и g. Для элемента «1» они возвращают разные значения: «a» и «b». А, вот, если бы функция h была эпиморфизмом, то из коммутативности диаграммы следовало бы равенство f и g.

Далее я не буду так подробно описывать «переходы по стрелочкам через кружочки», просто имейте в виду, что, когда в категории множеств идёт речь о коммутативных диаграммах, вы всегда можете проверить эту коммутативность таким способом.

Ещё раз отмечу, что мы описали сюръективные функции только через соотношение с другими функциями, полностью абстрагируясь от деталей их внутреннего устройства. В этом суть теории категорий.

Мономорфизм – это морфизм m : A → B, такой что из всякого равенства m ∘ f = m ∘ g следует f = g (другими словами, на m можно сокращать слева).


Изоморфизм – это морфизм f : A → B, для которого существует обратный, т.е. существует морфизм g : B → A, такой что f ∘ g = idB и g ∘ f = idA.


Вот, тут небольшой сюрприз. Не во всех категориях из того, что морфизм является эпиморфизмом и мономорфизмом следует, что он также является и изоморфизмом. Это демонстрирует то, что категория множеств конечно хороша для визуализации каких-то понятий, но может приводить к ложным аналогиям.

Конечный, начальный и нулевой объект


Конечный объект – это объект T, такой что для любого объекта X существует единственный морфизм u : X → T.

В категории множеств конечный объект – это синглетон, а уникальный морфизм – это функция, отображающая любой элемент исходного множества в единственный элемент синглетона. Терминальных объектов в категории множеств бесконечное количество, однако, все они изоморфны друг другу. Это значит, что с точки зрения теории категорий неважно о каком именно синглетоне идёт речь, всё, что верно для одного с точностью до изоморфизма будет верно и для любого другого синглетона.


Начальный объект – это объект I, такой что для любого объекта X существует единственный морфизм u : I → X.

В категории множеств начальный объект – это пустое множество, а уникальный морфзим, определённый на пустом множестве – это пустая функция. Причём, существует единственное пустое множество, соответственно, в категории множеств единственный начальный объект.


Нулевой объект – это объект, который является одновременно начальным и конечным объектом.

В категории множеств нулевых объектов нет, т.к. множество не может одновременно быть пустым и быть синглетоном.

Отметим несколько важных моментов.

Начальные и конечные объекты – это дуальные понятия, они эквивалентны с точностью до обращения направления морфизмов. Начальный объект будет конечным объектом в двойственной категории (категории с такими же объектами и операцией композиции, но морфизмами, направленными в обратном направлении). Идея дуальности или двойственности очень важна в теории категорий. Далее вы увидите ещё несколько примеров двойственных понятий.

К слову, конечные объекты можно называть коначальными, а начальные – коконечными, но тут мы уже попадаем в область одного фундаментально нового языка программирования. Если добавить или убрать у понятия приставку «ко-», то получим дуальное понятие. Кококонечные объекты я не встречал, хотя специалист по теории категорий должен понять, что речь идёт о начальных объектах.

В определениях выше ничего не говорится о морфизмах, направленных от конечного объекта. А они существуют. Например, некий морфизм f : {1} → {1,2,3,4} с графиком {(1,1)} или морфизм g с такой же сигнатурой, но графиком {(1,2)}. Т.е. они мало того, что существуют, но ещё и не уникальны и, забегая вперёд, играют достаточно важную роль. Поэтому представление о конечных объектах как об объектах, морфизмы которых направлены только к ним, не верно.


Насчёт морфизмов, направленных к начальным объектам, не могу ничего сказать. Я предполагаю, что в категории множеств их либо нет, либо это пустые уникальные функции. В принципе, почему бы им и не быть. Но тогда, каждое множество будет изоморфно пустому множеству. Если кто-то может прояснить этот момент, было бы отлично.

Универсальное свойство и самый важный момент


Обратите внимание на фразу «… существует единственный морфизм …» в определениях выше. Она повсеместно встречается в работах по теории категорий. Это называется «универсальное свойство».

Универсальное свойство позволяет определить понятие, абстрагируясь от деталей. Вы видите, что начальный и конечный объекты определены без упоминания пустых множеств, синглетонов, да, и, вообще, каких-либо структур. Вот, это настоящая абстракция! Я думаю, что в руководствах по теории категорий для разработчиков нужно говорить в первую очередь именно о таких вещах, а не о декартово замкнутых категориях или монадах.

Иными словами, в теории категорий вы определяете объекты, делая акцент не на описании их внутренней реализации, а на описании их внешнего поведения, того как они могут «взаимодействовать» с другими объектами, фактически вы описываете их интерфейс. Правда, немного иначе, чем это обычно делается в языках программирования, но этим теория категорий и интересна.

Вследствие абстрагирования от деталей универсальное свойство определяет объект с точностью до изоморфизма. Выше мы уже отмечали, что в категории множеств все конечные объекты (синглетоны) изоморфны. Но это верно для любых объектов, определенных через универсальное свойство. В принципе, это вполне логично: если два объекта внешне «ведут себя» одинаково (для них выполняется одно универсальное свойство), значит они изоморфны.

И, наверное, самый важный момент, который лежит в основе всего этого цикла статей. За универсальными свойствами обычно стоит некоторая оптимизационная задача, заключающаяся в поиске наилучших в некотором смысле объектов или морфизмов. Мы вернёмся к этому в разделе про уравнители.

Реализация конечных и начальных объектов


Слишком много теории, посмотрим, как конечные и начальные объекты реализованы в коде.
SetCategory.prototype.terminal = function () {
  return new SetTerminalObject(this).calculate();
};
function SetTerminalObject(cat) {
  this.cat = function () { return cat; };
}
SetTerminalObject.prototype.calculate = function () {
  this.obj = new Set([1]);
  return this;
}
SetTerminalObject.prototype.univ = function (A) {
  var mapping = {};
  A.forEach(function (el) {
    mapping[el] = 1;
  });
  return this.cat().morphism(A, this.obj, mapping);
}

SetCategory.prototype.initial = function () {
  return new SetInitialObject(this).calculate();
};
function SetInitialObject(cat) {
  this.cat = function () { return cat; };
}
SetInitialObject.prototype.calculate = function () {
  this.obj = new Set();
  return this;
}
SetInitialObject.prototype.univ = function (A) {
  return this.cat().morphism(this.obj, A, {});
}

У вас, возможно, возник вопрос: зачем столько кода для реализации синглетона и ПУСТОГО множества???

Конечный и начальный объекты – это не просто какие-то множества. Для них ещё должно выполняться универсальное свойство, которое имеет не какой-то теоретический характер, но оно активно используется в вычислениях. Например, при вычислении дополнения к кодекартову квадрату вычисляется универсальный морфизм для суммы объектов. Мы вернёмся к этому позже.

В нашей реализации у конструкций, обладающих универсальным свойством, будут методы:

  • calculate – создаёт некоторую универсальную конструкцию или собирает её из других конструкций,
  • complement – создаёт универсальную конструкцию из не очень типичных компонентов,
  • univ – вычисляет для данной конструкции универсальные морфизмы.

Произведение


Продолжим нестрогие определения на пальцах и рассмотрим чуть более сложные объекты.

Произведение объектов Xj – это объект X и морфизмы πj : X → Xj, называемые каноническими проекциями, такие что для любого объекта Y и морфизмов fj : Y → Xj существует единственный морфизм u : Y → X, такой что πj ∘ u = fj.

В теории категорий вместо написания равенств вида πj ∘ u = fj можно нарисовать подобную диаграмму и сказать, что она коммутативна (пример для двух объектов, но в общем случае их может быть больше):


В категории множеств произведение объектов – это декартово произведение множеств.


На рисунке произведение обозначено как AxB, а его элементы – как пары элементов из исходных множеств. Но это сделано для наглядности и совершенно не обязательно! Произведение можно назвать как угодно, а его элементами могут быть

  • 1, 2, 3, …
  • квадратик, кружочек, треугольничек, …
  • или что угодно.

Произведение определено не как множество пар значений, а через соотношения между морфизмами. Сравните определения декартова произведения множеств и произведения объектов в теории категорий – они не имеют ничего общего. Вы снова видите пример абстрагирования от деталей в теории категорий.

В коде произведение реализовано следующим образом.
SetCategory.prototype.product = function (A, B) {
  return new SetProduct(this).calculate(A, B);
};
function SetProduct(cat) {
  this.cat = function () { return cat; };
}
SetProduct.prototype.calculate = function (A, B) {
  var obj = new Set();
  var mapping1 = {};
  var mapping2 = {};
  A.forEach(function (x) {
    B.forEach(function (y) {
      var z = [x, y].toString();
      obj.add(z);
      mapping1[z] = x;
      mapping2[z] = y;
    });
  });
  this.obj = obj;
  this.f = this.cat().morphism(this.obj, A, mapping1);
  this.g = this.cat().morphism(this.obj, B, mapping2);
  return this;
};
SetProduct.prototype.univ = function(m, n) {
  assertEqualDom(m, n);
  assertEqualCodom(this.f, m);
  assertEqualCodom(this.g, n);
  var obj = m.dom();
  var mapping = {};
  obj.forEach(function (x) {
    var s1 = this.f.preimage(m.image(x));
    var s2 = this.g.preimage(n.image(x));
    mapping[x] = s1.intersection(s2).representative();
  }.bind(this));
  var u = this.cat().morphism(obj, this.obj, mapping);
  assertCommutes(this.f.compose(u), m);
  assertCommutes(this.g.compose(u), n);
  return u;
};

Обратите внимание, что в функции calculate вычисляется не только декартово произведение множеств, но и два морфизма – канонические проекции произведения на исходные объекты. В большинстве вычислений именно они играют основную роль и, грубо говоря, они гораздо важнее множества.

Функция univ вычисляет универсальный морфизм (u – на диаграмме выше) для некоторого объекта и пары морфизмов. Посмотрим, чем может быть полезен универсальный морфизм произведения.

На следующей диаграмме вы видите объекты A и B, их произведение AxB, а также некоторый произвольный объект C с морфизмами f1 и f2.


Вы видите, что элемент «1» множества C отображается на элемент «1» множества A и на элемент «a» множества B. Точно также как элемент «1,a» множества AxB. При вычислении универсального морфизма мы устанавливаем этот факт и конструируем универсальный морфизм таким образом, чтобы он отображал элемент «1» множества C на элемент «1,a» множества AxB.

Элементы «4» и «5» множества C отображаются морфизмами f1 и f2 на одни и те же элементы. Поэтому универсальный морфизм отображает их на один элемент «2,b» множества AxB.

Для наглядности представим, что C – это множество обезьянок. f1 каждую обезьянку относит к одной из категорий: красивая или некрасивая, а f2 – к одной из категорий: умная или глупая. Тогда универсальный морфизм u относит каждую обезьянку к одной из четырех категорий: красивая и умная, красивая и глупая, некрасивая и умная, некрасивая и глупая.

Фактически, универсальный морфизм для произведения – это произведение морфизмов.

Произведение в разном виде реализовано в различных языках программирования. Это и структуры, и кортежи, и всяческие join’ы в SQL, LINQ и т.п. Почитайте про типы-произведения.

В JavaScript канонические проекции произведения можно рассматривать как деструкторы или акцессоры:

monkeyKind.a
monkeyKind.b

а универсальные морфизмы – как конструкторы:

function u(x) {
  return { a : isBeautiful(x), b : isSmart(x) };
}

В теории категорий акцессоры часто называют деструкторами, потому что они позволяют разобрать сложный объект на составные части, они дуальны конструкторам. При вызове такого деструктора объект совершенно не обязательно должен уничтожаться.

Сумма


Сумма объектов Xj – это объект X и морфизмы ij : Xj → X, называемые каноническими вложениями, такие что для любого объекта Y и морфизмов fj : Xj → Y существует единственный морфизм u : X → Y, такой что u ∘ ij = fj.

Пример коммутативной диаграммы для двух объектов:


В категории множеств сумма объектов – это дизъюнктивное объединение множеств. Т.е. если в объединяемых множествах есть совпадающие объекты, то эти объекты не будут сливаться, а, грубо говоря, будут некоторым образом отмечены, чтобы можно было понять из какого множества каждый объект.


В теории множеств элементы дизъюнктивного объединения обычно помечают некоторым тегами или индексами, например, 1A, 2A, 3A, aB, bB. Но в нашем примере элементы суммы – это просто числа от 1 до 5, которые связаны с элементами исходного множества морфизмами f и g. И именно эти морфизмы «помечают» элементы суммы. Как и для произведения само множество без морфизмов не играет особой роли.

Очевидно, что произведение и сумма – это дуальные понятия. Они сформулированы аналогично с точностью до обращения морфизмов.

Но на этом обобщения не заканчиваются. Произведение и сумма очень похожи на конечный и начальный объекты соответственно. Для произведений и конечных объектов можно от каждого объекта категории, удовлетворяющего определённым условиям, построить универсальный морфизм – такие конструкции называют пределами. Для суммы и начального объекта можно к каждому объекту категории, удовлетворяющему определённым условиям, построить универсальный морфизм – такие конструкции называют копределами. Далее вы увидите ещё несколько примеров пределов и копределов.

В общем случае (ко)пределы – это (ко)конусы, определенные для некоторой диаграммы. Как я уже говорил, диаграмма – это функтор из некоторой индексной категории в текущую категорию. Если грубо, то индексная категория определяет «форму», «вид» диаграммы и в итоге определяет какой (ко)предел мы получим (конечный объект, произведение, …). Если дальше развивать эту мысль, то мы рискуем вызвать какодемона.



Короче, идея в том, что даже такие общие понятия, которые мы рассмотрели выше, можно обобщить ещё сильнее.

Чтобы запомнить, чем пределы отличаются от копределов, обратите внимание на то, что универсальные морфизмы всегда направлены (стремятся) к некоторому «предельному» объекту. Равно как и пределы последовательностей или функций стремятся к некоторому значению.

Реализация суммы объектов аналогична реализации других (ко)пределов.
SetCategory.prototype.coproduct = function (A, B) {
  return new SetCoproduct(this).calculate(A, B);
};
function SetCoproduct(cat) {
  this.cat = function () { return cat; };
}
SetCoproduct.prototype.calculate = function (A, B) {
  this.obj = new Set();
  var elementCount = 1;
  function createInjection(set, obj) {
    var mapping = {};
    set.forEach(function (x) {
      obj.add(elementCount);
      mapping[x] = elementCount;
      elementCount++;
    });
    return mapping;
  }
  this.f = this.cat().morphism(A, this.obj, createInjection(A, this.obj));
  this.g = this.cat().morphism(B, this.obj, createInjection(B, this.obj));
  return this;
};
SetCoproduct.prototype.univ = function(m, n) {
  assertEqualCodom(m, n);
  assertEqualDom(this.f, m);
  assertEqualDom(this.g, n);
  var obj = m.codom();
  var mapping = {};
  function addMappings(f, h) {
    h.dom().forEach(function (x) {
      mapping[f.image(x)] = h.image(x);
    });
  }
  addMappings(this.f, m);
  addMappings(this.g, n);
  var u = this.cat().morphism(this.obj, obj, mapping);
  assertCommutes(u.compose(this.f), m);
  assertCommutes(u.compose(this.g), n);
  return u;
};

Попробуем разобраться, что делает универсальный морфизм суммы объектов.


Напомню, что канонические проекции произведения можно рассматривать как деструкторы произведения объктов, а универсальный морфизм – как конструктор. Сумма – это дуальное понятие.

Соответственно, канонические вложения можно рассматривать как конструкторы суммы объектов, а универсальный морфизм – как деструктор. Почитайте про типы-суммы. В том или ином виде они реализованы в очень разных языках программирования. Как правило, в качестве примеров приводят алгебраические типы данных и сопоставление с образцом. Но в JavaScript этого нет, поэтому приведу немного другой пример.

Пусть у нас есть два вида обезьянок – шимпанзе и гориллы – с соответствующими конструкторами:

function Chimpanzee() { }
function Gorilla() { }

Пусть для шимпанзе нам нужно вычислять некоторую функцию p, а для горилл – q, при этом область значений обоих функций – это некоторое множество C. Например, C – это перечисление: маленькая, средняя, большая. Функция p вычисляет категорию, к которой относится шимпанзе в зависимости от размера, а функция q вычисляет категорию для гориллы:

function u(x) {
  if (x instanceof Chimpanzee) {
    return p(x);
  }
  else if (x instanceof Gorilla) {
    return q(x);
  }
}

Вычитание (дополнение к сумме)


Если вы что-то читали по теории категорий, то вряд ли увидели выше для себя что-то новое. А слышали ли вы, например, о вычитании объектов в теории категорий? Идея совершенно очевидная, правда, в англоязычных статьях обычно говорят о вычислении coproduct complement. На русский язык можно перевести как вычисление дополнения к сумме объектов. Но, по сути, это операция вычитания.

Пусть имеется сумма объектов A+B, один из слагаемых объектов A и соответствующее ему каноническое вложение i1. Или просто каноническое вложение i1, доменом которого является A, а кодоменом – A+B. Если мы вычислим другой канонический морфизм i2, то фактически вычтем из суммы одно из слагаемых:


Реализовано это следующим образом.
SetCategory.prototype.coproductComplement = function (f) {
  return new SetCoproduct(this).complement(f);
};
SetCoproduct.prototype.complement = function (f) {
  this.obj = f.codom();
  this.f = f;
  this.g = this.cat().morphism(f.codom().diff(f.image()), this.obj).initId();
  return this;
};

В общем случае сумма объектов может быть N-арной, а не только бинарной. Однозначно вычислить дополнение можно только для бинарной суммы. Дополнения к суммам нам потребуются позже для вычисления дополнений к кодекартовым квадратам.

Уравнитель


Выше мы уже рассмотрели (ко)пределы для пустых диаграмм (конечные и начальные объекты) и для дискретных объектов (произведение и сумма). Теперь рассмотрим (ко)пределы для пары параллельных морфизмов, т.е. морфизмов с общими доменом и кодоменом.

Уравнитель параллельных морфизмов f, g : X → Y – это объект E и морфизм eq : E → X, такие что f ∘ eq = g ∘ eq и для любого объекта O и морфизма m : O → X если f ∘ m = g ∘ m, то существует уникальный морфизм u : O → E, такой что eq ∘ u = m, т.е. следующая диаграмма коммутативна.


Охх… В своё время я прочитал несколько учебников по теории категорий. И где-то на этом месте переставал понимать о чём вообще идёт речь. Это происходило по двум причинам. Во-первых, я ленился рисовать множества и функции на бумаге и при этом, не будучи Григорием Перельманом, не мог сконструировать всё это в воображении. Как следствие, я не понимал эти конструкции даже для категории множеств, не говоря о других категориях. Далее будут диаграммы, на которых визуально виден смысл уравнителя. Во-вторых, даже более простые произведение и сумму объектов я понимал только на интуитивном уровне, не понимая смысл универсального свойства. В общем-то и в этой статье я пока не рассматривал толком универсальное свойство. Разберёмся с ним более детально на примере уравнителя.

Сначала разберёмся с условием f ∘ eq = g ∘ eq. Для удобства изобразим объект X и морфизм eq дважды, чтобы морфизмы f и g не накладывались друг на друга.


Морфизмы f и g отображают элемент «1» множества X на элемент «a» множества Y. Следовательно, если морфизм eq будет отображать некий элемент «1» множества E на элемент «1» множества X, то будет выполнено равенство f(eq(1)) = g(eq(1)) = a. На рисунке видно, что пути, начинающиеся с элемента «1» в множестве E, заканчиваются одними и тем же элементом в множестве Y.

Морфизм f отображает элемент «2» на элемент «a», а морфизм g отображает элемент «2» на элемент «b». Следовательно, как не реализуй отображение eq, при прохождении через элемент «2» в множестве X пути разойдутся. Т.е. какой элемент не подставь вместо вопросительного знака f(eq(?)) = a никогда не будет равно g(eq(?)) = b, потому что элемент «a» не равен «b».

Продолжаем эти рассуждения для оставшихся элементов множеств X и Y и таким образом завершаем формирование E и eq. Только элементы «1» и «3» отображаются функциями f и g одинаково.

Это должно быть относительно понятно, при вычислении E и eq мы действительно находим что-то общее между f и g. Но зачем в определении объект O и морфизмы m и u? Дело в том, что множество E и морфизм eq, которые мы сконструировали, не уникальные. Добавим на диаграмму O и m, для которых тоже выполняется f ∘ m = g ∘ m.


Получается, что m уравнивает f и g не хуже, чем eq. Чем вообще eq лучше m? Таких уравнителей мы можем построить бесконечное количество. Очевидно, что E и eq проще, чем O и m и поэтому, наверное, лучше. Но в теории категорий мы не можем сказать, что морфизм уравнителя должен содержать наименьшее количество элементов, потому что, как я уже отмечал, мы максимально абстрагируемся от внутреннего устройства объектов и морфизмов. В какой-нибудь другой категории нет никаких множеств и функций, поэтому привязываясь к количеству элементов, мы очень сильно ограничили бы применимость уравнителей.

Итак, как из всех потенциальных уравнителей выбрать лучший? На помощь приходит универсальное свойство. От объекта E к объекту O можно провести два морфизма h, для которых выполняется условие m ∘ h = eq, это {(1,1),(3,3)} и {(1,2),(3,3)}. А, следовательно, O и m не являются уравнителем, так как для них не выполняется универсальное свойство.

А, вот, для E и eq универсальное свойство как-раз выполняется. Мы можем вычислить универсальный морфизм для O и m и получим u = {(1,1),(2,1),(3,3)}. Для других O и m, для которых выполняется f ∘ m = g ∘ m, универсальный морфизм будет другой, но всё равно уникальный.

А что если O и m будут соответственно такого же размера как E и eq? Какой уравнитель будет лучше? Они изоморфны, с точки зрения теории категорий не существенно какой выбрать.

И только скажите, что теория категорий не нужна простому работяге, фигачящему на JavaScript! Нужна, она позволяет узреть истинное абстрагирование, а не то, что называют абстрагированием всякие ООПшники и иже с ними (ирония).

Реализация в коде не особо сложнее реализации (ко)пределов, рассмотренных ранее.
SetCategory.prototype.equalizer = function (f, g) {
  return new SetEqualizer(this).calculate(f, g);
};
function SetEqualizer(cat) {
  this.cat = function () { return cat; };
}
SetEqualizer.prototype.calculate = function (f, g) {
  assertParallel(f, g);

  this.f = function () { return f };
  this.g = function () { return g };

  var dom = new Set();
  var codom = f.dom();
  this.q = this.cat().morphism(dom, codom);
  f.dom().forEach(function (x) {
    if (f.image(x) == g.image(x)) {
      dom.add(x);
      this.q.push(x, x);
    }
  }.bind(this));

  this.obj = this.q.dom();

  assertCommutes(f.compose(this.q), g.compose(this.q));
  return this;
}
SetEqualizer.prototype.univ = function (m) {
  assertEqualCodom(this.q, m);
  assertCommutes(this.f().compose(m), this.g().compose(m));
  var mapping = {};
  m.forEach(function (x, y) {
    mapping[x] = this.q.preimage(y).representative();
  }.bind(this));
  var u = this.cat().morphism(m.dom(), this.obj, mapping);
  assertCommutes(this.q.compose(u), m);
  return u;
};

Отметим ещё один момент. В учебниках по теории категорий написано, что любой уравнитель – это мономорфизм. Внимательный читатель наверняка заметил, что условие f ∘ eq = g ∘ eq для уравнителя очень похоже на условие f ∘ m = g ∘ m для… эпиморфизма. Стоп, почему эпиморфизма, а не мономорфизма? В данном случае схожесть уравнений приводит к возникновению ложных аналогий.

Равенство для эпиморфизма можно сократить на эпиморфизм и при этом будет выполняться равенство f = g. А, вот, если сократить равенство на уравнитель, то морфизм f не будет равен g. Скорее наоборот, уравнитель, как правило, применяется к неравным морфизмам. В этом легко убедиться, если ещё раз посмотреть на рисунки выше. Морфизмы f и g не равны, а уравнитель eq не является сюръекцией (эпиморфизмом в категории множеств).

Ок, но почему он тогда является мономорфизмом? Это следует из универсального свойства. Любые два морфизма от некоторого объекта O к объекту E будут равны. С другой стороны, видно, что в нашем примере уравнитель – это инъекция (мономорфизм в категории множеств), и универсальное свойство гарантирует, что это всегда будет инъекция.

Зачем я описываю всю эту жесть? Чтобы ещё раз показать, что для «простых» категорий можно понять смысл разных конструкций или теорем, представляя какие реальные вещи (множества, функции) за всем этим стоят. Вы никогда не поймёте, что всё это значит, если не будете рисовать подобные картинки.

Коуравнитель


Коуравнитель параллельных морфизмов f, g : X → Y – это объект Q и морфизм q : Y → Q, такие что q ∘ f = q ∘ g и для любого объекта O и морфизма m : Y → O если m ∘ f = m ∘ g, то существует уникальный морфизм u : Q → O, такой что u ∘ q = m, т.е. следующая диаграмма коммутативна.


Как видите, определение аналогично определению уравнителя, только морфизмы направлены в обратную сторону. Однако, вычислительная составляющая коуравнителя, на первый взгляд, не имеет ничего общего с тем, что мы рассматривали в предыдущем разделе.

Рассмотрим это на примере конкретных множеств и функций.


Оба морфизма f и g, для которых мы вычисляем коуравнитель, отображают элемент «1» множества X на элемент «a» множества Y. Чтобы выполнялось равенство q(f(1)) = q(g(1)), достаточно, чтобы морфизм q просто отображал элемент «a» на некий элемент «a» множества Q.

Морфизм f отображает элемент «2» на элемент «b», а морфизм g отображает элемент «2» на элемент «c». Чтобы выполнялось равенство q(f(2)) = q(g(2)), морфизм q должен отображать элементы «b» и «c» на некий элемент «b» множества Q. Иными словами, мы объединили элементы «b» и «c» в один класс эквивалентности «b».

Морфизм f отображает элемент «3» на элемент «c», а морфизм g отображает элемент «3» на элемент «d». Как и ранее, это означает, что «c» и «d» необходимо объединить в один класс эквивалентности. Однако «c» уже принадлежит классу «b», поэтому мы не создаём новый класс, а просто относим элемент «d» к классу «b».

Аналогично создаём класс эквивалентности «e» для элементов «e» и «f». И завершаем формирование коуравнителя Q с морфизмом q.

Однако, руководствуясь такой логикой, мы можем построить некоторый объект O с морфизмом m, для которых так же как и для коуравнителя выполняется условие m ∘ f = m ∘ g. Причём, O и m будут даже проще, чем Q и q.


Но O и m не будут являться коуравнителем, потому что для них не выполняется универсальное свойство, и поэтому они в некотором смысле хуже, чем Q и q. Хуже тем, что они слишком простые, они не различают классы «a» и «b», смешивая их в класс «1».

Обратите внимание на то, что универсальное свойство уравнителя позволяет отобрать наименьшие объект и морфизм среди всех потенциально подходящих. А универсальное свойство коуравнителя – позволяет отобрать наибольшие объект и морфизм. Наверное, многие подобные задачи структурной оптимизации можно свести к поиску (ко)пределов в той или иной категории.

Вот, как коуравнители реализованы в коде.
SetCategory.prototype.coequalizer = function (f, g) {
  return new SetCoequalizer(this).calculate(f, g);
};
function SetCoequalizer(cat) {
  this.cat = function () { return cat; };
}
SetCoequalizer.prototype.calculate = function (f, g) {
  assertParallel(f, g);

  this.f = function () { return f };
  this.g = function () { return g };

  var dom = f.codom();
  var codom = new Set();
  var eq = {};
  f.dom().forEach(function (x) {
    var fx = f.image(x);
    var gx = g.image(x);
    eq[fx] = eq[gx] = has(eq, fx) ? eq[fx] : has(eq, gx) ? eq[gx] : fx;
  });
  this.q = this.cat().morphism(dom, codom);
  dom.forEach(function (s) {
    var t = eq[s] || s;
    codom.add(t);
    this.q.push(s, t);
  }.bind(this));

  this.obj = this.q.codom();

  assertCommutes(this.q.compose(f), this.q.compose(g));
  return this;
}
SetCoequalizer.prototype.univ = function (m) {
  assertEqualDom(this.q, m);
  assertCommutes(m.compose(this.f()), m.compose(this.g()));
  var mapping = {};
  m.dom().forEach(function (x) {
    mapping[this.q.image(x)] = m.image(x);
  }.bind(this));
  var u = this.cat().morphism(this.q.codom(), m.codom(), mapping);
  assertCommutes(u.compose(this.q), m);
  return u;
};

Коуравнитель – это очень полезная с точки зрения ИТ конструкция. Он позволяет решать различные задачи унификации: унификации типов в языках программирования, унификации выражений в системах компьютерной алгебры, унификации графов. Из той же области задачи слияния моделей или исходного кода. Мы вернёмся к этому в следующих статьях.

Декартов квадрат (расслоённое произведение)


Уравнитель вычисляется для двух параллельных морфизмов. А что, если вычислить предел для двух морфизмов, у которых совпадает только кодомен? Мы получим ещё один вид предела – декартов квадрат.

Декартов квадрат морфизмов f : X → Z и g : Y → Z – это объект P и морфизмы p : P → X и q : P → Y, такие что f ∘ p = g ∘ q и для любого объекта Q и морфизмов m : Q → X и n : Q → Y, если f ∘ m = g ∘ n, то существует уникальный морфизм u : Q → P, такой что p ∘ u = m и q ∘ u = n, т.е. следующая диаграмма коммутативна.


Выглядит сложно, но в категории множеств это всего-навсего расслоённое произведение:


На рисунке видно, что множество P содержит пары элементов из множеств X и Y, но не все возможные, как в случае с декартовым произведением, а только такие, составные элементы которых функциями f и g отображаются на одни и те же элементы множества Z.

Если вы попробуете в исходном коде найти реализацию декартова квадрата для категории множеств, то не сможете, потому что он реализован для любой полной категории, а не только категории множеств.

Универсальная реализация декартова квадрата для произвольной полной категории.
CompleteCategory.prototype.pullback = function (f, g) {
  return new Pullback(this).calculate(f, g);
};
function Pullback(cat) {
  this.cat = function () { return cat; };
}
Pullback.prototype.calculate = function (f, g) {
  assertEqualCodom(f, g);
  this.f = f;
  this.g = g;

  var prod = this.cat().product(f.dom(), g.dom());
  this.product = function () { return prod; };

  var eq = this.cat().equalizer(f.compose(prod.f), g.compose(prod.g));
  this.equalizer = function () { return eq; };

  this.p = prod.f.compose(eq.q);
  this.q = prod.g.compose(eq.q);
  this.obj = eq.obj;
  assertCommutes(this.f.compose(this.p), this.g.compose(this.q));
  return this;
}
Pullback.prototype.univ = function (m, n) {
  assertEqualDom(m, n);
  assertEqualCodom(m, this.p);
  assertEqualCodom(n, this.q);
  var u = this.equalizer().univ(this.product().univ(m, n));
  assertCommutes(this.p.compose(u), m);
  assertCommutes(this.q.compose(u), n);
  return u;
};

Декартов квадрат вычисляется следующим образом. Сначала получаем произведение объектов X и Y, а затем вычисляем уравнитель для двух параллельных морфизмов f ∘ π1 и g ∘ π2. Объект уравнителя – это и есть объект P декартова квадрата. Морфизм p вычисляется как π1 ∘ eq, а q – как π2 ∘ eq. Универсальное свойство декартова квадрата вычисляется на основе универсальных свойств произведения и уравнителя.


Причём, этот алгоритм применим в любой полной категории: категории топологических пространств, групп, колец и т.п. Я понятия не имею, что это за категория топологических пространств, но я знаю, что она полная и значит в ней будет работать этот алгоритм. Это пример профита, получаемого благодаря абстрагированию от внутреннего представления объектов и морфизмов. Более того, в полной категории можно вычислять и более сложные пределы с произвольной диаграммой на основе простейших пределов, рассмотренных в данной статье.

Кодекартов квадрат (универсальный квадрат)


Кодекартов квадрат морфизмов f : Z → X и g : Z → Y – это объект P и морфизмы p : X → P и q : Y → P, такие что p ∘ f = q ∘ g и для любого объекта Q и морфизмов m : X → Q и n : Y → Q, если m ∘ f = n ∘ g, то существует уникальный морфизм u : P → Q, такой что u ∘ p = m и u ∘ q = n, т.е. следующая диаграмма коммутативна.


Кодекартов квадрат дуален декартову квадрату и может быть вычислен в любой кополной категории как коуравнитель морфизмов i1 ∘ f и i2 ∘ g, где i1 и i2 – это канонические включения суммы объектов X и Y. Морфизмы p и q вычисляются как h ∘ i1 и h ∘ i2 соответственно, где h – морфизм коуравнителя:


Иными словами, множество P – это дизъюнктивное объединение множеств X и Y, причём те элементы, у которых одинаковые прообразы в множестве Z, объединены:


Кодекартов квадрат аналогично коуравнителю используется в задачах унификации. На диаграмме вы видите, что элементы «a» и «b» из множеств X и Y были унифицированы в множестве P в элементы «1» и «2» соответственно. Элемент «c» из множества X был унифицирован с элементом «d» из множества Y. А элемент «c» из множества Y не был ни с чем унифицирован.

С помощью кодекартова квадрата можно решать и более интересные задачи. Пусть известны морфизмы g и q. Если мы вычислим морфизмы f и p, то фактически получим объект X удалением из P всего, что присуще только Y. Это называется вычислением дополнения к кодекартову квадрату. В следующих статьях на примере графов это будет более наглядно.

Ещё раз обращаю ваше внимание на то, что вычисление кодекартова квадрата (как, кстати, и дополнения к нему) реализовано независимо от множеств, функций и прочих деталей внутреннего устройства той или иной категории:

Универсальная реализация кодекартова квадрата для произвольной кополной категории.
CocompleteCategory.prototype.pushout = function (f, g) {
  return new Pushout(this).calculate(f, g);
};
function Pushout(cat, f, g) {
  this.cat = function () { return cat; };
}
Pushout.prototype.calculate = function (f, g) {
  assertEqualDom(f, g);
  this.f = f;
  this.g = g;

  var cp = this.cat().coproduct(f.codom(), g.codom());
  this.coproduct = function () { return cp; };

  var ceq = this.cat().coequalizer(cp.f.compose(f), cp.g.compose(g));
  this.coequalizer = function () { return ceq; };

  this.p = ceq.q.compose(cp.f);
  this.q = ceq.q.compose(cp.g);
  this.obj = ceq.obj;
  assertCommutes(this.p.compose(this.f), this.q.compose(this.g));
  return this;
}
Pushout.prototype.univ = function (m, n) {
  assertEqualCodom(m, n);
  assertEqualDom(m, this.p);
  assertEqualDom(n, this.q);
  var u = this.coequalizer().univ(this.coproduct().univ(m, n));
  assertCommutes(u.compose(this.p), m);
  assertCommutes(u.compose(this.q), n);
  return u;
};

Что почитать


Фактически, моя статья является плагиатом идей из этой книги, единственное, вместо JavaScript они используют ML:
» D.E. Rydeheard, R.M. Burstall. Computational Category Theory, 1988

Также я сплагиатил много идей отсюда, но об этом уже в следующих частях:
» Hans Jürgen Schneider. Graph Transformations. An Introduction to the Categorical Approach, 2011

Сам не читал, только листал, но, вроде, неплохая книга с множеством примеров, написанная простым языком:
» Peter Smith, Category Theory. A Gentle Introduction, 2016

Должно быть интересно тем, кто пишет на функциональных языках программирования:
» Maarten M. Fokkinga. A Gentle Introduction to Category Theory — the calculational approach, 1994

Ещё пара не очень простых книг для тех, кто пишет на функциональных ЯП:
» Andrea Asperti, Giuseppe Longo. Categories, Types and Structures. Category Theory for the working computer scientist, 1991
» Michael Barr, Charles Wells. Category Theory for Computing Science, 1998

Конечно, стоит почитать цикл статей «Теория категорий для программистов» (оригинал — Bartosz Milewski), но, на мой взгляд, он ориентирован преимущественно на людей, пишущих на ФЯП. У нас немного другой подход, вернёмся к этому в заключении.

В данной статье мы максимально абстрагировались от элементов множеств. Но, вообще, в теории категорий есть понятие элемент объекта. Оно более общее, но по смыслу похоже на элемент множества. Также в теории категорий есть обобщение идеи подмножеств — подобъекты. Я надеюсь, мы вернёмся к ним в следующих статьях, а пока можно посмотреть следующую книгу. Хотя она и рассчитана на математиков, но, по крайней мере, в 1-ой главе язык относительно простой:
» Michael Barr, Charles Wells. Toposes, Triples and Theories, 1985

Тем, кто интересуется базами данных, рекомендую почитать статьи чела по имени David I. Spivak. Я сам только листал, но выглядит очень интересно.

Интересная статья про приложение теории категорий к нейронным сетям:
» Michael J. Healy. Category Theory Applied to Neural Modeling and Graphical Representations, 2000

Заключение


В статье вы увидели вычислительный аспект теории категорий. Обычно, когда говорят о вычислениях, то вспоминают декартово замкнутые категории или монады Но в теории категорий за большинством конструкций стоят те или иные вычисления, а не только за монадами. Теория категорий в большей степени о вычислениях на структурах, чем о самих структурах.

Я встречал два способа объяснить ИТшнику, что такое теория категорий. Некоторые авторы рассматривают в качестве категории систему типов и функции некоторого языка программирования. Например, в Haskell такая категория называется Hask. В данной статье используется другой подход. Мы рассмотрели категорию множеств как есть, не увязывая множества с типами данных, а морфизмы с функциями некоторого ЯП. Для каждой рассмотренной конструкции мы увидели её вычислительный аспект и реализовали его. Таким образом можно реализовать любую категорию на любом языке программирования. Совершенно не обязательно пытаться каким-то образом встроить теорию категорий в этот язык.

В статье вы увидели примеры абстрагирования от деталей внутреннего устройства объектов и морфизмов. Например, увидели, как можно определить сюръективные функции или декартово произведение, ничего не говоря о множествах. Абстрагирование в программировании очень похоже на абстрагирование в теории категорий. У меня даже ощущение, что тот, кто придумал ООП, черпал вдохновение из теории категорий.

После прочтения статьи вы должны понимать, что универсальное свойство – это, по сути, абстрактное представление некоторой задачи на поиск оптимальной структуры.

Также вы увидели профит от применения теории категорий.

Во-первых, она помогает правильно организовывать код, правильно называть классы и функции. Например, я мог бы назвать метод вычисления декартова произведения множеств calcCartesianProduct(), мог бы придумывать какие-нибудь функции типа multiplyFunctions(). Но благодаря теории категорий я понимаю, что произведения объектов бывают и в других категориях и не сводятся только к декартову произведению, а произведение функций — это универсальный морфизм произведения. Т.е. у совершенно разных категорий будет единый интерфейс.

Во-вторых, теория категорий позволяет писать универсальные алгоритмы, типа вычисления декартова квадрата, которые могут повторно использовать для разных категорий.

В-третьих, теория категорий позволяет писать код, очень хорошо покрытый проверками. Обратите внимание, что во многих функциях проверяются различные предусловия и постусловия (вызовы assert в начале и конце функций соответственно). Причём, мне не нужно как-то искусственно придумывать эти проверки, они следуют из определений!

И, вообще, обратите внимание на тот как написан весь код в статье. Сначала мы описываем некоторое внешнее поведение объекта, его соотношение с другими объектами, в декларативном виде описываем различные универсальные свойства, инварианты, которые должны выполняться для данного объекта. А затем думаем, как это декларативное описание реализовать в коде. При этом реализация получается «правильная», универсальная и покрытая проверками.

Возможно, вы узнали что-то интересное о примесях и смесях в JavaScript.

В предыдущей статье я немного говорил о применении теории категорий для преобразования моделей. В следующих статьях мы будем двигаться в этом направлении и рассмотрим категорию графов, категорию графов с метками и более подробно остановимся на кодекартовых квадратах.

» Исходные коды и примеры из статьи.
ООО «ЦИТ»
54,00
ИКТ-решения и сервисы для органов власти и бизнеса
Поделиться публикацией

Похожие публикации

Комментарии 47

    +1
    Ассоциативность операции композиции очевидна. Если А знает B, который знает C, который знает D, то как не группируй тут морфизмы, всё равно A опосредованно знает D.

    Это точно ассоциативность?
      +1
      Да, ассоциативность — сочетательность, свойство бинарной операции, при котором результат последовательного применения операции не зависит от расстановки скобок:
      (h ∘ g) ∘ f = h ∘ (g ∘ f) = h ∘ g ∘ f
      где используются следующие морфизмы:
      f: A → B, g: B → C и h: C → D

      Все 3 композиции обозначают одно и то же: A опосредованно знает D.
        0

        Вам намекнули, что "A опосредованно знает D" — это уже не ассоциативность, а транзитивность, которая вообще не про скобки. А вот что Вы подразумеваете под отношением "знает" и как его транзитивность следует из ассоциативности композиции функций или наоборот — это уже загадка.

          0
          Спасибо за комментарий, опишу это немного подробней. Согласен, что момент с транзитивностью тут не очень раскрыт. Не хотел усложнять описание.

          На рисунке ниже нарисованы 4 человека (или их страницы вконтакте — не суть важно): Иван, Я, Мария, Алёна. Пётр нас в данный момент не интересует.

          image

          Пусть этот гипотетический Иван знает меня, неважно, в реальной жизни или в сети. Т.е. под отношением «знает» я подразумеваю именно то, что один человек знает другого. Пусть Я знаю гипотетическую Марию. Причём, если речь идёт, скажем, о теннисистке Марии Шараповой, то, скорее всего, она меня не знает, поэтому морфизм от неё ко мне не рисуем. Пусть Мария знает некоторую Алёну — рисуем ещё один морфизм.

          Итого получается цепочка: Иван знает меня, Я знаю Марию, Мария знает Алёну.

          При этом Иван опосредованно знает Марию через меня. Также Иван опосредованно знает Алёну через меня и Марию. Я опосредованно знаю Алёну через Марию. В отношение «опосредованно знает» я не вкладываю какой-то больший смысл, на интуитивном уровне это отношение вполне понятно: один человек знает кого-то, кто знает другого человека. Хотя, блин, я согласен, что в реальной жизни отношение «опосредованно знает» не используется и какое-то не очень интуитивное.

          Будем считать, что в нашем примере один человек знает другого именно в реальности. Пусть я видел Марию Шарапову не только по телевизору, но, скажем, брал у неё автограф и жал ей руку. А, вот, Ивану так не посчастливилось. Но он может тешить себя тем, что знает Марию через два рукопожатия, а Алёну — через три.

          Транзитивность отношения «опосредованно знает» нас в данном случае совершенно не интересует, поэтому я и не говорил о ней в статье. Для нас важно то, что следующие высказывания
          «Иван через меня знает Марию, которая знает Алёну.»
          «Иван знает меня, который через Марию знает Алёну.»
          обозначают одно и то же:
          «Иван через меня и Марию знает Алёну.»

          Т.е. в этой цепочке «знания» можно группировать морфизмы (расставлять скобки) как угодно — всё-равно результат будет один.

          Свободная категория, на мой взгляд, существенно сложнее категории множеств. Этот пример я привёл просто для затравки. Совсем серьёзно свободные категории мы в этом цикле скорее всего не будем рассматривать. И у более простых категорий есть интересные применения.
            0

            Спасибо за ответ. Теперь стало понятнее, что Вы хотели донести.

      +2

      Почему не использовать синтаксис es6? Код сократился бы раза в 2.


      И через typeof тип проверять не стоит:


      function A() {}
      class B {}
      
      let a = new A();
      let b = new B();
      
      typeof a; // => "object"
      typeof b; // => "object"
        0
        Спасибо! С typeof я тупанул, исправил.

        Изначально не использовал ES6, потому что писал всё это преимущественно в 2013-ом году. Сейчас не стал переписывать, потому что по хорошему надо всё это разложить по модулям и существенно иначе организовать код. Но сейчас этим заниматься слишком рано, пока не реализованы более сложные категории.

        С другой стороны, в том же d3.js не используются лямбды, классы и т.п. Разве что только модули. В общем, я согласен, что стоит переписать на ES6, но хочется поднакопить ещё категорий и сразу переписать нормально.
          0
          хочется поднакопить ещё категорий и сразу переписать нормально.

          Раз так, очень советую писать на Typescript. Типы там конечно только во время компиляции живут (после компиляции всё становится обычным JS с его правилами), но, тем не менее, плюсов у TS намного больше, чем минусов, и его изучение окупится. Вот, например, доки с продвинутым использованием типов. Там и дженерики, и объединения типов, и другие плюшки.

            +1
            Статическая типизация — это отлично, но, на мой взгляд, её недостаточно. В развитии языков программирования сейчас общая тенденция — брать из одних языков какие-то идеи, которые были придуманы десятилетия назад, и реализовывать эти идеи в других языках программирования. Так появился TypeScript, были добавлены Set, Map, лямбды, модули в ES6. Хорошо, что языки развиваются, но печально, что копированием совершенно тривиальных идей.

            Мне, как и разработчикам ES6 или TypeScript, не нравились некоторые особенности JavaScript. Но я планировал усовершенствовать JavaScript не просто добавлением статической типизации или коллекций, а созданием некоего CategoricalScript, основанного на теории категорий. На начальном этапе он может быть реализован просто в виде набора функций, написанных, на JavaScript. В будущем для него может быть запилен какой-то специальный синтаксис, но это не принципиально.

            Например, язык Charity (ещё тут и тут) полностью основан на теории категорий. На мой взгляд, это качественно новый уровень по сравнению с остальными языками программирования.

            Короче, эта библиотечка решает задачи аналогичные тем, которые решает TypeScript и т.п., но качественно иначе. Как именно она реализована уже вторично. Изначально хотелось сократить количество лишних прослоек в виде TypeScript и т.п., но в будущем будет виднее.
              +1

              Уже ведь есть PureScript.

                0
                Похоже на Haskell, который компилируется в JavaScript. В Haskell для меня слишком мало теории категорий, я хочу что-то такое.
                  0

                  Да, он по мотивам Haskell. Насчёт "мало ТК в Haskell" у меня возникает вопрос: Вы хотите много теории категорий в языке, чтобы что? Какой-то практический смысл в этом будет? Или просто just for fun эзотерический ЯП создать?

                    0
                    Чтобы лучше разобраться в теории категорий. Я прочитал первую книгу по ТК лет 15 назад, и только через 10 лет, когда попробовал реализовать какие-то категории в коде, начал что-то понимать. Возможно, это поможет ещё кому-то разобраться в ТК.

                    В Haskell реализована одна категория Hask, в которой объекты — типы, морфизмы — функции. А, скажем, категория множеств или графов в нём из коробки не реализованы. Они нам понадобятся в следующих статьях для написания одного приложения. Мне мало осознания того, что, например, полиморфные функции в Haskell — это типа естественные преобразования и т.п. Всё-равно они остаются полиморфными функциями. А я хочу собрать какое-то осмысленное приложение полностью в терминах ТК. Чтобы в нём не было функций, классов, типов, а были только категории, функторы и т.п., чтобы все задачи на унификацию чего-то были описаны как коуравнители или кодекартовы квадраты в некоторой категории, чтобы все задачи на поиск оптимальной структуры описывались через универсальные свойства и т.п. Иными словами, хочу, чтобы не просто какие-то конструкции ЯП можно было бы описать в терминах ТК, а чтобы само приложение было написано в терминах ТК. Короче, в Haskell есть конструкции, которые типа из ТК, но всё-равно приложения пишутся в терминах функций, типов, классов, а не ТК.

                    Если получится всё приложение разложить на категории, пределы, универсальные свойства и т.п., то можно попробовать запилить под это ЯП, в котором уже не будет типов, функций, классов, а будут только категории, пределы,… Все привыкли к тому, что в ЯП есть функции, типы. А я хочу сделать ЯП, в котором будет что-то принципиально другое.

                    Не факт, что это получится, пока просто пишем приложение, о котором расскажу в следующих статьях, и разбираемся в ТК.
                      +1
                      хочу, чтобы не просто какие-то конструкции ЯП можно было бы описать в терминах ТК, а чтобы само приложение было написано в терминах ТК. Короче, в Haskell есть конструкции, которые типа из ТК, но всё-равно приложения пишутся в терминах функций, типов, классов, а не ТК.

                      Для меня это выглядит логичным, потому что программисты, может быть за редким исключением, не мыслят в терминах теории категорий при разработке программы.
                      Но в любом случае, успехов Вам, может правда кому-то пригодится и такой ЯП.

        +2
        А что можете сказать о fantasy-land?
          0
          Спека для JS (аналог для ФП в haskell)
            0
            Спасибо за ссылку! Очень интересная штука. Хотя там и не говорится явно о теории категорий, но по смыслу это пересекается с тем, что я пытаюсь сделать. За большинством конструкций, которые у них реализованы стоят различные категории, но библиотека реализована без явного их выделения.
              0
              ну в хаскелл это категория Hask, где объекты это типы, а морфизмы это ф-ции
            +1
            Написано очень приятно, спасибо. Я простой трудяга на javascript. И даже когда-то (давно) на математика учился. Наверное я всё это изучал, и возможно в приложениях (к каким-нибудь задачам о ранцах), но вот кроме «вау!» и «скажите, так и стенку в магазине можно убрать?» после прочтения сказать пока по существу не могу. Не улеглось.

            Я вот за что математику люблю. За то, что если удалось какую-то человечески-сформулированную задачу поставить на математическом языке, то путем применения лемм, теорем и следствий мы имеем ответ (сначала на математическом, а затем и уже на человеческо-сформулированном).

            Вот чувствую же что с теорией категорий можно всё, но без человеческой задачи сложно весьма. Вот смотрите, из практики. Есть множество товаров. «Морфизм» (?) для товаров — взаимодополняющие. Это категория, так как ассоциативна, и будем полагать что товар сам себя дополняет. Что можно из этого «заиметь бесплатно» с теорией категорий в руках?..
              +1
              Вы задали слишком сложный для меня вопрос. На сколько я понимаю, для взаимодополняющих товаров решаются различные минимаксные задачи, например, на поиск оптимальной потребительской корзины. Наверное, можно сформулировать подобные задачи на языке теории категорий, но я не достаточно хорошо в этом разбираюсь.

              Что касается категории товаров. Можно каждый товар рассматривать как отдельный объект и мы получим свободную категорию. Но не уверен, что это удачный взгляд. С другой стороны, можно рассматривать категорию товаров как категорию отношений. Например, в этой категории будет объект { Автомобиль, Шина, Бензин, Силикон (для чернения шин), Телефон, Планшет, Внешний аккумулятор } и эндоморфизм на этом объекте, который является следующим отношением: { (Автомобиль, Шина), (Шина, Силикон), (Автомобиль, Бензин), (Телефон, Аккумулятор), (Планшет, Аккумулятор) }.

              Причем, повторюсь, что такая категория будет именно категорией отношений, а не множеств. Потому что приведенный морфизм является отношением, а не функцией — он сопоставляет автомобилю два значения: шина и бензин.

              Что делать с этой категорией дальше — я не знаю :) У меня есть практический пример использования теории категорий, я планирую его описать в одной из следующих статей, но он немного из другой области.
                +1
                Спасибо, буду следить за обновлениями. Взаимодополняющие товары, про оптимум вы отличную идею подали, чаще всего их кластеризуют (по ART1 или что-то по типу).

                И вот лично что я увидел увидел в теории категорий, так это потенциал к AI-вычислениям, например, не так давно я баловался с F# и генетическими алгоритмами поиска действий, переводящих систему из точки А в точку В. Но генетические алгоритмы ненадежны, сами понимаете, random — а ему особо не доверишь чувствительные вопросы, даже на моих простецких модельках результаты зависели «от погоды на Марсе» — от тупо запуска программы. Так вот… теория категорий… оно ж решает уравнения. Уравнения относительно произвольных объектов, а объектом могут быть и математические, и любые другие операции. Вобщем задали вы мне материал для размышлений, даже как отвлекаться на обычную работу теперь не знаю :)
                  0
                  Да вот наверное отвечу сам на свой вопрос. Похоже, как и обычно в математике с этим дело обстоит, с подъемом по абстракциям теряется релевантная для практических задач информация («предел всех рефлексий — я мыслю», или «где я нахожусь? — на воздушном шаре!»).

                  Сидел весь вечер с двумя примерами: дерево KPI предприятия и действия, условно, какой-нибудь единицы на поле боя. Если вершина, так выражусь, теории категорий — это уравнители, то никакой особо полезной информации, кроме того что «могут существовать эквивалентные порядки», мы похоже не получаем.

                  Возвращаясь к нашим товарам, можно размножить сущности на уровень ниже: у товаров есть свойства. Соответственно, операция «товар дополняет» должна сохранять какие-то соотношения у свойств. Наличие уравнителя бы означало бы, что, ну нет, не масло масляное, но близко к тому — «удочки хорошо идут с джипами». Вроде хорошо, только беда что утверждение имеет место с точностью до изоморфизма, коих может быть более чем континуально (ну не на конечном множестве естественно, а на конечных там всё вырождается в тривиальщину — в случае с KPI, а в случае с каким-нибудь танком — там бесконечность решений).

                  Хотя может я и неправильно всё рассудил.
                  Пока что...

                    0
                    Перечитал статью. Не подскажете, а продолжений ждать? «Уже джва года жду!». Если честно, со второго раза вдумчивого чтения куда более понятно, и оказывается проще чем думал изначально.

                    Раз уж пишу ответом на свой бестолковый коммент чуть более чем полугодовалой давности, кое-что скажу и по поводу своих примеров.

                    Дерево KPI. Имеем несколько множеств индикаторов. Пусть каждое множество отражает некоторый аспект (без кавычек, в менеджменте это и есть аспекты, финансовый, рыночный, внутрикорпоративно-персональный, и другие). Морфизм — «показатель влияет». Навскидку, уравнитель даст множество «корневых» индикаторов — тех, которые определяют поведение всей системы.

                    Поле боя. Пусть есть множества боевых единиц двух враждующих сторон (разных родов войск). Морфизм — «может подбить». Аналогично, предел — множество единиц, которые всех могут подбить.

                    Что касается «AI и прочих умных и красивых обезьянок». Теория категорий в изложенном виде как мне видится может быть чертовски полезна в анализе (кластеризованных) событий с морфизмом «является причиной».

                    Ну вобщем захотелось написать свой теор-велосипед :) Спасибо еще раз за статью!
                0
                Раз затронули монады, то было бы не плохо покрыть категорию Клейсли и стрелки Клейсли
                  +2
                  Есть еще https://www.youtube.com/playlist?list=PLwuUlC2HlHGe7vmItFmrdBLn6p0AS8ALX и https://jscategory.wordpress.com/
                    0
                    Спасибо за ссылки! Особенно последние статьи у них достаточно клевые. Ну, я, по крайней мере, постарался добавить во всё это немного больше наглядности и больше внимания уделил универсальным свойствам. В большинстве статей они воспринимаются как что-то очевидное и само собой разумеющееся, хотя это не так.

                    До категории Клейсли я дойду наверное не очень скоро. Ей везде уделяют очень много внимания. А более простые и, на мой взгляд, важные вещи (типа глобальных и обобщённых элементов) обходят стороной или рассматривают вскользь.
                      0
                      Функторы прикольно покрывать когда есть обобщение про 2-категории (они там как морфизмы)
                        +1
                        Кстати у меня есть такой список, тут есть и про ТК https://github.com/xgrommx/awesome-functional-programming
                          +1
                          Еще от того же Бартоша https://www.youtube.com/watch?v=I8LbkfSSR58&list=PLbgaMIhjbmEnaH_LTkxLI7FMa2HsnawM_
                        +1
                        Выводы 1, 2 очень спорные:
                        «она помогает правильно организовывать код, правильно называть классы и функции.»- да, ладно. Вы вкладываете в смысл организация кода явно не структуру файлов, каталогов и тд.
                        и про название классов и функций тоже мимо.
                        «Во-вторых, теория категорий позволяет писать универсальные алгоритмы» — универсальные для чего? Может он один универсальный алгоритм-то… Или если он не один, то почему они все универсальные…
                        Практического приложения не хватает очень…
                          0
                          Спасибо за комментарий. Я постараюсь продемонстрировать универсальность во 2-ой или 3-ей статье про категорию графов. Там будет видно, что одни и те же алгоритмы применимы хоть для множеств, хоть для графов.

                          Практическое приложение планируется в самой последней статье цикла.
                            +3
                            Я очень люблю такое описание, к чему приводит ТК (про уровни абстракции и ТК это пока крайняя степень абстракции)

                            Самая простая абстракция — это переход от «двух яблок», «двух камней» и т. д. к понятию числа 2; переход от «я повернулся боком», «камень повернулся боком» к понятию поворота на 90°. При этом манипулирование предметами заменяется на универсальные законы работы с числами (или с преобразованиями, или с чем-то еще).

                            Абстракция следующего уровня возникает, когда понимаешь, что правила обращения с числами 2, 3, 15 и т. д. по сути одинаковы. Все эти числа можно складывать, перемножать, для них работают переместительный, сочетательный и другие законы. Иными словами, все целые числа «играют по одним правилам». Поэтому часто полезно оперировать не с конкретными числами, а с новым математическим объектом — кольцом целых чисел. Аналогично, разные повороты предмета в пространстве являются элементами нового математического объекта — группы трехмерных вращений.

                            Третий уровень абстракции — это когда исчезает «осязаемость» элементов групп, колец, полей. Тут уже рассматриваются не конкретные группы вращений или иных преобразований, а просто абстрактные группы — совокупности элементов со строго очерченными свойствами. Здесь на первый план выходит то, какова структура группы, а не то, из чего она «состоит». Свойства всевозможных непротиворечивых математических структур, безотносительно к тому, где именно эти структуры возникают, изучает абстрактная алгебра.

                            Теория категорий предлагает подняться еще выше, на четвертый уровень абстракции. В ней изучаются уже не конкретные группы, а сеть математических взаимосвязей между разными группами. Аналогично, изучается сеть взаимосвязей между самыми разными типами пространств или между самыми разными кольцами. Более того, оказывается, что эти сети взаимосвязей (групп, полей, пространств и т. д.) — очень шаблонны. Между ними (между сетями!) можно установить параллели, и с помощью этих параллелей высокого уровня иногда удается решить очень трудные, но вполне конкретные задачи.
                              0
                              Как же мне не хватало этого понимания, когда я изучал линейную алгебру
                          +1
                          Класс, интересно было прочитать, хм хотя я в жизни не интересовался программированием, признаться половину них не понял, но прочитал, может автор умело преподнес текст.спасибо интересно
                            +1
                            При этом, не будучи Георгием Перельманом...

                            Видимо, имеется ввиду Григорий Перельман.
                              0
                              Исправил, я раз на пятьдесят вычитывал статью, но всё-равно остались ошибки, рад, что вы прочитали :)
                                0
                                Я еще не читал, а только просматривал… Спасибо вам за такой труд ).
                              +1
                              Спасибо за статью — интересно и доступно написано. и очень классная иллюстрация — хэллоуинский настрой:)
                                +1
                                Насчет отображений в пустое множество из непустого: их нет, как вы и предполагали. Объяснение такое: для каждого x из области определения f(x) должна быть элементом области прибытия (кодомена), а у нас в кодомене ничего нет (если область определения X не пуста, то какой-то x в ней взять можно). Формальнее (все равно не доказательство): функция из X в Y — это такое множество пар (x,y), т. е. подмножество декартова произведения X на Y, что для каждого элемента из X есть ровно одна пара, его содержащая. Произведение пустого множества на что угодно является пустым множеством, его единственное подмножество — оно само. Тогда из пустого множества X у нас есть пустое отображение в произвольное Y: поскольку в X ничего нет, то «для любого x из X что-то выполняется» всегда верно. А вот если X непусто, а Y пусто, то никакого шанса найти для какого-то x из X пару (x,y), где y — элемент пустого множества, у нас нет.
                                  0
                                  Спасибо, теперь понятно! Правда теперь я загрузился ещё сильнее. В категории множеств функции можно рассматривать одновременно как морфизмы и как объекты (множества пар). С другой стороны, в категории множеств совершенно неважно множество ли это пар или чего-то ещё, для любого множества пар можно найти изоморфное ему множество чего угодно. Или, наоборот, для любого множества не пар можно найти изоморфное множество пар (или функцию).

                                  Получается, что в категории множеств класс объектов и класс морфизмов совпадают? По крайней мере, с точностью до изоморфизмов. Интересно, есть ли какое-то строгое описание всего этого. Это похоже на какой-то частный случай леммы Йонеды или непонятно что.
                                    +1
                                    Ну, я не эксперт в теории категорий, поэтому могу наврать. Сам по себе факт, что стрелки категории являются в то же время и ее объектами, не исключителен: вот если вы Мак Лейна откроете, то дискретную категорию он именно так и вводит: там класс морфизмов совпадает с классом объектов (потому что ничего, кроме тождественных морфизмов и не нужно). Я (очень возможно, по невежеству) ничего особо интересного тут не вижу, честно говоря, потому что математику поставили на теоретико-множественный фундамент, и «все есть множество» (включая и отображения между двумя множествами) в математике скорее банальность (которая некогда была великим прорывом, само собой).
                                    Получается, что в категории множеств класс объектов и класс морфизмов совпадают? По крайней мере, с точностью до изоморфизмов

                                    Именно что с точностью до изоморфизма, то есть сами классы не совпадают. А морфизмы нужны, чтобы композицию из них делать, и тут мы нужную для этого информацию безнадежно теряем. Как сюда Ионеду воткнуть, тоже не очень видно, потому что там все про hom-множества, а не про их отдельные элементы. Может и можно как-то проинтерпретировать, при желании.
                                  +1
                                  В разделе «Пример свободной категории» есть неочевидная двусмысленность. Вопрос: есть ли из «Я» в «Я» морфизмы помимо тождественного? Судя по тому, что пишет о свободных конструкциях Милевский, есть, причём бесконечное число. А вот для предпорядка будет только один, соответственно, предпорядок в общем случае не свободный.
                                  Дело в том, что в данных категориях от некоторого объекта A к некоторому объекту B может идти максимум один морфизм.

                                  Получается, что нет.
                                    0
                                    Спасибо! Добавил уточнение, что речь идёт именно о свободной категории, порождённой графом. В которой, в общем, случае действительно может быть произвольное количество морфизмов между парой объектов. Но в рассмотренном примере в графе, на основе которого строится категория, максимум одно ребро между вершинами, поэтому максимум один морфизм.
                                      +1
                                      Не совсем так. Ребро-то одно, но в данном случае морфизмы это пути, а не ребра. Из «Я» в «Я» кроме тождественного пути, будут пути «Я» -> «Иван» -> «Я», «Я» -> «Иван» -> «Я» -> «Иван» -> «Я» и т.д. Поскольку категория свободная, вы не можете их склеивать вместе.
                                        +1
                                        Спасибо! Кажется теперь я окончательно понял. Я понимал, что морфизмы — это пути, но не задумывался о том, что в путях могут повторяться узлы. Тут и тут в явном виде не говорится, что узлы могут повторяться. Скорее даже, наоборот, из формулировок, которые они проводят, можно сделать обратный вывод. Хотя, раз это явно не запрещено, значит разрешено. Для моноидов, действительно, подобные цепочки играют важную роль. Но для свободной категории, порождённой графом, не очень понятно дают ли они что-то полезное.
                                    0
                                    Отличная статья и прекрасный цикл в целом.
                                    Я ищу некое подобие сравнения давно захватившего меня аппарата родов структур и ступеней шкал множеств и теории категорий и функторов. И в меня закрадывается подозрение, что если поделить Мир на три аспекта, как это иллюстрировал Чернышёв в периодической системе элементов Смысла (книга), то можно отнести теорию родов структур больше к Единству-Целостности, а теорию категорий (по мнению Левича,, например) к Изменчивости.
                                    У С.П. Никанорова в письме Н.Бурбаки есть акцент на отличии «теории категорий и функторов от теории шкал множеств именно отсутствием аппарата, позволяющего на уровне ступеней представить полное разнообразие как ступеней данной шкалы, так и самих шкал».
                                    В справочнике по теоретико-системным конструктам разнообразиям сопоставляются множества, комплексам разнообразий — булеан на множестве, а отношениям и комплексам отношений — декартиан на множестве и булеан декартиана. Что сопоставляется разнообразию, комплексам разнообразий, отношению и комплексу отношений в теории категорий?

                                      0
                                      Спасибо за добрые слова! Я не знаком с этими теориями и не на столько хорошо разбираюсь в математике, чтобы ответить на ваш вопрос. Немного почитал эти книги. Сходу вникнуть не получилось, нужно больше времени. Выглядит довольно интересно. На сколько я понял, декартиан — это декартово произведение множеств, а булениан — это множество подмножеств.

                                      Соответственно, на языке теории категорий декартиан — это просто произведение объектов в категории множеств, а булениан — это, скорее всего, экспоненциал в категории множеств. Наверное для разных видов ступеней можно попробовать нарисовать коммутативные диаграммы, попробовать соотнести универсальные свойства произведений и экспоненциалов с каким-то «физическим» смыслом, который стоит за разными видами ступеней. Чтобы ответить что-то более конкретное, нужно лучше понять какой «физический» смысл стоит за разнообразиями, комплексами разнообразий, отношениями, комплексами отношений. Я не смог найти примеры.

                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                    Самое читаемое