Алгебра текста без формул / Хабр

Статья является рефератом Книги [1], основанной на представленных ранее публикациях: [2], [3], [4] и [5].

1. Координатизация текстов

1.1. Правила

1.1.1 Тексты и алгебра

Числа и буквы – два вида идеальных объектов-знаков изучения отношений реальных объектов. Понимание (толкование) текстов персонифицировано - зависит от генотипа и фенотипа человека. Также со временем смысл слов может меняться. Все слова контекстного языка – омонимы. У слова столько свойств (отношений между словами), сколько контекстов во всем корпусе естественного языка.

Числа люди понимают примерно одинаково и независимо от места и времени их использования. Язык чисел является всеобщим, универсальным и вечным.

Алгебра (символьное обобщение арифметики) и текст (последовательность символов) пока являются двумя совершенно разными инструментами познания.

1.1.2. Координатизация

Применение математических методов в любой предметной области предваряет координатизация, которая начинается с цифровизации. Координатизация – это замена, моделирование объекта исследования его цифровой копией. Затем следует правильная замена уже самих чисел модели символами и определение свойств и закономерностей сочетаний этих символов.

Если правильную координатизацию применить к тексту, то текст можно свести к алгебре.

Для успешной алгебраизации чрезвычайно важно так описать правила координатизации и свойства координатизирующих объектов, чтобы уменьшить вариантность их выбора.

1.1.3. Цель алгебраизации

Целью алгебраизации текста является возможность вычислять из решений систем алгебраических уравнений смысл текста, варианты структуризации, словари, краткие содержания и версии текста по целевой функции.

Под текстами понимаются последовательности знаков (букв, слов, нот etc). Существует пять типов знаковых систем: естественные, образные, языковые, записи и коды.

1.1.4. Словари и алфавиты

Носитель знаковой последовательности – это все ее знаки без повторов. Носитель может называться алфавитом или словарем знаковой последовательности.

Слова – это последовательности из букв или элементарных фонем. Смысл буквы только в ее форме или звуке. Контекстная зависимость букв алфавита отсутствует.

Предельная контекстная зависимость имеется у слов-омонимов естественного языка. Например, у русского слова «коса» имеется четыре разных значения. Считается, что пятую часть словарной базы английского языка занимает омонимия.

1.1.5. Повторы

Текст – знаковая последовательность, имеющая хотя бы один повтор. Словарь – знаковая последовательность без повторов. Наличие повторов позволяет уменьшить количество используемых знаков-слов (уменьшить словарь). Но тогда повторяющиеся знаки могут различаться смыслом. Смысл слова зависит от окружающих его слов. Проблемы понимания слова и текста имеют своей причиной то, что эта какая-то часть значений (смысл) определяется или угадывается субъективно и неоднозначно. Разные читатели и слушатели за одним словом понимают разный смысл.

При повторении слов в тексте возникают предпочтительные, по мнению автора текста, связи-отношения повторяющегося слова с другими словами. Эти связи фиксируются как новый смысл повторяемого слова.

1.1.6. Смысловая разметка

Если конкретный текст не имеет явных повторов, это не означает, что они не скрываются в смысловой (контекстной) форме. Повторяться может смысл, а не только обозначающий его символ-знак (слово). Контекстом здесь называется фрагмент текста между повторяющимися словами. Если похожи контексты разных слов, то разные слова похожи в смысле их общих контекстов, слов-знаков этих контекстов. Контексты похожи, если имеют хотя бы один общий знак-слово.

При этом контекст бывает не только у двух подряд повторяющихся слов. На смысл или контекст слова можно указывать ссылкой на любой подходящий фрагмент текста, необязательно находящиеся в ближайшей окрестности повторяющегося слова. В этом случае текст утрачивает линейный порядок, подобный составлению слов из букв. Если таких фрагментов нет, то смысл слова заимствуется ссылкой на подходящий контекст из другого текста корпуса языка (библиотеки).

Общие слова в контекстах, в свою очередь, также имеют свои контексты – возникает понятие уточненного контекста слова.

1.1.7. Правила координатизации

В конечной знаковой последовательности каждый знак имеет уникальный номер, определяющий место знака в последовательности. На одном месте не могут находиться два знака. Но для текста требуется еще один индекс, указывающий на повтор знака в тексте. Этот второй индекс создает отношения эквивалентности на конечном множестве слов. Знаку целесообразно поставить в соответствие некий двухиндексный объект (например, некоторую матрицу). Первый индекс матрицы указывает на номер знака в последовательности. Второй индекс - на номер этого знака, впервые встретившегося в последовательности. Носителем (словарем) знаковой последовательности (текста) является ее часть знаков с одинаковыми индексами. Пропуски номеров слов в словаре можно исключить сплошной нумерацией.

Правила координатизации текста:

Первый индекс координатизируещего текст (матрицы) – это порядковый номер слова в тексте, второй индекс – это порядковый номер этого же слова, впервые встретившегося в тексте. Если слово ранее не встречалось, второй индекс равен первому индексу.

Словарем является исходный текст с удаленными повторами. Возможно упорядочение словаря с исключением пропусков в нумерации слов.

Для двух и более текстов, которые не являются единым текстом, порядок слов в каждом тексте независим. В двух текстах начальные слова являются одинаково первыми. Также, как в двух книгах начальные страницы начинаются с единицы.

Общим словарем набора текстов является словарь всех текстов после их конкатенации. Возможно упорядочение словаря с удалением пропусков в нумерации слов.

1.2. Примеры

1.2.1. Сходство и одинаковость

По Г. Фреге любой объект, имеющий отношения с другими объектами и их сочетаниями, имеет столько же свойств (значений), сколько и этих отношений сходства и одинаковости (толерантности и эквивалентности). Часть учитываемых значений называется смыслом, которым в данной ситуации представляется объект. Наименование объекта числом, символом, словом, рисунком, звуком, жестом для его короткого описания называется знаком объекта (это одно из значений).

Каждое из всевозможных частей (булеан множества) значений объекта (смысл) соответствуют одному знаку. Эта главная проблема распознавания смысла, но и одновременно основание, позволяющее обходиться минимальными наборами знаков. Невозможно каждому подмножеству значений поставить в соответствие уникальный знак. Объектами информационного обмена являются минимальные наборы знаков (ноты, алфавит, словарь языка). Смысл знаков обычно не вычисляется, а определяется контекстами (окрестностями) знака пока интуитивно.

1.2.2. Пример на абаке

Решением проблемы неоднозначности знаков является смысловая разметка текста. Смысловую разметку можно пояснить на примере предельной однозначности. На русских счетах текстом является последовательность одинаковых знаков (костяшек). Словарь такого текста состоит из одного слова. Это еще более сильно, чем в азбуке Морзе, где словарь состоит из двух слов. Без смысловой разметки пользоваться такими текстами невозможно. Поэтому словарь изменяется, а знаки разделяются на группы – единицы, десятки, сотни и т. д. Эти наименования групп (цифры) становятся уникальными номерами слов. Словарем являются цифры от нуля до девяти. Каждую костяшку тоже можно представить пока неопределенной матрицей на таком декартовом абаке.

Произошло превращение одинаковых объектов в похожие. Мерой сходства являются значения координат слов. Дополнительно к позиционным, повторы цифр из словаря возникают при совершении арифметических операций. Устанавливаются отношения эквивалентности: если после арифметической операции получается число 9+1, то в этой позиции появляется 0, а следующем разряде добавляется 1. На абаке все костяшки сдвигаются в исходное (нулевое) положение, а одна добавляется в следующем разряде (проволоке). На матричном абаке совершается некоторое матричное преобразование.

Если задать меру одинаковости знаков, то отношение толерантности (сходства) можно снова превратить в отношение эквивалентности (одинаковости) по этой мере. Например, округлением чисел. Распознать отличие толерантности от эквивалентности можно по нарушению транзитивности. Для отношений толерантности она может нарушаться. Например, пусть элемент A похож на B в одном смысле. Если смысл B не совпадает со смыслом элемента C, то A может быть похож на C только в части пересечения их смыслов (части свойств). Транзитивность отношений восстанавливается (замыкается), но только для этой общей части смысла. После достигнутой указанием смысла одинаковости A будет эквивалентен C. Например, приведенным выше преобразованием (замыканием) по некоторым координатам обеспечивается выполнение арифметических операций на матричном абаке.

1.2.3. Шахматный пример

Для шахмат словарем их матричного текста партии являются номера по одной из фигур каждого цвета и разделитель ходов (от 1 до 11). Слово шахматного текста – также некая матрица. Первая координата i уникальна и является номером клетки на шахматной доске (от 1 до 64). Вторая координата j – номер из словаря. Шахматным матричным текстом в любой момент игры является сумма матриц, каждая из которых показывает фигуру на соответствующем месте шахматной доски. Повторы в тексте появляются как из-за дублирования фигур, так и из-за постоянных переходов в течение партии от сходства к одинаковости и наоборот для всех фигур кроме короля. Игра состоит в реализации наиболее эффективных таких переходов и актуальной классификации фигур. Пешки, одинаковые вначале, затем становятся похожими только правилом хода, а иногда пешка становится одинаковой с ферзем.

Инструментом анализа матричных текстов является контроль транзитивности для проверки отличия сходства от одинаковости. Отсутствие контроля транзитивности является алгебраической экспликацией непонимания для языковых текстов, проигрыша в шахматах или ошибок в числовых вычислениях.

Транзитивность отношений - условие превращения множества объектов в математическую категорию. Смысловой разметкой текста может стать вычисление его категорий посредством транзитивного замыкания. Объектами категории являются контексты матричных слов, морфизмами – матрицы преобразования этих контекстов.

1.2.4. Пример языкового текста

Пример текста:

Множество – это объект, являющийся множеством объектов. Полином – это множество объектов-мономов, являющихся множеством объектов-сомножителей.

Текст в нормальной форме координатизируется по приведенным выше правилам. Словарь текста– это сам текст, но без повторов. Координатизация текста– это его индексация и сопоставление индексированным словам матриц.

1.2.5. Пример математического текста

В качестве примера математического текста выбраны формулы объема конуса, цилиндра и тора. Формулы рассматриваются как тексты. Это означает, что входящие в тексты знаки не являются математическими объектами и для них отсутствуют алгебраические операции.

Для семиотического анализа формул как текстов важно наличие повторов знаков. Повторы определяют закономерности.

Формулы представляются по правилам координатизации в индексной форме в единой нумерации, как если бы это были не три текста, а один. Координатизированный текст записывается через матрицы в табличной форме.

1.2.6. Пример кода Морзе-Вейля-Герке

Этот пример выбран из-за предельной краткости словаря. В азбуке Морзе знаковые последовательности 26 латинских букв можно рассматривать как тексты, состоящие из слов - точек и тире. При этом порядок слов (точек и тире) предельно важен в каждом отдельном тексте (букве азбуке). В языковых текстах порядок тоже важен («папа мамы» — это не «мама папы», но бывают исключения («вечер томный» и «томный вечер»)

Словарем и носителем азбуки Морзе является последовательность двух знаков-символов ·– («точка» и «тире»), совпадающая с буквой A. Порядок знаков в словаре или носителе уже несущественен. Поэтому носителем также может быть буква N. Одна буква – носитель (словарь), остальные 25 букв являются кодовыми текстами. Определение 26 букв азбуки Морзе как текстов из слов является непривычным для языковых текстов. В языковых текста слова состоят из букв. Но для кодов, как отношений знаков, составление букв (шифра) из слов является естественным.

У каждого кодового слова (из точек и тире), как некоторого объекта, две координаты. Первая координата – номер слова в этой букве (от одного до четырех). Вторая координата – номер в словаре (1 или 2). Словарь для всех 26 текстов одинаковый.

Все 26 текстов (латинских букв) независимы друг от друга: наличие точек или тире в одном тексте (как буквы) и их порядок никак не влияют на состав другого текста (другой буквы). Поэтому нумерация первого знака в азбуке Морзе во всех буквах начинается с единицы по третьему правилу координатизации .

Каждой точке или тире, из которых буква состоит, с учетом их порядка по правилу координатизации ставится в соответствие координатизирующий объект – некоторая матрица, выбор которой должен удовлетворять определенным требованиям.

1.3. Требования к объектам координатизации

Координатизация для текстов заключается в сопоставлении словам текста некоторых «числоподобных объектов», удовлетворяющих трем общим требованиям:

Объекты должны быть индивидуальными подобно числам;
Объекты должны быть абстрактными (объем понятия максимальным, содержание понятия минимальным);
Над объектами можно совершать алгебраические операции (сложение, умножение, сравнение).

Подходящими для текста объектами в алгебре являются двухиндексные матричные единицы:

Они индивидуальны – все матричные единицы различны как матрицы.
Произвольную матрицу n – порядка можно представить через разложение по матричным единицам. Матричные единицы являются базисом полной матричной алгебры и матричного кольца. Это означает, что требование максимального объема понятия выполняется. Матрицы содержат только одну единицу - содержание минимально.
С матрицами можно выполняться все алгебраические операции, необходимые для объекта координатизации.

2. Матричные единицы

В разделе на основе матричных единиц (гипербинарных чисел) построены и исследованы необходимые алгебраические системы для преобразования координатизированных текстов в матричные. Матричное преставление текстов позволяет распознавать и создавать смысл текстов с помощью математических методов.

2.1. Определение

Матричные единицы – это матрицы, в которых единица находится на пересечении номера строки (первого индекса) и номера столбца (второго индекса). Далее рассматриваются только квадратные матричные единицы.

Число всех квадратных матричных единиц (полный набор) равно общему количеству элементов квадратной матрицы.

В дальнейшем матричные единицы рассматриваются как матричное обобщение целых бинарных чисел 0 и 1. Главным отличием таких гипербинарных чисел от целых является некоммутативность их произведения.

2.2. Произведение

2.2.1. Определяющее соотношение

Произведение матричных единиц отлично от нуля (нулевой матрицы) лишь в случае равенства внутренних индексов матриц произведения. Тогда результатом произведения будет матричная единица с первым индексом первого сомножителя и вторым индексом второго сомножителя.

Часть матричных единиц можно назвать простыми матричными единицами по аналогии с простыми целыми числами, а остальные - составными матричными единицами, поскольку они являются произведениями простых.

Полный набор матричных единиц можно получить из простых матричных единиц, которые называются образующими полного набора.

Матричные единицы рассматриваются именно как матричное обобщение целых чисел. Левые и правые некоммутативные делители гипербинарных чисел могут различаться, а также имеются делители нуля, когда каждый множитель (делитель произведения) отличен от нуля, но их произведение равно нулевой матрице. Такое свойство матриц существенно отличает их от целых чисел, для которых делителей нуля не существует. Но многие понятия модулярной арифметики (сравнений целых чисел по модулю) остаются справедливыми для гипербинарных чисел, но исключительно из-за их матричной формы. При этом сами элементы таких матриц (ноль и единица) подобных свойств не имеют.

Распознаются простые матричные единицы (аналог простых целых чисел) в полном наборе по соотношению индексов.

2.2.2. Индексы

Индексы простых матричных единиц бывают двух видов: единицы в таких бинарных матрицах находятся сразу над или под главной диагональю квадратной матрицы. На главной диагонали располагаются элементы с одинаковыми индексами (диагональные матричные единицы), и они простыми не являются.

В составных матричных единицах разность первого и второго индексов равна либо нулю (диагональные матричные единицы), либо разность индексов больше единицы по абсолютной величие. В составных матричных единицах их единицы находятся вне двух диагоналей, на которых находятся единицы простых матричных единиц.

Индексы составных матричных единиц – это все пары индексов элементов квадратной матрицы размерности за исключением пар индексов простых матричных единиц.

Соотношением индексов определяется значение произведения двух одинаковых матричных единиц. В отличие от целых чисел квадрат любого гипербинарного числа является либо нулем (нильпотентные числа), либо тем же числом (идемпотентные гипербинарные числа).

2.2.3. Идемпотентность и нильпотентность

Идемпотентность – это свойство алгебраической операции и объекта при повторном ее применении к объекту приводить к тому же результату, что и при первом применении операции. Например, это сложение числа с нулем, умножение на единицу или возведение в степень единицы.

Диагональные матричные единицы идемпотентны. Квадраты диагональных матричных единиц – это сами матрицы из-за равенства внутренних индексов. При этом произведение диагональных матричных единиц с разными индексам равно нулю. Такие алгебраические объекты известны как ортогональные проекторы.

Нильпотентный элемент — это элемент алгебраической структуры, некоторая степень которого обращается в ноль. Все матричные единицы (гипербинарные числа) кроме идемпотентных являются нильпотентными матричными единицами. Обращается в ноль их вторая степень. Пара одинаковых нильпотентных матричных единиц (гипербинарных чисел) является делителями нуля.

Соотношение (распределение) простых и составных гипербинарных чисел в полном наборе определяется их размерностью (соответствующей размерностью матричных единиц).

2.2.4. Распределение

Распределение простых и составных матричных единиц следующее. Из общего количества полного набора матричных единиц число матричных единиц с элементами над и под главной диагонали являются простыми. Остальные матричные единицы являются составными матричными единицами (произведениями простых).

Особенностью системы гипербинарных чисел является наличие у них левых и правых множителей (фантомных), умножение на которые не приводит к их изменению.

2.2.5. Фантомность

Фантомными называются такие сомножители матричных единиц, которые при умножении не приводят к изменению матричных единиц. Фантомность является обобщением унипотентности. У матричных единиц существует счетное множество (бесконечное множество, которое можно пронумеровать натуральным рядом чисел) фантомных левых и правых сомножителей. Фантомные множители не приводят к изменению матричной единицы и являются аналогами единицы для целых чисел.

В отличие от случая целых чисел и унылого умножения их на единицу, фантомные множители матричных единиц счетным образом многообразны. Если появление определенного фантомного множителя имеет признаки закономерности, то матричные единицы можно сравнивать по их фантомным множителям. Фантомные множители являются некоторыми свободными индексными (координатными) параметрами гипербинарных чисел.

Мотивация использование фантомных множителей объясняется тем, что отношения между матричными единицами могут быть расширены соответствующими отношениями эквивалентности и сходства между их фантомными множителями. Разные матричные единицы с одинаковыми или подобными по соответствующей мере фантомными множителями могут быть сравнимы по модулю этого фантомного множителя. И наоборот, одинаковые матричные единицы могут отличаться своими фантомными множителями.

Если определяется однозначное соответствие между матричной единицей и ее фантомным множителем, то этот множитель может быть модулем сравнения матричных единиц.

Наличие таких фантомных сомножителе в дальнейшем будет использоваться для сравнений слов по их контекстам и составления систем уравнений матричных текстов. Контекстами для слов будут их соответствующие фантомные множители.

Однозначность разложения целых чисел на простые сомножители (факториальность) для матричных единиц обобщается с учетом их некоммутативности и необходимости ограничения неоднозначности разложений.

2.2.6. Гипербинарная факториальность

У матричных единиц существует счетное множество разложений на сомножители. Это означает, что отсутствует однозначность разложения на сомножители для матричных единиц. Это свойство окажется полезным для сравнений фрагментов текста, находящихся в любой удаленности друг от друга.

Среди разложений матричных единиц возможно определить некие канонические разложения, обобщающие разложения целых чисел на простые сомножители. Такие разложения алгебраически богаче разложений целых чисел из-за некоммутативности гипербинарных чисел.

Существует следующая классификация канонических разложений.

2.2.7. Классификация

Имеется три класса канонических разложений матричных единиц. Разложение называется каноническим, если сомножители являются простыми матричными единицами. Свойством, определяющим канонические разложения является максимальная близость по координатам множителей разложения составных гипербинарных чисел на простые.

В общем случае, в зависимости от соотношения индексов, имеется три класса канонических разложений произвольных матричных единиц:

2.2.7.1. Первый индекс больше второго.

Это первый класс разложения на простые матричные единицы – здесь первый индекс больше второго строго на единицу в каждом сомножителе. Меньше невозможно.

2.2.7.2. Первый индекс меньше второго

Это второй класс разложения на простые матричные единицы – первый индекс меньше второго в каждом сомножителе. Первый индекс меньше второго строго на единицу в каждом сомножителе.

2.2.7.3. Индексы равны

Это третий класс разложения на простые матричные единицы – первый индекс в первом сомножителе меньше второго строго на единицу, а во втором сомножителе первый индекс больше второго на единицу и равен второму индексу первого сомножителя.

Разложение единственное и поэтому является каноническим.

Все простые матричные единицы являются полной системой образующих полного набора матричных единиц.

2.2.8. Образующие

Сравнительно небольшое количество простых матричных единиц позволит любые тексты записывать только с помощью таких образующих, которые являются образующими для всех матричных единиц (полного набора). Образующие являются алфавитом матричных текстов, а мономы, как произведения образующих, - словами.

Полная система образующих состоит из простых матричных единиц. Составные матричные (мономы) называются базисными элементами полного набора в системах гиперкомплексных чисел, например альтернионов.

Эти образующие, как и базисные элементы, линейно независимы. Не существует ни одного набора любых чисел, кроме нулевого, чтобы любая частичная сумма или сумма всех элементов и базисных элементов была равна нулевой матрице. Это следует из того, что единицы во всех матричных единицах любой образующей и базисного элемента находятся на разных местах матрицы и добиться нулевой матричной суммы с помощью чисел (целых или действительных) как коэффициентов перед слагаемыми этой суммы невозможно.

Кратность целых чисел для гипербинарных чисел наследуется в терминах подобия.

2.2.9. Подобие слева

Матричные единицы, имеющие одинаковые вторые индексы являются кратными (подобными) слева.

2.2.10. Подобие справа

Матричные единицы, имеющие одинаковые первые индексы являются кратными справа.

Транзитивность кратности для троек целых чисел наследуется для троек гипербинарных чисел.

2.2.11. Транзитивность подобия слева

Отношения подобия матричных единиц транзитивны: если первая матричная единица подобна слева второй, а вторая - третьей матричной единице, то первая матричная единица подобна слева третьей.

2.2.12. Транзитивность подобия справа

Если первая матричная единица подобна справа второй, а вторая - третьей матричной единице, то первая матричная единица подобна справа третьей. Отношения подобия справа транзитивны.

Свойство транзитивности подобия матричных единиц будет в дальнейшем использоваться при построении категории контекста.

2.3. Сложение

2.3.1 Проблема

Результатом умножения матричных единиц является матричная единица. Матричные единицы замкнуты по отношению к операции умножения. Поэтому алгебраической системой матричных единиц по умножению является моноид матричных единиц или полугруппа с единичной матрицей (общим нейтральным элементом).

Результат сложения матричных единиц уже не будет матричной единицей в общем случае.

Матричные единицы являются матричными мономами (одночленами). Это либо простые матричные единицы, либо их произведения. Матричным полиномом (многочленом) является сумма матричных мономов.

Любую бинарную матрицу n (базисный элемент) можно представить как полином относительно простых матричных единиц (образующих). Матрицы над кольцом целых чисел и полем действительных чисел здесь не рассматриваются. Но и бинарные матрицы (состоящие из 0 и 1), необходимые для создания матричных текстов, также должны иметь соответствующие ограничения.

Текстовые бинарные матрицы не должны иметь более одной единицы в строке в соответствие с правилами координатизации текстов. Первая координата слов уникальна — это первый индекс матричных единиц и номер строки, на которой находится единица. При сложении одинаковых матричных единиц, например, результат вообще перестает быть бинарной матрицей. Поэтому сложение текстовых матричных единиц должно специальным образом определяться.

Существуют разные правила сложения бинарных чисел.

2.3.2. Известные бинарные сложения

При умножении квадратных бинарных матриц одинаковой размерности результатом всегда будут бинарные матрицы. Аналог бинарной операции умножения на языке логических функций – это логическое умножение. Таблица истинности для этой операции совпадает с обычным умножением 0 и 1.

Логическое сложение может рассматриваться как претендент на правило сложения текстовых бинарных матриц. В этом случае результатом их поэлементного сложения и умножения будет опять бинарная матрица.

В свою очередь, логическое сложение (дизъюнкция) бывает двух видов: строгая дизъюнкция (сложение по модулю 2); нестрогая (слабая) дизъюнкция.

Таблица истинности для них различается сложением единиц. В теории множеств сложению по модулю 2 соответствует операция симметрической разности двух множеств. Строгая дизъюнкция имеет смысл «или то, или это». Нестрогая дизъюнкция имеет смысл «или то, или это, или оба сразу». С точки зрения теории множеств, нестрогая дизъюнкция аналогична операции объединения множеств.

Операции логического сложения вместо обычного сложения при сложении матричных единиц решают проблему появления элементов по абсолютной величине больше единицы, но в результате сложения матриц могут появляться единицы в нескольких местах строк матрицы суммы. По правилу координатизации текста это означает, что на одном месте текста (определяемой первой координатой) могут находиться два и более слов.

Требуется правило сложение, лишенное этих недостатков.

2.3.3. Сложение по согласованию (конкордантности)

Три вида операций сложения различаются правилами сопоставления слагаемым соответствующей суммы. Если некоторое правило принимается (согласовывается), то и правило сложения определяется однозначно.

Три вида сложения можно объединить в одно сложение по согласованию (конкордантное сложение). На основе конкордатного сложения возможно определить сложение по согласование матричных единиц. Такое умножение должно быть замкнуто по такому сложению.

Сумма по согласованию двух текстовых бинарных матриц является текстовой бинарной матрицей. Результатом сложения по согласованию является обычное сложение матриц.

Алгебраической системой матричных единиц по сложению является моноид матричных единиц или полугруппа с нулевой матрицей (общим нейтральным элементом).

Прежде чем исследовать операцию деления гипербинарных чисел, необходимо определить для них отношение порядка. Деление гипербинарных чисел, как и для целых чисел, в общем случае возможно, но только как деление с остатком, который по определению должен быть меньше делимого. Свойство гипербинарных чисел быть меньше или больше требуется определить.

2.4. Порядок

На множестве гипербинарных чисел возможно определить отношение порядка через отношение принадлежности, подобно целым числам. Любое целое число является суммой единиц. Одно число больше другого, если последнее содержится частью этих единиц в первом и принадлежит ему. Такой же подход используется для гипербинарных чисел с помощью фантомных множителей, что является примером полезности их использования.

2.4.1. Величина

Величиной слева гипербинарных чисел является след матриц их левых фантомных множителей. Величиной справа гипербинарных чисел является след матриц их правых фантомных множителей. Тогда, гипербинарное число больше (меньше) слева или справа, если советующие следы матриц их фантомных множителей больше или меньше.

Скалярная мера величины является необходимым признаком упорядочения гипербинарных чисел, но недостаточным.

2.4.2. Цепи Нётер

Величина не различает распределение единиц на диагонали матрицы. Как уже упоминалось, гипербинарное число подобно слева и справа своим фантомным множителям. Это означает, что фантомные множители порождают множества гипербинарных чисел, которые отличаются друг от друга соответствующими коэффициентами подобия. Эти коэффициенты подобия сами являются гипербинарными числами.

Возникают множества, порождаемые слева или справа соответствующими фантомными гипербинарными числами. Множество всех таких подмножеств (булеан) выстраивается в цепи с порождающими их диагональными элементами – один, сумма двух, сумма трех и так далее. Это возрастающие цепи по количеству порождающих элементов. Для текстовых гипербинарных цепи обрываются, поскольку их словари (фантомные множители) конечны.

Цепи, имеющие такие свойства, являются нётеровыми.

Существует простой метод построения таких нётеровых цепей для гипербинарных чисел:

Произведение порождающих фантомных множителей соседних звеньев отлично от нулевой матрицы.
Величина звена должна быть меньше следующего звена.

Возрастающие цепи Нётер булеана, порождаемого левыми и правыми фантомными множителями являются достаточным признаком упорядочения гипербинарных чисел.

2.5. Вычитание и деление

2.5.1 Вычитание

Операция вычитания текстовых гипербинарных чисел в общем случае не определена, как и для целых положительных чисел. Результатом может быть отрицательное число. Но всегда определено вычитание одинаковых целых положительных чисел.

Также и для гипербинарных чисел. Матрица разности различных матричных единиц в общем случае будет содержать отрицательные числа и тогда она не является бинарной матрицей. Но результатом вычитания одинаковых матричных единиц является нулевая матрицы. Это бинарная матрица.

2.5.2 Деление

Операция деления гипербинарных чисел, как и целых чисел, не определена. Для целых чисел операция деления заменяется на соответствующую операцию умножения, которая называется делением с остатком (деление через умножение и сложение).

Квадратные матричные единицы сингулярные (не имеют обратных матриц). Для гипербинарных чисел существует матричный аналог деления с остатком целых чисел.

2.6. Сравнения по фантомным множителям

Сравнения целых чисел обобщаются на случай гипербинарных чисел.

Диагональное гипербинарное число называется модулем сравнения двух гипербинарных чисел, если разность правых (левых) диагональных фантомных множителей этих двух гипербинарных чисел делится без остатка на этот модуль.

Множество всех гипербинарных чисел, сравнимых с по модулю, называется классом вычетов по модулю. Таким образом, сравнение равносильно равенству классов вычетов.

Любое гипербинарное число класса называется вычетом по модулю. Пусть имеется остаток от деления любого из представителей выбранного класса, тогда вычет, равный остатку называется наименьшим неотрицательным вычетом, а вычет, самый малый по , называется абсолютно наименьшим вычетом.

Поскольку сравнимость по модулю является отношением эквивалентности на множестве целых чисел, то классы вычетов по модулю представляют собой классы эквивалентности; их количество равно мере их фантомных множителей.

2.7. Преобразования и уравнения

2.7.1 Преобразования

Всегда существует четверка таких гипербинарных чисел, что произведение трех чисел равно четвертому гипербинарному числу. Такое равенство является общей формулой преобразования любого числа из этой четверки.

2.7.2. Уравнения

Формула преобразование гипербинарных чисел является равенством на четверке чисел. Его можно рассматривать как уравнение, где каждый набор из гипербинарных чисел и их составляющих может быть неизвестным матричным числом, а оставшийся набор – заданным. На различные слова (матричные единицы), их место в тексте, фантомные множители и слагаемые может быть составлена система линейных или нелинейных уравнений, если на множестве уравнений задаются или определяются отношения эквивалентности гипербинарных чисел по их фантомным множителям и слагаемым. В этом случае разные слова считаются равными, если подобны их фантомные элементы (фантомы), и наоборот, если подобны слова (повторяются в тексте в разных его местах), то могут различаться их фантомы. То же относится не только к словам, но и к фрагментам текста. Например, для всех фрагментов и слов текста общим может быть фантом (гипербинарное число), например реферат текста, как его инвариант при преобразованиях и смысл текста. В свою очередь, этот общий фантом может быть неизвестным для соответствующей системы уравнений.

В случае наличия таких классов эквивалентности текстовых гипербинарных чисел уравнения становятся сцепленными по эквивалентным гипербинарным числам.

В отличие от полиномиальных систем уравнений над полем чисел в системах гипербинарных уравнений заданные и неизвестные переменные некоммутативны. В дальнейшем будет предложен метод решения таких систем уравнений.

3. Матричные тексты

3.1. Формула гипербинарной координатизации

В соответствие с правилами координатизации тексты превращаются в матричные тексты по следующей формуле. Каждому слову текста с некоторым порядковым номером соответствует квадратная матричная единица с двумя индексами, где второй индекс является функцией первого индекса, а этот первый индекс является номером слова. Функция принимает два значения: если слово не встречалось ранее в тексте, то второму индексу присваивается значение равное номеру слова в тексте; если слово встречалось ранее в тексте под некоторым номером, то второй индекс равен этому номеру.

Матричным текстом называется специальный матричный полином – частный случай гипербинарного числа. Сумма мономов в этом полиноме должна рассматриваться как суммирование по согласованию. После согласования это гипербинарное число приобретает свойства, .соответствующее правилам координатизации текстов.

Матричный текст состоит из суммы матричных слов (мономов), в части которых может повторяться второй индекс (повтор слов в тексте). Эта сумма является матричным полиномом и гипербинарным числом (после согласования), поскольку каждое ее слагаемое – это матричный моном, который может быть простой матричной единицей или их произведением (составной матричной единицей). При этом мономы должны соответствовать формуле координатизации.

Правый матричный словарь – это матричный текст с исключенными мономами с разными индексами, состоит из матричных единиц с одинаковыми индексами. Левый матричный словарь — это полная сумма матричных единиц с одинаковыми индексами, каждый из которых – номер слова в тексте. Размерность квадратных матричных единиц текста и словарей равна максимальной размерности любой из них.

В каждой строке матриц текста и словарей имеется не более одной единицы, остальные элементы равны нулю. Это свойство является следствием уникальности первого индекса во всех матричных словах текста в соответствие с правилами и формулой координатизации. В каком месте строки матриц находится единица – это определяется соответствующим вторым индексом.

В матрице словарей соответствующие словам текста единицы находятся на главной диагонали. Остальные элементы диагонали и матрицы равны нулю. В матрице левого словаря единицы находятся на каждом месте главной диагонали, матрица является единичной. Правый словарь единичной матрицей не является.

Разделитель (пробел) слов в обычных текстах превращается в операцию сложения матриц. Обратно, исходный текст восстанавливается матричного текста по индексам «забыванием» алгебраических свойств (превращением операции сложения в разделитель-пробел).

Порядок элементов в матричных текстах уже несущественен, в отличие от обычных текстов. Слагаемые можно менять местами, но не изменяя их индексы. Следовательно, можно совершать алгебраические преобразования с матричными текстами (например, приведение подобных), как в случае числовых многочленов.

3.2. Свойства

Произведение слева полного левого словаря на весь матричный текст — это, естественно, весь матричный текст, поскольку полный левый словарь – это единичная матрица (фантомный множитель). Часть левого словаря – это проектор. Умножение этого проектора на слева выделит из целого матричного текста соответствующей этому проектору часть текста.

Произведение справа полного правого словаря на весь матричный текст — это весь матричный текст, поскольку этот словарь содержит все вторые индексы, имеющиеся в тексте, а в мономах текста нет других вторых индексов, каких не было бы в правом словаре. Правый словарь – это правый фантомный множитель для матричного текста как гипербинарного числа. При этом правый словарь, в отличие от левого, — это не единичная матрица.

Квадраты матричного текста и словарей – это сам текст и словари. Произведение правого словаря на левый – это правый словарь. Произведение левого словаря на правый – это правый словарь.

3.3. Фрагменты

Каждое слово матричного текста является его минимальным фрагментом. Сумма всех минимальных фрагментов – это сам текст. В общем случае фрагментами матричного текста называются полиномы, являющиеся результатом произведение слева части полного левого словаря на весь матричных текст. Для того, чтобы сумма любых фрагментов тексты была этим текстом необходимо сложение понимать как сложение по согласованию. После такого согласования будут исключены пересечения фрагментов.

Алгебраическая цель преобразований матричных текстов – обоснованная (с помощью фантомных множителей) фрагментация исходного текста со значительным уменьшением числа используемых фрагментов по сравнению с комбинаторной оценкой.

3.4. Пример языкового текста

3.5. Пример матричного математического текста

3.6. Пример матричной азбуки Морзе

4. Алгебра текста

4.1. Определения алгебраических систем

Полугруппой называется непустое множество, в котором для любой пары взятых в определённом порядке элементов определён новый элемент, называемый их произведением, причём для любых трех элементов произведение ассоциативно. Матричные единицы по умножению образуют полугруппу. Для матричных единиц условие ассоциативности выполняется из-за того, что они являются квадратными матрицами одинаковой размерности. Матричные единицы не имеют обратных (сингулярные). Наличие нейтрального элемента (единичной матрицы) и обратного элемента для полугруппы не требуется (в отличие от группы). Полугруппа с нейтральным элементом называется моноидом. Любую полугруппу, не содержащую нейтральный элемент, можно превратить в моноид, добавив к ней некоторый элемент, перестановочный со всеми элементами полугруппы, например единичную матрицу той же размерности для полугруппы матричных единиц.

Кольцо – это алгебраическая структура, множество, в котором для его элементов определены операция обратимого сложения и операция умножения, по свойствам похожие на соответствующие операции над числами. Результат этих операций должен принадлежать той же системе. Целые числа образуют кольцо. Целые числа можно умножать и складывать - результатом будет целое число. Для целых чисел имеются противоположные числа по сложению (отрицательные целые числа) - сложение обратимо. Целые числа являются бесконечным коммутативным кольцом с единицей, без делителей нуля (целостное кольцо). Два элемента являются элементами целостного кольца или первый элемент (делитель) делит второй, тогда и только тогда, когда существует третий элемент такой, что произведение первого числа на третье равно второму числу.

Кольцо целых чисел является евклидовым. Евклидово кольцо — это кольцо, в котором для элементов существует аналог алгоритма Евклида деления с остатком. Алгоритм Евклида – это эффективный алгоритм вычисления наибольшего общего делителя двух целых чисел (или общей меры двух отрезков).

Для кольца идеалом называется подкольцо, замкнутое относительно умножения на элементы из кольца. При этом идеал называется левым (соответственно правым), если он замкнут относительно умножения слева (соответственно справа) на элементы из всего кольца. Конечнопорождённым идеалом ассоциативного кольца называется такой идеал, который порождается конечным числом своих элементов. Простейшим примером идеала может служить подкольцо чётных чисел в кольце целых чисел.

Кольца различаются характеристикой - наименьшим целым числом k, таким, что произведение каждого элемента на такое k (сумма из k экземпляров этого элемента) равно нулевому элементу кольца. Если такого k не существует, то кольцо имеет характеристику ноль. Например, конечное поле (конечное число элементов) характеристики 2 – это поле, состоящее из двух элементов 0 и 1. Сумма двух единиц здесь равна нулю.

Полукольцо – это две полугруппы (аддитивная и мультипликативная), связанные законом дистрибутивности умножения относительно сложения с обеих сторон. Например, натуральные числа образуют полукольцо. Результатом умножения натуральных чисел будет натуральное число. Но из-за отсутствия отрицательных чисел нет противоположных натуральным числам по сложению элементов.

Алгебра – это кольцо, которое своими элементами имеет эти же элементы, умноженные на элементы некоторого поля. Поле – это тоже кольцо, но такое, что его элементы перестановочны при умножении друг на друга и элементы имеют обратный (произведение элемента на его обратный является единичным элементом).

Модуль над кольцом - одно из основных понятий в общей алгебре, являющееся обобщением векторного пространства (модуль над полем) и абелевой группы (модуль над кольцом целых чисел). В векторном пространстве поле – это множество чисел, например вещественных, на которые можно умножать векторы. Эта операция удовлетворяет соответствующим аксиомам, например дистрибутивности умножения. В модуле же требуется только, чтобы элементы, на которые умножаются вектора, образовывали кольцо (ассоциативное с единицей), например кольцо матриц, а не обязательно поле вещественных чисел.

Идеал (правый или левый) можно определять как подмодуль кольца, рассмотренного как правый или левый модуль над собой.

Полумодуль похож на модуль, но это модуль над полукольцом (нет обратных элементов).

Свободный модуль – это модуль над кольцом, если он имеет генерирующий набор линейно независимые образующих, порождающих этот модуль. Термин свободный означает, что этот набор остается порождающим после линейных преобразований образующих. Каждое векторное пространство, например, является свободным модулем.

Свободный полумодуль – это свободный модуль над полукольцом.

Алгебраические системы представляют собой перевернутую иерархическую систему понятий (перевернутая пирамида), где в основе лежат натуральные числа, а сверху различные числоподобные объекты, с определяемыми их свойства аксиомами и соответствиями («забывание» некоторой части свойств) между ними. Например, комплексные числа превращаются в действительные забыванием мнимой единицы, гиперкомплексные числа – в комплексные числа забыванием их матричной природы. Свободные полумодули превращаются в векторные пространства, когда координатами векторов является действительные числа, а не гиперкомплексные числа-матрицы, да еще и не имеющие обратных по сложению и умножению (гипербинарные числа).

4.2. Свободный полумодуль

Алгеброй текста называется свободный некоммутативный полумодуль (ассоциативная алгебра с единицей), элементы которого (матричные единицы текста) коммутативны по сложению и некоммутативны по умножению, и удовлетворяют двум соотношениям. Первое определяет умножение матричных единиц (полугруппа по умножению). Второе соотношение определяет сложение матричных единиц по согласованию. Результат такого сложения удовлетворяет правилам и формуле координатизации текста (полугруппа по сложению). Сумма текстовых матричных единиц будет текстовой матричной единицей.

Полукольцо – это две полугруппы. Мультипликативная полугруппа и аддитивная полугруппа связаны законом дистрибутивности умножения относительно сложения с обеих сторон, поскольку их элементы – это квадратные бинарные матрицы, которые дистрибутивны относительно их совместного умножения и сложения.

4.3. Алгебра фрагментов

Фрагменты матричных текстов имеют следующие алгебраические свойства:

1. Делимое, делитель и частное определяются для любых фрагментов матричного текста почти также, как для целых чисел. Фрагменты являются гипербинарными числами. Каждый из фрагментов имеет соответствующий левый и правый фантомный множитель.

2. Отношение делимости (или кратности) фрагментов, как и для целых чисел, рефлексивно (фрагмент делится сам на себя). При этом матрица частного не всегда определяется однозначно. Однозначность и диагональность матрицы частного восстанавливаются при использовании сложения по согласованию. Причиной многозначности являются возможные повторы индексов в матричных единицах фрагментов текста.

3. Отношение делимости (кратности) транзитивно,

4. - 7. Описывают свойства умножения и сложения отношений делимости, аналогичные целым числам.

7. Свойства правого и левого умножения кратных фрагментов на комбинации матричных единиц (матричные полиномы) отличает делимость (кратность) целых чисел и делимость (кратность) числоподобных элементов (гипербинарных чисел) как полиномов матричных единиц. Целые числа всегда существуют при умножении кратных чисел слева или справа на целые числа. В случае гипербинарных чисел они существуют не всегда.

8. и 9. Признаком делимости фрагментов матричных текстов является делимость (кратность) их правых и левых словарей.

10.-18. Определения и признаки общего делителя, НОД, взаимной простоты, общего кратного.

19, 20. Левый идеал матричного текста – это корпус всех текстов (всевозможных первых координат), которые можно составить из слов заданного словаря правого словаря (вторых координат). Действительно, левый идеал – это множество всех матричных полиномов, которые умножаются слева на правый словарь. В результате умножения получаются полиномы, имеющими вторые координаты только такие, которые имеются в словаре. Также при умножении любого полинома слева на другой полином, результатом умножения будет такой матричный полином, что все его вторые индексы будут подмножеством вторых индексов полинома, на который слева производится умножение. Любой матричный полином порождает левый идеал полиномов, имеющих такой же правый словарь или меньший. При сложении по согласованию текстовых матричных полиномов результатом является текстовый полином: матрица полинома бинарная и на каждой строке матрицы имеется не более одной единицы.

Если текстовое гипербинарное числа (после согласования сложения составляющих его мономов) умножается слева или справа на любой элемент матричного полукольца, то этим гипербинарным числом порождается левый или правый идеал – это все матричные единицы кратные слева или справа заданной матричной единице. Это означает тому, как при умножение четного числа на любое целое число получается четное число.

Главные левые и правые идеалы порождаются каждой матричной единицей словарей. Левый и правый идеал матричного полукольца порождается суммой порождающих элементов главных идеалов.

21. Идеалы матричных текстов, по аналогии с идеалами целых чисел, позволяют исследовать не только конкретные тексты и фрагменты, но и их совокупности (классы). Для идеалов текстов справедливы теоремы, имеющие место для идеалов целых чисел, но с учетом того, что матричные слова некоммутативны и некоторые из них по являются делителями нуля.

22. Понятие делимости матричных текстов обобщается на делимость идеалов матричных текстов. Свойства делимости матричных фрагментов текста имеют место при делении идеалов. Понятия НОД и НОК также обобщаются на случай идеалов матричных текстов.

23. Сравнения целых чисел также обобщаются на случай матричных текстов. Фрагменты матричных текстов сравнимы по модулю (мере) некоторого фрагмента, если остатки от деления этих фрагментов на заданный фрагмент кратны. Если остатки кратны, то они имеют одинаковые словари. Поэтому фрагменты сравнимы по модулю заданного фрагмента, если остатки от деления фрагментов на заданный фрагмент имеют одинаковые словари. Сравнимость текстов по модулю некоторого текста можно интерпретировать следующим образом. Пусть имеется корпус английского языка. Выбираются шесть книг, наиболее соответствующие шести базовым сюжетам Шекспира. Матричный текст этих шести книг является общим фрагментом. Тогда шесть книг, имеющие кратные остатки от деления их матричных текстов на общий фрагмент, сравнимы. Это означает, что можно сделать каталог книг для тех, кого интересуют не только шекспировские сюжеты. Причем кратность остатков является классифицирующим признаком для этого каталога. Классов вычетов в этом примере шесть. Взяв только три книги, например, можно весь корпус английского языка сравнить только по трем сюжетам из шести. Если человек имеет десять любимых книг или авторов, можно классифицировать корпус языка по признакам отличия от этого топтена.

24. Для классов вычетов (остатков) матричных текстов выполняются операции модулярной арифметики, с учетом того, что, как и для идеалов, матричные слова и фрагменты некоммутативны и некоторые из них по могут быть делителями нуля.

25. Понятие решения сравнений также обобщается на матричные тексты. Решить систему сравнений по модулю означает найти все классы вычетов такие, что любые комбинации матричных единиц фрагмента из этих классов удовлетворяют уравнению сравнения.

Неизвестными в уравнении сравнения являются координаты матричных единиц во фрагментах текста. Результатом решения системы сравнений является такая замена слов и/или места слов в тексте, что выполняется уравнение сравнения. Например, если человек прочитал десять книг, то остальные книги решением сравнений редактируются в словаре и фразах этих десяти книг. Если имеется частное решение сравнения, то общее решение – это класс вычетов, для которого частное решение (например, рабочая версия текста) является представителем этого класса. Тогда текущей версии матричного текста соответствует множество возможных матричных текстов, соответствующих решениям системы сравнений. Это свойство матричных текстов может использоваться при создании текстов прогнозированием вариантного продолжения фрагмента текста (автоавтор).

26. Алгоритм Евклида для полиномов матричных единиц проще, чем для целых чисел. Неполное частное находится в один шаг и зависит от числа общих вторых координат. Эти общие координаты определяются как неполное частное словарей полиномов, которые делятся. Неполное частное словарей фрагментов однозначно находится в отличие от неполного частного фрагментов, поскольку в каждом из словарей фрагментов нет повторов.

Кольцо целых чисел является евклидовым. Свободный некоммутативный полумодуль гипербинарных чисел евклидов.

5. Алгебраическая структуризация

5.1. Структуризация

Структура — совокупность и расположение связей между частями целого. Признаками структурированного текста являются: заголовки разного уровня фрагментов (параграфа, главы, тома, всего текста); краткие изложения (предисловие, введение, заключение, аннотация, реферат – расширенная аннотация); контекстный и частотный словари; словари синонимов, антонимов и омонимов; разметка знаками-разделителями текстообразующих фрагментов (запятыми, точками, знаками абзацев, параграфов, глав).

Перечисленные структурные признаки – соответствующие части (фрагменты) текста. Для полиномиального представления матричного текста некоторые такие части – это соответствующие некоммутативные базисы Грёбнера-Ширшова свободного некоммутативного полумодуля гипербинарных чисел (алгеброй текста).

5.2. Пример языкового текста

Алгебраическая структуризация текста примера происходит преобразованием, используя свойства матричных единиц, исходного матричного текста в аддитивной форме в мультипликативную форму (аналогично делению обычных многочленов «в столбик»). Соответствующие сомножители являются некоммутативным аналогом базиса Грёбнера-Ширшова для коммутативных многочленов. Бриллиантовая лемма выполняется – в сомножителях имеются зацепления справа по второму индексу, но они разрешимы.

При преобразовании (редукции) происходит преобразование словаря текста. В новом словаре (базисе идеала) появились новые слова. Слова как знаки те же, но смысл повторяющихся слов в тексте меняется. Слова определяются контекстами. Слова близки, если их контексты содержат хотя бы одно общее слово. Контексты тем более близки, чем больше общих слов из соответствующего словаря (общих вторых индексов) они содержат.

В естественных языках множественность контекстов слова является причиной неоднозначности понимания смысла слов. Смысл по Фреге – это соответствующая часть значений знака (слова). Значения слова – это все его контексты (свойства).

Правый словарь в начале структуризации являлся словарем знаков-слов. В процессе структуризации он преобразуется в контекстно-зависимые матричные конструкции n-грамм (сочетаний слов-знаков, учитывающий их взаимный порядок и расстояние в тексте). Смысловая разметка текста основывается на расширении исходного словаря текста омонимами (знаки одинаковые, контекстный смысл разный), а сам текст уже строится по такому расширенному словарю из некоммутативного базиса Грёбнера-Ширшова.

Размеченный текст после первого разделения омонимов и внесения их в расширенный словарь может быть опять алгебраически структурирован для более тонкой смысловой разметки.

Расширенный словарь (базис Грёбнера-Ширшова) вместе с контекстами повторяющихся слов называется матричным контекстным словарем текста.

Матричный словарь синонимов – это фрагмент контекстного словаря для слов, имеющих близкие по семантическому расстоянию контексты, но разных, как знаки в правом словаре. Семантическим расстоянием измеряется мера синонимичности.

Матричный словарь омонимов — это фрагмент контекстного словаря для слов, одинаковых как знаки, но с нулевым семантическим расстоянием.

Матричный словарь антонимов — это фрагмент контекстного словаря для слов с противоположными контекстами. Признаком противоположности в языковых текстах является наличие в контекстах отрицательных слов (частиц, местоимений и наречий).

Иерархические заголовки матричного текста – это фрагменты базиса Грёбнера-Ширшова, имеющие соответствующую частотность слов синонимического словаря. Например, для примера языкового текста высший заголовок – это две биграммы «множество объект» «объект множество».

Предисловие, введение, заключение, аннотация, реферат — это заголовки, дополненные элементами базиса Грёбнера-Ширшова меньшей частотности. и вычетами, вошедшими в базис (как в алгоритме Бухбергера).

Повторяющиеся слова определяются частотным матричным словарем текста, который равен транспонированному тексту на сам матричный текст.

Список контекстов определяется контекстным матричным словарем, который равен произведению матричного текста на транспонированный текст. Контекстный матричный словарь – это словарь интервалов между повторяющимися словами текста. Контекстом неповторяющихся слов является вся содержащая их знаковая последовательность. Контекст словаря – словарь.

Текст может быть реструктурирован с помощью фрагмента базиса. Например, роман «Война и мир» может быть реструктурирован в медицинскую тематику, если использовать фрагмент словаря, связанный со сценой полевой хирургии, и раскладывать весь текст по модулю этого фрагмента общего базиса Грёбнера-Ширшова. При этом высший заголовок может измениться. Существующее название романа (высший заголовок) считается спорным. Слово «мир» имеет два разных значения (антоним слова «война» и синоним слова «общество»). В 1918 году был изменен словарь русского языка. Исчезли буквы «ъ» и «і». Два слова «миръ» и «міръ» стали одним словом, возможно, изменившим авторский смысл названия романа. С помощью алгебраической структуризации возможно вычислить название текста, как функцию текста, используя два текста (и два вычисленных контекстных словаря романа) до и после орфографической реформы.

Два текста при алгебраической структуризации превращаются в один текст с уникальной первой координатой матричных слов следующим образом. Пусть каждая уникальная первая координата слова превращается в два индекса. Первый – это номер текста, второй – номер слова в этом тексте. Затем пары индексов двух текстов нумеруются одним индексом и превращаются в одну знаковую последовательность с уникальными номерами (конкатенация текстов).

Смысл текста, его понимание определяются мотивацией и персональным контекстным словарем читателя. Если они определены, то возможна реструктуризация авторского текста, представленного в матричной форме, в текст максимально понятный читателю (в его персональном базисе Грёбнера-Ширшова), но с элементами неизвестного, изложенного на персональном языке читателя, а также с дополнениями или уточнениями его персонального контекстного словаря.

Возможна персональная адаптация текстов на основе его реструктуризации. Понять текст – это изложить его своими словами – основной прием смыслового чтения. Для текстов в матричной форме понять его – означает разложить и реструктурировать авторский текст по своему базису Грёбнера-Ширшова.

Для реструктуризации необходима алгебраическая структуризация корпуса текстов для составления указанных выше словарей корпуса языка. В этом случае идеалы и классы вычетов матричного кольца корпуса матричных текстов должны быть предварительно построены и исследованы. В структурной теории Бергмана-Кона свободные (конечно порожденные) матричные кольца соотносятся (связываются) с кольцами некоммутативных полиномов над телами как коммутативные области главных идеалов с кольцами полиномов от одной переменной над полем.

В свободном полукольце между полиномами текста существуют связи, задаваемые интервальными и семантическими расширенными словарями корпуса текстов. Конкретный матричный текст может определяться системой полиномиальных уравнений на координаты текста (неизвестные в уравнениях – это мономы с неизвестными индексами; задаваемые в уравнениях некоммутативные коэффициенты – это мономы с известными индексами). Часть их них будет задаваться расширенными словарями или неравенствами на фрагменты, а часть будет неизвестными. В этом случае можно задавать уравнениями заголовки и краткие изложения, а черновик текста вычислять из систем полиномиальных уравнений (обратная задача структуризации - реструктуризация). Можно находить необходимое перераспределение текстообразующих фрагментов, заменять одни словари другими, изменять значимость повторяющихся слов, определять неологизмы.

5.3. Пример математического текста

Метод алгебраической структуризации текстов позволяет для текстов разной природы найти соответствующие классификаторы и словари. Т. е. классифицировать тексты без априорного задания признаков классификации и наименования классов. Такая классификация называется категоризацией или апостериорной классификацией. На примере математического текста вычисляются пять классификационных признаков, их сочетаний и соответствующих классов. Наименования классов совпадает с наименованием признаков и их сочетаний.

5.4. Пример азбуки Морзе

Азбука Морзе алгебраически структурирована в три идеала (класса) по соответствующим некоммутативным базисами Гребнера-Ширшова.

Заголовок тех букв, которые имеют знак «тире» на первом месте 4-знакового шаблона последовательности:

_BCD__G___K_MNO_Q__T___XYZ (13 букв)

Заголовок тех букв, которые имеют знак «точка» на втором месте 4-знакового шаблона последовательности:

_BCD_F_HI_K__N____S_UV_XY_ (13 букв)

Заголовок тех букв, которые имеют знак «тире» на третьем месте 4-знакового шаблона последовательности:

__C__F___J K ___OP____U_W_Y_ (9 букв)

6. Категория контекста

6.1. Определения

Контекстом слова матричного текста называется его фрагмент – сумма матричных единиц (слов) между двумя матричными словами-повторами. Контекст – это все слова матричного текста между повторяющимися знаками словаря. Например, между повторяющимися словами, повторяющимися точками, знаками абзацев, глав, томов языковых текстов или фраз, периодов и частей музыкальных произведений.

Знаки текстообразующих фрагментов выглядят одинаково, но это тоже знаки-омонимы – их контекстом являются соответствующие фрагменты. Контекстом языкового фрагмента (экспликацией или пояснением) может быть не только языковый текст, но и звуковой (например, музыка), образный (фото) или совместный (видео). Контекстом музыкального текста может быть языковый текст (например, либретто).

Матричным словам соответствуют их матричные контексты, представленные как алгебраические объекты. Всевозможные отношения между этими объектами являются предметом анализа при определении смысла слов. Для исследования таких конструкций полезна теория категорий из-за того, что в ее основе находится понятие транзитивности.

Категория контекста знака текста определяется следующим образом:

Объекты категории – попарно кратные контексты.
Для каждой пары кратных объектов существует множество морфизмов (правых и левых частных), каждому морфизму соответствует единственные.
Для пары морфизмов определена такая их композиция (произведение квадратных матриц двух частных), что если задано одно частное первого и второго контекста, а также второе частное второго и третьего контекста, то частное первого и третьего контекста равно произведению матриц двух этих частных (с учетом правых и левых произведений) - условие транзитивности.
Для каждого объекта в качестве тождественного морфизма определена единичная матрица. Категорная ассоциативность следует из ассоциативности матричного умножения.

Пересечением (общими словами) матричных словарей является их произведение. Доказательство следует из определяющего свойства матричных единиц и определения словарей. При умножении матричных единиц словарей (нижние индексы одинаковые в каждой единице) произведение их матричных слов (единиц) с отличающимися индексами равны нулю. В произведении останутся только общие слова с совпадающими индексами из всех сомножителей.

Объединение любой пары словарей является их сумма за вычетом пересечения (удалены повторы матричных единиц).

Минимальным правым словарем фрагмента матричного текста называется такой словарь текста, что словарь и текст взаимно кратны. Для взаимно кратных текста и правого словаря ненулевые матрицы их частных существуют. Частные существуют, если матричные единицы текста и правого словаря содержат одинаковое количество вторых индексов (координат) и не содержат иных вторых индексов.

Минимальные словари не содержат матричных слов (вторых индексов матричных единиц), отсутствующих в соответствующем фрагменте текста.

Классы эквивалентности контекстов задаются общими минимальными правыми словарями. Если пара контекстов имеет минимальный общий словарь, то эти контексты взаимно кратны. Следовательно, существуют их взаимные преобразования (матрицы).

Если контексты слова-знака имеют минимальный общий правый словарь, то они кратны друг другу. В дальнейшем под словарями фрагментов текста подразумеваются их минимальные словари.

Если заданные контексты умножить справа на такой словарь, что каждый полученный контекст будет иметь правый словарь (минимальный), то они называются редуцированными контекстами. При редуцировании (умножении на словарь справа) часть матричных единиц со вторыми индексами, которых нет в соответствующем словаре, удаляется в каждом из заданных фрагментов. Если в каких-то полученных фрагментах отсутствует хотя бы один из индексов словаря, то он не должен попасть в набор редуцированных.

Контексты с общими словарями, например, после редукции какого-нибудь слова-знака из словаря, являются объектами категории этого знака.

Транзитивное замыкание можно определить для любого набора фрагментов, задав для них общий словарь, который по мере порядка соответствующей цепи Нётер меньше или равен любому фрагменту.

6.2. Пример

Используется тот же пример языкового текста, в котором имеется четыре одинаковые как знаки слова «множество». У этих четырех знаков, в свою очередь, имеется четыре контекста и их четыре словаря.

Постановкой задачи является вычисление одинаковости и различия четырех слов «множество» в зависимости от одинаковости и различия по некоторой мере (модулю) их контекстов. Одинаковость контекстов определяется наличием общих словарей, которые используются как модуль сравнения контекстов. Различие определяется вычетами контекстов по этому же модулю. Вычеты определят свои классы эквивалентности (классы вычетов) и категории вычетов, поскольку для них также может происходить замыкание транзитивности.

Строится общий словарь четырех контекстов как их произведение. Транзитивное замыкание по общему словарю-модулю приводит к удалению «лишних» слов.

Таким образом, редуцированными (сокращенными) контекстами знака-слова «множество» являются четыре соответствующих матричные слова. Эти слова имеют одинаковую матричную единицу знака «объект» в объединенном матричном словаре (см. Объединение словарей). Вычисляется категория этого знака: четыре морфизма-матрицы и их композиция. Композиция является выражением на языке теории категорий интервальной разметки слова «множество» (главе об алгебраической структуризации), а редуцирование - примером решения системы сравнений по модулю Полезность использования теории категорий в том, что ее подход более общий и позволяет использовать методы из разных разделов алгебры.

Таким образом, все четыре фрагмента текста одинаковы (эквивалентны) в смысле матричного знака-слова «множество» (сравнимы по модулю этого слова). Существуют четыре матрицы-морфизмы, преобразующие эти тексты друг в друга. По аналогии с библиотечным каталогом все эти четыре текста (объекты категории матричного знака «множество») находятся в одном каталожном ящике с наименованием матричного знака «множество». Это пример грубой классификации текстов по ключевым словам. Контекстный смысл слов не учитывается, все такие слова как знаки одинаковы, и все случаи их появления в тексте могут складываться для вычисления значимости ключевых слов по частоте употребления.

Полученный результат означает, что в первом приближении все четыре слова «множество» контекстно связаны со словом «объект». Слова «множество» могут быть одинаковы или различаться настолько, насколько одинаковы или различны их сокращенные (редуцированные) контексты.

Для матричных текстов выполняются сравнения по модулю. Остатки деления фрагментов матричных текстов на другие фрагменты (модули) могут иметь остатки (вычеты), которые так же, как и модули, являются классифицирующими признаками.

Признаком делимости (кратности) фрагментов матричных текстов является делимость (кратность) их правых словарей. Остатки деления словарей (вычеты словарей) фрагментов являются словарями остатков от деления этих фрагментов.

Для того, чтобы вычислить сходства и различия слов необходимо сравнить соответствующие четыре контекста по модулю матричного слова «объект». Вычисляются четыре вычета каждого контекста по модулю матричного слова «объект».

Из полученного результата следует, что все четыре контекста несравнимы по модулю матричного слова «объект». Вычеты попарно не кратны и не образуют попарно ни один класс вычетов. Это означает, что все слова «множество» различны по смыслу (контексту).

Сходство находится на следующем этапе вычислений (для вычетов), если для пар вычетов вычислить общие словари и произвести редукцию. Общего словаря для всех вычетов не существует. Это является причиной отсутствия общего класса вычетов и соответствующей категории матричного слова «объект». Но некоторые три пары вычетов имеют три соответствующие общие словари. Тогда эти пары вычетов после редуцирования образуют классы и категории вычетов с именами матричных слов «это», «являться» и «точка». В каталог с матричным именем «это» попадут первый и второй фрагменты, в каталог с матричным именем «являться» – первый и третий фрагменты, в каталог с матричным именем «точка» - второй и четвертый фрагменты.

Матричное слова «полином» является аннулятором (делителем нуля) вычетов первого, третьего и четвертого фрагментов.

Матричное слова «моном» является аннулятором (делителем нуля) вычетов первого, второго и четвертого фрагментов.

Матричное слова «сомножитель» является аннулятором (делителем нуля) вычетов первого, второго и третьего фрагментов.

Это слова матричного текста, не имеющие контекста (три последние слагаемые в контекстном словаре главы об алгебраической структуризации) – при умножении вычета на аннулятор произведение отлично от нуля, если вычет содержит этот аннулятор.

Итак, постановкой задачи приведенного примера являлось вычисление одинаковости и различия четырех матричных слов «множество» в зависимости от одинаковости и различия их четырех контекстов (фрагментов) по некоторой мере (модулю).

Получено решение: соответствующие четыре матричных слова (как их четыре контекста) сравнимы по модулю матричного слова «объект» и не сравнимы (различны) по модулям матричных слов «полином», «моном» и «сомножитель».

Это означает, что редуцирование нужно производить не по общему словарю, состоящему из одного матричного слова-знака «объект». Как оказалась это слово-знак имеет разный смысл в разных местах текста. Вычисляются расширение первоначального словаря в соответствующий контекстный словарь. В главе об алгебраической структуризации это происходило с помощью некоммутативного базиса Гребнера Ширшова.

Исходный словарь преобразован в контекстный словарь. К четырем матричным знакам-словам «объект» добавлены с помощью вычисления категорий дополнительные матричные слова «полином», «моном» и «сомножитель». Этими дополнительными словами три недиагональные матричные слова «объект» отличаются между собой.

Приведённая выше классификация является категоризацией матричных текстов по словарям. При категоризации классы и их наименование вычисляются как алгебраические функции текста. Категоризация вычислялась по словарям, поскольку классифицирующие признаки (имена категорий) определялись по взаимному пересечению словарей. Такая категоризация не учитывает порядок слов в тексте, но может быть в дальнейшем использована при построении более тонкой категоризации, учитывающей взаимный порядок слов. Модулями сравнения в этом случае будут не части словарей, а фрагменты контекстов. При замене фрагментов словарей на фрагменты текстов могут появиться повторы слов в контекстах. Возникает неоднозначность при делении (построении морфизмов категории). Именно поэтому вначале производится сравнение по модулю словарей, определяются сходства и отличия (делители и остатки) по этой мере. Затем, после установления сходства и отличия слов-повторов в контекстах, модуль сравнения по словарю заменяется на фрагмент текста, который уже учитывает порядок слов. Именами категорий становятся фрагменты текста.

Общий метод вычисления классифицирующих признаков дает аналог CRT для матричных текстов. Китайская теорема об остатках (CRT) для матричных текстов формулируется следующим образом. Пусть даны:

Попарно не кратные минимальные словари фрагментов матричного текста (уже согласованы).
Правый словарь некоторого множества подобных текстов как сумма минимальных словарей.
Правый словарь множества других подобных текстов, меньших по мере (следу словаря).
Множество вторых текстов является подмножеством первых в смысле того, что их правые словари является частью правого словаря первых текстов.
Кортеж вычетов, где его элементы – это сравнения каждого текста из второго множества с объединением всех вторых текстов по модулям словарей первого множества текстов.

Тогда существует взаимно-однозначное соответствие между текстами второго множества текстов с этим кортежем вычетов. Доказывается по индукции с использованием определения кратности полиномов матричных единиц и минимальности словаря.

Кортеж вычетов является классифицирующим признаком всевозможных кратных друг другу текстов, имеющих словарь второго множества текстов или любую его часть. Именно по этому соответствию целесообразно строить классификаторы языковых и иных знаковых последовательностей.

7. Конкордантность смысла

Ранее тексты (знаковые последовательности с повторами) с помощью матричных единиц, как образов слов, превращались (координатизировались) в алгебраические системы. Координатизация – необходимое условие алгебраизации любой предметной области. Функция (стрелка) является матричной координатизацией текста. Со словами и фрагментами матричных текстов можно совершать алгебраические операции, как с целыми числами, но с учетом некоммутативности умножения слов как матриц. Структуризация текстов сводится к вычислению идеалов и категорий текстов в матричной (гипербинарной) форме.

Здесь определяется понятие матричного слова в контексте. Слова-знаки при повторах могут иметь разные фрагменты текста между ними (контексты), а слова, одинаковые по написанию и звучанию, - иметь разный смысл (как омонимы). В тексте все повторяющиеся слова могут быть омонимами, если их контексты отличаются соответствующей мерой (модулем). И обратно, разные по написанию и звучанию слова могут иметь схожие контексты и разную меру синонимичности. Частотность ключевых слов в семантическом анализе целесообразнее определять как частотность контекстов, сравнимых по соответствующей мере, чем как частотность слов-знаков, подобно буквам алфавита. При вычислении смысловой частотности слов с учетом контекста разные слова-знаки с одинаковыми контекстами должны суммироваться при вычислении частоты и, наоборот, одинаковые слова-знаки с разными контекстами – исключаться.

Матричные слова дополняются множителями-контекстами. Эти множители из-за свойств матричных единиц не приводят к изменению слов как знаков, но содержат знаки, влияющие на смысл определяемых слов. Фантомные контекстные множители у матричных слов имеются, но не влияют на знаки. Множители содержат отношения (по Фреге) с другими знаками (часть свойств этих знаков – это их смысл в данном контексте). Смысловое сходство и различие слов можно тогда вычислять сравнением (согласованием) этих фантомных множителей-контекстов.

Для выполнения алгебраических операций с матричными словами в контексте требуется согласование (конкордация) – смысловое согласование знаков и фрагментов текста, зависящее от меры (модуля) согласования. Матричные слова могут складываться в текст, если их контексты имеют общий смысл (модуль). Инвариантами матричных текстов, сохраняющими их смысл при заменах слов и фрагментов текста на согласованные, являются возрастающие Нётер. Цепи Нётер позволяют составить системы алгебраических уравнений для преобразований текстов, сохраняющих их смысл.

7.1. Контекстная конкордантность слов

Пусть имеются два повторяющихся слова текста, у которых первая координата второго слова больше первой координаты первого слова, и фрагмент матричного текста между этими словами (контекст). При этом по правилам и формуле координатизации все вторые индексы фрагменты меньше первой координаты второго слова. Тогда произведение слева этого контекстного фрагмента на второе слова равно нулю.

Словом в контексте называется произведение слева суммы контекстного фрагмента и единичной матрицы на это матричное слово.

Контекстный фрагмент плюс единичная матрица – это левый фантомный множитель матричного слова. Фантомный множитель не приводит к изменению слова, но может использоваться для сравнения двух (необязательно повторяющихся) слов сравнением их матричных контекстов. Такое семантическое сравнение слов текста по контексту (смыслу) в дальнейшем будет называться согласованием (конкордацией) по смыслу слов.

Два слова могут быть конкордантны (согласованы) как по пересечению контекстов слов, так и по объединению. В дальнейшем будет рассматриваться только пересечение контекстов. Алгебраически описания для объединения и пересечения совпадают. Для применения – их назначение отличается. Человек из-за природных физических ограничений одновременно может удерживать в процессе понимания всего несколько сущностей (около семи). Для сведения к этому количеству многообразия мира используется такая операция мышления как абстрагирование. Конкордантность по пересечению является математической экспликацией процесса абстрагирования в форме редукции. Предельным случаем абстрактных понятий естественного языка являются логические категории (Аристотеля, Канта, Гегеля). Иерархическая преемственность понятий (слов) необходима для построения отношений часть-целое (отношений понимания).

Конкордантность по объединению увеличивает сущности. Но их количество имеет значение только для людей. Для машинных языков это ограничение несущественно. Поэтому конкордантность по объединению может быть применена для взаимодействия машин, а также для будущего коллективного разума человеческой популяции, для которого необходимо создать технологии коллективного понимания. В настоящее время приемлемое понимание достигается в коллективах программистов. Для коллективов пять и больше, например, медиков нет ни одного термина, который бы они понимали одинаково. В математике, казалось бы, универсальном языке человечества, с идеальными объектами не меняющимися во времени, специализация достигла такого уровня, что полностью понимают друг друга территориально распределенные коллективы по три-четыре человека.

Конкордантность по пересечению будет называться просто конкордантностью.

Два слова конкордантны (согласованы) по пересечению правых словарей их контекстов, если пересечение (произведение) двух словарей отлично от нуля. Слова похожи в том смысле, что их контексты имеют общий словарь. При этом согласованными являются контексты после редуцирования. Редуцирование (см. раздел «Категория контекста») — это произведение справа каждого контекста на этот общий по пересечению словарь.

Каждый редуцированный контекст содержит все слова из общего словаря. N слов конкордантны, если каждая их пара конкордантна.

Отношение конкордантности является отношением эквивалентности, поскольку условия рефлексивности и симметричности для матриц выполняются, а транзитивность отношения следует из определения конкордантности слов.

Мерой (модулем) конкордантности является общий словарь. Именно этим модулем объясняется появление термина «конкордантность по модулю» по аналогии с термином «сравнение по модулю» для целых чисел. Как разные целые числа могут быть равны по модулю, так и разные (как знаки) слова текста могут быть эквивалентны (взаимозаменяемы) по соответствующему модулю конкордантности. Это означает, что если у слов конкордантны их контексты, то слова имеют согласованный смысл и могут считаться эквивалентными (взаимозаменяемыми по смыслу в тексте).

Слова и их суммы могут быть конкордантны по модулю. На отношениях конкордантности, подобно равенству и сравнению по модулю, возможно составлять системы уравнений конкордантности. Неизвестными могут быть определяемые и определяющие слова, модули конкордантности, контексты и фрагменты текста. Уравнения конкордантности позволяют вычислять ответы на такие вопросы: в каком смысле (здесь неизвестная – модуль конкордантности) слова и тексты конкордантны? Если задан смысл (модуль), то какой набор слов заменяем на другие слова? Таким образом, возможно вычислять определения слов и смысловые версии текста. Находить взаимозаменяемые слова, вычислять смысловую разметку и структуризацию текста, черновики текста по аннотации и смысловой перевод текста (даже одного языка). На этих вычислительных возможностях могут основываться новые функции текстовых редакторов и ридеров, мессенджеров и социальных сетей. В последнем случае возможно, составив персональный контекстный словарь пользователя-участника по его сообщениям, сопровождать общение смысловым переводом текста и звука через персональные контекстные языки других участников.

Конкордантным сложением пары слов называется выражение, в котором в общем левом фантомном множителе два фрагменты складываются и умножаются справа (редуцируются) на общий словарь. Затем к этому выражению суммы фрагментов-контекстов прибавляется единичная матрица. Это финальное выражение является фантомным множителем и согласованным контекстом конкордатной суммы двух слов. Модулем согласования является общий словарь двух контекстов. Конкордантное сложение n слов определяется аналогично. Общим словарем является произведение их n правых словарей n контекстов.

Два слова конкордантны, если правые словари их контекстов имеют ненулевую область пересечения. Но каждое слово этих контекстов, в свою очередь, также является словом в контексте. Поэтому необходима взаимная конкордантность определяемого слова с определяющими словами. Такая рефлексия, является причиной неоднозначности естественного языка и трактований текстов («я думаю, что они думают, что я думаю, …»).

Математической экспликацией рефлексии является латентная смысловая нелинейность линейно упорядоченных слов-знаков. Возможно, в будущем языковые тексты перестанут быть линейными и одномерными. Нотные тексты, например, 5-мерные, хотя и их можно переложить в одномерный стан-«ниточку», но это превратит нотные тексты в чудовищно непонятные коды со словарями, сравнимыми со словарями языковых текстов. Такие одномерные музыкальные тексты, как и языковые тексты, потребуют смыслого гештальт перевода, а не только персонального интонационного, как для 5-мерных музыкальных текстов. В будущем многомерном языковом тексте можно будет указывать на смысловые цепочки раскрытия смысла слов и фрагментов текста, а не распознавать их интуитивно или с помощью лайфхаков смыслового (быстрого) чтения.

Фрагмент в определении слова в контексте, в свою очередь, может рассматриваться как конкордантная сумма матричных слов, поскольку каждое слагаемое слово в этом фрагменте также имеет свой контекст. Тогда слово может быть соответствующим образом определено в таком уточненном контексте. Слово в уточненном контексте – матричная билинейная форма.

Два слова конкордантны по уточненным контекстам, если пересечение (произведение) всех словарей всех контекстов обоих слов отлично от нуля. Могут быть конкордантны n слов по уточненным контекстам, если каждая пара конкордантна. Модулем конкордантности является произведение всех словарей всех контекстов всех форм.

Могут быть конкордантны суммы слов (фрагменты текста) по уточненным контекстам, если каждая пара сумм конкордантна.

Пара сумм слов конкордантна, если произведение словарей всех контекстов всех слов пары сумм отлично от нуля.

Если модуль конкордантности, как произведение словарей всех уточненных контекстов всех слов как билинейных форм, ненулевой, то текст из этих слов конкордантен.

Все слова и фрагменты матричного текста могут быть разложены в классы конкордантности.

Каждому слову соответствует свой определенный выше фантомный множитель слева. Каждому фрагменту текста соответствует свой словарь (фантомный множитель справа). Эти множители существуют, но не изменяют слова или фрагмент. При этом такие множители однозначно определяются из текста по его фрагментам. Отсутствие влияния множителя на знаки является необходимым условием, но не достаточным для отношений конкордантности. Достаточным условием является то, что не влияющие на знаки и фрагменты знаков множители являются однозначной функцией (свойством) текста.

Каждой паре слов в тексте соответствует модуль (каппа) конкордантности – произведение всех словарей всех уточненных контекстов обоих слов.

Каждой паре фрагментов текста соответствует модуль каппа конкордантности – произведение всех словарей всех уточненных контекстов всех слов пары фрагментов.

Каждой паре из слова и фрагмента текста соответствует модуль каппа конкордантности – произведение всех словарей всех уточненных контекстов слова и фрагмента текста.

Обратно, каждому модулю каппа (имя класса) соответствует множество уточненных контекстов, множество слов, соответствующих этим контекстам и множество фрагментов текста, имеющих словарь, равный каппа. Все эти три множества взаимно конкордантны и все их элементы являются элементами одного класса конкордантности каппа.

Множество всех классов конкордантности по модулю каппа – это булеан множества всех слов словаря текста или все его частичные суммы (словари фрагментов). Число всех частичных сумм два в степени .

Принадлежность таких элементов одному классу означает, что существуют матрицы преобразования элементов друг в друга. Действительно, если множество уточненных контекстов, множество слов, соответствующих этим контекстам по и множество фрагментов текста, имеют один словарь, равный каппа, то все эти элементы подобны друг другу. При этом общим объектом преобразования в уточненном контексте и фрагментов текста являются матричные полиномы (гипербинарные числа).

Взаимные преобразования уточненных контекстов, слов, соответствующих этим контекстам и фрагментов текста, имеющих словарь, равный каппа, следующие:

Преобразование пары уточненных контекстов вида.
Пусть имеются два матричных текста. Из-за того, что они принадлежат одному классу, они имеют одинаковый модуль каппа или, что то же самое, имеют одинаковые правые словари. Но матричные тексты, имеющие одинаковые словари, образуют идеалы матричного полукольца (кратны словарю). Всегда существует матричный полином, при умножении которым слева на один уточненный фрагмент получается соответствующий уточненный фрагмент. С точностью до матричного множителя (частного) два уточненных фрагмента неразличимы (взаимозаменяемы).
Преобразование слов в уточненном контексте.
Пусть имеются два слова в контексте. Поскольку слова конкордантны (имеют общий словарь каппа, как произведение всех словарей всех уточненных контекстов), то слова конкордантны по каппе. Как и сравнения целых чисел, конкордантность матричных единиц можно записать соответствующим образом через равенство.
Преобразование слов и контекстов.
Пусть имеются слово и контекст. Слово и контекст конкордантны, если имеют общий модуль каппа. Также имеется запись через равенство как формула вычисления наименования фрагмента текста словом, принадлежащим классу конкордантности каппа. И наоборот, определение слова текстом.

7.2. Смысловые цепи Нётер

Классы конкордантности каппа различаются словами, входящими в словарь каппа. Пусть задана последовательность словарей такая, что соседние словари различаются одним словом.

Класс конкордантности (заглавная каппа) для каждого каппа – это множество всех слов в уточненном контексте, всех уточненных контекстов и всех фрагментов текста, имеющих общий словарь каппа. Элементы (заглавная каппа) взаимно заменяемы по формулам

Пусть имеются классы конкордантности как цепочки по «включению в» и «включает в себя». В таких цепочках словарей происходит увеличение слов в каждом словаре слева направо или уменьшение.

Последовательность таких непустых подмножеств корпуса текстов, составленных на основе словаря корпуса всех текстов, является возрастающей, поскольку каждое из них является подмножеством следующего.

И наоборот, последовательность подмножеств является убывающей, так как каждое из них содержит следующее подмножество.

Считается, что последовательность стабилизируется после конечного числа шагов, если существует такое n, что для всех последующих номеров цепочки подмножеств они совпадают. Это имеет место для матричных текстов – не существует большего словаря, чем словарь всех текстов. Совокупность подмножеств заданного множества (заглавная каппа) удовлетворяет условию обрыва возрастающих цепей, так как любая возрастающая последовательность становится постоянной после конечного числа шагов.

Любая убывающая последовательность становится постоянной после конечного числа шагов, так как словарь (заглавная каппа) имеет минимальное множество – одно слово, следовательно соответствующая совокупность подмножеств удовлетворяет условию обрыва убывающих цепей.

В общей алгебре объекты называются нётеровыми, если они удовлетворяют условиям обрыва цепей. Амалия Эмми Нётер виртуозно использовала технику обрывающихся цепей в своих многочисленных кейсах. Такие объекты, как классы конкордантности, тоже являются нётеровыми.

Нётеревы цепи могут быть определены также для порядка слов в тексте. Для текстов существенен относительный порядок слов. Например, «случайное в необходимом» различается смыслом с «необходимое в случайном» или «папа мамы» и «мама папы». Для музыкальных текстов и кодов – порядок знаков не менее значим, чем сами знаки.

Модуль конкордантности является фрагментом словаря текста. Для словаря порядок слов несущественен. Поэтому класс конкордантности содержит элементы без учета порядка слов во фрагментах текста. Порядок слов учитывается через имеющиеся подклассы класса конкордантности. В результате вычислений описываются соответствующий класс конкордантности и три признака трех его подклассов, учитывающих порядок слов. Подклассы порядка определяются восходящими или убывающими цепями Нётер для первых координат матричных мономов в левых словарях текстов. Для левых словарей также существуют цепи Нётер, как и для правых словарей, и именно таким образом учитывается смысл порядка слов в матричных текстах.

Цепи Нётер для слов и их порядка являются смысловыми инвариантами текста, сохраняющимися при соответствующих конкордантных заменах слов в тексте (пересказ текста своими словами), заменах фрагментов словами (реферирование и аннотирование), замена слов фрагментами (бот-автописатель). Инвариантность происходит из того, что нётеревы цепи строятся по левым или правым словарям матричных полиномов. Инвариантность по нётеревым цепям правых словарей означает, что для смысла текста не важны места слов в тексте, важна система их контекстного соответствия как функции вложения (с учетом порядка слов внутри n-грамм). Инвариантность по нётеревым цепям левых словарей означает, что для структуры текста не важны слова из правого словаря, важна система их структурного соответствия как функции вложения левых словарей текстообразующих фрагментов (структурный шаблон текста).

Цепи Нётер текста более предпочтительны для семантического анализа, чем частотные ключевые слова, поскольку учитывают контексты слов, а также выявляют закономерности раскрытия системы понятий в тексте через последовательность вложенности их содержания (контекста) – это и есть упомянутая выше иерархическая преемственность понятий (слов). Логические, этические и эстетические категории естественных языков возможно вычислять как смысловые цепи Нётер.

Если смысловые цепи Нётер задаются как целевые функции (последовательности вложений), то возможно составление систем уравнений на переменные билинейных форм. Из-за того, что переменные попарно зацеплены друг с другом (попарно вложены в цепях Нётер), может быть составлена система квадратичных уравнений на слова в уточненном контексте, их контексты и текстообразующие фрагменты как неизвестные таких уравнений.

7.3. Уравнители смысла

В теории категорий уравнителем (обобщение уравнения) называется применительно к фрагментам матричных текстов следующая модель. Пусть заданы четыре объекта-фрагмента и их словари. Объекты связаны парой морфизмов. Второй словарь – это часть или весь словарь первого словаря. Третий объект-фрагмент и морфизм-преобразование его к первому объекту-фрагменту (функция включения) называется уравнителем первой пары морфизмов, если конкордантны матричные произведения справа каждого морфизма этой пары на эту функцию включения. При этом для любого другого четвертого объекта, произведения справа каждого морфизма той же пары на функцию включения четвертого объекта в первый тоже конкордантны и существует единственный морфизм третьего объекта в четвертый, такой, что матричное произведение морфизма первого объекта в третий на морфизм третьего в четвертый конкордантно морфизму первого объекта в четвертый (эти морфизмы транзитивны).

Существенным отличием приведенного выше определения для уравнителя матричных фрагментов от канонического определения уравнителя для категории множеств Set, например, является замена отношения равенства на отношение конкордантности. Но поскольку отношения равенства и конкордантности являются отношениями эквивалентности (обладают свойствами рефлективности, симметричности и транзитивности), такая замена допустима и удовлетворяет аксиомам категории.

Причина использования конкордантности следующая. Для первых двух объектов-фрагментов категории требуется найти третий фрагмент текста и его соответствующий матричный полином-преобразование такой, что при умножении на него справа неоднозначность, связанная с повторами индексов в мономах фрагментов, устраняется. Поскольку в мономах матричных полиномов обе координаты относятся к положению слов в тексте, то умножение первой пары морфизмов на функцию включения – это и есть согласованное правило выбора повторяющихся слов, устраняющее многозначность.

Если слова рассматриваются в уточненном контексте, то для достижения такой однозначности используется смысловое различие повторяющихся слов в тексте и их конкордантность по уточненным контекстам.

Система уравнений для фрагментов в уточненных контекстах (слово – частный случай фрагмента) может быть составлена тремя способами:

По соотношению конкордантности фрагментов текста в уточненных контекстах. Например, это конкордантность названия текста и всего текста или частей текста (параграфов, глав etc), частей текста (например, аннотации и всего текста, первых абзацев параграфов, etc. Перечисленные сочетания фрагментов обозначаются и являются соответствующими номерами уравнений в системах уравнений текста.
По цепям Нётер фрагментов текста и их порядка следования. Уравнения в этом случае является рекуррентными и определяются формулами соответствующими формулами. Рекуррентность по первым координатам определяет последовательность следования фрагментов текста (структурный шаблон текста). Рекуррентность по вторым координатам определяет последовательность следования фрагментов по преемственности смысла (контекстное оглавление всего текста и его разделов). Каждая цепь Нетер определяет уравнение в системе уравнений.
Сочетание двух пунктов выше.

Системы матричных уравнений имеют общий вид билинейной формы и, в зависимости от того, какие фрагменты в соответствующей билинейной форме принимаются за неизвестные, являются либо системами линейных, либо квадратичных уравнений. Задаваемые и неизвестные величины являются матрицами. Для линейного случая имеются матричные версии метода Гаусса решения систем линейных матричных уравнений. Для систем квадратичных матричных уравнений также существует обобщение метода Гаусса исключения неизвестных и редукции в системах уравнений со многими неизвестными к уравнению с одним неизвестным и формулам связи между неизвестными.

Свести систему квадратичных уравнений к системе линейных уравнений можно без потери общности и точности с помощью альтернионов, которые являются гиперкомплексными числами, состоящими из гипербинарных чисел.

Приводится пример точной линеаризации.

Для точной линеаризации и решения систем конкордантных уравнений необходимо, чтобы матричные слова и тексты коммутировали с альтернионами и существовали квадраты неизвестных. Первое требование удовлетворяется использованием соответстствуещего свойства кронеккеровского (прямого) произведений матриц, второе требование для матричных текстов всегда выполняется поскольку квадрат фрагмента матричного текста является этим же фрагментом.

Заключение

Практическое применение алгебры текста иллюстрируется описанием функций смыслового помощника «Фреге». Это приложение является усилителем способностей человека к познанию. Познание имеет три составляющие: восприятие, осознание и понимание. При этом каждый видит и слышит только то, что он понимает (И. В. Гёте).

Восприятие – чувственное, непосредственное познание окружающих объектов. Устанавливаются отношения эквивалентности (наименования) чувственных сигналов (аудио и видео, например), их сочетаний (сцен) и слов.

Осознание - использование активного запаса слов (оперативный словарь) человека в обыденной жизни его сообщества. Оперативный словарь (активный структурированный запас слов) связан со словарем действий человека. Основной вопрос к этому словарю – «что?». Содержит персональный словарь интересов и мотивов человека.

Понимание – использование полного структурированного словаря отдельного человека (персоны). Вопросы к нему – «как?» («почему?», «зачем?»). Необходим для адаптации человека и актуализации оперативного словаря. Это пассивный структурированный запас слов, часть всеобщего словаря естественного языка, его персональная часть. Частичность определяется воспитанием, образованием и опытом – это персональный запас слов человека и связей между ними на основе становления отношений сходства. Объединение всех персональных словарей всех людей за всю историю языка – всеобщий контекстный словарь языка человеческой популяции.

Ментальный цифровой помощник Фреге – набор функций повышения эффективности познания и операций мышления таких, как:

Анализ — разделение предмета/явления на составляющие компоненты.
Синтез — объединение разделённых анализом составляющих с выявлением при этом существенных связей (свойств).

Анализ и синтез являются основными операциями мышления, на основе которых выстраиваются онтологические единицы (слова, понятия и логические, этические, эстетические категории).

Сравнение (сопоставление предметов и явлений, при этом обнаруживаются их сходства и различия).
Классификация (группировка предметов по признакам).
Обобщение (объединение предметов по общим существенным признакам).
Конкретизация (выделение частного из общего).
Абстрагирование (выделение какой-либо одной стороны, аспекта предмета или явления с игнорированием других).

Машинное представление операций мышления следующее:

Разделение (анализ, классификация, конкретизация, абстрагирование).
Объединение (синтез, обобщение).

Это базовые операции теории множеств. В математической теории категорий они заменяются одной операцией – упорядочением (стрелкой).

Основная функция приложения Фреге – адаптивная структуризация и увеличение активного и пассивного запасов языка. Другие функции:

Совершенствование (обучение) словаря восприятия. Поддержка увеличения количества и качества распознавания образов и сцен. Практическая реализация – клиентское приложение предоставляет пользователю сигнальную систему о распознанных образах и сценах с возможностью их демонстрации с наименованиями из персональных словарей и классификаторов.
Совершенствование (обучение) словаря осознания. Актуализация активного запаса слов по частоте использования в различных классах активности действий. Частотность определяется числом вызовов словаря действий (маппингом словарей) и обращений к словарю понимания.
Совершенствование (обучение) словаря понимания – совершенствование персонального распознавания смысла. Персональная структуризация, замыкание отношений эквивалентности, сходства и порядка. Развитие словаря понимания происходит на сервере. Все клиентские словари (ментальные клоны) – проекции, персонификация словарей на основе действий клиента (обращения к словарям).

Взаимопонимание клиентов – это маппинг клиентских словарей.

Обучение клиента – структуризация и актуализация клиентских словарей на основе мониторинга активности клиента и распознавания его интересов (актуализации словаря интересов).

Обучения серверной библиотеки словарей – на основе обратной связи с клиентскими приложениями, анализа активности и запросов пользователей.

Смысловой цифровой помощник Фреге – усилитель познания на основе замыкания отношений и маппинга словарей. Результаты использования приложения:

У пользователя явно имеются (созданы и поддерживаются) персональные словари (контекстный, синонимический, антонимический, омонимический), личные онтологии как словари со гетерархическими связями используемых знаковых последовательностей (языковых, образных, музыкальных). Набор таких словарей называется моделью человека и представляет собой логические (истина-ложь), этические (хорошо-плохо) и эстетические (красиво-ужасно) оценки мира. Персональные словари являются проекциями (частями) общих словарей корпусов языка, изображений и звуков.

Назначение приложения – согласование в реальном времени смысла (общей части значений) используемых при общении знаков (слов, образов, звуков), смысловой перевод персональных словарей. Например, в переговорах (совещаниях) — это мгновенный смысловой перевод используемых понятий и терминов для специалистов-участников разных предметных областей и школ в контексте цели переговоров.

Начальное ментальное состояние клиента приложения допускается в двух формах:

у пользователя отсутствуют оформленные персональные словари, но мотивация к созданию имеется. Тогда назначение приложения – вычисление персональных словарей на основе предоставленного доступа к личным знаковым последовательностям (если имеется их достаточное количество и качество). Если не имеется – создание личных знаковых последовательностей на основе предоставления инструментов поддержки для персональных консультантов-менторов. Например, создание необходимых фото-, аудио- и видеоархивов, создание личной библиотеки через пересказ «своими словами» языковых текстов.
у пользователя отсутствуют оформленные персональные словари и мотивация к их созданию, но имеется интерес. В этом случае предоставляется доступ к кейсам приложения:
- Счастье – это когда тебя понимают.
- Вместо резюме (поддерживает личную востребованность).
- Вечная жизнь (цифровое существование после биологической смерти).
- Личный учитель (поддерживает в актуальном состоянии и комфортно развивает персональные словари).
- Работать вместо себя (модель и человек дистанционно неразличимы).
- Искать только для себя (информацию, знания, музыку, изображения, близкие социальные группы) без дополнительного отбора.
- Смысловой перевод с иностранного языка (подстрочник «своими словами»).
- Быстрое смысловое чтение (персональная адаптация текстов, пересказ «своими словами»).
- Быстрая смена профессии (персональное зацепление неизвестного через известное).
- Персональный выбор (автопоиск товаров и услуг «под себя»).
- Формулировка вопроса (перевод со «своего» языка на всеобщий).
- Создание черновиков знаковых последовательностей по заголовкам и аннотациям.
- Купирование деменции (поддержка в качестве актуальных словарей их необходимых и возможных частей).

Смысловой помощник Фреге основывается на следующих принципах современного обучения:

умение задавать вопросы важнее заучивания ответов. Хорошо сформулированному вопросу гарантирован ответ с помощью современных информационных технологий. Роль машинного учителя (личного цифрового ментора) - обучение навыкам формулировки вопросов или постановки задачи на примерах, систематизации ответов и следующей стадии формулировки вопросов.
не только ответы бывают истинными или ложными, но и вопросы. Вопрос называется истинным, если ответ на него является истинным или ложным (да или нет); иначе вопрос называется ложным. Другими словами, нужно так сформулировать вопрос, чтобы ответить на него можно было утвердительно или отрицательно. Тогда формулировка вопроса считается проработанной (истинной). Если так ответить нельзя, то вопрос недостаточно хорош (ложный). Ученик при тестировании должен демонстрировать умение задавать истинные вопросы. Необходимо овладеть навыком декомпозиции первичного вопроса на элементарные. Оцениваться должны не ответы, а вопросы. Относительное количество истинных вопросов определяют общую оценку.
оценки не должны назначаться субъективно, а должна вычисляться. Элементарная оценка может принимать только два значения (зачёт или незачёт). Итоговые оценки вычисляются по элементарным в соответствии с простыми алгоритмами (синтез). Обучение оценивается непрерывно и постоянно. У обучаемого должна быть возможность изменить (исправить) полученные ранее элементарные оценки (незачёты). Предметная область должна быть декомпозирована на элементарные блоки (темы). Знание всех блоков должно проверяться.

Систематизированные и структурированные контексты слов, которыми овладевают при обучении, называются логической, этической и эстетическими составляющими модели человека - его фенотипом. Человек – это его генотип и фенотип. В прошлом они биологически хранились в персональных генетических последовательностях и памяти человека. Современные информационные технологии позволяют сохранить не только генотип, но и фенотип отдельно от человека. Фенотип возможно и необходимо сохранять накопительно при обучении в течение всей короткой биологической жизни. Образовательный фенотип используется, тестируется и совершенствуется в процессах понимания смысла. Человек объективно мотивирован на создание своего второго «Я». Созданный формализованный фенотип позволит обеспечить бессмертие человека биологическим клонированием генотипа и фенотипа, или/и виртуально в информационном пространстве.

Назначение смысловых цифровых помощников – технологическая поддержка всеобщего понимания для создание коллективного разума человеческой популяции и всеобщей востребованности.

Алгебра текста без формул