Это отрывок из большой статьи в журнале "Философские проблемы информационных технологий и киберпространства". В ней приводится критика современного теоретического представления об аналогии как структурного отображения (Д. Гентнер) с одной стороны и статистического метода получения аналогии "по контексту употребления" (Т. Миколов). Мы предлагаем иной метод получения аналогии, который основан на методе аналогии по предикатам (статья), что дает значительные преимущества. Во-первых, ее легче получить в отличие от статистических методов, которые требуют обучения на большом корпусе. В нашем методе достаточно прим. 200 книг. Во-вторых, это интерпретируемая и управляемая аналогия - всегда можно посмотреть, по каким предикатам получена аналогия и какие будут аналоги по другим предикатам. Это отправная точка исследования. Далее будет показана фундаментальная роль аналогии в нашем мышлении.
Аналогия в мышлении
Предикативная структура как таковая присуща нашему мышлению априори, все чем мы оперируем в мышлении имеет предикативный строй. Например, в визуальной модальности предикация связана с перемещением глаз в разных направлениях, и условно можно ее изобразить так – если наложить на любое изображение сетку как в тетрадке в клетку, то любой квадратик картинки будет относиться к другому как «красный на один квадратик ниже, выше, направо или налево от синего». Это предикаты движения глаз и таким образом, через такие предикаты перемещения, можно описать любую картинку, в зависимости от разрешения сетки. И такое предикативное разложение имеет некоторую ассоциацию (не осмелюсь сказать большего) с выявленными в гиппокампе нейронами решетки и нейронами места. Именно нейроны решетки служат для создания предикативных отношений между нейронами мест при перемещении от одного к другому (ранее была выявлена связь нейронов решетки с перемещением подопытного животного). Так что такая предикативная структура изображений может создавать аналогию мест на картинке, что в итоге может складываться в ощущение одного (близкого) цвета, текстуры и границы (аналогично расположенные по одному предикату и разные по-другому).
Теперь рассмотрим возможную роль аналогии в известных нам операциях мышления, а именно распознавание, сравнение, силлогизм, метафора, онтология, дедукция и индукция, обучение. В работах упомянутых ранее авторов рассматривается только общая роль аналогии в распознавании и обучении, в создании новых гипотез, в метафоре, но без определения того как они осуществляются. Ниже будет показано, как эти и другие известные способы мышления реализуются при помощи аналогии.
Распознавание
Основной проблемой распознавания является усматривания схожих признаков объектов, которые в деталях могут сильно различаться. Нейросети распознают за счет того, что в процессе обучения им показывается очень много объектов класса и при небольшом обобщении между набранными разнообразными признаками (сглаживании) они способны распознавать объекты, немного различающиеся с представленными при обучении, но того же класса. Основной недостаток такого обучения в том, что для этого нейросети требуется много примеров для постепенного смещения весов (параметров) нейросети в нужном направлении. Человек учится явно быстрее, что мы обсудим далее в разделе об аналогии в обучении.
Аналогия объединяет несколько схожих лексем и образов как близких по предикатам с учетом избирательности и частотности как отмечено в нашей предыдущей статье [1]. И распознавание происходит на основании распознания предикатов нового объекта. Если он имеет такие же предикаты, то это лексема и объект, уже известные нам. Именно так мы относим их к одному классу, то есть распознаем. Важно отметить, что распознавание осуществляется не за счет обучения на большом числе примеров. Это комбинация предикатов, которые как примитивы, уже и известны и просто собираются в новую совокупность, аналогичную уже известной по классу. И мы новое называем также как известное (имя класса). Это свойство композиционности будет рассмотрено далее.
Здесь надо привести пример, который наглядно поясняет как происходит распознавание по аналогии. Все цвета являются аналогами друг другу как цвета. Они хорошо выделяются как аналоги предложенным методе predicatIDF. Так вот, все вместе они образуют понятие цвета (цвет происходит от старославянского kvetъ, обозначающего не только цветок, но и луг, где много разноцветных цветов, поэтому «цвет» выбран как обобщающее понятие окраски в славянском языке). Так же любой выбранный цвет сразу ассоциируется с линейкой других цветов, которые входят в аналогию. Это значит, что присвоение какого-то одного цвета предмету позволяет быть готовым распознать так же такие же предметы всех других цветов, так как в его композицию предикатов входит один цвет, а у него есть в качестве аналогов все другие. Это важное свойство композицонности аналогов, которое создает возможность распознавания даже таких предметов, которые обладатель мышления никогда не видел. Это позволяет учиться не на миллионах примеров, а даже на одном. Такие линейки возникают везде как перечисления аналогичного – чисел, имен людей, виды транспорта и другие. Это объем понятий, которые имеют указанное обобщающее название (имя понятия).
При этом аналоги формируются динамически с распознаванием новой композиции предикатов как предмета возникают новые предикаты и аналоги с их участием, что создает новые возможности для распознавания и это реализует основной механизм познания, частью которого распознавание, собственно, и является.
Схема или композиция
В связи с упомянутой композиционностью как способом определения предмета или понятия, а любое слово – это обозначение не единичного предмета, а общности всех возможных аналогичных предметов, стоит определит понятия композиции или схемы предмета. Сочетание предикатов как описание предмета через аналогию лексем определяет все аналогичные предметы как показано выше при распознавании. Но это не случайное и единичное сочетание. Это именно обобщение сочетаний множества близких по аналогии лексем в одинаковой синтаксической конструкции. Схема предмета таким образом является наиболее частотным сочетанием, композицией аналогичных лексем в определенной синтаксической конструкции как решетке (сетке). Хотя возможны различные способы описания предмета, сходство между которыми менее очевидно и требует отдельного анализа, сейчас мы говорим о схеме как совокупности аналогичных лексем, наиболее часто встречающихся вместе в совокупности случаев. Таким образом, мы будем называть схемой или композицией А все случаи сочетаний аналогичных лексем с одинаковыми синтаксическими связами, отличающихся от композиции В слабой или отсутствующей аналогией хотя бы одной лексемы.
Силлогизм и метафора
Силлогизм – это вывод из двух посылок (пропозиций) третьей. Мы же рассматриваем силлогизм как последовательность «посылка – аналогия – вывод», то есть как рассуждение по аналогии как она была описана выше. Если у вас уже есть известная пропозиция и есть аналогия с неизвестным, к которому надо установить пропозицию, это реализуется через указанную последовательность из трех утверждений, среднее из которых не что иное как установление аналогии между средним и меньшим терминами силлогизма. Поясним для ясности на классическом примере силлогизма про Сократа.
Человек смертен – это исходной пропозиция, которая нам известна. Сократ – человек – это и есть установление факта аналогии между именем Сократ и понятием Человек, в объем которого входит имя Сократ. Замена «человек» в исходной пропозиции на «Сократ» в силу аналогии приводит к новой искомой пропозиции «Сократ смертен». Аналогичный силлогизм мог бы выглядеть так, что более естественно для обыденных рассуждения. «Петя смертен, а Вася что Петя, тоже смертен». И тут утверждение «Вася что Петя» утверждает аналогию между ними как людьми.
Эти примеры показывают сходство силлогизма с метафорой по своей структуре. В теории метафоры принято говорить об утверждении-источнике и утверждении-цели, преобразование источника в который происходит за счет установления связи членов утверждений через предикат. Возьмем простой пример.
Часы идут – это утверждение-источник или известное. Часы показывают время – это предикат, который устанавливает связь между известным понятием источника (часы) и новым понятием времени, свойство которого по аналогии надо определить. В итоге его установления получается метафора «Время идет» по той же схеме что и в силлогизме. Отличие заключается в том, что здесь аналогия устанавливается по одному предикату, указывающему скорее на ассоциацию часов со временем, что можно считать слабой аналогией. Но она свойственная всем новым понятия, для которых еще не распространены многочисленные предикаты, по которым можно было бы установить сильную аналогию как в случае силлогизма. Но по сути это тот же процесс установления вывода из известного утверждения по аналогии, которая установлена по указанному предикату (в силлогизме он не указывается). В обыденных рассуждениях он даже не указывается, а подразумевается интуитивно. Но такого рода аналогии часто применяются в обыденных рассуждениях. Другой пример.
Обычно рассматривают укороченную «время – деньги» и считается, что она указывает, что время тоже можно тратить, экономить, вложить. Но это ограниченная метафора, потому что время нельзя заработать, поделиться или получить проценты. И это как раз указывает на то, как метафора на само деле сформирована. Утверждением-источником метафоры скорее является утверждение «деньги дает работа» или аналогичная. Далее следует предикат установления связи «работа требует времени». Отсюда возникает метафора время можно тратить как деньги и т.д. Но так как связь времени и денег установлена через работу, то время нельзя заработать (получается тавтология) или получить проценты (с работы проценты не платят, в отличие от денег), поделиться временем тоже не получится, потому что нам платят за нашу работу, а не выполненную кем-то другим. И таким образом приведенная схема вывода метафоры обосновывает также и ограничения на применения метафоры.
Из известных теорий к предлагаемой гипотезе формирования метафоры наиболее близка теория концептуального смешения Жиля Фоконье [11].. Эта теория исследует, как можно смешивать различные концепции для создания новых значений, подчеркивая роль аналогии в этом когнитивном процессе. Эта идея развивается в теории метафоры Ж. Фоконье, в которой такое смещение называется блэндом. Но Ж. Фоконье не описывает конкретный механизм, который позволяет осуществить смещение и образовать метафору через аналогию, который бы позволил его реализовать, что вполне осуществимо в предлагаемой методе [1].
Многие ученые отмечают связь аналогии и метафоры, отмечая, что сама форма метафоры часто выглядит как указание на аналогию, например, «жизнь как пусть». Но никто не приводит конкретного способа формирования метафоры через аналогию так, чтобы это можно было повторить в программе и тем самым экспериментально подтвердить гипотезу. Ниже будет показано, как это можно сделать, используя метод из предыдущей статьи [1] и в данной интерпретации формирования метафоры это становится возможным повторить в программе.
Онтология
Онтология построено на обобщении, когда много разных объектов помещаются нами в один класс, а этот класс весте с другими похожими в класс более высокого уровня общности. В общем смысле это позволяет нам облегчить передачу информации, когда можно сказать сразу о предикате к множеству объектов одной фразой и сэкономить память. Как же производится обобщение в онтологии? Конечно же, по общим признакам и отношениям входящих в класс объектов. Но любой признак или отношение – это предикат, выраженный прилагательным или глаголом. И те понятия, что включены в общий класс, являются аналогами по ним. Это могут быть отдельные отношения для всех включаемых объектов или множество отношений и признаков, чуть различающихся для разных объектов как, например, в классе минералы. В принципе любое понятие, выражаемое лексемой, является как известно каким-то классом, кроме персональных имен, например, пароход Иван Свердлов.
Схожесть, аналогичность объектов, входящих в один класс, мы чувствуем интуитивно и стремимся назвать. Как же это происходит? Это ключевой вопрос образования онтологий, как не только выявления аналогии между двумя словами, а образования класса из них как нового объекта, объединяющего их общие признаки. Это важный процесс именно речевого мышления, которое позволяет нам образовать новые понятия, и охватить ими больше объектов, чтобы иметь возможность построить рассуждения с ними.
Образование имен классов не случайно. Обычно оно производится по наиболее характерному, распространенному общему предикату объектов класса. В приведенном выше примере про цвет имя класса цветов образовалось как наиболее распространенный предикат к существительному «цветок»: «красный цветок, голубой цветок, желтый цветок». Цвет и стал именем класса окраски цветов, так как более разнообразно и ярко показывал весь спектр цветов. Надо отметить, что само понятие «цветок» уже является обобщением всех луговых растений с яркой окраской, что говорит о том, что одно обобщение (растений) помогает делать другие (цветов). Другим примером могут служить понятия, сформированные по общим предикатам с глаголами, что более распространено. Например, все растения растут, а животные живут. Понятие образовано как субстантив от общих глаголов так как называть классы принято существительным. Иногда это бывают более сложные предикаты как «паровоз» – то, что движется на паровой машине. Это достаточно устойчивый способ называть классы, хотя некоторые случаи требуют исследования этимологии слов, чтобы узнать причину называния класса, например транспортом. Это слово образовано старофранцузского transporter: «перевозить или перевозить», что является общим предикатом для всех транспортных средств.
Дедукция и индукция
Выше была рассмотрена онтология, которая объединяет в классы единичные объекты и называющие их понятия. Индукция же объединяет целые утверждения в общий «закон» или утверждение более общего порядка (содержащее такие кванторы как «все» и имена классов). И важность аналогии в индукции отмечал еще Р. Карнап [10]. По его мнению, рассуждения по аналогии позволяют нам делать выводы о свойствах или поведении одного объекта на основе его сходства с другим объектом, свойства которого известны. Р. Карнап подчеркивал, что для того, чтобы индуктивные аргументы были применимы, они должны включать в себя аналогии. Это означает, что признание сходства между случаями является основополагающим для формирования обоснованных индуктивных заключений.
Индуктивный вывод по аналогии схож по сути с формированием названия класса, описанного выше. Например, серия утверждений «Дерево тянется к солнцу, трава тянется к солнцу, куст тянется к солнцу» становятся общим индуктивным выводом «растения тянутся к солнцу» на основе замены многочисленных имен экземпляров класса в одно наименование, что создает общее индуктивное утверждение. То есть аналогия отдельных понятий утверждений создает обобщение утверждения до индуктивного «закона», который в дальнейшем используется как основа для обратного, дедуктивного вывода от общего утверждения к утверждениям с экземплярами класса.
Именно такая возможность глубокого обобщения по аналогии позволяет создать понятия, недоступные для нейросетей. Например, одна из самых больших проблем беспилотных автомобилях заключается в том, что они не могут понять, что считается препятствием. Например, если вы видите перевернуты фургон перед своей машиной, вы не собираетесь проезжать сквозь него. Автопилот решит проехать, потому что не знает, что это препятствие вообще, а примера перевернутого фургона не оказалось в его обучающей выборке (реальный случай с автомобилями Tesla). Как в представляемом методе аналогии образуется понятие препятствия на дороге, перед которым надо остановиться? Есть отдельные факты, которые сильно обобщаются: «Дерево препятствует проезду, шлакоблок препятствует проезду, машина препятствует проезду». Так образуется, с одной стороны, понятие «препятствия», который является общим классом предметов, которые могут быть на дороге и препятствовать проезду. В этот класс по общим признакам с его экземплярами может попасть любой неподвижный и массивный (общие признаки) предмет.
Надо заметить, что название общего класса не похоже на название экземпляров и содержит гораздо меньше общих предикатов с экземплярами класса, чем экземпляры между собой. То есть понятие класса не аналогично экземплярам. Это парадокс может ввести в заблуждение, но интуитивно мы знаем по каким распространенным предикатам образовано общее понятие класса, и именно это позволяет нам связать общее наименование класса с его экземплярами. То есть связь сохраняется от экземпляров к понятию класса, а не наоборот. Мы как бы в дедукции вспоминаем как образовали класс.
Обучение
Человек может начать распознавать новый класс объектов просто по его описанию. Это свойство называется композициональностью, о нем много пишет сейчас Франсуа Шолле [6]. И по его мнению композициональность недоступна нейросетям. По мнению Шолле она доступна нейросетям, иначе не могли отвечать на комбинированные вопросы, которые не встречались в такой виде в обучающих данных. Но уровень общения у нейросетей в силу их архитектуры не очень глубокий, так что они не могут создать такие абстрактные понятия как «препятствие». А обучение во многом построено на композициональности, то есть на построении нового описания явления как варианта известного. Например, описания чего-либо в словарях и в обыденных рассуждениях строятся по четкой схеме указания известного понятия, общего с новым (родового) и отличительной черты нового. Это новая композиция. Например, «осел – это лошадь с длинными ушами». Или, «водопад – это река, падающая вниз» (обыденное объяснение). Как видно из примера, используется общее понятие для объяснения нового, а мы знаем, что общее понятие мы получаем за счет аналогии как показано выше (онтологии).
Но не только это конструирование позволяет нам обучаться и открывать новое. Еще более абстрактный уровень, построенный на аналогии, выводит на верхний уровень абстрактные отношения, наиболее общие и применимые для всех понятий и лексем. Это отношения отрицания, положения относительно друг друга чего-либо, родства и т.п. Причем это такие отношения, которые имеют обратимые отношения в одной схеме, то есть прямое отношения подразумевает возможность обратного (не во всех случаях). Например, положение над и под чем-то. Все предметы в комнате находятся одновременно на полу и под потолком. У женщины есть дочь, и она дочь какой женщины (обратное отношение). Отсюда видно, что такие отношения - это максимальная аналогия, аналогия всех объектов, которые могут быть в комнате, всех женщин, которые кем-то рождены. Это позволяет строить систематические отношения, о которых писали Дж. Фодор и З. Пилишин [7] как об аргументе систематичности, недоступном в коннекционизме. Теперь мы подошли к тому, чтобы объяснить, как это реализуется в языке методами дистрибутивной семантики и аналогии.
Заключение
В описанных выше способах мышления применяется один прием – замена в схеме рассуждения как последовательности предикатов одного из понятий (лексемы) на аналогичное, которое надо объяснить, то есть установить известные из схемы источника отношения между понятиями целевого явления. Это заменяемое понятие задает весь концепт нового целевого явления, что позволяет наложить схему отношений в источнике на него. Замена одного из понятий на аналогичное легко реализуемый [1]. Это позволяет сделать предположение о возможности проверки гипотезы через реализацию.
Сам факт того, что приведенные выше отдельные процессы мышления аналитически могут быть описаны при помощи аналогии, позволяет сделать утверждение, что это не разные способы мышления, а его разные проявления одного способа работы интеллекта. Мы только по разному их называем при проявлении их разным способом. Ведь даже распознавание – это нахождение аналога той схеме предмета, которая уже известна по ранее полученным примерам. Это говорит о фундаментальном характере такого утверждения, в таком выводе и заключается цель этой статьи.
И третье утверждение, следующее из исследования. Для создания аналоги требуется не только структурное сходство хотя бы по одному отношению, но и совпадение прогнозируемого отношением свойства с фактически обнаруживаемым. Это совершенно другой подход «предположение-подтверждение» из опыта, а не просто совпадение по совокупности отношений, что с философской, гносеологической точки зрения имеет принципиальное значение, что будет прослежено в последующих статьях.
Литература
1. Kenneth D. Forbus, Brian Falkenhainer, Dedre Gentner The Structure-Mapping Engine: Algorithm and Examples // Artificial Intelligence, Volume 41, Issue 1, November 1989, Pages 1-63
2. Boicho Kokinov, Alexandrov Petrov Integration of Memory and Reasoning in Analogy-Making: The AMBR https://www.researchgate.net/publication/2593827,
3. Dedre Gentner, Keith J. Holyoak, Boicho N. Kokinov, The Analogical Mind Perspectives from Cognitive Science, - MIT Press, 2000541 pages
4. Francois Chollet, It's Not About Scale, It's About Abstraction, https://youtu.be/s7_NlkBwdj8?si=ENkRbgMZMI84MaJg
5. Jerry A. Fodor, Zenon W. Pylyshyn, Connectionism and cognitive architecture: A critical analysis // Cognition, Volume 28, Issues 1–2, March 1988, Pages 3-71, https://www.sciencedirect.com/science/article/abs/pii/0010027788900315
6. Douglas Hofstadter, Melanie Mitchell, The copycat project: A model of mental fluidity and analogy-making, https://www.researchgate.net/publication/243649607
7. Kenneth D. Forbus, Dedre Gentner, Keith Law, MAC/FAC: A model of similarity-based retrieval // Cognitive Science, Volume 19, Issue 2, April–June 1995, Pages 141-205.
8. Mary Hesse, Analogy and Confirmation Theory // Published online by Cambridge University Press: 14 March 2022, https://www.cambridge.org/core/journals/philosophy-of-science/article/abs/analogy-and-confirmation-theory/
9. Gilles Fauconnier, George Lakoff, On Metaphor and Blending // Cognitive Semiotics 5(1-2), December 2009
10.Douglas Hofstadter, Fluid Concepts and Creative Analogies - Harvester Wheatsheaf, 1995, 250 pages
11.Holyoak, Keith J. & Thagard, P. The analogical mind || American Psychologist, 1997, p. 35-44.