Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Знаки

    Эта работа является продолжением всего сказанного ранее в статье «Нейронные сети, генетические алгоритмы и прочее… Мифы и реальность. Версия II». В большинстве статей, посвященных анализу текстов, которые удалось изучить автору, под анализом текста понимается главным образом две совершенно практические задачи, связанные либо с извлечением какого-либо контекста, либо перевод текста с одного языка на другой. В первом случае речь, как правило, идет или об «очистке» анализируемого контента и сопоставлению какого-либо участка текста эталону в соответствии с заранее заданной таксономией1 каких-либо сущностей. Например, разбор адресов, товаров и т.д. Во втором случае, о поиске соответствия одного блока текста, написанного на одном языке блоку, написанному на другом.


    Объединяющим оба эти варианта является статистический, по сути, анализ участков контекстов, с учетом синонимов слов, устоявшихся выражений. При этом за рамками такого рода анализ выходит анализ троп2, риторических оборотов и много другого. Причина этого кроется в непонимании современной наукой даже на философском уровне некоторых базовых вопросов, связанных с логикой мышления и принятия решения, построения знаковых систем т.е. неразвитость семиотики и т.д.


    С точки зрения статистических подходов, если не учитывать проблемы с постановкой задачи как таковой, налицо нехватка вычислительных ресурсов для отслеживания всех возможных комбинаций, а также анализа семантических структур при реализации разного рода нейронных и прочих комбинаторных алгоритмов. Исключением является анализ относительно небольших смысловых конструкций, таких как адреса, товары и услуги при наличии хорошо проработанного опорного справочника, да и то с не очень высокими показателями точности. Очевидно, что большинство поклонников нейронных сетей и прочего слабого, по своей сути ИИ, могут не согласятся с данным постулатом. Но практика применения переводчика google.com или «Королев» Yandex.ru только подтверждают все вышеизложенное. Количество статей на эту тему как научных, так и не очень огромное количество. Например, «Google Translate: руководство для полного идиота».Некоторый анализ исследований на эту тему представлен в статье «Сравнение технологических подходов к решению задач по извлечению данных». Сама по себе привлекательность тех же нейронных сетей для решения определенного класса задач, не связанных с анализом «смысла» не умаляется ни в какой мере. Задачи поиска статистически значимых закономерностей являются вполне разработанной областью.


    Вернемся к основному вопросу о причинах, по которым сегодня не приходится говорить о каком-либо значимом успехе в анализе текстов. Попробуем наметить основные шаги, которые, по мнению автора, следует пройти прежде, чем мы сможем говорить об анализе текста в полном смысле этого слова.


    Анализируя большинство практических решений в области Data mining и Data Science неизбежно вырисовывается практически одна и та же картина-модель. В этой модели строятся онтологические справочники, добавляются модули морфологического анализа, строится база синонимов как слов, так и устойчивых выражений. Далее, на основании точности и процента найденных соответствий в анализируемом тексте элементам того или иного антологического справочника, строится заключение об эффективности того или иного алгоритма. В этом отношении не имеет решающего значения выбран ли подход, построенный на базе нейронных сетей, «хешевых» алгоритмов или какой-либо другой. Все они опираются на статистически-частотный принцип. В качестве примера хочется привести все участившиеся публикации о том, как нейронные сети смогли «самообучиться» и «познать» новый смысл. В реальности же можно говорить лишь об «обнаружении» не более чем новых групп или элементов сущностей в рамках известных описательных моделей и шаблонов. Принять решение о том, что выявлена новая сущность или класс, а не экземпляр в рамках предварительно описанного класса, такая система не может даже теоретически. Математический аппарат не имеет математики индукции и абстрагирования.


    Поэтому, существующие на сегодняшний день алгоритмы и библиотеки ИИ являются по большей части тупиковой веткой с точки зрения задач «понимания смысла», но, несмотря на это, будут давать неплохие результаты в некоторых областях ввиду «простого» экстенсивного роста как размеченных баз знаний, так и вычислительных мощностей. Все эти победы будут лежать в рамках реализации Интеллектуальных агентов, предназначенных для решения довольно узких практических задач и довольно связаны с решением проблемы создания ИИ-полного механизма.


    В действительности же, понимание смысла текста носит гораздо более сложный характер и связана с такими понятиями как «знак», «смысл», «индукция», «ценность» и многое другое, о чем упоминалось ранее. Настоящая статья посвящена первому из базовых понятий, а именно знаку.


    Понятие знака


    Приступая к обсуждению знака как такового, необходимо сделать некоторые уточнения, связанные с тем, что в действительности необходимо обсуждать сразу три термина, тесно связанных друг с другом. Это «знак», «символ» и «сигнал». Относительно терминологии понятие знака и символа зачастую носит синонимический, характер, сигнал же представляет собой несколько иную сущность.


    По утверждению Ю. Шрейдера3 «вряд ли стоит пытаться точно определить, что такое знак». Но это можно объяснить с точки зрения «знаковой ситуации». Знаковая ситуация – это пара из знака и обозначаемого. Другими словами, знак — это то что используется как «заменитель» чего-либо. При этом в «реальном» мире может не существовать ни знака, ни обозначаемого-денотата. До него Ч. Пирс4
    выделял три типа знака:


    1. Иконический знак.
      Пирс определил его как знак, обладающий известным натуральным сходством с объектом, к которому он относится. То есть его действие основано на фактическом подобии означающего и означаемого (например, рисунок льва и сам лев).
    2. Индекс, действие которого основано на реальной смежности означающего и означаемого (например, стон является индексом ранения, болезни; веселый, жизнерадостный смех — индексом радости, счастья). Индексальные знаки также могут указывать на объект (указание пальцем, стрелкой, окриком). Форма этих знаков не является для референта случайной (в отличие от символов), но и не является прямым повторением формы референта (как иконические знаки). Форма индексальных знаков связана с референтом определенными отношениями — например, причинно-следственными.
    3. Символ, действие которого основано на условной, установленной «по соглашению» связи означаемого и означающего (например, кивок головой, как правило, означает утвердительный ответ, однако, у некоторых народов это движение характеризуется как ответ отрицательный). Здесь мы видим, что связь между означающим и означаемым обозначает не отдельный предмет или вещь, а род вещи и зависит от менталитета той или иной культуры.

    Своего рода продолжением такой типизации является определение данное Ю. Лотманом5, В его понимании «символ» в плане выражения, и в плане содержания всегда представляет собой некоторый текст, то есть обладает некоторым единым замкнутым в себе значением и отчетливо выраженной границей, позволяющей ясно выделить его из окружающего семиотического контекста. При этом, далее Ю. Лотман, дает пояснение, уточняющее положение «символа» внутри всей совокупности знаков. Тем, что символ обладает иконическим свойством «определенным подобием между планами выражения и содержания»6. Таким образом, можно высказать предположение, что «символ» — это своего рода подкласс «знаков», тесно связанный прежде всего со своим представлением в виде текстов или аудиозаписей, но не являющийся графическим символом, иначе говоря связь только смысловая, представляющая собой своего рода намек.


    Мысль о том, что текст — это прежде всего сигнал переданный от одного адресата другому впервые высказана еще в начале прошлого века еще Ч. Моррисом7. В дальнейшем была замечательно развита, например, А. М. Пятигорским8
    в его работе «Некоторые общие замечания относительно рассмотрения текста как разновидности сигнала». Вот некоторые из его тезисов:


    «В лингвистике текст – это определенным образом ограничиваемое разнообразие сигналов… Другим резоном в пользу отнесения теории текста к науке о сигнале, а не о языке может послужить то обстоятельство, что значительная часть текстов (идеографические некоторые иероглифические и т.д.) может быть вообще не связана с конкретным языком».


    «Текст создается в определенной, единственной ситуации связи – субъективной ситуации, а воспринимается в зависимости от времени и места в бесчисленном множестве ситуаций».


    Далее Пятигорский пишет, что текст есть по своей сути некий «акт поведения автора, определенным образом им же самим физически объективированный и внутренне обусловленный, а его создание – как такая разновидность поведения, содержанием которой является описания»


    «Для всякого акта семиотического осознания существенным является выделение в окружающей действительности значимых и незначимых элементов. Элементы, не несущие значения, с точки зрения системы моделирования как бы не существуют.»9


    Таким образом, любой поток информации и текст по мнению ряда авторов необходимо рассматривать прежде всего, как сигнал, который должен вызвать у получателя какую-либо реакцию.


    Контекстность. По меткому выражению того же Ю. Лотмана, каждый текст имеет свою «аудиторию», обладающую некой общей памятью. Таким образом, задача анализа текста осложняется еще и тем, что «анализатор» должен правильно предсказывать целевую группу потребителей текста.


    На практике ситуация обстоит еще «хуже», по мнению ряда авторов, любой текст строится на основании «образов-моделей, имеющих синкретическое10
    словестно-зреительное бытие»11, включая смешение и столкновение контекстов в целях риторического усиления смысла. В случае текстов, предназначенных для широкой аудитории задача правильного выбора контекста и набора кодов может быть частично решена путем анализа терминологии, устоявшихся выражений и т.д. В случае же частной переписки, поиск правильного семиотического поля представляет собой практически нерешаемую задачу, требующую глубокий анализ истории отношений корреспондентов, построение их собственной структуры кодов, включая тропы, «собственные», выдуманные ими слова т.д...


    Структура знаковых систем


    Структуру знаковых систем представляет собой многогранное и многоуровневое явление. К наукам, которые можно охарактеризовать как разделы семиотики можно отнести синтактику, семантику, прагматику, лингвистику, риторику, культурологию и ряд других. К междисциплинарным наукам, затрагивающим сферу интересов семиотики можно отнести культурную антропологию, этносемиотику и этнографию, историю, философию, математику и т.д.


    На нижнем уровне можно говорить о структуре знака, на среднем о семантических и семиотических структурах. На высшем уровне — о семиосфере в целом.


    Впервые о структуре знака заговорили Г. Фреге, Ч. Огден и А. Ричардс12, Де Соссюр13, Ч. Моррис и ряд других авторов еще в 1920-х годах. На эту тему существует огромное количество работ, например, работы Шрейдера14, или статьи в Русском журнале и многих других, повторять которые в рамках данной статьи не имеет смысла. Остановимся кратко лишь на треугольнике Фреге:




    Все эти работы объединены анализу взаимосвязи знак-концепт-денотат. Где концепт – это информация, которую знак несет о возможных денотатах15, а денотат — это то что обозначается. Ч. Моррис выделяет дополнительное абстрактное понятие – десигнат. В его понимании десигнат – это не вещь, но род объекта или класс объектов, а класс может включать в себя или много членов, или только один член, или вообще не иметь членов16. Понятие же знака, описано выше. Таким образом любой текст можно рассматривать двояко: с одной стороны, это некая суперпозиция знаков, а с другой — их концептов, в отдельных случаях весь текст и будет являться знаком целиком.


    Гораздо неоднозначнее все обстоит с определением отношений знак-сигнал. Как уже упоминалось выше, в работах таких исследователей как Ч. Моррис, А. Пятигорский, Р. Якобсон одним из приоритетных посылов является тот факт, что любой текст прежде всего следует воспринимать как сигнал. Если в начале прошлого века этому уделялось большое значение, то сегодня в угоду задач перевода и извлечения данных львиная доля исследований посвящена синтагматическому и семантическому анализу, построению разного рода тезаурусов.


    Все что на сегодняшний день упоминается в связи с сигналами – это то что, часть знаков можно отнести к сигналам или в терминологии Ч. Пирса – индексам. В реальности же картина совершенно противоположна – знаки есть часть сигнальной системы. Если внимательно отнестись к анализу пары знак-сигнал, то мы переходим к совершенно иной области исследований связанную с дополнительными по отношению к знаку свойствами сигнала.


    Сигнал:


    К основным признакам сигнала можно отнести следующие:


    • Имеет физическую сущность в виде канала распространения.

    Согласно предложенной А. Пятигорским концепции текст обладает такими базовыми характеристиками как пространственность, время и объектность. Под пространственностью понимается как сам факт наличия носителя информации, так как его форма. Форма может иметь существенное значение. Например, письмо и газетная вырезка имеют совершенно разную чувствительность к оценке и интерпретации смысла текста.

    • Канал служит для передачи невербальных и вербальных знаков.

    Чаще всего, говоря о понимании смысла мы оперируем задачами анализа текстов или распознавания эмоций на лице человека. Эти задачи по сути сводятся к двум довольно изолированным каналам – текстам и изображениям.

    • Предполагается ожидание обратной связи – реакции.

    Причина возникновения любого сигнала – это потребность или необходимость получения какой-либо реакции. Она может иметь целью установление обратной связи, а может иметь и односторонний характер. Но наличие какой-либо реакции является обязательным условием.


    • Точность соответствия реакции может варьироваться.

    Варьирование точности реакции является функцией, зависящей от таких параметров как наличие шума, наличие общей множественности понятий, ассоциативных рядов. Все это можно выразить обобщенным понятием общего (одинакового) предыдущего опыта. При этом под шумом надо понимать не истинность или ложность потока знаков, а скорее его взаимная непротиворечивость знаков. Данная проблема усугубляется наличием троп и риторических оборотов в целом, которые не является выпадающим контекстом. Они служат для усиления потока сигналов.


    • сила и качество воздействия сигнала;

    Свойство силы и качества воздействия зависит многих факторов, но главным образом от наличия общего опыта, состояния адресата на момент получения сигнала и совокупности знаков, по средствам которых передается сигнал. Кроме того, следует учитывать «плотность» и скорость передаваемого потока знаков, ограничивающих предел восприятия, и силу эмоционального воздействия, ограничивающего возможности психики, в случае адресата-человека.


    • эмоциональная окраска;


    Сама по себе тема эмоций безгранична. В рамках задач текущего исследования, представляет интерес два вопроса. Является ли эмоция самостоятельным сигналом? Имеет ли она сама по себе знаковую природу, т.е. имеются ли концепт и десигнат? Является ли эмоция свойством знака или одной из характеристик канала передачи сигналов? Ввиду ограниченности самого формата статьи ограничимся лишь утверждением, что эмоция — это как минимум полноценный сигнал, с неочевидной знаковой природой. Эмоциональная окраска является характеристикой канала, меняющейся во времени в рамках процесса работы канала.


    Часть вышеуказанные признаков в той или иной мере перекликаются с хорошо известной теорией сигналов в теории информации.


    Семиосфера – среда обитания знаков


    Термин семиосфера17 был введен Ю. Лотманом, по аналогии с биосферой В. Вернадского, как общее культурное пространство, включающее язык как его часть.

    Семиотическая система, согласно Лотману, обладает бинарностью, асимметричностью и неоднородностью. Принцип бинарности предполагает, что любой язык (семиотическая система) рано или поздно подвергается раздроблению на другие языки (системы). При этом, надо учитывать наличие и обратного механизма – унификации. В результате появляются новые языки искусства с одной стороны, и возникают новые каноны с другой. Принцип асимметричности говорит о том, что такое дробление происходит в разных пропорциях. Принцип неоднородности говорит о том, что в рамках семиосферы могу существовать структуры совершенно различной природы. Упрощенно, в качестве таковых могут выступать разного рода мемы, локальные понятия об истинности тех или иных высказываний, различные означивания одних и тех же концептов и денотатов и многое другое. В результате могут возникать ситуации как частичной, так и полной непереводимости.


    Исходя из всего вышеизложенного, напрашивается вывод, что не существует некой единой семиотической структуры или каких-либо изолированных систем. В противовес этому следует говорить о наличии глобальной семиосферы, представляющей собой некую «суперпозицию» различных семиотических систем.


    Модели обмена.


    Построение модели канала коммуникации является одной из важнейших задач, без решения которой невозможно провести анализ процессов в ходе которых происходит обмен сигналами, и знаками, в частности.


    Одной из первых коммуникационных моделей была предложена Р. Якобсоном18. Данная модель представляет собой следующую абстракцию19:





    Позже была предложены другие, по сути, расширенные модели. Например, «театральная модель» Ю. Кристевой20: «автор-адресат-другие-ситуация».


    Все эти модели указывают, что сама по себе любая из моделей кроме того, что оперирует общими понятиями адресата и получателя, сильно зависимы от таких понятий как «контекст». По утверждению Ю. Кристевой21, одной из базовых проблем в анализе передаваемого содержания является отсутствие Единственного смысла, а следовательно, и отказ от самой возможности однозначной интерпретации. Искажение или различия в трактовках смысла обусловлены отказом в праве субъекту-автору в «сакральности», «магии» и «эффекту».


    Под «сакральностью» понимается отсутствие в самом праве на Единственный смысл. Под «магией» — невозможности охранить субъекта от доминирующей семиосферы, т.е. от возможных изменений трактовок в тех или иных семиотических систем.


    С точки зрения темы статьи наличие этих моделей указывает, на тот факт, что проектировать придется не только сам канал как таковой, но и реализовывать, например, такие подсистемы как:


    — сетевые базы-графы знаков, которые сами по себе могут быть инкапсулированы друг в друга;


    — групп субъектов (адресатов и получателей)


    — сетевые модели возможных контекстов.


    Омниканальность22


    Большинство работ, связанных с семиотикой и семантикой оперируют такими понятиями как изолированные с точки зрения анализа текст или изображение. Но без исследования эффектов, который накладывает наличие большого количества параллельных и взаимоинтегрированных потоков говорить о полноценном ИИ не приходится, даже в задачах «простого» анализа текстов. При передаче информации, например, учебные фильмы, курсы лекций и т.д. одновременно присутствуют и текстовые, и аудио- видео- потоки информации.


    До сегодняшнего времени автору не попадались сколь значимо серьезные работы на эту тему.


    Выводы


    Данная тема представляет собой огромный пласт вопросов, детальное обсуждение которых невозможно в рамках отдельной статьи. Поэтому, основной задачей было показать основные блоки, без реализации которых дальнейшее продвижение попросту невозможно.


    Существующие решения, из тех, что известны автору на данный момент, либо вообще игнорируют проблему знаков, либо имеют сильно упрощенный подход к задаче анализа и оперирования знаками.


    Для дальнейшего продвижения необходимо решение следующих инженерных задач:


    1. Создание единых комплексов баз и правил оперирования, объединяющих различные классы знаковых систем таких как текстовые, графические, видео и аудио знаки. Данные комплексы должны включать в себя такие подсистемы как знаки, концепты и денотаты в разрезе культурных, профессиональных, исторических и ряда других измерений.
    2. Создание баз и типов субъектов-адресатов с учетом измерений, указанных в предыдущем пункте.
    3. Создание баз взаимосвязей семиотических структур, а не только блоков взаимосвязанных текстов и разного рода тезаурусов.
    4. Создание баз и правил порождения и оперирования в целом эмоциональным воздействия знаков.
    5. Создаваемая система должна в обязательном порядке учитывать проблему омниканальности, даже в случае оперирования в рамках только одного из каналов.
    6. Отказ от попыток получения единственного смысла в пользу построения скорее вероятностных результатов, характерных для той или иной семиотической структуры, интерпретация которых кумулятивно зависит от предыдущих проанализированных контекстов, включая смежные.
    7. Понятие верности и ложности высказываний, сформированные суперпозицией утверждений, образованные знаками являются достоверности только в разрезе одного момента времени. Следовательно, должны быть реализованы подсистемы мониторинга и анализа таких суперпозиций. Разработаны модели корректирующие основной поток выводов.

    Ссылки

    1ТАКСОНО́МИЯ- наука о классификации сложных объектов действительности (живой природы, строения Земли, этнических общностей, языка и др.) Толковый словарь Ожегова. С.И. Ожегов, Н.Ю. Шведова. 1949-1992.

    2ТРОПЫ (от греческого tropos - поворот, оборот речи), 1) в стилистике и поэтике употребление слова в образном смысле, при котором происходит сдвиг в семантике слова от его прямого значения к переносному. На соотношении прямого и переносного значений слова строятся три вида троп: соотношение по сходству(метафора), по контрасту (оксиморон), по смежности (метонимия). Различные способысловопреобразований (от слова к образу) являются важным элементом художественного мышления. Нарядус главными видами троп выделяют также их разновидности (ирония, синекдоха, гиперболалитотаэпитети др.). 2) (Музыкальное) в григорианском хорале вставка (или серия вставок) в каноническое песнопение - текстовая или бестекстовая. Современная энциклопедия. 2000.

    3 Шрейдер Ю.А. Логика знаковых систем: Элементы семиотики. Книжный дом «ЛИБРИКОМ»,2012. Стр. 4

    4 textb.net/51/18.html

    5 Лотман Ю.М. Внутри мыслящих миров. Издательство Азбука, 2015. С.158

    6 Лотман Ю.М. Внутри мыслящих миров. Издательство Азбука, 2015. С.171

    7 Ch.Morris Fundations of the theory of Sings. Chicago, 1938 г.

    8 А.М. Пятигорский “Некоторые общие замечания относительно рассмотрения текста как разновидности сигнала». Структурно-типологические исследования. Сборник статей. М.: Издательство Академии Наук СССР, 1962 Стр. 144-154

    9 Лотман Ю.М. Внутри мыслящих миров. Издательство Азбука, 2015. С.90

    10 Синкретический — филос. состоящий из разнородных элементов, но являющийся целостным.

    11 Лотман Ю.М. Внутри мыслящих миров. Издательство Азбука, 2015. С.127

    12 C. K. Ogden and I. A. Richards, The Meaning of Meaning subtitled A Study of the Influence of Language upon Thought and of the Science of Symbolism, 1923, Magdalene College, University of Cambridge, p. 11

    13 Соссюр Фердинанд де, Курс общей лингвистики: Изданный Ш. Балли и А. Сеше при участии А. Ридлингера. Пер.с фр. / Под ред. И с примеч. Р.О. Шор., Книжный дом «ЛИБРИКОМ», 2016.

    14 Шрейдер Ю.А. Логика знаковых систем: Элементы семиотики. Книжный дом «ЛИБРИКОМ»,2012.

    15 Шрейдер Ю.А. Логика знаковых систем: Элементы семиотики. Книжный дом «ЛИБРИКОМ»,2012. С.10.

    16 Ch.Morris Fundations of the theory of Sings. Chicago, 1938 г.


    17 Лотман Ю.М. Внутри мыслящих миров. Издательство Азбука, 2015. С.176

    18Jakobson R. Lingustics and Poetics. Style in Linguage. Cambridge, 1964. P. 353

    19 Лотман Ю.М. Внутри мыслящих миров. Издательство Азбука, 2015. С.30

    20 Кристева Ю. Семиотика: Исследования по семанализу. Академический проект,2015.

    21 Кристева Ю. Семиотика: Исследования по семанализу. Академический проект,2015. С 13.

    22 Термин «омниканальность» введен автором по аналогии с понятием омниканальности принятым в маркетинге.

    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 34

      0

      Название статьи вводит в заблуждение. Это же хабрахабр, а не гиктаймс. Здесь статьи обычно имеют прикладной характер.

        0
        > задач, не связанных с анализом «смысла»
        ============================
        Правильно я понимаю, что науке до сих пор неизвестно, что такое Смысл, и в каком виде он должен храниться?

        Насколько я понимаю эту тему, смысл — это просто эталонная знаковая система (инстинкты или там или программа судьбы), а мозг — действительно статистическая машинка, которая все воспринимаемое пытается сравнивать с эталоном, и формирует реакции в случае совпадения / несовпадения. На животных это так, а эксперименты на человеческом мозге, увы, теперь запрещены. Но если смысл — это просто эталонный алгоритм, то действительно, остается лишь наращивать вычислительную мощность и базу эталонов, что никак не приближает к пониманию — кто и как формирует эти самые эталонные алгоритмы, то есть смыслы.
          0
          Вполне известно. Смысл — это связь между некоторым X и Y. Т е смысл является синонимом связи на семантическом уровне. На бытовом несколько иначе.
            0
            Нет, там человек писал про это как гиперболу, думаю
              +1
              Точно! Но тогда рушится определение меры информации — хоть по шенону хоть по колмогорову, то есть невозможно определить — сколько в данном тексте информации, не обладая полным знанием всего человечества. А если у тебя ограниченные знания — то и смысл для тебя обрезается. То есть мера количества информации (смысла) зависит от субъекта, читающего текст! Это полностью обнуляет возможность научного подхода, в котором декларируется объективность, то есть разделение наблюдаемого и наблюдателя. Именно поэтому психология до сих пор не наука, а искусственный интеллект до сих пор не интеллект.
                0
                Верно.
                1. Поблема понимания термина «искусственный интеллект», по крайне в русском переводе, хотя бы потому что мы изначально неверно перевели то, что сегодня понимается под AI. Правильный перевод — это интеллектуальные вычисления. И тогда многое встает на свои места. И те же нейронные сети сразу обретают свое законное место. Интеллектуальные вычисления.

                2. Да, психология имеет дело с наблюдаем и наблюдателем. Это одна из базовых проблем полного ИИ. И она продолжается вопросом — а возможен ли тот же в действительности объективный сверхразум? Или мы получим того же, но только более быстро рассуждаемого, субъекта со своими тараканами. А будет ли он тогда сверхразумом? Я даже не говорю о полезности как таковой для человечества. А вообще — не свернет ли он с дорожки в сторону или погружения в дзен или погибнет под своими же страстями. А возможна ли абсолютная объективность в принципе. Пусть даже в некоем идеальном искусственном мире?
                  +1
                  > А возможна ли абсолютная объективность в принципе
                  ======================
                  Хороший вопрос. Если человечество замкнутая система, то абсолютная объективность — это максимум накопленного знания, относительно которого измеряется уровень всего остального, проблема в том, что точка отсчета все время «плывет», но в физике эта проблема ведь решена в СТО, где нет неподвижного пространства, почему в информатике нельзя сделать так же, задекларировав например «максимальную скорость думания»?

                  Вся эта идея с самообучающеся замкнутой системой, стремящейся к полному знанию, она противоречит второму началу термодинамики, и пока ни один физик мне внятно не объяснил — как может эволюционировать замкнутая информационная система, если замкнутая физическая всегда деградирует. Ссылаются на приток солнечной энергии и гравитацию, но пардон, тогда наша система незамкнута, и внешним эталоном смысла (информации) действительно выступает некий бог. Но тогда круг замыкается, так как этому богу негде жить.
                    0
                    А может быть, просто не ставить такой цели-абсолютная истина? Есть пул вполне практических задач, где ИИ, что бы под этим не понимали, может быть полезен. Собственно в этом одна из задач серии моих статей. С одной стороны я хотел показать сложность задачи и подчеркнуть ее комплексность, с другой пытаюсь ее систематизировать, переводя в по возможности, в инженерную плоскость. И конечно же, привести ее к реальным задачам, в которых бог «непричем». Так как нет самого эталона, как Вами верно замечено.

                    Мы можем создать в ДОСТАТОЧНОЙ СТЕПЕНИ интеллектуальные системы, без перехода к идее трансцендентного разума. Такие системы могут быть полезны.
                    На счет «максимальную скорость думания», то думаю ее незачем декларировать, думаю, это вполне вычислимая величина, как физические константы. Скорость и плотность потока интеллектуально-эмоционального потока есть, пусть как и в теоретической физике, где все оперирует моделями — величина осознаваемая и предельная. Как, например, скорость света. Грубое, конечно, сравнение-но как гипербола сойдет. В общем, к и любая систем, ИИ — ограниченная объективными законами системами, без искусственных ограничений, конечно же — это нельзя не регулировать обществом, но, «законы природы», так скажем, будут вносить необходимые коррективы. Мне это кажется верным подчеркнуть в противовес активному продвижению идеи суперразума.

                    Подход к знакам, с четки выделением такого понятия как «сигнал»,«канал», «ониканальность», «суперпозиции систем» и т.д., в противовес абсолюной иерархии с верхушкой в виде «абсолютного эталона», как раз и переформируют постановку задачи. Собственно в этом один из главных целей статьи.

                      0
                      > «сигнал»,«канал», «ониканальность», «суперпозиции систем»
                      ===============
                      Удивительно, но это все термины из нейро-физиологии. Есть такая дисциплина — эволюция мозга, там рассказывают что сначала были отдельные каналы (зрение, обоняние), потом возникли ассоциативные зоны, где каналы пересекались, это еще в лимбическом мозге, а потом уже в неокортексе сумма каналов стала обобщаться до символа. И куча экспериментов с рептилиями, мышами и собаками. Айтишники пройдут этот же путь, и на выходе получат тоже собаку :)))
                      PS
                      Кстати, галюцинации от ЛСД объясняются именно электрическими наводками одного канала на другой, и человек начинает слышать запах, или видеть вкус, омниканальность в действии…
                        0
                        Очень близко к теме.
                  +1
                  «То есть мера количества информации (смысла) зависит от субъекта, читающего текст!»
                  В том числе. Прагматика — это раздел семиотики, и это там не секрет.
                  «Это полностью обнуляет возможность научного подхода, в котором декларируется объективность,» — вообще нет. Есть знание оторванное от воспринимающего субъекта. Объективное, идеализированное (в дебри вдаваться не будем ибо тема тянет на отдельную книжку), а есть субъективное, которое у субъекта. И то и другое исчислимо методами алгебры и геометрии. Психология классическая не строгая наука. Однако же есть по меньшей мере 1 труд, который подводит под нее строгий фундамент. (Акофф Эмери, О целеустремленных системах). К сожалению психологами проигнорирован.
                    0
                    В целом согласен, кроме того, что признание чего-то объективного и идеализированного приводит к необходимости бесконечного восхождения в объективности. На счет вычислимости -и да и нет. Если брать какую-то модель -то да. Она сама по себе ограничена и тут все нормально. В рамках модели-можно и нужно строить математику. Собственно, об этом, в том числе, и идет речь. Но, к сожалению, сегодня мы имеем в основном дело с задачами «Смысл — это связь между некоторым X и Y.». Это нормально в ряде прикладных задач. Но это никак не связано с задачами создания ИИ в полном виде. На счет книги-спасибо за наводку. Найду. И еще Матурана неплохо написал на эту тему об автопоэзисе.
                      +1
                      «Но это никак не связано с задачами создания ИИ в полном виде.» На мой скромный взгляд это единственный рабочий подход. Вот здесь об этом подробнее
                        0
                        Почитал. Очень интересная работа. Направление мышления в нужную сторону. Но пока ей не хватает именно семиотической составляющей. Решения тех проблем, о которых я написал, недостаточное внимание к знаковым системам, они пока идут от языка. Но, судя по всему они на верном пути. По крайней мере их желание отобразить модель функциональных элементов организма при реализации поискового движка в медицине — абсолютно верное направление. Так что соглашусь, очень интересная работа.
                          +1
                          Они- это я. :) «Но пока ей не хватает именно семиотической составляющей.» В моем понимании она (ТАИС)от головы до пят семиотическая. Разве что мы разные книги по семиотике читали.
                            0
                            То что вы делаете-замечательный проект. Но все ж у вас скорее семантический, а не семотический анализатор. Пока семантический, но мне кажется, усилить именно семотическую составляющую необходимо. И я так понимаю вы начали это делать. И это здорово. Все таки, семитика это про знаки, образы, если угодно.
                              0
                              на этом все и работает:) знаки и образы имеют соответствия в реальном языке (к словам и фразам). а правила задают отношения между ними, точные и непоколебимые в текущем состоянии конкретного языка:)
                                0
                                Значит вам надо обновить описание :)
                                  0
                                  Позволю себе поспорить. Во-первых, знаки и образы далеко не всегда имеют соответствия в реальном мире. Во-вторых, точных и непоколебимых нет. Это все очень многослойно, даже " в текущем состоянии конкретного языка". Собственно я об этом и пишу в статье. Это как раз одна из базовых проблем.
                                    0
                                    если знак осознаваемый (присутствует) в вашей (моей) голове (компьютере, НЛО) то он имеет соответствие как минимум к тому как он трактуется вашей (моей) головой и сл-но имеет соответствие в реальном мире, к коему несомненно принадлежит ваша (моя) голова. проблемой это не является, тем более базовой. ИМХО разумеется.
                                      0
                                      Знак присутствует именно в вашей голове и обусловлен ВАШИМ опытом.
                                      Знак далеко не всегда соотносится с реальным миром, есть еще, скажем так, например «мифологическая» составляющая, на которую указывает та же Кристенева в своих работах.
                                      И это является как раз одной из основных проблем.
                                        0
                                        Философские дебри меня мало занимали. Я практик и логик.
                                          0

                                          К сожалению, это не философские дебри.

                    0
                    А если попробовать описать смысл как степень соответствия данного текста некому стеку эталонных смыслов — мы математически приходим к предельному случаю — смысл всей ноосферы и есть бог, ну как абсолютный ноль и бесконечность — абстракция, необходимая для сходимости уравнений. В такой трактовке эталон == человечество == бог, и вот сдесь уже возможна точная наука, так как очевидно, что знания человечества хоть и предельны, но неполны, и они могут дать необходимую метрику (точку отсчета).
                      0
                      Надо подумать.
                        0
                        Так вообще то и работают системы строгого семантического анализа. И да, в них можно строго вычислить отличие/сходство бога с нулем или черта с бубликом.
                          0
                          Не надо вычислять бога с нулем. :) Вот вопрос строгости вызывает у меня беспокойство. То что вы делаете, это, если я правильно понимаю, прикладная задача в условиях ограниченных вычислительных ресурсов. Я нисколько не умаляю ваш подход к решению прикладной задачи медицинского ассистента. Я бы тоже выбрал «строгий», метод. И я думаю, он даст неплохие результаты. Но это частный контекст. И я думаю, что используя ваш движок, можно прийти к решению в других областях. Но возникает несколько вопросов, ответы на которые я не увидел в описании и на которые я указываю в статье как необходимые:
                          1.Как учитываются ментальности разных групп людей. Поисковый запрос врача и водителя будет разный?
                          2.Как учитывается омниканальность?
                          3.Как учитывается эмоциональное состояние и характер вопрошающего?
                          4.Существуют в рамках вашего движка реализация разных семиотических систем, связанных с разным предыдущим опытом?
                          5.Допускается ли кардинальная разность выводов?
                          И тд. Посмотрите мои выводы.
                          P.S. Еще раз ваш подход абсолютно уместен и правилен при наличии большого ряда ограничений. И он вполне рабочий в прикладном использовании.
                            0
                            «Не надо вычислять бога с нулем. :)» Норм. тест семантической системы. Если она не может это вычислить она дефектна при условии что понятия бог и ноль там присутствуют. 1)в Селанге есть контекст говорящего и слушающего (воспринимающего). К нему могут быть пристегнуты любые характеристики, которые вводят условность информации с любой стороны. 2. не знаю как это с чем то соотносится. в рамках модели каждый знак уникальный и имеет одно значение. Слову могут соответствовать множество знаков. Контекст и окружение обычно определяют правильный вариант. если однозначно не определен берется самый вероятный первый. 3). см.1 4). не имеет отношения ввиду п.2. 5). выводы ессно могут быть альтернативные так как интенсивно используется нечеткий вывод и на числах и на утверждениях. с ЕЯ без этого никак. P/s ограничения не мешают при разработке практических приложений. Когда такие находил — правил теорию.
                              0

                              Сильно упрощенный подход, могу ошибаться, но думаю это будет сильно ограничивать развитие вашей модели в будущем.

                                +1
                                Обещаю отписаться, если найду ограничение :)
                      0
                      .
                      0
                      В том-то и дело, что не совсем так. Это весьма упрощенное понимание, но не лишенное смысла (прошу прощения за возможную тавтологию) в рамках разработки ИИ-полных систем. Понимание смысла-как набор неких эталонов это именно то, на что сейчас направлено большинство усилий. И Вы правы-рост мощностей сильно в этом помогает. И есть огромный пласт задач, где этого в общем-то и достаточно.

                      Если не брать в расчет общечеловеческое стремление к поиску абсолютной Истине, что находится за рамками прикладных задач, то с инженерной точки зрения смысл, как мне кажется, это (упрощенно) некое оптимальное в данной ситуации решение по достижению какого-либо нового более оптимального состояния системы. Я здесь специально не употребляю термин «цель». Мне кажется, что «эталон» не существует в принципе, даже как абстракция. Есть суперпозиции, скажем так, «положения вещей».

                      Знаки — это не более чем часть системы, еще важно правильное оперирование ими. Вторая проблема — это сам эталон. Так как он разбивается не только на знаки, но и концепты и суперпозицию знаков в рамках той или иной семантической структуры и смежных систем. Кроме того, нельзя забывать о такой вещи как «качество», которое само по себе не так просто как кажется.

                      На тему «смысла», «качества» и что это такое я готовлю следующие статьи.
                        0
                        И все же статья знаках и их роле. О смысле будет позже.
                          0
                          под анализом текста понимается главным образом две совершенно практические задачи, связанные либо с извлечением какого-либо контекста, либо перевод текста с одного языка на другой.

                          Еще есть отдельная задача генерации текста, которая включает в себя анализ — всякие там боты и пр.
                          Является ли эмоция самостоятельным сигналом?

                          Я бы сказал больше: эмоции — это то, что служит основой для знаков. Или способствуют порождению знаков.
                          Вообще эмоциям уделяется неоправданно мало внимания. То что вы тут приводите — классическое семиотическое описание коммуникации. Теория, ес-но, не нова. Но, к сожалению, до сих пор полезна разве что для умозрительных построений, практически мало осуществимых. Поэтому, как мне кажется, нужна какая-то другая идея. Конечно, можно работать в рамках динамически меняющегося во времени денотата. То есть можно, скажем, построить Марковскую сеть всех знаков (связанный сложный граф) и для каких-то случаев это хорошо заработает. Но связи в языке не статичны, а находятся в постоянной конкуренции друг с другом. И эту динамику как раз и задают эмоции. Как это смоделировать в ИИ — пока не знаю. Да, и понятно, что это в равной степени касается как генерации, так и анализа текста.

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое