Как стать автором
Обновить
6
0
Александр Головань @InFortis

Психолог, психоаналитик.

Отправить сообщение
Это обзорная статья. Отдельные темы будут раскрыты в следующих.

Полностью описывать семантическую сеть не буду, там много ноу-хау. Но на большинство вопросов постараюсь ответить.

Структура. Вершины — слова или выражения. Соединяются различными видами связей, их 15 для семилетки. Различия в видах определяется спецификой взаимодействия различных вершин в рамках различных задач.

Факты хранятся в виде вершин, соединенных связями. Например, «Зеленый помидор не съедобен» — «Помидор» W «Зеленый» N «Съедобен». ИИ может ответить как на вопрос «Съедобен ли зеленый помидор?», так и на «Какой помидор не съедобен?», «Какие бывают помидоры?» и их варианты.

Это несколько упрощенно. Наверное, будет отдельная статья по семантической сети. С картинками.

Противоречащие факты для семилетки невозможны, он такой конфликт стремится разрешить. Для более взрослого ИИ – конечно. И, конечно, кроме весов достоверности других решений мы не видим.

Генерация абстракции вопрос сложный. Когда полностью оформим этот алгоритм и отладим — напишу об этом. Мы отбрасываем большой массив информации, беря только ту, где ожидание наличия закономерностей высокое. Но согласен, вычислений все равно много.

Сейчас то, что относят к рефлексии для семилетки сделано – это поиск несоответствий (взаимоисключающих высказываний) в имеющейся информации. То, что относят к рефлексии и касается Личности, пока не реализовано. По плану будем делать это для 17-летнего. Т.е. через этап.
Не соглашусь. Как раз скопировать можно.

Вы, скорее, описываете путь воспроизведения филогенеза. Воссоздать условия, в которых формировалась так долго и такая сложная система как психика будет очень трудно. Мы же берем уже сформированное.

Например, что бы построить кинематическую модель опорно-двигательной системы взрослого человека не нужно начинать с простейших. Достаточно сделать МРТ этого человека и провести ряд простейших экспериментов по регистрации динамических параметров. После описания всего в формулах модель готова.

Примерно тоже, только посложнее, мы делаем с высшей нервной деятельностью.

В чем Вы правы, по моему мнению, так это в том, что онтогенез отражать необходимо. Отсюда наш подход по «взращиванию» с детства до зрелости.

Кстати, Мински об этом же: «приличные теории о разуме должны перекрывать по крайней мере три различные временные шкалы: медленную — миллиарды лет эволюции нашего мозга; быструю — недели и месяцы младенчества и детства; и промежуточную — столетия исторического развития наших идей»
Мы сейчас воссоздали структуры, связанные с когнитивными процессами. «Тела» у нас, пока, нет.

Мы занимаемся только высшей нервной деятельностью и готовы осуществить механизм целеполагания. Т.е. сказать, что нужно делать, в каком порядке, какие признаки отслеживать, как реагировать на изменения. Это скорее язык высокого уровня.

А работать с сигналами от датчиков хорошо получается у нынешних решений на НС. Мы готовы состыковываться с подобными системами и решать свою часть задачи.
Мой коллега занимался анализом имеющихся на рынке решений по семантическим сетям. По его словам SMW нам не подошел из-за невозможности отразить большинство из видов связей нашей семантической сети.

Ресурсоемкость низкая, для нынешнего решения кластер не требуется.
Пока с производительностью проблем нет. Для взрослого сеть будет примерно в 20 больше, до 200 000 вершин. Возможно возникнет необходимость оптимизации.

По нашим наблюдениям ребенок уже рождается с некоторой «сетью». Помучились с этим изрядно. Считаем, что нам удалось эту проблему решить.

За мысли спасибо. По вопросу границы между детьми и взрослыми я бы порекомендовал З. Фройда и Пиаже. Они наиболее фундаментальны. Если есть желание заморочиться, то Анна Фройд и Мелани Кляйн.
Работаем мы над этим много лет. Опубликовали, когда сделали. За трендами не очень следим. Меня тоже огорчает подобная «замусоренность» этой темы.
От экспертной системы мы отличаемся тем, что факты не представлены в виде высказываний. Каждый элемент(слово) связан с другими. Их различные сочетания и для различных запросов являются фактами. Отсюда бОльшая гибкость как в обучении, так и конструировании ответов.

Если строить ИИ путем копирования высшей нервной деятельности или, хотя бы, когнитивных процессов человека, то кто кроме нас, психологов, способен это сделать?
Спасибо. Про шаблоны и мышление стало понятнее.

«Играть мальчик машинка» простое высказывание. Наш обученный ИИ его поймет. А вот второй пример, с красной туфлей, увы, лишь частично. Слишком велика неопределенность. Красный каблук у туфли выделит. А вот кто играет – нет.

Про проблему контекста планирую следующую статью. Насколько мне известно математики пытаются ее решить с помощью латентного размещения дирихле. Человек контекст определяет по маркерам присутствующим в ситуации (в тексте). Качественно выделить эти маркеры — отдельная задача. В рамках нашего подхода она решаема.

Про Линкольна – это решение задачи. Он у нас такие решать пока не умеет. Но проблема только в том, что мы его этому не учили. С нынешним уровнем сети и алгоритмов ИИ способен решать подобные задачи. Но я еще подумаю над этим.
Возможно. Но я могу подтвердить свое непонимание или соглашусь с ошибками, если Вы приведете мои конкретные высказывания.

Да, уже после того, как мы это сделали, выяснили, что Мински об этом пути говорил 30 лет назад. Семантические сети применяются, например, в экспертных системах. В ряде задач эффекта не дали. Но каким образом это говорит о нашем непонимании или о наших ошибках?
Нет, терминологию создавали свою, хотя, почти целиком заимствовали. Просто давали определение терминам сами, слишком много в психологии «кто в лес, кто по дрова». Сейчас теория ограничена всеми феноменами, которые доступны в психотерапевтическом процессе.

Есть исключение. Клинику Билли Миллигана не можем объяснить в рамках нынешнего аппарата.
Мы, пока, работаем с письменной речью. Проблема омонимов существует. Если я напишу здесь «Я вижу длинную косу», то как можно определить, о какой именно косе идет речь? Если же это в предложение встретиться в абзаце, то станет понятно из предыдущих предложений. Так наш ИИ тоже понимает.
Против графа работает то, что для ответа Ватсон обрабатывает большой массив истории сети. Если я не перепутал, то в какой-то статье так описывали.
Да, ВАТСОН отвечает на вопросы. Уверен, он может ответить на большее число вопросов, чем наш семилетка. Но делает это совсем по-другому. Там, как раз, нейронные сети. По-моему. И уж ему контекст не под силу именно из-за применяемых методов решения задачи.

Для меня вопрос контекста очень важен. Если можно, подскажите, что в описанном нами решении заставляет сомневаться, что понимание контекста может быть реализовано?
))))
Я в психике своих клиентов наковырялся порядком. Не предвижу у Вашей девушки никаких особо разрушительных структур. То, что у нее есть парень, говорит о ее психическом здоровье.

А личностные особенности мы пока оставляем вне нашей семантической сети. У нас абсолютно средний ребенок. Без каких-либо личностных отклонений, изюминок и пр. В общем, совсем не интересен. Даже скучен.

Есть задумка делать личности известных и не очень людей на базе нашего решения. Вот тогда и обращайтесь по поводу «такой же, но с перламутровыми пуговицами». ))))
Вы правы в том, что омонимы – проблема. Сейчас решаем ее, оговаривая эти случаи при обучении и присваивая второму из слов-омонимов некоторое расширение («девичья коса», «речная коса»). Таким образом избегаем одинаковых вершин. Проблема есть, но я бы ее не преувеличивал.

В семь лет понимает много, но это еще не интеллект взрослого человека. Нет абстрактного мышления и не строит сам новые виды связи.

А вот идея, что наш подход к разработке ИИ не позволит сделать решение, различающее контекст, не понятна. Вы же различаете. В чем вы видите проблему?
))))

Если перед этим обучить ИИ сюжету «Ведьмака» и не сказать ничего о лошади главного героя, то после предложенной Вами реплики на вопрос, «Что ест плотва?» буде ответ «Червяков», а на вопрос «Что ест Плотва?» — «Сено». Имена собственные ИИ уже понимает.

В том то и дело, что «сеть» и алгоритмы, если они построена по образу человеческих, не «ломаются». Если Вы напишите в своей реплике Плотву с маленькой буквы, то ИИ задаст уточняющий вопрос «Плотва это лошадь или рыба?».

Абсолютно согласен, что контекст важен. Пока реализуем его понимание на уровне семи лет.
Ну, что-то Вы точно поняли верно)))

Если хотите боле точного ответа, то дайте определение «механизма мышления/рассуждения», а так отвечу, как понял сам.

Семантическая сеть наполняется из утверждений – разговорной (письменной) речи. Они, утверждения, подчиняются законам речи. Это можно назвать шаблоном. Мне не знакомы языки, в которых таких шаблонов нет.

Вопросы, задаваемые человеку, конструируются по определенным правилам. Их тоже можно считать шаблонами. Наличие этих правил позволяет «вытащить» из семантической сети адекватный ответ на вопрос.

Также функционирует и когнитивные процессы человека, которые мы постарались максимально отразить в наших алгоритмах и структуре сети.

Английский выбрали не из-за простоты, но это приятный бонус. С русским работа по алгоритмам была бы раза в два более трудоемкая. Плюс на русском нет хорошего парсера.

Не очень понял, что именно существует, но все знакомые нам решения не похожи на наше по задачам и функционалу. Если у Вас есть ссылка — буду благодарен. Обязательно изучу и готов подтвердить здесь, если тождественное решение обнаружится.
Насчет прорыва время покажет.

Примеры сети будет в следующих статьях, эта статья обзорная. Примеры элементов сети из вершин и связей между ними в тексте есть, но прописанные словами.

Граф безусловно из слов, в большинстве случаев именно слова используются психикой для идентификации информации. Связи между ними сильно отличаются от грамматических. Они отражают связи, которые устанавливает между феноменами наш ум. А грамматика здесь для возможности анализировать письменную речь, используя закономерности языка.

Касательно «хороших результатах на данных, аналогичных тренировочным». На примере из текста про Рыбу. После него можно сказать, что «Плотва – это рыба». А затем задать вопрос «Где живет плотва?». ИИ ответит «В воде». Этого не было в «тренировочных данных»?

В психике, нашем ее понимании, как раз суть подхода и проекта. Эта семантическая сеть (ИИ) тождественна тому, как хранит информацию человек. Это и дает ИИ как возможность понимать «человеческий» контент, так и возможность говорить понятное реальному человеку. Если изменить в этой семантической сети один ВИД связи, то на выходе, часто, будет околесица.
Я психоаналитик, психолог. Типологиями занимаюсь с 1996 года.
По типологии. MBTI это кривоватое переложение и развитие типологии Юнга. У Юнга гораздо глубже, точнее и эффективнее. Если на то пошло, то Соционика к Юнгу ближе, в эффективности и глубине не уступает. По крайней мере, в моем опыте терапевтической работы. Кроме прочего, проблема в процедуре тестирования. По каждой шкале точность максимум 80%, поскольку шкал 4, то на выходе получаем 0.8*0.8*0.8*0.8=0.4096. Вероятность определения – никакая. В работе мы с коллегами либо останавливаемся на проявленных шкалах (чаще 3 из 4х), либо для ряда задач проводим экспертизу, тогда выходим на типаж с точностью больше 90%.
По обучающей процедуре. Для обучения системы взята невалидная информация. Лучшие из анкет, которые я видел, имеют 60% точность по сравнению с экспертным методом. Я бы предположил, что на сайте-партнере точность на уровне 50% максимум. Почти «угадал-не угадал» ). Брать такую информацию за исходную мне кажется неверно.
По Feature engineering. Моей квалификации хватает только увидеть его корректность.
По процедуре проверки данных. Реакция на баннер в контексте шкал Юнга сильно зависит от того, как содержащиеся на баннере элементы резонируют с каждой из шкал. Например, такие элементы как открытые пространства предпочитаются экстравертами, лаконичность образов – интровертами, эстетическое оформление ценится эмоциональным типом и т.д. Без анализа самих демонстрируемых баннеров трудно оценить таблицу «Оценки CTR».
По выводам. Целиком согласен с описанием перспектив. Единственно предложил бы использовать более точные технологии сегментирования пользователей по психологическим характеристикам.
Возможно, в статье эта мысль получилась немного размытой, но мы считаем, что 17% откликов на рекомендации — это приличный показатель.

Информация

В рейтинге
Не участвует
Дата рождения
Зарегистрирован
Активность