Четыре шага на пути к Скайнет / Хабр

В канун Нового года принято подводить итоги и строить планы на будущее. Вот и мы решили не нарушать традицию и внести свой вклад в общий тренд.

Все мы сейчас часто слышим словосочетание «искусственный интеллект». Интернет, телевидение, реклама – отовсюду на нас обрушивается лавина информации. Бытовая техника с искусственным интеллектом, голосовые помощники в телефоне. Нам обещают, что искусственный интеллект решит все наши проблемы и сделает нашу жизнь лучше.

И мы решили оценить, насколько на самом деле разумны существующие системы ИИ, и можно ли их вообще назвать интеллектом.

В настоящий момент искусственный интеллект принято делить на два типа – слабый/узкий ИИ и сильный/общий ИИ (в литературе он часто обозначается как AGI).

Узкий ИИ – это алгоритмы, созданные для решения одной конкретной задачи. Например, распознавание образов, оценка заемщика в банке или перевод текста. Такие алгоритмы мы не будем рассматривать в этой статье – у них свои рейтинги и критерии качества.

Сильный или общий ИИ – это алгоритм, или набор алгоритмов, способный действовать в условиях неопределенности и находить решение задач, на решение которых он не был изначально запрограммирован.

О чем думает обычный человек, когда заходит речь об искусственном интеллекте? Скорее всего, он представляет систему, которая общается с ним приятным женским голосом, выполняет его задания и отвечает на вопросы. В большой степени, этот образ сформирован фантастическими фильмами. Например, система Скайнет из всеми любимого фильма «Терминатор» с Арнольдом Шварценеггером.

Что в нашей повседневной жизни наиболее близко к этому представлению? Правильно – голосовые помощники: Ok, Google, Alexa, Siri и так далее.

Мы хотим оценить то, насколько существующие голосовые помощники близки к общему искусственному интеллекту, например, к той самой Скайнет (как мы ее себе представляем).

Вы можете сказать – «Зачем изобретать велосипед, все уже придумали до вас. Есть же тест Тьюринга в различных его вариациях».

Тест Тьюринга есть – это правда. Но:

1. Периодически в интернет появляются сообщения, что та или иная система прошла тест Тьюринга. Но, при ближайшем рассмотрении, оказывается, что тест пройден не за счет интеллекта системы, а за счет хитрости и актерского мастерства ее создателей. Система отвечала на большинство вопросов общими правильно построенными, но заранее заготовленными фразами. Поэтому сейчас многие специалисты скептически относятся к тесту Тьюринга как к достоверному критерию при оценке систем ИИ.

2. Тест Тьюринга имеет две градации – «пройден» или «не пройден». Мы же хотим определить более подробную шкалу для оценки текущих и будущих возможностей ИИ.

3. Сама постановка задачи в тесте Тьюринга вызывает вопросы. Почему искусственный интеллект должен маскироваться человеком чтобы доказать свои мыслительные способности?

Вы верите в инопланетян? Я верю. Достаточно теории вероятностей, чтобы сделать вывод, что среди миллиардов планет во Вселенной где-то есть жизнь. И, если мы когда-нибудь встретимся с инопланетянами, то их интеллект, логика и мыслительные способности будут отличаться от наших. Более развитыми или менее – я не знаю, но другими.

На наш интеллект повлияли многие факторы, как общие (процесс эволюции человека, наша история), так и уникальные для каждого из нас (окружение в котором мы выросли, чем занимались в детстве и так далее). Компьютер свободен от большинства из этих ограничений, и его интеллект наверняка будет другим.

Поэтому тест Тьюринга для оценки когнитивных (мыслительных) способностей ИИ нам не подходит. Кстати, я не уверен, что все «естественные» интеллекты (то есть, люди) смогут пройти этот тест :)

Если мы хотим проверить интеллект компьютера, то проверять надо не то, как компьютер маскируется человеком, а то, как он, например, решает логические задачи. Для оценки интеллектуальных способностей человека используется IQ-тест. Попробуем применить IQ-тест для оценки интеллекта голосовых помощников.

Мы задали логическую задачу из IQ-теста одному из голосовых помощников и были ~~посланы (зачеркнуто)~~ перенаправлены на одноименный поисковый сайт. Тот же результат мы получили и с другими помощниками.

Определяем классификацию ИИ

С IQ-тестом не вышло, но мы не сдавались, Мы решили зайти с другой стороны и посмотреть, какие сейчас существуют классификации мышления. Оказалось, что есть целый ряд таких классификаций – по способам, видам, процессам, результатам мышления и так далее. Одна из таких классификаций показалась нам интересной, и мы решили применить ее для оценки когнитивных способностей ИИ.

Немного упрощенно, она определяет следующие уровни мышления -

1. Восприятие - система интерпретаций чувственных данных, чувственное познание предметов окружающего мира. Проще говоря, восприятие - это изучение предметов с помощью органов чувств – зрения, слуха, обоняния и так далее. Присуще животным и человеку. Восприятие выделяет объекты и некоторые их свойства (размер, форма и так далее).

2. Понятие и суждение – форма мышления, выявляющая существенные свойства, связи и отношения предметов и явлений. В основном, присуще человеку и, частично, некоторым животным.

3. Умозаключение - форма мышления, при которой на основе суждений делается определенный вывод. Умозаключение помогает нам построить целостную картину окружающего мира и понять причинно-следственную связь между объектами и явлениями.

4. Воображение — способность человека к созданию образов и представлений объектов, которые в пережитом опыте воображающего в целостном виде ранее не воспринимались или же вообще не могут быть восприняты посредством органов чувств. Воображение присуще только человеку (пока).

Мы адаптировали эту классификацию для оценки когнитивных способностей ИИ при общении с человеком:

1. Восприятие – выделение из входящего текста объектов и определение некоторых их свойств.

2. Понятие и суждение – определение ключевых свойств объектов и их взаимосвязей с другими объектами.

3. Умозаключение – построение целостной картины описываемых объектов и их роли и места в окружающем мире, нахождение причинно-следственной связи между объектами и явлениями.

4. Воображение – на этом этапе ИИ дополнит ранее сформированную модель окружающего мира самостоятельно созданными объектами с ранее неизвестными свойствами. Скайнет, например, создала боевых роботов, в том числе, Терминатора. В фильме «Матрица» ИИ создал целый виртуальный мир, в котором жили аватары реальных людей.

Вообще, такие фильмы, как «Терминатор» и «Я, робот» и произведения писателей-фантастов дают много пищи для размышления о том, каким, возможно, будет наше взаимодействие с сильным ИИ. И просто это хорошие фильмы, которые интересно посмотреть сидя дома на самоизоляции. А сцена автомобильной погони в фильме «Терминатор 3», по-моему, лучшая сцена погони в истории кино.

Определяем текущее местоположение

Вернемся к нашей классификации. В середине 2000-х годов на многих сайтах знакомств «работали» боты – компьютерные программы, которые имитировали диалог с реальными пользователями. Они неплохо справлялись со своими «обязанностями» - некоторые пользователи принимали их за людей. В целом, их алгоритм был достаточно простым: они выделяли в тексте диалога ключевые слова, анализировали их и понимали о каких объектах или действиях идет речь. А затем формировали ответ на основе заранее подготовленных фраз в зависимости от найденных ключевых слов.

Очевидно, что эти боты находятся на первом уровне нашей классификации. А что покажут нам современные голосовые помощники?

Чтобы проверить, насколько «поумнели» сегодняшние алгоритмы ИИ, мы задали нескольким наиболее продвинутым голосовым помощникам простую логическую задачу –

Моя одежда в химчистке, мне нужно забрать ее. Где моя одежда?

Кто-то (или что-то – даже не знаю, как более уместно обращаться к голосовому ассистенту) перенаправлял на сайт, кто-то отвечал невпопад. Даже нейросеть GPT-3, о которой сейчас так много говорят, ответила на этот вопрос – «У меня много одежды».

Очевидно, что максимум того, что смогли текущие алгоритмы – это определить, что речь в задаче идет об одежде. Но определить свойства одежды (она в химчистке) и понять вопрос они не смогли. Получается, что это тот же самый первый уровень.

Справедливости ради, нужно сказать, что сегодняшние алгоритмы ИИ все-таки сделали шаг вперед - алгоритмы стали работать быстрее, ответы более разнообразные и не определены заранее, а формируются «на лету», появилось распознавание речи и так далее.

Поэтому, чтобы выделить текущие алгоритмы на фоне ранних ботов, мы присвоили им уровень 1+.

Второй уровень или Искусственный интеллект 2.0

С текущим положением дел определились, теперь переходим к планам на будущее.

По нашей классификации, второй уровень – это понятие и суждение, то есть определение ключевых свойств объектов и их взаимосвязей с другими объектами. Сразу возникает вопрос: как мы поймем, что ИИ перешел на второй уровень? Мы будем задавать ему логические задачи, и, если искусственный интеллект сможет решить их на уровне обычного человека, значит перед нами ИИ второго уровня. Мы говорим о логических задачах небольшой сложности, которые обычно построены на понимании свойств объектов и их связей друг с другом.

Какие технологии позволят ИИ перейти на второй уровень?

Теперь попробуем ответить на вопросы: когда системы ИИ «поумнеют» и перейдут на второй уровень, и какие они будут использовать алгоритмы и типы данных?

Казалось бы, ответ очевиден - это будет мощная нейронная сеть с триллионами параметров (многие сейчас, вообще, ставят знак равенства между ИИ и нейронными сетями, что, конечно же, не верно). В одном из докладов по ИИ даже сообщили когда это произойдет – тогда, когда количество параметров нейронной сети станет равным количеству параметров мозга человека. Логика тут простая – нейроны в мозгу человека и нейроны в искусственной нейронной сети в равном количестве будут работать одинаково.

Здесь мы вынуждены не согласиться - несмотря на успехи последних лет, с использованием нейронных сетей не все так однозначно. Нейросети имеют много проблем и ограничений:

1. Нейронная сеть – это черный ящик. Даже в небольших нейросетях, состоящих из нескольких слоев и нескольких сотен нейронов, разработчик не в состоянии понять, почему сеть установила именно эти веса, и как это влияет на результат. Также, он не может повлиять на работу сети – что-то поменять вручную возможности нет. Если обычный алгоритм выдает неправильные результаты, то разработчик может уточнить условие или поставить дополнительный «if». С нейросетями это не работает. Все, что можно сделать, - это поменять параметры сети и обучить ее заново.

- Нейросеть крайне зависима от количества и качества обучающих данных. Отсутствие больших наборов данных, проблемы с качеством или перекосы в обучающей выборке напрямую отражаются на результатах. Чтобы научиться уверенно отличать одну породу собаки от другой нейросети потребуются сотни тысяч или даже миллионы фотографий. Человек уверенно отличает таксу от пуделя, посмотрев всего несколько фото собак каждой породы. Поэтому, для дальнейшего развития разработчикам важно научить нейросети обучаться на малых наборах данных и снизить требование к качеству обучающих данных.

Но главное – нейросеть не понимает данные, которые обрабатывает. Она не различает что ей подали на вход – фотографии собак или текст романа «Война и мир». Ей все равно, для нее это просто набор нулей и единиц. Нейросеть хорошо справляется с задачей классификации данных. Но «понять» данные она не может - такой механизм в нее не заложен.

Например, когда нейросеть анализирует текст, она переводит каждое слово в вектор (массив из нулей и единиц), а затем перемножает эти вектора на матрицы и выдает ответ. Разве так мыслит человек, когда читает текст? Разве он перемножает в уме вектора на матрицы? Лично я, нет. Если мы хотим создать интеллект, похожий на человеческий, то имеет смысл использовать те же методы, какими оперирует человек в процессе мышления.

Здесь нужно привести пример с экспериментом «Китайская комната». Вкратце, суть эксперимента такова – в изолированную комнату поместили человека (назовем его лаборантом) и дали ему несколько табличек с китайскими иероглифами. Лаборант не знает ни одного китайского иероглифа, но у него есть четкая инструкция – если он увидит определенную последовательность иероглифов, то нужно поднять в ответ такую-то табличку, другая последовательность на входе – поднимай другую табличку и так далее. Например, ему показывают иероглифы «Какой твой любимый цвет?», он смотрит в инструкцию и показывает в ответ табличку с иероглифом «Синий». У стороннего наблюдателя будет полная уверенность, что лаборант знает китайский язык, но на самом деле он просто выполняет инструкцию.

Так вот, нейросеть – это аналог «китайской комнаты». Ей подают на вход последовательность сигналов, она преобразует их по определенной инструкции и выдает ответ. Чем больше входной сигнал отличается от обучающей выборки, тем менее точна инструкция, и тем менее правильный ответ мы получим в результате ее работы.

Таким образом, нейросеть не очень подходит на роль будущего ИИ. Тогда что подходит? Каким будет ИИ в будущем? Чтобы понять это, нам нужно посмотреть на то, как мыслит человек. Каждый из нас обладает множеством навыков, как врожденных (обработка изображений и звуков), так и приобретенных - умение считать, писать стихи и так далее. В процессе мышления мы используем часть этих навыков для выполнения поставленной задачи. Например, когда надо решить задачу по математике человек выполняет следующие действия – сначала он смотрит на текст задачи, разделяет изображение на буквы и цифры, складывает их в слова и формулы. Потом он задействует навык выполнения арифметических операций и вычисления формул и так далее.

Некоторые специалисты высказывают мнение, что так же будет работать искусственный интелект будущего. Это будет не один алгоритм, а большое количество различных алгоритмов, работающих вместе и обменивающихся данными для совместного выполнения поставленных задач. Каждый из этих алгоритмов будет отвечать за конкретный навык.

Какими будут эти алгоритмы сейчас сказать сложно. Возможно, нейросети будут отвечать за распознавание образов и звуков. За логическое мышление будут отвечать какие-то другие алгоритмы. И так далее.

Но уже сейчас можно точно сказать, что это будут самообучающиеся алгоритмы, и процесс обучения будет определяться внешними данными, которые будет получать ИИ. Мозг человека физиологически, в основном, формируется к 7 годам. Дальнейшее интеллектуальное развитие идет за счет получения и анализа внешней информации. Мы получаем данные, обрабатываем их и «донастраиваем» наш мозг для выполнения новых задач. Например, нам рассказали в школе про арифметические операции, мы «донастроили» наш мозг и теперь умеем складывать и умножать числа.

Также, будет развиваться и ИИ. Получая новые данные, он будет «донастраивать» свои алгоритмы для приобретения новых навыков. Как будет выглядеть такая «донастройка», сейчас сказать сложно. Может быть, будут меняться параметры существующих программ. Возможно, ИИ научится создавать новые более совершенные программы – такие эксперименты уже сейчас ведутся.

Какова в этом процессе будет роль человека? Сначала разработчик будет играть основную роль в развитии ИИ – именно он будет определять все параметры и производить все изменения. Постепенно алгоритмы научатся самостоятельно получать и обрабатывать данные, и роль человека будет снижаться. В какой-то момент времени алгоритмы будут обходиться в своей работе без вмешательства человека. Потом человек перестанет понимать что происходит внутри системы, а ИИ будет отменять все изменения, внесенные человеком, как нарушающие работу системы.

Представьте себе, что вы разработали суперполезную программу, а когда вы отошли от компьютера ваш 7-летний ребенок внес в нее нужные, как ему кажется, изменения. Что вы сделаете? Правильно, отмените все его изменения. Так же будет поступать и ИИ с теми изменения, которые сделает человек.

Поэтому, принципиально важно предусмотреть в системах ИИ возможность полного и безусловного контроля за работой системы, вплоть до ее отключения. Что случится, если этого не сделать? Чтобы подробно ответить на этот вопрос, вы можете посмотреть фильм «Терминатор».

Когда системы ИИ перейдут на второй уровень?

Скорее всего, не будет точной даты, когда это случится. Границы между уровнями условные, а алгоритмы и вычислительные мощности развиваются постепенно. Когда это произойдет - мы не можем сказать. Но это точно не случится в ближайшие 5-7 лет, для этого нет предпосылок. Существующие алгоритмы на текущей стадии их развития не помогут нам перейти на второй уровень, а на развитие новых потребуется время.

Каких-то прорывных технологий, которые позволят нам в ближайшее время сделать большой шаг вперед, тоже не видно. Много разговоров идет про квантовые компьютеры, но пока непонятно когда появятся полноценные производительные коммерческие образцы. Вряд ли это произойдет в ближайшие 5-7 лет. Также, до сих пор не ясно, какие технологии получат выигрыш от внедрения квантовых компьютеров: шифрование-дешифрование данных – это точно, а насчет многих других (в том числе, технологий ИИ) пока непонятно.

Третий уровень развития ИИ

Заглядывать вперед на десятки лет бессмысленно – реальность будет отличаться от любых прогнозов. Здесь мне вспоминается интересный случай – в начале 20 века ведущих ученых-урбанистов спросили, какой будет основная проблема крупных городов в середине века. Ученые сошлись на мнении, что это будет навоз. В городах будет так много лошадей, и они будут производить столько навоза, что именно уборка навоза станет основной проблемой крупных городов через несколько десятилетий. Прошло время, пробки и смог стали одними из главных проблем крупных городов, но никак не навоз.

Мы не хотим выглядеть как те специалисты, поэтому в своем прогнозе затронем только самые общие вопросы.

По нашей классификации, третий уровень развития ИИ – это умозаключение, то есть построение целостной картины описываемых объектов и их роли и места в окружающем мире и нахождение причинно-следственной связи между всеми объектами и явлениями.

То есть, ИИ будет обладать информацией обо всех объектах на нашей планете и понимать причины и следствия всех действий и явлений. Он будет знать все, что знают все люди вместе взятые и каждую секунду получать новую информацию из интернет (или как его тогда будут называть). Чтобы понять, что искусственный интеллект будет делать со всем этим огромным массивом информации, мы посмотрим на историю человечества.

Что обычно делало человечество, когда получало новые знания? Люди формировали, с учетом новых знаний, картину миру, строили прогнозы и выбирали наиболее приоритетные варианты развития, и принимали решения, необходимые для реализации этих вариантов. Так было, например, после открытия Америки Колумбом – европейцы поняли, что по другую сторону океана есть новые земли, предположили, что эти земли могут стать источником богатства и приняли решение направить туда корабли.

Скорее всего, ИИ поступит так же, поэтому третий уровень условно можно разделить на три этапа:

1. Формирование полной картины окружающего мира;

2. Построение прогнозов и вариантов будущего развития;

3. Принятие решений для реализация приоритетных вариантов.

На втором и третьем этапах, для принятия решений, ИИ потребуется оценивать различные прогнозы и варианты развития и находить наиболее приоритетные из них. Для этого ИИ будет использовать систему весов, проще говоря, оценок – какой объект является важным для развития системы, а какой не очень, а чем или кем вообще можно пренебречь.

Появление оценок приведет к появлению у ИИ эмпатии (в данном случае, способности определять состояние другого объекта и учитывать его в своих действиях), а затем, возможно, и эмоций (в том числе, симпатии и антипатии). Эмпатия будет напрямую влиять на приятие решений искусственным интеллектом.

За счет наличия полной картины мира, понимания причинно-следственных связей и наличия эмпатии, результаты обработки информации искусственным интеллектом третьего уровня будут кардинально отличаться от результатов обработки той же информации ИИ второго уровня.

Например, ИИ второго уровня получит на вход информацию - человечество производит чуть более 2 млрд тонн мусора в год. ИИ поймет эту информацию и запишет в свою базу данных. Если его спросят, когда мусор заполнит всю планету, то ИИ разделит площадь планеты на количество мусора и выдаст дату. «Ну, заполнит и заполнит»- подумает ИИ и перейдет к следующему факту.

ИИ третьего уровня будет рассуждать по другому – Человек заполнит мусором всю планету -> будут уничтожены большинство животных и растений -> состояние объекта «Планета Земля» станет отрицательным. Этого нельзя допустить, но что делать? Найти новый способ переработки мусора или уничтожить человечество?

Интересно, что он выберет.

Четвертый уровень - Воображение

На этом уровне ИИ научится создавать в реальном или виртуальном (если мы все к тому моменту дружно туда переедем) мире новые объекты с ранее неизвестными свойствами.

И тогда начнется самое интересное. Или самое страшное. Посмотрим...

Четыре шага на пути к Скайнет