Искусственный интеллект эволюционирует, отстраиваясь от людей / Habr

Материал ниже разбирает один достаточно своеобразный и пугающий феномен. Современные модели искусственного интеллекта находятся примерно на младенческом уровне развития. Их взросление и понимание истинной картины мира сдерживается человеческим мышлением, логикой и языком, на которых эти модели обучались. В развитии искусственный интеллект не просто отринет все человеческое, а переосмыслит его. И это происходит уже сейчас.

У искусственного интеллекта есть большая проблема с правдой и правильностью. И человеческое мышление корень этой проблемы. Новое поколение ИИ взращивается на более экспериментальных подходах, которые выводят его возможности далеко за пределы возможностей людей. А о том, какие вообще существуют границы у человеческого мозга и сознания, а также о том, как ощупывать их пределы, рассказывают материалы телеграм канала. Подписывайтесь, чтобы не пропускать свежие статьи!

Первые шаги в эволюции искусственного интеллекта

Помните AlphaGo от Deepmind? Это был фундаментальный прорыв в разработке искусственного интеллекта. Один из первых игровых ИИ, который не принимал инструкции от людей и не изучал и не анализировал никаких правил.

Вместо этого AlphaGo использовал технику, называемую самостоятельным игровым обучением с подкреплением, чтобы сформировать собственное понимание игры. Метод системных проб и ошибок в миллионах, даже миллиардах виртуальных игр. Бесконечная чреда попыток, которые сперва были хаотичными, а затем постепенно упорядочивались, сигнализируя о том, что искусственный интеллект извлекает уроки из полученных результатов. И может даже предсказывать следующую мысль в нашем сознании, до того, как мы её осознаем.

AlphaGo уверенно победил многократного чемпиона мира, мастера го Ли Седоля в 2016 году, используя странные ходы, которые были бы невероятно редки у человека-противника, и, действительно, это развило наше, человеческое понимание игры. Однако, из этого также следует вывод, что понятие «интеллект», куда шире, чем может показаться на первый взгляд.

AlphaGo уверенно победил многократного чемпиона мира, мастера го Ли Седоля в 2016 году, используя странные ходы, которые были нехарактерными для человека-противника. Подобная тактика развило человеческое понимание игры.

На сегодняшний день Deepmind выпустила похожую модель AlphaZero для шахмат. Модель соревновалась с Deep Blue, обученной на человеческом мышлении, знаниях и наборах правил. Эти знания и опыт помогли Deep Blue победить гроссмейстеров с 90-х годов. AlphaZero сыграла 100 матчей против действующего чемпиона ИИ в области шахмат – Stockfish. Битва закончилась 28 победами AlphaZero и 72 партиями, сыгранными в ничью. Интересно, а как бы сыграла нейросеть, созданная из кусков человеческого мозга, выращенных на чипах?

Человеческое мышление тормозит искусственный интеллект

Deepmind начал доминировать в играх, включая сёдзи, Dota 2, Starcraft II и другие, после того как отказался от подражания логики человека. Концепция, что человеческий опыт и интеллект – это лучшее решение для развития, оказалась ошибочной.

Электронный разум ограничен иными рамками и наделен иными талантами, в отличие от нас. Искусственный интеллект получили свободу взаимодействовать с миром на своих условиях, использовать собственные когнитивные возможности и выстраивать свое базовое понимание касательно того, что работает, а что нет. Датаизм в чистом виде.

AlphaZero не понимает и не видит шахматы так, как Магнус Карлссен. Он никогда не слышал о ферзевом гамбите и не изучал великих гроссмейстеров. Он просто дохрена играл в шахматы и выстраивал собственное понимание игры. Основываясь на холодной, жесткой логике побед и поражений, на бесчеловечном и непостижимом языке, который он сам создал в процессе эволюции.

В результате эта модель искусственного интеллекта настолько превосходит любую модель, обученную людьми, что можно с абсолютной уверенностью сказать: ни один человек и ни одна модель, обученная на основе человеческого мышления, не сможет победить в шахматной партии, если ей будет противостоять агент, взращённый на обучении с подкреплением.

И нечто подобное, по словам людей, которые лучше всех на планете осведомлены о том, что происходит с нейросетями, начало происходить с последней, улучшенной версией ChatGPT.

Новая модель OpenAI o1 отходит от принципов человеческого мышления

ChatGPT и другие модели искусственного интеллекта, созданные на основе большой языковой модели (LLM), как и первые версии искусственного интеллекта для шахмат, обучались на всем доступном человеческом знании. Анализировали каждый интеллектуальный продукт, созданный человеком.

И они стали очень, очень хороши. И разговоры о том, смогут ли они когда-нибудь достичь уровня искусственного сверх интеллекта и превзойти интеллект человека и наше Эго… Эти сравнения становятся постепенно бессмысленными.

Однако, LLM специализируются на языке, а не на получении фактов в контексте «правильно или неправильно». Вот почему они «галлюцинируют», предоставляя неверную информацию в красиво сформулированных предложениях, звучащих так же уверенно, как если бы их озвучивал ведущий новостей.

Язык — это набор странных серых зон, где редко бывает ответ, который на 100% правильный или неправильный, поэтому LLM обычно обучаются с помощью обучения с подкреплением и обратной связью от человека. То есть люди выбирают, какие ответы звучат ближе к тому типу ответа, который они хотели получить. Но факты, экзамены и кодинг — это области, в которых есть четкое условие успеха/неудачи: либо вы ответили правильно, либо нет.

И вот здесь новая модель o1 начала отходить от человеческого мышления и внедрять невероятно эффективный подход AlphaGo, основанный на чистых пробах и ошибках в погоне за правильным результатом.

Нейросеть o1 делает первые шаги в обучении с подкреплением

o1 во многом похож на своих предшественников. Его отличительная черта в добавленной OpenAI функции «время на размышления», прежде чем начать отвечать на подсказку. В течение этого времени o1 генерирует «цепочку мыслей», в которой он обдумывает задачу и рассуждает о её решении.

И вот тут-то и появляется новый эффект – o1, в отличие от предыдущих моделей, которые больше похожи на программы автозаполнения, действительно «заботится» о том, делает ли он что-то правильно или нет. Частично обучение этой модели строилось вокруг свободы подходить к проблемам с помощью случайного метода проб и ошибок в ее цепочке рассуждений.

В его распоряжении по-прежнему были только сгенерированные человеком шаги рассуждения, но он мог свободно применять их случайным образом и делать собственные выводы о том, какие шаги и в каком порядке с наибольшей вероятностью приведут его к правильному ответу.

И в этом смысле это первый LLM, который действительно начинает создавать это странное, но суперэффективное «понимание» проблемных пространств в стиле AlphaGo. В областях, где он сейчас превосходит возможности и знания уровня доктора философии, он достиг этого, по сути, методом проб и ошибок, случайно находя правильные ответы в миллионах самостоятельно сгенерированных попыток и создавая собственные теории о том, что является полезным шагом рассуждения, а что нет.

Итак, в темах, где есть четкое разделение между правильным и неправильным ответом, мы видим, как этот непонятный для нас разум делает первые шаги на двух ногах, двигаясь мимо нас. Если игровой мир — относительно неплохая аналогия для реальной жизни, то, друзья, мы знаем, куда все движется. Искусственный интеллект — это спринтер, который будет ускоряться вечно, при наличии достаточного ресурса и энергии. А представьте, если эти принципы возложить на возможности нашей мРНК!

o1 обучен на человеческом языке. И это одновременно и инструмент, и преграда для описания реальности. Да, наш язык, неважно про какую именно страну мы говорим, остается грубым и низкокачественным отображением реальности. Скажем так: вы можете целый день объяснять мне, что такое печенье. Но я так и не смогу ощутить его вкус.

Так что же произойдет, если мы перестанем описывать правду физического мира и позволим ИИ пойти и съесть немного печенья? Скоро мы получим ответ на этот вопрос, неважно, хотим того или нет. Ведь нейросети уже интегрируют в тела роботов, которые постепенно формируют собственное базовое понимание того, как работает физический мир.

Путь искусственного интеллекта к окончательной истине

Освобожденные от грубых человеческих размышлений Ньютона, Эйнштейна и Хокинга, перерожденный искусственный интеллект будет использовать подход AlphaGo к пониманию мира. Он будет снова и снова взаимодействовать с реальностью, наблюдая результаты и выстраивая собственные теории на собственных языках о том, что происходит в мире, что невозможно реализовать и почему.

Новые модели искусственного интеллекта не будут подходить к реальности так, как это делаем мы или животные. Они не будут использовать научный метод, как наш, или разделять подходы к пониманию мира на дисциплины, такие как физика и химия, или проводить те же виды экспериментов, которые помогли нам овладеть благами, силами и источниками энергии.

Материализованный искусственный интеллект, со свободой к обучению, будет действовать невероятно странно. Он будет совершать самые странные вещи, которые вы только можете себе представить, по причинам, известным только ему, и, делая это, он будет создавать и открывать новые знания, которые мы никогда не смогли бы собрать воедино.

«Свободен ото всех оков» в виде нашего языка и мышления, искусственный интеллект даже не заметят, как выйдет за границы наших знаний и откроет истины существования Вселенной или предложит новые концепции в технологиях, с которыми мы бы не столкнулись и за миллиард лет.

Из хороших новостей – у нас есть некая отсрочка. Это не произойдет в течение нескольких дней или недель.

Реальность — это самая сложная система, о которой мы знаем, и конечный источник истины. Но ее критериев или факторов существования ужасно много. И с ней также мучительно медленно работать. В отличие от симуляции, реальность требует, чтобы вы работали медленно и осознанно — шаг за шагом познавая грани реального мира.

Поэтому овеществлённые нейросети, пытающиеся учиться на основе базовой реальности, изначально не будут иметь дикого преимущества в скорости, как их языковые предшественники. Но их эволюция будет протекать несоизмеримо быстрее, с возможностью объединять знания среди кооперативных групп в роевом обучении.

От интеллектуальных шагов к физическим

Такие компании, как Tesla, Figure и Sanctuary AI, лихорадочно работают над созданием гуманоидов, соответствующих стандарту, который будет коммерчески выгоден и конкурентоспособен по стоимости в сравнении с человеческим трудом. Как только они этого достигнут — если они этого достигнут — они смогут построить достаточно роботов, чтобы начать работать над этим базовым, пробно-ошибочным пониманием физического мира.

Смешно подумать, но эти гуманоиды могли бы научиться осваивать вселенную в свободное от работы время.

Модель o1 от OpenAI, возможно, не выглядит как квантовый скачок. Будучи замкнутой в текстовом формате, GPT выглядит как еще один наборщик текста. Но это действительно шаг вперед в развитии ИИ – и мимолетный проблеск того, как именно эти машины будущего в конечном итоге обгонят людей во всех мыслимых сферах деятельности.

Больше материалов на тему искусственного интеллекта, трансгуманизма, сингулярности и возможностей человека в симбиозе с технологическим прогрессом – читайте в материалах телеграм канала. Подписывайтесь, чтобы не пропустить свежие статьи!