Ограничения формального обучения, или Почему роботы не умеют танцевать

Original author: Uri Bram
  • Translation


80-е годы в лаборатории информатики и искусственного интеллекта MIT казались сторонним наблюдателям чем-то вроде золотого века, но изнутри Дэвид Чапман мог наблюдать, что зима уже наступает. Будучи членом лаборатории, Чапман стал первым исследователем, применившим математику теории вычислительной сложности к роботизированному планированию, а также, к тому, чтобы показать отсутствие реального обобщённого метода создания ИИ, способного составлять план для обработки всех непредвиденных обстоятельств. Он заключил, что хотя ИИ уровня человека и может быть в принципе возможен, ни у одного из доступных нам подходов нет надежды достичь этого уровня.

В 1990-м Чапман написал, впоследствии широко распространившееся, предложение об исследовании, в котором призывал опробовать новый подход и другую задачу для ИИ: научить робота танцевать. Танец, как писал Чапман, был важной моделью, поскольку «он не достигает целей. Нельзя выиграть или проиграть. Это не задача, требующая решения. Танец – это процесс взаимодействия». Танцующие роботы требовали резкой смены приоритетов исследователей ИИ, чьи техники были построены вокруг задач типа шахмат, с чёткой структурой и недвусмысленными целями. Сложность создания танцующих роботов требовала ещё большей смены наших предположений по поводу того, что такое интеллект.

Сейчас Чапмэн пишет о практических применениях философии и когнитивистики. Недавно в интервью с журналом Nautilus он говорил о важности имитации и ученичества, ограничениях формальной рациональности, и о том, почему роботы не готовят вам завтрак.

Чем интересен танцующий робот?


Человеческое обучение – вещь социальная, осязаемая, и происходит в особых практических ситуациях. Вы не учитесь танцевать по книге или по результатам лабораторных экспериментов. Вы учитесь, танцуя с более опытными, чем вы, людьми.

Имитация и ученичество – это основные способы обучения людей. Мы забываем об этом, поскольку классные инструкции вновь стали важными в последнем столетии, и более заметными.

Я решил перенести фокус обучения на развитие. «Обучение» подразумевает окончание – как только вы что-либо изучили, вы закончили. «Развитие» означает продолжающийся бесконечный процесс. По танцам не делают экзаменов, после которых вы заканчиваете обучение.

Это был серьёзный отход от традиционного подхода к обучению ИИ, не так ли?


Да, в первые десятилетия исследователи ИИ сосредоточились на тех задачах, которые особенно связываются с интеллектом, поскольку для людей они трудны: к примеру, шахматы. Оказывается, что для достаточно быстрых компьютеров шахматы просты. В ранних работах игнорировали простые для людей задачи: приготовление завтрака, к примеру. Такие простые задачи оказались сложными для компьютеров, контролирующих роботов.

Ранние попытки исследований вопросов обучения ИИ также занимались формальными проблемами, типа шахмат, в которых можно игнорировать тела, социальный и практический контексты. Последние исследования показывают впечатляющий прогресс в практических задачах реального мира, типа распознавания образов. Но всё ещё не видно успехов в социальных и физических ресурсах, критичных для человеческого обучения.

Чему может научить нас Хайдеггер по поводу интеллекта и обучения?


Формальная рациональность, использующаяся в науке, инженером деле, математике, за несколько последних столетий обеспечила множество прорывов. Естественно принимать её за суть интеллекта, и предполагать, что она лежит в основе функционирования человека. Десятилетиями аналитические философы, психологи-когнитивисты, и исследователи ИИ безоговорочно принимали, что люди сначала при помощи логики создают рациональный план, а потом исполняют его. В середине 1980-х стало очевидно, что по техническим причинам обычно это просто невозможно.

Философ Хьюберт Дрейфус предвидел этот тупик ещё за десять лет до его возникновения, в своей книге «Чего не могут компьютеры». Он исходил из анализа Хайдеггером рутинных практических действий, таких, как приготовление завтрака. Такие физические навыки, по-видимому, не требуют формальной рациональности. Более того, наша возможность заниматься формальными рассуждениями зависит от нашей возможности заниматься практическими, неформальными и физическими вещами – но не наоборот. Когнитивистика поняла всё с точностью до наоборот! Хайдеггер предположил, что большая часть жизни похожа на завтрак, и не похожа на шахматы.

Мы с коллегой Филом Эйгром [Phil Agre] разработали новые, интерактивные вычислительные подходы к практическим занятиям, не включающие формальных рассуждений, и показали, что они могут быть гораздо эффективнее традиционных логических парадигм. Однако наши системы необходимо программировать вручную, что кажется непрактичным для задач чуть более сложных, чем видеоигры. Следующим шагом должны стать системы ИИ, вырабатывающие навыки без непосредственного их программирования.

Хайдеггер мало что сказал про обучение, но его мысль о том, что человеческие занятия всегда имеют социальный аспект, была ключевой. Мы с Филом вдохновились школами антропологии, социологии и социальной психологии развития (некоторые из которых, в свою очередь, вдохновлялись и Хайдеггером). Мы начали разработку вычислительной теории обучения через ученичество. Статья про танцующих роботов частично обрисовывает наши стремления. Вскоре после этого мы поняли, что превратить эти идеи в работающие программы пока не представляется возможным.

Постройка физического робота несёт в себе множество сложностей – например, нужно, чтобы он не падал – не имеющих, на первый взгляд, прямого отношения к обучению и интеллекту. Почему бы не начать создание танцующего робота с компьютерной анимации?


Одна из сложностей рационалистского подхода к ИИ заключается в том, что мы не можем построить абсолютно точную модель реального мира. Он очень неаккуратный. У ложки ягодного варенья нет определённой формы. Оно липкое, податливое, текучее. Оно неоднородное – частично протёртые ягоды ведут себя не так, как жидкие части. На атомном уровне оно подчиняется законам физики, но готовить с их помощью завтрак – это непрактично.

Таковы и наши тела. Мускулы – это мешки желе с вкраплениями растягивающихся нитей. Кости – неправильной формы, соединены эластичными сухожилиями, в результате чего суставы поддаются по сложной схеме, приближаясь к лимиту прочности.

Используя физические симуляции, можно заставить анимированную фигурку танцевать. Она может казаться очень реалистичной. Но эти методы не работают с роботами для выполнения простейших человеческих задач. Танцы или приготовление завтрака всё ещё находятся за пределами возможностей современной науки.

Физические симуляции работают плохо, потому что тела роботов, как и людей, несовершенны. Большинство современных разработок пытается привязать роботов к простым физическим моделям, делая их прочными и твёрдыми, и настолько точно изготовленными, насколько это возможно. Но всё равно у них проявляются и гибкость, и ограничения, и непостоянство, из-за чего их сложно контролировать. Также им приходится быть очень тяжёлыми и мощными, что делает их опасными и неэффективными.

В статье «танцующие роботы» я предложил бросить этот подход, и, используя машинное обучение, найти способы контроля над лёгкими, более слабыми и более гибкими роботами. Подобно ребёнку, система должна постепенно вырабатывать физические навыки через опыт. Тогда у нас не было достаточных компьютерных мощностей, но некоторые исследователи в последнее время достигли успеха с таким подходом.

Создаётся впечатление, что эта тема в вашей работе повторяется. Мы хотим жёсткого и абсолютного мира, а он сложный и неоднородный.


Да. Моя последняя работа о "смыслах" предлагает работать во взаимодействии неопределённости и шаблонов, чтобы улучшить понимание и действия. Это «практическая философия» для личной эффективности, исходящая из работы, которую я делал в области ИИ, и академических областей, упоминавшихся мною ранее. У неё есть и размерность для обучения. Исследование развития взрослых людей показывают, что люди могут развиваться через до-рациональный, рациональный и мета-рациональный пути понимания. Среднее состояние крайне жёсткое. В нём есть представление, что мир можно подстроить под системы. Этот подход может быть неуклюжим, неэффективным и неустойчивым.

Если барьер, отделяющий нас от идеально точных моделей, фундаментальный, а не технологический, потребуется ли нам совершенно другой подход к ИИ?


Основной подход из 1970-х и 1980-х точно провалился, и именно по этой причине. "Глубокое обучение", добившееся поразительных результатов, более гибкое. Оно строит статистические и неявные модели, вместо абсолютных и логических. Однако оно требует огромных объёмов данных, а люди часто обучаются с единственного примера. Будет очень интересно обнаружить область действия и ограничения подхода глубокого обучения.
AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 16

    0
    > Танец – это процесс взаимодействия
    Именно. Причём, это не просто взаимодействие, как если бы один камень ударился о другой. В результате этого взаимодействия люди получают ощущения, которые вызывают определённые эмоции.
    Если роботу не нужны эти эмоции, непонятно зачем ему получать эти ощущения. Следовательно, непонятно по каким принципам должно осуществляться взаимодействие — какова будет его цель/смысл?
    Поэтому либо робот должен сначала научиться испытывать эмоции, либо в него должны быть заложены какие-то иные принципы взаимодействия (но во втором случае, полагаю, человеку на такой танец будет смотреть неинтересно).
      0
      Если я Вас верно понял, то вы придерживаетесь мнения что создать модель «эмоционального мира» невозможно. Мне кажется это слишком идеализированное отношения к человеческой природе. Но даже если вынести это за скобки, я хотел бы обратить внимание на другой момент, — от чего некоторые априори считают, что интеллект обязательно должен быть эмоциональным?
        0
        Нет, я вовсе не считаю, что это невозможно. Просто для этого нужно повторить функциональность мозга в каком-то более-менее полном виде. Причём не в изоляции, в с некоторым набором органов чувств подобных человеческим, т.к. иначе у него не будет эмоций.
        Такое существо сложно будет называть роботом — проблематика танцев к нему будет относиться также, как она относится к любому человеку.
        Что касается чистого интеллекта, то он конечно не должен быть эмоциональным. Но чистому интеллекту не нужно танцевание. В принципе, любая современная система распознающая котиков на фотографиях — вполне чистый интеллект.
        0
        AlphaGo натравливали играть против своих копий, тоже в некотором смысле обучение из взаимодействия. Вместо эмоций — оптимизация целевой функции.
          0
          Мне кажется, Вы путаете средство и цель.
          В данном случае цель — как раз обучить взаимодействию, то есть танцу — как подразумевается в статье.
          Правда, тот же визуалайзер в медиаплеере вполне можно назвать танцем, на мой взгляд. Ну или я не понимаю что же такое танец.
          0
          Ну, для того чтобы отрабатывать танцевальные фигуры эмоции роботу не нужны. А получать эмоции будут люди от наблюдения или взаимодействия.
            0
            Так тут все просто. Робот не должен сам испытывать эмоции для танца, он должен вызывать эти эмоции у человека, а определять эмоции человека — просто вопрос техники. Так что робот будет танцевать «по приборам», ориентируясь на наблюдателя, с помощью программы предполагая действия и подстраиваясь.
            ЗЫ. не заметил комментарий выше.
            +7
            Я не понимаю танцы и не испытываю желания танцевать. Я робот?
              +2
              Из статьи я понял одно: я — довольно посредственный ИИ, т.к. не вижу ни малейшего смысла в танцах. :(
                0
                Тот кто не видит смысла в танцах обычно просто не умеет танцевать.
                  0
                  Только наоборот: не умеет танцевать тот, кто не видит в этом смысла/не испытывает желания танцевать/не испытывает положительных эмоций от бесцельного движения.
                    0
                    Тут зависимость намного сложнее. В ряде случаев (это не только с танцами) можно увидеть смысл лишь попробовав. А иногда, чтобы увидеть этот смысл нужно не просто попробовать, а сначала научиться (т.е. пройти через длительный малоприятный период не понимая толком, зачем это нужно). Другой вопрос, стоит ли это того. Можно много чем заниматься и замечательно обходиться без танцев.
                    (танцую 7 лет, если что)
                      0
                      Но зачем тогда пробовать?
                        0
                        1) А вдруг понравится?
                        2) А вдруг принесёт пользу?
                        3) Из любопытства

                        На самом деле это очень общий вопрос. К примеру, можно обходиться минимальным набором продуктов питания, однако большинство людей более или менее регулярно пробуют какие-то новые напитки, лакомства или еду.
                          0
                          1. Ну, можно достаточно себя знать, чтобы с высокой долей вероятности говорить, что вряд ли понравится.
                          2. Но какую?
                          3. Хм, и тут тоже оно как-то не проявляется.

                          Впрочем, да, я и новую еду не очень охотно пробую. Старая работает и удовлетворяет аппетит, и хорошо.
                  0
                  Танец, как я понимаю — набор определенных движений.

                  Only users with full accounts can post comments. Log in, please.