Google в сотрудничестве с Everyday Robots, дочерней компанией Alphabet, создала роботов-официантов, которые способны реагировать на сложные запросы. Роботы займутся доставкой закусок и напитков сотрудникам.
Большинство современных роботизированных систем способны выполнять только очень короткие конкретные команды, например, «Принеси яблоко». Им трудно выполнять сложные задачи и рассуждать об абстрактных целях, и запрос «Я только что потренировался, принеси мне что-нибудь полезное для перекуса» поставит их в тупик, указывает Google Research.
Компания разработала метод PaLM-SayCan, который объединяет языковые ИИ-модели с алгоритмами обучения роботов. С этим методом робот действует как «руки и глаза» языковой модели.
Пользователь даёт роботу запрос, которую языковая модель превращает в последовательность шагов для выполнения. Эта последовательность фильтруется с использованием набора навыков робота, что помогает определить наиболее осуществимый план с учётом его текущего состояния и окружающей среды. Робот интерпретирует команду, сопоставляет её со своими возможностями и разбивает на более мелкие шаги.
Составление цепочки шагов стало возможным благодаря внедрению в роботов языковой нейросети, обученной на «Википедии», социальных сетях и других сайтах. По словам Google, аналогичный ИИ лежит в основе чат-ботов и голосовых помощников, но ранее он не применялся к роботам так широко.
Пока роботы выполняют несколько десятков простых действий. Когда их просят помочь убрать разлитую воду, они признают, что взять губку — это самый разумный вариант действия. Согласно сообщению в блоге компании, внедрение более сложного языкового ИИ повысило успешность выполнения роботами команд на 13%.