Как стать автором
Обновить

Sony SCL — эксперимент «игровая площадка»

Время на прочтение3 мин
Количество просмотров791
image

Для самых нетерпеливых: ученые запрограммировали собачку Aibo так, чтобы она могла изучать мир самостоятельно, т.е. без заданной последовательности действий.
Тут лежат несколько видео, где робособака, как ребенок, изучает мир вокруг, ссылка.
Для тех, кому этого не достаточно, добро пожаловать под хабракат.

Итак, в прошлом топике кому-то не хватало практики, поэтому вот она, практика:

Строение робота


Судя по инструкции,
робот обладает 20 степенями свободы,
работает 1.5 часа,
потребляет 9 ватт,
обладает сенсорами температуры, ИК, расстояния, ускорения, давления, вибрации,
основная память на 32 мегабайта,
и имеет 64-битный RISС процессор.

Постановка эксперимента


Как видно из этого графика:
image
(на котором, по уверению разработчиков, робот совершил около 15000 действий)
робот имеет всего несколько вариантов действий(укусить, ударить, оглядеться),
несколько состояний от сенсоров(ничего не вижу, вижу объект 1\2, успешный укус\удар)

Стадии, указанные на рисунке как P1-P5:
P1 — робот учится сосредотачиваться на определенных обьектах и обнаруживать их
P2 — попытка совершить некоторые действия, не применяя их к каким-то конкретным обьектам
P3 — попытка передвижения частей своего тела, но без определенной цели
P4 и P5 — более сложные действия, укусить кусаемое или пнуть пинаемое.

Самые внимательные наверняка заметили белые листы с «маркером» на глазу висящей игрушки и за ухом слона на полу, перед собакой. Я не нашел упоминания об этом в постановке эксперимента, но могу предположить, что это использовалось для упрощения идентификации объектов окружения. Т.е. собака не определяла обьекты самостоятельно, за неё это делал некий алгоритм. Ну да ладно.

Взгляд изнутри


Программа робота состоит из нескольких модулей.
* Первый из которых — модуль прогноза, каждая часть которого специализирована на определенных областях сенсорно-двигательного пространства.
* Второй модуль — система метапрогноза, цель которого — предсказание его дальнейшего развития и ошибок первого модуля. Он основан на том, что сравнивает коэффициент ошибок в прошлом и в настоящем.
* Третий модуль — который вырибирает действие на основе результатов, выданных вторым модулем.

Предполагается, что алгоритм позволит выбирать действия, которые будут не слишком предсказуемы, но и не слишком трудными для предсказания.

Цель эксперимента


«The aim is to construct engines implementing such general capacities as „curiosity“, thus producing generic attention mechanisms with a minimum of preprogrammed biases.»
Цель состоит в том, чтобы создавать механизмы, реализуя такие явления как «любопытство», что позволит создавать универсальные механизмы с минимальным размером предварительно запрограммированных действий.

Т.е. разработчики стремятся научиться создавать самообучаемые машины, которым почти не нужно программирование человеком, которые могли бы самостоятельно обучаться. Так же разработчики говорят о том, что хотят скопировать поведение маленьких детей, как те изучают мир вокруг себя пробуя все «на зуб».

Субъективный взгляд


На мой взгляд такой способ(самостоятельное обучение) достаточно перспективный способ получать больше количество индивидуальных алгоритмов под конкретные задачи или просто с разными подходами. Однако, судя по видео, разработчики дали собаке весьма узкий круг возможностей, в частности: собака может совершить удар в конкретную точку пространства только определенным способом и на определенный угол\высоту, т.е. полного управления телом нет. Нет даже самостоятельно составленных действий, менять можно только параметры движения(точка удара), и составлять их в последовательности. Так же нет определения обьектов, и многого другого, но даже такой результат однозначно интересен, ведь это только начало.

Фотки и материалы




Удачный укус

Удар с разворота

Для тех, кому все ещё мало, вот тут(1.2 мб, pdf, англ) лежит описание исследования, что они называют «Интеллектуальное Адаптивное Любопытство». Исходников кода нет, но есть некоторые формулы для расчетов программы и подробное описание.

Вопросы для обсуждения

1) Имеет ли какую-то перспективу обучение роботов как детей, с самых азов?

2) Можно ли считать данный эксперимент имеющим смысл, если робот был сильно ограничен в движениях, а определение объектов предположительно выполнял отдельный алгоритм?

3) Можно ли считать данный эксперимент успешным, т.е. сумел ли робот действительно узнать что-то новое, что не было заложено в него изначально?
Теги:
Хабы:
+22
Комментарии28

Публикации

Изменить настройки темы

Истории

Ближайшие события

Weekend Offer в AliExpress
Дата20 – 21 апреля
Время10:00 – 20:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн