
Норвежская компания 1X, известная своим человекоподобным роботом Neo, выложила в открытый доступ модель мира 1X World Model.
Разработчики заявляют, что эта ИИ‑модель, основанная на физике, помогает роботам не просто видеть, но и понимать динамику реального мира, а затем применять эти знания для освоения новых задач.
Идея в следующем: Neo может анализировать видео, сопоставленное с текстовыми промптами, и на основе этого формировать представление о том, как выполнить то, чего в его памяти раньше не было. Проще говоря, робота теперь можно в теории «поучить» с помощью роликов из интернета.
Этот релиз совпал по времени с активной подготовкой к началу поставок Neo для дома. Предзаказы на роботов открылись ещё в октябре, и, по словам компании, спрос превысил ожидания. Конкретные сроки отгрузки и цифры 1X пока не раскрывает, что, впрочем, типично для стартапов на этой стадии.
Основатель и CEO 1X Бернт Бёрнич рассказал: «После многих лет разработки нашей модели мира и приближения дизайна Neo к человеческому теперь он может учиться на видео из интернета и применять эти знания непосредственно в физическом мире. Со способностью преобразовывать любой промпт в новые действия — даже без предварительных примеров — это отмечает отправную точку способности Neo самообучаться и осваивать почти всё, что вы могли бы подумать попросить».
Звучит впечатляюще, особенно часть про «любой промпт». Как утверждается в блоге, «что модель может визуализировать, Neo обычно может сделать».
Однако стоит сразу внести ясность: это не магия. Вы не сможете просто сказать Neo «Иди припаркуй машину» — и он с первого раза идеально впишется в тесное пространство.
Как позже уточнил представитель компании, процесс не такой мгновенный. Neo не смотрит одно видео и сразу же идеально выполняет задачу. Схема работы скорее выглядит так: робот собирает видеоданные, связанные с конкретными промптами, отправляет их в модель мира, та дообучается, а затем обновлённые знания распространяются на всю сеть роботов. Это постепенно улучшает их общее понимание физического мира и набор know‑how.
Сейчас на один вывод модели уходит около 11 секунд, а планируется всего 5 секунд действий. Для реактивных задач, где важна скорость, этого может быть маловато. В планах — ускорение генерации (инференса) и внедрение замкнутого цикла перепланирования, чтобы Neo мог корректировать свои действия на лету, если что‑то пошло не так (например, предмет выскальзывает из руки).
Разработчики и в будущем пользователи могут получить представление о том, как Neo планирует свое поведение в ответ на запрос. Эта обратная связь — золотая жила для дальнейшего обучения моделей. Именно она в перспективе может привести к тому, что робот действительно сможет адекватно реагировать на запрос о чём‑то, чего он никогда раньше не делал.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
