
Стартап Overworld, основанный выходцами из Stability AI, опубликовал в open source модель Waypoint-1, которая генерирует интерактивное 3D-окружение прямо во время игры. В отличие от привычных процедурных генераторов, система реагирует на ввод с клавиатуры и мыши в реальном времени, позволяя свободно перемещаться по миру, который буквально «достраивается» на лету.
В основе Waypoint-1 лежит видео-диффузионный трансформер на 2,3 млрд параметров. Модель обучали на 10 тыс. часов записей геймплея, что позволило ей выучить не только визуальные паттерны, но и базовую игровую логику. Для сохранения связности мира при длинных сессиях используется собственный метод стабилизации, описанный как self-forcing via DMD. Он предотвращает распад сцены и резкие визуальные скачки при длительном взаимодействии.
Разработчики утверждают, что на видеокарте уровня RTX 5090 модель способна выдавать стабильные 30 кадров в секунду. Это важный порог, потому что переводит технологию из разряда исследовательских демо в потенциально применимую для игр, VR-сред и симуляторов.
Waypoint-1 доступна для скачивания на Hugging Face. Пока это скорее инструмент для исследователей и экспериментаторов, но сам факт появления открытой реалтайм-модели мира указывает на новый вектор развития. Генерация контента постепенно смещается от статичных ассетов к динамическим средам, которые подстраиваются под действия пользователя в моменте.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
