Представьте себе, что есть система, которая достраивает все движение 3-хмерного окружения в зависимости от ситуации и контекста, а если видит незнакомый объект, то не ломается, а на ходу собирает датасет поведения объекта и дообучается в реальном времени.
TL;DR. Мы делаем point‑native прототип, который по краткой истории облаков точек объектов предсказывает следующие 10 шагов их движения в сцене Unity (лодка + плавающие ящики). Движок не использует скрытые состояния из физики Unity — только точки. Сейчас сеть выдаёт будущие облака точек объектов.
▶️ Демо‑видео: https://youtu.be/p0Uackg41iw
Слабое место сейчас — взаимодействия объектов (сдвиг контакта, небольшие проникновения). Мы закрываем это сценовым «корректором»: после базового прогноза на 10 шагов запускаем 1–3 итерации уточнения в духе диффузии. На каждой итерации корректор видит всю предсказанную сцену, считает резидуальную поправку и мягко проецирует состояние, снижая проникновения. Повторяем до стабилизации метрик.
Цель: довести точность короткого горизонта на точках, добавить сценовый «корректор» взаимодействий.