daniilshat4 авг 2025 в 18:17

Google DeepMind запустила Game Arena — бенчмарк с настольными играми для тестирования LLM

1 мин

6.7K

Машинное обучение * Искусственный интеллектИгры и игровые консолиЛогические игры

Комментарии 6

avshkol 4 авг 2025 в 23:24

А где гарантия, что модель унутре себя не подключит программку - шахматного агента?

BlackMokona 5 авг 2025 в 03:04

Если подключит, то значит научилась

avshkol 5 авг 2025 в 06:05

Во время тестирования языковые модели не могут пользоваться возможностями игровых движков и полагаются только на систему распознавания изображений.

Как это проверить, обращаясь к модели на сервер?

BlackMokona 5 авг 2025 в 06:53

Просто подавать видеопоток, а не игровые данные внутренние с движков

pol_pot 5 авг 2025 в 02:20

Ллм же не умеет играть в шахматы и зрения у большинства нет. Странная затея. Если их будут дисквалифицировать за неверные ходы то большинство сольется за 5 минут.

BlackMokona 5 авг 2025 в 03:50

Так цели нету устроить зрелищный турнир. Это просто бичмарк для отслеживания прогресса ИИ

Зарегистрируйтесь на Хабре, чтобы оставить комментарий