Comments 4
С учетом тех тестов, что я видел ранее, стоит сразу приводить данные сколько набирает среднестатистический человек при их прохождении и сколько времени тратит на это.
Не указано среднестатистические они или нет. Но всё же результат в статье есть.
"Более 400 человек прошли тест ARC-AGI-2 для установления базового человеческого уровня. В среднем, «панели» участников справлялись с 60% заданий — значительно лучше, чем любые из протестированных моделей."
Тесты не очень сложные, но вот способ составления ответа дебильный. Вместо того чтобы оперировать фигурами, ты как дурак играешь в паинт, и где нибудь обязательно забудешь пиксель.
- Клетки.- Клетки.- Вы бывали в тюрьме?- Клетки.- Клетки.- Вас держат в клетке?- Клетки.- Клетки.
Дальнейший текст, я полагаю, многие и так знают.
Фонд Arc Prize представил новый AGI-тест, который ставит в тупик большинство ИИ-моделей