
Anthropic открыла свое тестовое задание для performance-инженеров и предлагает всем желающим побить рекорд Claude Opus 4.5. Тем, кто справится лучше модели, компания обещает рассмотреть резюме и, возможно, пригласить на собеседование.
Задание использовалось для найма, но потеряло смысл после того, как Claude Opus 4.5 начал справляться с ним лучше кандидатов за отведенные два часа. Суть задачи — оптимизация кода, результат измеряется в тактах симулированной машины: чем меньше, тем лучше.
Кандидатам нужно оптимизировать ядро (kernel) для вымышленного процессора, напоминающего GPU: правильно упаковывать векторы, распределять операции по ядрам и минимизировать количество тактов. Репозиторий включает симулятор, тесты и визуализатор для отладки.
Лучший результат человека за два часа — около 1790 тактов. Claude Opus 4.5 за то же время показывает 1579, а за 11,5 часов добрался до 1487. Именно превышение последнего результата в Anthropic называют условием "победы" над ИИ.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
