Судоку и искусственный интеллект: новый бенчмарк для reasoning моделей от Sakana AI

Искусственный интеллект продолжает совершенствоваться, переходя к более сложным формам размышления. Недавно компания Sakana AI представила бенчмарк, основанный на судоку, которое сочетает в себе традиционное решение логических головоломок с новыми творческими подходами.
Сотрудничая с популярным YouTube-каналом “Cracking The Cryptic”, известным своими исследованиями сложных стратегий решения головоломок, Sakana AI собрала ценные знания людей о логике решения головоломок. Кроме того, тест Sakana AI включает головоломки ручной работы от Nikoli — знаменитого японского издателя головоломок, которому приписывают международную популяризацию судоку.
Предлагаю вам попробовать проверить свой ризонинг:
1. Rat run: multiple choice 2. Reserved parking 3. Pierced Butterfly