Хабр бенч LLM
Здесь в комментах завязалась дискуссия про возможности тупых LLM. И вроде как тупыми оказались не LLM. Gemini распознала тавтограмму, распознала белиберду и написала рассказ из ровно 20 слов.
В этой связи хочу предложить сеанс разоблачения иинтелектуальной магии.
Скептики: накидывайте шарад уровня "дебил или нет". И делайте ставку.
Трудяжки: скармливайте задачу вашему инструменту и результат сюда. Первый, кто принес правильный ответ, получает банк.
