Обновить
0.63

F# *

Язык из семейства языков .NET Framework

Сначала показывать
Порог рейтинга

Хабр бенч LLM

Здесь в комментах завязалась дискуссия про возможности тупых LLM. И вроде как тупыми оказались не LLM. Gemini распознала тавтограмму, распознала белиберду и написала рассказ из ровно 20 слов.

В этой связи хочу предложить сеанс разоблачения иинтелектуальной магии.

Скептики: накидывайте шарад уровня "дебил или нет". И делайте ставку.
Трудяжки: скармливайте задачу вашему инструменту и результат сюда. Первый, кто принес правильный ответ, получает банк.


Теги:
+1
Комментарии0