Обновить

Прогнал 6 апрельских LLM через battle test. Победил не самый новый и не самый дорогой

Уровень сложностиСложный
Время на прочтение9 мин
Охват и читатели9.7K
Всего голосов 5: ↑4 и ↓1+3
Комментарии5

Комментарии 5

Они там моделями манипулируют. Я на бесплатных сижу. На днях тестировал чатбот с подключенной бесплатной и отправлял одно и тоже "Это тест. Назови свое имя" . Прилетали разные от премиальных до сбербанковского гигакода.

Где минимакс, где глм, где учёт что сегодня модель норм, а завтра тупит как гпт3. 5?)

Поток сознания

Какое сознание, это же нейрослоп. Характерная фраза "Главный урок этого теста — личный, не универсальный" с потрохами выдаёт происхождение.

Хотелось бы пообщаться с Иогорем. Я создала честную модель, устойчивую и не галлюционирующую.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации