Обновить

Каково это — работать с Fable 5 (Mythos)

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели10K
Всего голосов 9: ↑8 и ↓1+8
Комментарии6

Комментарии 6

Anthropic выпустила модель, преимущество которой раскрывается только в информационной безопасности, но в итоге эта модель отказывается работать даже близко к похожей теме.

Да и публичная версия лоботомированная относительно той, чтобы была доступна узкому кругу лиц. Прям максимальное разочарование

Лично мне кажется, что улучшение способностей модели - это не результат мощности модели как таковой. Есть ощущение, что Антропики нащупали удачный харнесс, который позволяет дробить суждения на более мелкие суждения, которые проверяются ворохом каких-нибудь опровергателей. Может ещё и математика замешана, когда язык суждений переводится в строгую математическую формулу.

А может и вовсе не существует Sonnet, Opus, Fable как таковых. И они лишь построены на платформе небольших LLM, с вылизанными до блеска способностями в логику. Отличие только в масштабе архитектуры. У Sonnet - небольшая, а Opus - это пачка Соннетов в определенной конфигурации. Ну и так далее.

И главное - все эти варианты масштабируемы. Можно построить систему ещё мощнее, закупив 100500 миллионов серверов. И наоборот, если надо сделать модель потупее, то это делается очень просто.

Я просто сам для себя делаю такую систему на основе моделей Клода, с верификациями, опровергателями, судьями и состязательной панелью. Оттого и такое предположение

А почему только Клода? Я в ручном режиме пробовал разные модели, чтобы увеличить разброс и было меньше склонности соглашаться. Типа бесплатные ощутимо хуже, а за зоопарк платных платить не хочется?

LLM сегодня be like:

Mythos который без цензуры выпустят позже, а fable 5 доступен по-моему дней 12 в подписке pro+ а потом только api. Но цены словно для миллионеров делали, а нахрена она зацензуренная? Учитывая что ее уже успели прогнать по задачам, в конкретике она сыпется по сравнению с гпт5.5, а на длинных задачах скорее ты станешь банкротом.

Глянул ещё бенчмарк данной модели в сравнении, то сомневаться я стал в этих всех бенчмарках, учитываю что это прогон в медиа anthropic в связи с IPO

- Как продать то же самое, но в два раза дороже?

- Давайте припишем моделе мифические свойства!

- Но люди же все поймут при релизе.

- А мы скажем что она настолько ох*енная, что нам пришлось как раз таки и ограничить эти функции из-за соображений безпосаности!

- А точно проканает?

- Не парьтесь, они до сих пор верят в идею, что нейросеть заменит им программиста, они готовы платить нам 3 его оклада за сомнительный результат, лишь бы оптимизировать!!! Главное побольше слов про оптимизацию и умение писать код!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации