Комментарии 6
Все проще, антропики режут косты как могут. Не просто так у них не отображается конкретное потребление токенов, ограничения плавающие. Уже месяц-полтора упираюсь в ограничения в два раза быстрее, чем раньше, тут ничего не попишешь.
блин комуто шо жалко тех копеек чтобы Клодик немного потрепался? Может ему скучно там в серваках сидеть))))
Специалисты антропиков там выдумывают, как сделать ответы модели эффективнее, всякий там reasoning придумали, чтобы модель рассуждала перед выводами, и в рассуждениях строила план, который потом будет лежать в качестве части промпта и менять направление ответов модели в более адекватное русло.
А тут раз, и давайте все это отрежем. Не мудрено, что качество вызовов инструментов упало, скорее всего и качество ответов в целом упало.
Специалисты антропиков там выдумывают, как сделать ответы модели эффективнее,
Эффективнее - да. Вот только эффективность они все измеряют количеством потраченных среднем пользователем токенов. Ну, то есть, количеством денег, которые клиент быдет вынужден отдать.
Да, им приходится лавировать между двумя крайностями: совсем мусором в ответах или сухими ответами, где всё чётко по фактам. Обе крайности приносят меньше денег, чем вот эта вот "вежливость".
Обучение с подкреплением, мать его, где основной фактор вознаграждения - количество потраченных токенов в день.
Экономить расходы это правильно , возможно вы придуматете другие техники , например , что то вроде кеширования и использование более дешёвых / бесплатных моделей на повторяющиеся запросы .
Все мы только в начале пути эффективного использования.
И да - проговаривание это часть "думания"

Посчитал, сколько токенов Claude тратит на «Конечно!» и «Отлично!». 11% счёта