Комментарии 29
Сегодя весь день работал с Opus 4.8
Истратил больше 100$.
Искал ошибку в драйвере WiFi, возникшую утром. Не поднималась точка доступа в дивайсе.
Opus 4.8 ошибку не нашел, предлагал отключить то одно, то другое. Напичкал весь драйвер логами так, что даже стало страдать быстродействие.
А сейчас включил Fable 5 и он мигом (ну может за 10 мин реальных) без логов, однозначно указал проблему в путанице номеров интерфейсов после какого-то комита (напутал сам Opus 4.8, делая очередную фичу). Истратил где-то 8 $
Вывод: мощные модели - экономят.
Fable 5 is also more token-efficient than past Claude models: on Cognition’s FrontierCode evaluation, which tests whether models can pass difficult coding tasks while meeting the standards of high-quality production codebases, Fable 5 scores highest among frontier models, even at medium effort.
мой вывод: попробуй не более двух-трех раз и если не получается, то уже и не получится.
Вы знаете, это не показатель. Ситуации, когда один агент не может разобраться с багом, а второй быстро всё находит - бывают и при переходе от сильных моделей к более слабым. Вот если бы, неудачу потерпели opus, gpt, deepseek, а fable бы быстро нашёл, это бы был более верный эксперимент
Поздравляю с умением доводить задачу до результата.
Или Вывод: повезло.
Про это автор и говорил. Мощные модели нужны для сложных задач. Но нет особого смысла решать дорогой моделью все 100% задач. Условно, 80% времени используем Sonnet, а в 20% Opus или Fable.
Правда, в тексте автор всё-таки не указал что мощные модели могут ещё и сэкономить деньги, на сложных задачах. Там скорее речь шла, что мол за критических задачах надо больше ума, и тут бо́льшие траты имеют смысл.
Сочетание "дёшево и мощно" - это про китайские модели, и, как ни странно, про Гугл :) В результате ценовых войн на сверхконкурентом рынке получаем приличное качество по ненапряжным ценам в API доступе.
Но у "фронтира" есть подписка... :)
а зачем вы убрали из вступительного абзаца фразу "Одно замечание: тон статьи — умеренно критический к индустрии в целом, не к Anthropic конкретно. Если хочешь сместить акцент (сделать жёстче или, наоборот, нейтральнее) — скажу как поправить. И поскольку это мнение под твоим именем, финальное слово за тобой — перечитай, согласен ли ты с формулировками, прежде чем публиковать." ?
Я успел скопировать :)

И скриншот есть )
Интересно не ужели так сложно сделать вывод комментариев модели ну там ярко красным или ядовито-зеленым, ну чтоб не пропускали? Впрочем если не смотреть и CtrlA-CtrlC-CtrlV, то это не поможет)
@Exosphere , @Boomburum , а представители администрации не хотят ли заблокировать автора к черту?
RSS все помнит
Огромная простыня нейрослопа - надо же, мне не показалось.
Пора уже на хабре блокировать нейрослоп. Всегда раньше сюда приходил за личным мнением, а теперь как будто уже не хочется читать.
Спросить у нейронки я и сам могу.
У меня тоже было какое-то смутное ощущение. Вроде бы, написано как не литературный, естественный монолог. Но местами проскакивают едва выделяющиеся странности.
А вот такое вообще свойственно нейронкам "Отдельно про «три недели бесплатно, потом лимиты улетят в секунду»."
В целом, я не против помощи нейронок в текстах. Главное - тоже подумать и проконтролировать текст. А не отдавать всю работу на плечи нейронки. Но замечать это всё-таки забавно.
Сейчас антропики и прочие палят инвесторские бабки. Они имеют свойство заканчиваться. либо будут выпускать урезанные модели либо давать доступ к нормальным по дорогому апи имхо
Почему совсем не учитывается военное применение? Там цена играет ещё меньшую роль. В целом странное использование местоимения "мы". Цель у них – деньги зарабатывать, а наше удобство – тут уж как повезет.
Часто вижу этот аргумент. Странное у вас мышление. Как будто бы вы рынок в глаза никогда не видели. Антропики могли бы плевать на пользователей, если бы они были монополистами. А конкуренты дышат им в спину. Так что, чтобы зарабатывать те самые деньги и не разориться, им приходится думать и об удобстве пользователей.
Чем больше компания плюёт на пользователей, тем активнее они уходят к конкурентам.
Уже все это выглядит для многих как наркотик/курение. Без подключения к задачам любимой модели уже и не строится решение. Братья Либерманы в интервью рассуждали, что мы идем по пути где 2 варианта: 1) все доступно всем, 2) все в руках корпораций. Вот тут явно мы движемся к 2.
Ну, как показывает история, опасность корпораций несколько преувеличена. Государства и политики куда опаснее.
Вот в этом и главная ошибка автора, он предполагает, что все это в конечном счёте создаётся для большинства. Это в корне противоречит здравому смыслу. Зачем дворнику условно давать возможность выполнять задачи профессора? Кто тогда будет двор мести? Роботы? А дворник тогда что будет делать? Дальнейшая цепочка думаю очевидна
А можно промпт статьи огласить? Мне для друга.
качество работы на порядок выше чем у gpt 5.5 и opus 4.8, модель ошибается в разы меньше
Писать такой длинный текст ради одной тревиальной мысли - не уважать читателя. Хотя бы развернуть стоило, минусы, плюсы. Но вдвойне смешнее находить llm штампы в тексте посвященном обсуждению llm
Интересно, а когда она сама даунгрейдиться, то цену всё равно по максимуму платишь? Если да, то нормальный они такой подход пропихивают: "Мы будем подсовывать вам модель потупее когда захотим, вам об этом напрямую никак не расскажем, но при этом будем драть полную стоимость".


Anthropic выпустила Fable 5 — и я задумался, не движемся ли мы не в ту сторону