Обновить
76
Александр Щепановский@Suor

Пользователь

0,1
Рейтинг
13
Подписчики
Отправить сообщение

Кажется на питоне можно было за 8 часов без всяких клодов и спеков написать. А если с Клодом, но без спеков за 2-3 часа. Вообще, задача небольшая, тут даже plan mode не факт что нужен

GLM и рядом не валялся, опус тормозил, конечно, и иногда просто вылетал по перегрузке, но глупостей не генерировал, по крайней мере, у меня

Я имел в виду именно 3.6 plus.

Вот только этот квен тупой как пробка. Он найдёт только всякие шаблонные ошибки да опечатки. А ещё же есть ложноположительные срабатывания, которые могут привести к тому, что ИИ вам не экономит время, а тратит.

На пару лет рассчитывать такое себе. Там могут и проблемы с чипами решить или, что более вероятно, пузырь ИИ сдуется. Поэтому нужно брать деньги инвесторов пока дают, оптимизировать инференс и вообще учиться жить на свои: больше зарабатывать и меньше тратить.

Обвязка - русское слово для harness

Все примеры не про модель, а про инструкции. Непонятно, что мешало всё то же самое делать с другими моделями

Добавить проверку или детерминированную через хук, или в виде другого агента, у которого другой задачи нет, кроме как проверять, что оно на сервере

В малом бизнесе просто нет такого количества дурных процессов, которые надо автоматизировать. Ещё нет дурных процессов, которые в принципе не автоматизируются. А ещё нет такого, что несколько лет пилится какая-то хрень, а потом выбрасывается. Нет целых подразделений, которые занимаются или обслуживанием сложности большой компании, или и вовсе никому не нужной ерундой.

В общем крупный бизнес конкурирует не с помощью какой-то эффективности или оптимизации, а за счёт концентрации ресурсов.

Разные сессии дают разные результаты, для этого ничего не нужно менять разработчикам.

Скорей всего никакого живого оператора не было

Тут задачи всё-таки весьма специфические, так что вполне может быть

На моем рабочем нет никакой возможности подключить впн

Можно поднять локальный сингбокс как http proxy и перенаправить трафик Клода в него с помощью переменных окружения.

Можно также и весь трафик перехватывать и просто большую часть направлять обратно в интерфейс корпоративного ВПН - несколько более замороченный вариант, зато без прокси.

Это статическое мышление, а динамическое такое - сейчас мы наговнокодим, а через полгода-год, когда нужно будет разгребать модели поумнеют и разгребут.

А может и не понадобится разгребать, там какой-то подкаст, может, у них с точки зрения программирования всё просто. Им нужно с точки зрения маркетинга всё правильно сделать, поэтому найм маркетологов - как раз то, что нужно

Было же исследование. Побеждает польский, потом русский, потом английский (плюс какие-то посадочные варианты). Но разница невелика

Это не квантование, а разные модели. Как Gemini 3 Pro и Gemini 3 Flash

У опуса лучше и даже у сонета. Такое весьма редко приходится видеть.

Ну такой тест и люди не пройдут)

Слишком ограниченный набор бумаг, ничего интересного не увидим. Пока на графиках полный рандом.

1 ms или 90 ms вообще без разницы, сетевые задержки уже больше, а уж на "подумать" модели ещё больше. Т.е. тулза не стоит потраченного контекста и сопровождающих проблем - Клод будет пытаться, если индекс устарел и не находит чего-то, что должно

1
23 ...

Информация

В рейтинге
4 494-й
Откуда
Красноярск, Красноярский край, Россия
Дата рождения
Зарегистрирован
Активность