Pull to refresh

Comments 19

А качество не агентских моделей падает с начала года медленно но верно

Существует гипотеза "отравления обучающей выборки" - новые модели учатся на текстах, сгенерированных старыми моделями, которые уже заполонили интернет. Из-за этого теряется вариативность, и ответы становятся усредненно-пресными

Есть ещё желающие купить Open AI по оценке 850 млрд. $ ?

Я бы на основании только бенчмарков да еще только от самого разработчика не делал бы таких поспешных выводов.

Я вчера подписку взял. Хотя с осени не оплачивал. Потребовался deep research. И первое что вспомнил.

Уже точно нет, так некоторые из их инвесторов стали занимать деньги "на покушать". Под обдирательский процент, который невозможно выплатить с нормального бизнеса.

Для того, чтобы что-то переписать, надо сначала это что-то написать.

А переписанное приложение в итоге работает или нет? Как дорого это бы обошлось, если бы это делалось на коммерческой основе, а не для демонстрации?

Режим "Agent Swarm" на 300 субагентов — это, по сути, запуск небольшого IT-отдела внутри одной видеокарты.

Ну, "одной" - это сильно сказано конечно.

Внутри одного кластера

Кими вообще шикарен. Генерирует синтетические данные, поднимает виртуалку, прогоняет автотесты. Одна беда - надо жёстко чекистить когда реальный анализ переходит в бред и утечки

sarcasm mode on

с обычными разработчиками также, но им еще и Зряплату платить надо....

sarcasm mode off

Там у него еще артефакт реального разраба, он может написать sorry I'm busy и надо подождать когда он отдохнёт)

Зряплату платить надо

И виртуальным разработчикам тоже. Скромно умолчали сколько там agent swarm токенов за 13 часов сожрал.

вопрос к Знающим людям - есть кучка старых проектов на React - можно ли их отрефакторить нейросетевыми средствами? ни документаций не описания кпроектам нет но входные данные, параметры и результаты для теста собрать можно - системы воплне рабочие.

может кто ткнет примером как сделать что то подобоне....

Нужно. Я не знаю, дает ли Codex еще что-то делать бесплатно, если нет - придется платить за него или за Claude Code.

Оплачиваете, если вы из РФ - проходите танец с бубном вокруг прокси\впн, натравливаете на папку с сорцами и пишете "suggest refactor" в режиме plan. Дальше сами. :)

Если есть входные данные и примеры вывода, кидайте в подпапку и пишите, что это оно. Но не обязательно, современные модели прекрасно понимают, что у вас там наворочено.

Конечно же можно. Даже документацию подробную составит.

Я под такое дело запускаю Клода Опуса с детальными инструкциями на запуск субагентов послабее.

Рефакторят и пишут документацию в любом виде. Опус проверяет. Экономия топлива до 40% при таких манёврах.

"Успешные вызовы инструментов" не показатель. Я тоже могу 1000 раз успешно вызвать grep, но баг в проде от этого сам не починится. Без жесткого human-in-the-loop эта штука просто наплодит изящных, высокопроизводительных уязвимостей

Sign up to leave a comment.

Other news