Comments 19
А качество не агентских моделей падает с начала года медленно но верно
Есть ещё желающие купить Open AI по оценке 850 млрд. $ ?
Я бы на основании только бенчмарков да еще только от самого разработчика не делал бы таких поспешных выводов.
Я вчера подписку взял. Хотя с осени не оплачивал. Потребовался deep research. И первое что вспомнил.
Уже точно нет, так некоторые из их инвесторов стали занимать деньги "на покушать". Под обдирательский процент, который невозможно выплатить с нормального бизнеса.
Для того, чтобы что-то переписать, надо сначала это что-то написать.
А переписанное приложение в итоге работает или нет? Как дорого это бы обошлось, если бы это делалось на коммерческой основе, а не для демонстрации?
Режим "Agent Swarm" на 300 субагентов — это, по сути, запуск небольшого IT-отдела внутри одной видеокарты.
Кими вообще шикарен. Генерирует синтетические данные, поднимает виртуалку, прогоняет автотесты. Одна беда - надо жёстко чекистить когда реальный анализ переходит в бред и утечки
sarcasm mode on
с обычными разработчиками также, но им еще и Зряплату платить надо....
sarcasm mode off
вопрос к Знающим людям - есть кучка старых проектов на React - можно ли их отрефакторить нейросетевыми средствами? ни документаций не описания кпроектам нет но входные данные, параметры и результаты для теста собрать можно - системы воплне рабочие.
может кто ткнет примером как сделать что то подобоне....
Нужно. Я не знаю, дает ли Codex еще что-то делать бесплатно, если нет - придется платить за него или за Claude Code.
Оплачиваете, если вы из РФ - проходите танец с бубном вокруг прокси\впн, натравливаете на папку с сорцами и пишете "suggest refactor" в режиме plan. Дальше сами. :)
Если есть входные данные и примеры вывода, кидайте в подпапку и пишите, что это оно. Но не обязательно, современные модели прекрасно понимают, что у вас там наворочено.
Конечно же можно. Даже документацию подробную составит.
Я под такое дело запускаю Клода Опуса с детальными инструкциями на запуск субагентов послабее.
Рефакторят и пишут документацию в любом виде. Опус проверяет. Экономия топлива до 40% при таких манёврах.
"Успешные вызовы инструментов" не показатель. Я тоже могу 1000 раз успешно вызвать grep, но баг в проде от этого сам не починится. Без жесткого human-in-the-loop эта штука просто наплодит изящных, высокопроизводительных уязвимостей
+185% за 13 часов: как Kimi K2.6 переписала 8-летний движок