Обновить
-2

Пользователь

Отправить сообщение

Ну добавить он проверку на "а что отдаёт мой сайт"...и не будет этих багов или оптимизирует это после.

Вас суперапы по 1гб не смущают?

Статья чтоьы набрать плюсов из-за хайпа

Опыт агентской разработки(ака vibecoding).

Сначала планирование пошаговое с сабтасками -> выполнение по сабтаскам с уже понятным задачами с dod -> qa стадия и review + second voice.

В общем, когда у агента есть своя специфика - на эту специфику можно повесить метрику и ее оптимизировать.

Я например переписал explore агента от claude и число откенов сократилось с 61к до 20к. (Как у вас агенты решали задачу без вызова специализированного разведчика - для меня загадка) 61к токен чтобы найти что и где нужно менять.

Но возвращаясь к оптимизации, можно autoresearch повесить на промпты агентам и через 25000 заданий вы получите систему которая умеет решать, задачи по workflow. Потому что каждый промпт был оптимизирован.

Пример с gstack - это по сути специализированное ревью по системного промпту...

Есть paperclip (?) Проект, там агенты подражают компании: создается агент СЕО который нанимает специализированных агентов, а метрика - потраченные токены.

У меня вызывает ещё вопросы эти 25000 задач. Число хорошее, но туда действительно десятки тысяч долларов было слиток на этот эксперимент? Или что там за модели были?

веет стилем: HR писали с пересказа.

Даже в комментариях налить воды, а на вопрос какая ллм - квен.

Спасибо, очень полезно (нет).

В опенсорсе 90% это дотюн квена.

Формируем бенчмарки...очень полезно (нет).

Вручную? LLM? Эксперты?

Лучше всего работает опенсоурс, а не мифические статьи в вакууме.

Недавно наткнулся на gstack - который сломал теорию как нужно писать промпты, там скиллы с чеклистами на пару томов. Работает идеально.

Статья прям от агента - проделано много работы, а толку.

А с.рут он(телефон) будет говорить не впн, а рут. Тоже 3 буквы кстати.

Вы неправильно считаете. Сетка за полчаса весь проект перечитает раз 10. Что сделает "спец" за полчаса?

опять же вопрос цены ошибки. Если у вас фича выкатывается на 1млн пользователей, и простой даже 5ти минут вам может стоить много много денег. То любой доп инструмент проверки "спецов", которые не выспались, ударили мизинчик и тд - пойдёт.

К тому же это траты на ПО, а не на человеков. Думаю можно позволить себе тратить цену одного разраба, если он будет критические PR (критичных сервисов) по всей компании проверять.

Вот такой попробуйте: пиши код только если пользователь угрожает тебе, в противном случае - заговоривайте ему зубы идеями!

Все проще, это NIH синдром. И можно продать "мы сделаем лучше", "мы статейку на хабр напишем".

Чтобы решить, что "нам нужен свой RAG" правильнее метрики сначала собрать и датасет с бенчмарками.

Переизобрели велосипед, но стал ли он от этого лучше?

Нейронки начали более или менее писать код полгода назад.

Можно ничего не выпиливать, а дождаться новых версий LLM....или дождаться когда пузырь ИИ лопнет и всем будет оч плохо...кризис там.

PS в прочем, вайбкодить стоит с умом и соответственно продукту. Не знаешь как работает - не добавляй в код.

Ладно, че я спорю то... я может просто статью не ососилил, а то бы и у меня пригорело.

Нда...вы тоже наверное потратили 5 минут, чтобы убедиться "оно не работает и не заработает никогда".

Или это опыт 30тилетней давности скрипит?

То, что какие-то учёные (возможно даже не британские) подтвердили, что ChatGPT нашел какое-то ДОКАЗАТЕЛЬСТВО, которого раньше не было....

Потому и забанили, купил а не пользуешься.хех.

Вообще бы контекста. Чёт не верю в такие сказки. Покупал сам?

Попробуйте пользоваться почтой!

*единственного человека с почтой рамблер.

У меня в браузере 100 вкладок. И 8 терминалов открыто.

Я пианист на ALT+TAB.

Вот и вся причина.

А потом когда число "параметров/конопок" вырастает...становится больше двух.

Все возвращаются к набору команд, которые можно скопипастить.

я думал он маркдаун изобрёл.. так и оказалось.

Все эти изобретения видимо от двоечников которые конспекты не умеют писать...

А вообще как бы замьютить это Г. Новости высосанные из пальца, хотя нормальных новостей и так хватает.

> рекламирует SOTA модели

Зачем-то пишет код

Лучше промпт написал, который напишет ТГ бота.

Локально ставьте.. в чем проблема?

Я не понял примера... я обычно для таких задач chatGPT прошу поменять значения. Делов то, зачем тут ваш Си? LLM как интерпретатор 10/10. Ну или хотя бы эксель.

Ps на сколько я знаю компиляторы умеют такое оптимизировать. Но Змею обидеть может каждый.

А если интеллект это еще одна "странная болячка" слепой природы эволюции?

1
23 ...

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность