Одна из немногих хороших и детальных статей про построение агентной простенькой системы, вы большой молодец, я бы хотел с вами выступить в соавторстве или просто познакомиться)
Ну дырка важнее инструмента, это кажется бесспорно, а стохастичность LLM данность, с которой нужно работать, а не бороться. Проблема в том, что веса модели постоянно меняются, и вчерашнее идеально подобранное сверло сегодня внезапно начинает делать брак. К тому же часто некая изменчивость генерации вполне подконтрольна
Но опять таки, как мы ушли в сторону ИИ кодинга. если статья больше про способы машинного улучшения промптов для всяких тулов, например для gen агентов картинов или text2sql
Ну не скажите. Многие вещи можно проверять куда быстрее. Опять таки переносить много рутины, вроде вынести в микросервис на фастапи кусок функционала, а потом когда убедиться что бизнес-логика ок и данные не теряются переписать на более эффективный стек, вроде гошки милое дело
Я не понимаю почему вас минусуют. Вполне адекватные вещи говорите. Если можно настроить пайплайн и отбрасывать плохой код, даже не доводя до пользователя, то даже если 1 из 50 генераций корректна это уже жестко окупается
Одна из немногих хороших и детальных статей про построение агентной простенькой системы, вы большой молодец, я бы хотел с вами выступить в соавторстве или просто познакомиться)
Занятно, а есть ли подтверждения на эту тему? Беглым гуглингом не нашел
Приятно читать хоть чуть-чуть разбирающихся людей, а не про то что ИИ тупиковый путь
А что именно было не понятно? Постараюсь пояснить лучше и по возможности исправить статью
Почему описанные подходы в статье на ваш взгляд нерациональны?
А что вы предлагаете?
Вы противник ИИ?
А какие проекты/продукты можно привести как пример высокой стабильности?
Ну тут как посмотреть
Ну дырка важнее инструмента, это кажется бесспорно, а стохастичность LLM данность, с которой нужно работать, а не бороться. Проблема в том, что веса модели постоянно меняются, и вчерашнее идеально подобранное сверло сегодня внезапно начинает делать брак. К тому же часто некая изменчивость генерации вполне подконтрольна
Но опять таки, как мы ушли в сторону ИИ кодинга. если статья больше про способы машинного улучшения промптов для всяких тулов, например для gen агентов картинов или text2sql
Ну не скажите. Многие вещи можно проверять куда быстрее. Опять таки переносить много рутины, вроде вынести в микросервис на фастапи кусок функционала, а потом когда убедиться что бизнес-логика ок и данные не теряются переписать на более эффективный стек, вроде гошки милое дело
Спасибо тебе, обитатель хабра!
Параметризация не единственный путь. Опять таки очень сильно зависит от сферы применения
Занятное обобщение, однако замечу что по сути и человек так пишет, и ничего, синьором называют
А что именно оверинжниринг? Вложенность комментов уже высокая, потерял суть
А где плотненькое?
Веса да, но вы же промптами на них и параметры никак не влияете
А зачем компании человек ходячий справочник языка который просто реализует по ТЗ скрипт?
Я не понимаю почему вас минусуют. Вполне адекватные вещи говорите. Если можно настроить пайплайн и отбрасывать плохой код, даже не доводя до пользователя, то даже если 1 из 50 генераций корректна это уже жестко окупается