All streams
Search
Write a publication
Pull to refresh
3
0
Павел Коковин @Per_Ardua

Frontend developer

Send message

Если попросить, то такие опечатки многие модели тоже могут выдавать без какой-либо дополнительной настройки (помимо просьбы).

Ну и бред, если честно.

Autogen отличается только наличием визуального блочного редактора для создания агентных систем без кода. В этом его фишка, а тут о ней ни слова.

Отличается асинхронностью? Что langchain, что crewAI вполне нормально работают асинхронно в иерархическом типе агентной системы.

Так ещё у langchain с crewAI уже куча инструментов (tools), в то время как на автогене два десятка и то большая часть специфические на работу в azure окружении.

Как инструмент отличные, но из джуна не сделают сеньора. Скорей, сделают человека, который думает что он сеньор.

Хоть в этом мы солидарны друг с другом.

современные llm не умеют абстрагировать и следовательно связывать закономерности и события двух разных областей.

Напрямую действительно не могут. Лишь по запросу, с указанием куда копать. Но такой запрос может составить не только человек, но и ИИ, что отвечает за общую канву исследования или за соответствующую его часть, если у него на это достаточно данных и инструментов.

В любом случае, можно посмотреть на факты. Уже сейчас есть специальные бенчмарки (выше скидывал), с реальными задачами (issues), и списком систем, что эти задачи решает, хоть и частично. Например SWE-bench - открытый бенчмарк, в котором в принципе всё относительно прозрачно.

Чтобы не быть совсем уж голословным добавлю сюда ссылку на список решений, что проходят тесты на решение реальных issues с гитхаб: https://www.swebench.com

Проект - SWE-bench.

С тем, что ИИ не способен пока заменить разработчика - полностью согласен. Сложные запросы ставят современные модели в тупик, в основном благодаря тому, что даже рассуждающие модели могут рассуждать совершенно не в ту сторону.

Но есть нюанс. Для решения комплексных проблем создаются оркестры из разных моделей на основе мультиагентных систем. В таких оркестрах есть агенты, отвечающие за анализ запроса пользователя и его расшифровку в более структурированный вид (по сути рассуждения о том, что действительно имел ввиду пользователь). Есть кодогенерационные агенты; есть те, что будут проверять высокоуровневую логику сгенерированного кода; те, что будут запускать код в сендбоксе и при наличии ошибок анализировать проблемы и отправлять их обратно; те, что имеют доступ к кодовой базе проекта и документации и способны обогащать общий контекст. Каждый агент настроен по своему, у каждого своя роль, свои системные инструкции, свои таски и свои инструменты для их решения. Весь процесс итерационный и может насчитывать множество циклов.

Вот в таком формате ИИ способен решать сложные задачи. Но опять же не без присмотра разработчика, который способен ставить четкие задачи и знает, что хочет получить в итоге и как реализация должна себя вести на всех затрагиваемых уровнях.

То есть даже такие сложные программные комплексы с ИИ являются не волшебной палочкой, способной из недоджуна сделать супер-архитект-сеньор-помидора, а инструментом со своими ограничениями, лишь облегчающие и ускоряющие получение необходимого результата. Причём применяться, зачастую, они должны продвинутыми разработчиками, находящимися в контексте задачи и текущего проекта.

Другой вопрос, что такие комплексы просто так не доступны простому обывателю (а если и доступны, то их, зачастую, ещё нужно правильно настроить). Потому обе крайности в вечном холиваре о возможностях ИИ (1 - ИИ тупее моего попугая, 2 - ИИ заменят синьоров через 3,2...) считаю неверными. Истина как всегда где-то посередине. И чуть-чуть сбоку.

Если искали ответ на вопрос в заголовке, то он тут:

Скрытый текст

Никак. По крайней мере пока.

Вернул всё на прежние рельсы, чтобы у тебя была возможность смириться

Учитесь создавать ИИ-агентов, на ближайшее десятилетие это будет востребованное направление

Курсор хорош как продукт, особенно для тех, кто умеет работать с нейросетями. Но если ты не только промпт-инженер, но и, в первую очередь, разработчик, то куда проще и дешевле настроить под себя все необходимые инструменты в своей текущей ide. Весь функционал курсора, конечно, не заменить в адекватные сроки, но то, что используется больше всего уже реализовано в тех или иных расширениях/инструментах.

Люди будут контролировать действия агентов, но не будут принимать решения за них.

Странная сентенция. "Решения" по смыслу более высокоуровневая абстракция над "действиями". Сравним с оригиналом из источника, для примера:

Chase still expects that there will be a need for keeping humans in the loop as part of the ambient agent experience. But humans need only confirm and validate actions, rather than figure out what needs to be done.

Сразу видно, что для вольного перевода использовали какую-то устаревшую модель ИИ. Либо совсем не умеют её настраивать. Хотя, вариант с не самым ответственным человеком тоже откидывать не стоит.

В общем, надеюсь, что в будущем люди всё же будут принимать решения, а не контролировать и разбираться в том, что нужно для выполнения задачи.

Тем более, что в данном случае не обязательно находить именно свой кошелёк, достаточно найти любой подходящий

И в попытках оптимизации сделаем его ленивым. По итогу у нас получится точно такое же существо как и человек.

Ну, попробовать то можно и так, вроде как, на aistudio.google.com.

Но он да, уже хорош. Плюс их быстрая модель 2.0 Flash Experimental, которая почти не уступает 1.5 Pro, но работает процентов на 30-40 быстрее получилась очень удачной. И она пока бесплатная (с ограничениями, само собой).

Я хоть и смеюсь, но, откровенно говоря, индусский английский я понимаю куда лучше чем язык нативных спикеров

Так ещё и индийский акцент порой мешает разобраться в сути

Пока нет, но скоро уже появится. Есть уже несколько мультиагентных систем (langchain, crew.ai, etc), которые можно относительно несложно интегрировать с любым доступным API. И которые уже содержат некоторое количество атомарных агентов.

Если знаешь тот же gmail API, то можешь уже сейчас сделать интеграцию и отправлять письма промптами через ИИ. (В принципе, и без мультиагентов это можно сделать, используя function calling современных моделей и обёртку на коленке и это тоже будет работать)

Посмотрите в сторону мультиагентных систем. На том же crew ai можно завести всю обёртку в сотню строк кода (примеры есть в сети) и далее уже делать конкретного агента (возможно и не одного, а целую сеть агентов), который будет реализовывать вашу идею с памятью. Тем более там уже есть агенты, что работают с RAG, и вашу идею можно развить с их использованием.

Это не поможет в реализации ядра вашей идеи, но облегчит работу и позволит не думать об обвязке.

Information

Rating
Does not participate
Location
Новосибирск, Новосибирская обл., Россия
Date of birth
Registered
Activity