Comments / Profile of Per

Павел Коковин @Per_Ardua

Frontend developer

Заменяем хабраюзеров ИИ-агентами. Гайд по browser-use

Если попросить, то такие опечатки многие модели тоже могут выдавать без какой-либо дополнительной настройки (помимо просьбы).

Look

JetBrains анонсировала Junie – нейросетевого агента для программирования

Per_Ardua Jan 24 at 13:00

И налоги платить за десятерых

Look

Microsoft AutoGen v0.4: поворотный момент на пути к более интеллектуальным AI-агентам

Per_Ardua Jan 21 at 18:15

Ну и бред, если честно.

Autogen отличается только наличием визуального блочного редактора для создания агентных систем без кода. В этом его фишка, а тут о ней ни слова.

Отличается асинхронностью? Что langchain, что crewAI вполне нормально работают асинхронно в иерархическом типе агентной системы.

Так ещё у langchain с crewAI уже куча инструментов (tools), в то время как на автогене два десятка и то большая часть специфические на работу в azure окружении.

Look

Как ChatGPT может помочь джуну: практический гайд

Per_Ardua Jan 21 at 10:59

Как инструмент отличные, но из джуна не сделают сеньора. Скорей, сделают человека, который думает что он сеньор.

Хоть в этом мы солидарны друг с другом.

современные llm не умеют абстрагировать и следовательно связывать закономерности и события двух разных областей.

Напрямую действительно не могут. Лишь по запросу, с указанием куда копать. Но такой запрос может составить не только человек, но и ИИ, что отвечает за общую канву исследования или за соответствующую его часть, если у него на это достаточно данных и инструментов.

В любом случае, можно посмотреть на факты. Уже сейчас есть специальные бенчмарки (выше скидывал), с реальными задачами (issues), и списком систем, что эти задачи решает, хоть и частично. Например SWE-bench - открытый бенчмарк, в котором в принципе всё относительно прозрачно.

Look

Как ChatGPT может помочь джуну: практический гайд

Per_Ardua Jan 21 at 05:04

Чтобы не быть совсем уж голословным добавлю сюда ссылку на список решений, что проходят тесты на решение реальных issues с гитхаб: https://www.swebench.com

Проект - SWE-bench.

Look

Как ChatGPT может помочь джуну: практический гайд

Per_Ardua Jan 21 at 04:59

С тем, что ИИ не способен пока заменить разработчика - полностью согласен. Сложные запросы ставят современные модели в тупик, в основном благодаря тому, что даже рассуждающие модели могут рассуждать совершенно не в ту сторону.

Но есть нюанс. Для решения комплексных проблем создаются оркестры из разных моделей на основе мультиагентных систем. В таких оркестрах есть агенты, отвечающие за анализ запроса пользователя и его расшифровку в более структурированный вид (по сути рассуждения о том, что действительно имел ввиду пользователь). Есть кодогенерационные агенты; есть те, что будут проверять высокоуровневую логику сгенерированного кода; те, что будут запускать код в сендбоксе и при наличии ошибок анализировать проблемы и отправлять их обратно; те, что имеют доступ к кодовой базе проекта и документации и способны обогащать общий контекст. Каждый агент настроен по своему, у каждого своя роль, свои системные инструкции, свои таски и свои инструменты для их решения. Весь процесс итерационный и может насчитывать множество циклов.

Вот в таком формате ИИ способен решать сложные задачи. Но опять же не без присмотра разработчика, который способен ставить четкие задачи и знает, что хочет получить в итоге и как реализация должна себя вести на всех затрагиваемых уровнях.

То есть даже такие сложные программные комплексы с ИИ являются не волшебной палочкой, способной из недоджуна сделать супер-архитект-сеньор-помидора, а инструментом со своими ограничениями, лишь облегчающие и ускоряющие получение необходимого результата. Причём применяться, зачастую, они должны продвинутыми разработчиками, находящимися в контексте задачи и текущего проекта.

Другой вопрос, что такие комплексы просто так не доступны простому обывателю (а если и доступны, то их, зачастую, ещё нужно правильно настроить). Потому обе крайности в вечном холиваре о возможностях ИИ (1 - ИИ тупее моего попугая, 2 - ИИ заменят синьоров через 3,2...) считаю неверными. Истина как всегда где-то посередине. И чуть-чуть сбоку.

Look

Как ChatGPT может помочь джуну: практический гайд

Per_Ardua Jan 20 at 09:54

Если искали ответ на вопрос в заголовке, то он тут:

Скрытый текст

Никак. По крайней мере пока.

Look

У вас не будет серьезных перемен в жизни, пока вы не смиритесь. Почему это именно так и как работает?

Per_Ardua Jan 20 at 03:46

Вбок?

Look

У вас не будет серьезных перемен в жизни, пока вы не смиритесь. Почему это именно так и как работает?

Per_Ardua Jan 20 at 03:43

Вернул всё на прежние рельсы, чтобы у тебя была возможность смириться

Look

Делаем Телеграм-бота в Cursor AI без знания кода

Per_Ardua Jan 18 at 10:22

Учитесь создавать ИИ-агентов, на ближайшее десятилетие это будет востребованное направление

Look

Делаем Телеграм-бота в Cursor AI без знания кода

Per_Ardua Jan 17 at 18:56

Курсор хорош как продукт, особенно для тех, кто умеет работать с нейросетями. Но если ты не только промпт-инженер, но и, в первую очередь, разработчик, то куда проще и дешевле настроить под себя все необходимые инструменты в своей текущей ide. Весь функционал курсора, конечно, не заменить в адекватные сроки, но то, что используется больше всего уже реализовано в тех или иных расширениях/инструментах.

Look

«Окружающие агенты»: автоматизация повседневных задач и будущее AGI

Per_Ardua Jan 16 at 04:09

Люди будут контролировать действия агентов, но не будут принимать решения за них.

Странная сентенция. "Решения" по смыслу более высокоуровневая абстракция над "действиями". Сравним с оригиналом из источника, для примера:

Chase still expects that there will be a need for keeping humans in the loop as part of the ambient agent experience. But humans need only confirm and validate actions, rather than figure out what needs to be done.

Сразу видно, что для вольного перевода использовали какую-то устаревшую модель ИИ. Либо совсем не умеют её настраивать. Хотя, вариант с не самым ответственным человеком тоже откидывать не стоит.

В общем, надеюсь, что в будущем люди всё же будут принимать решения, а не контролировать и разбираться в том, что нужно для выполнения задачи.

Look

Сэм Альтман знает, как достичь AGI. Я тоже, и сейчас расскажу как

Per_Ardua Jan 14 at 18:09

Тем более, что в данном случае не обязательно находить именно свой кошелёк, достаточно найти любой подходящий

Look

Думающие модели: краткий обзор и чего программистам ждать дальше

Per_Ardua Jan 14 at 04:13

И в попытках оптимизации сделаем его ленивым. По итогу у нас получится точно такое же существо как и человек.

Look

Думающие модели: краткий обзор и чего программистам ждать дальше

Per_Ardua Jan 14 at 04:07

Ну, попробовать то можно и так, вроде как, на aistudio.google.com.

Но он да, уже хорош. Плюс их быстрая модель 2.0 Flash Experimental, которая почти не уступает 1.5 Pro, но работает процентов на 30-40 быстрее получилась очень удачной. И она пока бесплатная (с ограничениями, само собой).

Look

ИИ создаёт необычные микросхемы беспроводной связи, работающие лучше человеческих

Per_Ardua Jan 13 at 12:47

Я хоть и смеюсь, но, откровенно говоря, индусский английский я понимаю куда лучше чем язык нативных спикеров

Look

ИИ создаёт необычные микросхемы беспроводной связи, работающие лучше человеческих

Per_Ardua Jan 13 at 03:48

Это-то и пугает

Look

ИИ создаёт необычные микросхемы беспроводной связи, работающие лучше человеческих

Per_Ardua Jan 13 at 03:43

Так ещё и индийский акцент порой мешает разобраться в сути

Look

Надежность искусственного интеллекта в бизнесе

Per_Ardua Jan 10 at 14:00

Пока нет, но скоро уже появится. Есть уже несколько мультиагентных систем (langchain, crew.ai, etc), которые можно относительно несложно интегрировать с любым доступным API. И которые уже содержат некоторое количество атомарных агентов.

Если знаешь тот же gmail API, то можешь уже сейчас сделать интеграцию и отправлять письма промптами через ИИ. (В принципе, и без мультиагентов это можно сделать, используя function calling современных моделей и обёртку на коленке и это тоже будет работать)

Look

AIOverAI: искусственный интеллект поверх искусственного интеллекта

Per_Ardua Jan 9 at 04:47

Посмотрите в сторону мультиагентных систем. На том же crew ai можно завести всю обёртку в сотню строк кода (примеры есть в сети) и далее уже делать конкретного агента (возможно и не одного, а целую сеть агентов), который будет реализовывать вашу идею с памятью. Тем более там уже есть агенты, что работают с RAG, и вашу идею можно развить с их использованием.

Это не поможет в реализации ядра вашей идеи, но облегчит работу и позволит не думать об обвязке.

Look

1 2 3 4

6 7 8 9 10