Pull to refresh
32K+
88
Pastukhov Nikita@Propan671

Python, OpenSource enthusiast, FastStream creator

240,6
Rating
114
Subscribers
Send message

А почему именно Claude Code, если он по бенчмаркам чуть ли не худший Harness для агентов?

Не сравнивали с Forgecode / Opencode? Там даже изобретать не надо, OpenAI интерфейс они поддерживают

Зависит от модели. Многие OSS модели старого поколения с трудом справляются с вызовом инструментов. По моей практике с Qwen3.5+ уже все норм работает

Локальные модели предоставляют доступ по OpenAI Compatible, так что ты просто адрес указываешь для подключения - и все должно работать

Мне нравится, как они смотрятся в тексте

Да, все правда. Но это уже нюансы. Генерально - все просто. А дальше сидишь неделю тюнишь описания тулов и промпты, чтобы оно работало не на бумаге, а на практике

А его и не надо делать. Лучше сделать что-нибудь узкоспециализированное под конкретную задачу

Да, вполне валидно. У меня просто как-то так сложилось, что под бытовые задачи мне проще написать таргетного агента. Но мб и стоит присмотреться к агентам общего назначения - быстрее получится процессы автоматизировать

Это решается через HITL. Модель сама по себе не может взаимодействовать с внешним миром - только через ваши инструменты. А критичные инструменты надо прятать под апрув пользователя

Есть разные VAD алгоритмы, которые определают, когда слушать. Чисто технически их можно реализовать прям в коде без передачи данных в LLM - и отправлять по API только те аудиофайлы, что хотите

Или сделать проще - слушать только при активации. У меня хоткей на системе просто)

Очень интересно, т.к. я не использовал нейросети при написании. Это вообще текстовый вариант моего же доклада на конференции

Разница в том, что твой агент слушает только то, что ты ему разрешаешь) код же сам написал.

Осталось дождаться, когда у OSS провайдеров будет LiveAPI

Тут сложно. Есть такая штука от Nvidia - Garak. Это инструмент для тестирования устойчивости твоего агента к распространенным видам атак. У меня обычно какой пайплан - натравливаю Garak на агента, а потом пытаюсь пофиксить что нашлось. Обычно это пайплайн из нескольких подходов - куча регулярок, статистический анализ текста, прям в системный промпт агента дописывается инструкция, что делать не стоит. И в худших сценариях, да - это отдельный классификатор, который прогоняет сообщение перед передачей его в модель. Таким классификатором может быть как LLM (другой агент), так и любой другой МЛ алгоритм

А это и не "форк" Майкрософт. Это оригинальные авторы Autogen ушли из Майкрософт и сделали AG2 фреймворк как развитие идей оригинального autogen. Поэтому pypi пакет `pip install autogen` и принадлежит нам

Но я сейчас делаю совсем новую версию, которая пока прячется внутри модуля autogen.beta. Это совершенно новый фреймворк, который никак не опирается на оригинальную кодовую базу. И вот он уже после релиза 1.0.0 (пара месяцев) будет доступен как `pip install ag2` - или даже как-то иначе. Я лично сам выступаю за полный ребрендинг, но не все зависит от меня)

Почему сразу вайбкод? Можно писать и руками)
Инструменты - это та детерменированная логика, доступ к которой вы даете агенту на уровне кода. У каждого логика своя, поэтому и инструменты свои
Но для типовых задач уже есть переиспользуемые наборы инструментов, интеграций и MCP. Кажется, я даже ссылки в статье приводил

прям в каждой? - вряд ли: есть целые AI-limited/disabled сектора в ИТ: ВПК, dual-use, авионика, специальные контуры...

По большей части за рубежом это решается "эксклюзивными" контрактами с крупными провайдерами. Тот же Пентагон хвастался, что использовал Anthropic для планирования операций. С теми крупными компаниями, кто является клиентами AG2 (телеком, банки) - та же история. У них просто эксклюзивные договоры с OpenAI

Практика хостить свои модели есть, но она менее распространена

По остальному комментариев нет - все в точку)

Значит жду фидбек)

https://github.com/sonichi/sutando - я пока над ним не работаю, но видимо, вот-вот отправят)

Еще про ИИ?)

Честно говоря, я сходство не очень улавливаю

Information

Rating
15-th
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity