PavelTkachenk011 июн в 06:00

Токен-оптимизация агентов: на что уходит контекстное окно MCP

Простой

4 мин

5.9K

Искусственный интеллектOpen source * Программирование *

Аналитика

Комментарии 2

Delnor 11 июн в 06:10

Пагинация и суммаризация ответов это понятный рычаг, но тут же возникает вопрос кто суммаризирует. Если та же модель отдельным вызовом, то часть сэкономленного на контексте возвращается стоимостью этого вызова.

PavelTkachenk0 11 июн в 06:51

Согласен, но, как мне кажется, стоит разделить оптимизацию тулза mcp на две стороны:
1) Оптимизация ответа тулза непосредственно на стороне самого mcp. Тогда отдельного вызова-суммаризатора нет вообще, а значит, и стоимость не возникает: мы сами решаем, что инструмент кладёт на выход — не сырой дамп, а нужные поля с лимитом и пагинацией.
2) Если говорить о клиентской оптимизации, то вызов суммаризации действительно не бесплатен. Но ответ инструмента остаётся в истории и пересылается модели на каждом следующем шаге, а суммаризация — разовая операция в рамках одного ответа тулза.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий