Комментарии 2
Пагинация и суммаризация ответов это понятный рычаг, но тут же возникает вопрос кто суммаризирует. Если та же модель отдельным вызовом, то часть сэкономленного на контексте возвращается стоимостью этого вызова.
Согласен, но, как мне кажется, стоит разделить оптимизацию тулза mcp на две стороны:
1) Оптимизация ответа тулза непосредственно на стороне самого mcp. Тогда отдельного вызова-суммаризатора нет вообще, а значит, и стоимость не возникает: мы сами решаем, что инструмент кладёт на выход — не сырой дамп, а нужные поля с лимитом и пагинацией.
2) Если говорить о клиентской оптимизации, то вызов суммаризации действительно не бесплатен. Но ответ инструмента остаётся в истории и пересылается модели на каждом следующем шаге, а суммаризация — разовая операция в рамках одного ответа тулза.

Токен-оптимизация агентов: на что уходит контекстное окно MCP