Comments 8
Обычно кешированные запросы стоят раз в 10 дешевле. Так что в целом пофиг получается.
На счет того, что не нужно это всё в контексте - спорно. Модель может понять что она делал и продолжать, например использовать разные поисковые запросы и тп.
Но может и не понять, из-за перегруза контекста. Меньше контекста- выше точность ответа и меньше шансов поймать галюна.
Да, но можно и в кэш не попасть - тогда наступает интересная история с "дороже". Вроме того, защита вида <random> промпт </random> убивает кеш - и становится совсем грустно для кеширования :)
Я написал свой собственный mcp-сервер для работы с иконками в своём проекте (показать какие иконки есть, с поиском).
Замерил в курсоре расход токенов при работе с этим mcp-сервером и без на одном и том же запросе. Без - в 6-8 раз больше.
Это практика супротив вашей теории. Не говоря уже о том что нет глюков, и всё быстрее и надёжнее происходит.
Да, стоило оговориться, что я не противник этого подхода, если он обоснован и не превращает работу с нейронкой в бесконечный цикл вызовов модели и инструментов. К сожалению, не очень понял, как в вашем случае курсор выполняет те же действия без инструментов, но вероятно это тот случай, когда все сделано прямыми руками и нужными средствами.
Курсор сам либо придумывает, что иконка есть, либо лезет в файловую систему и проверяет, что есть. С поддиректориями это куча запросов.
То же самое мср сервера-документации каких-то библиотек очень много экономят токенов и нервов
Он превращается в таковой, когда из дисциплинированного запроса на следующих итерациях, пользователь начинает нервничать (или наоборот -расслабляется от успехов удачных первых шагов) и разговаривать с ИИ как с джуном, переставая давать полные и четкие указания. MCP не панацея, и что хуже того - качественно написанных не так и много, но если привыкаешь, то не смотря на некоторый лишний трафик токенов, потом может существенно их сократить , когда к примеру сам находит по записям в memory что впал в цикла, из которого его ранее выведен способом, который на том этапе записал в напоминалку. Так что, просто нужно постоянно учиться пользоваться инструментами ИИ, пока состояние с разработкой с их помощью, на той стадии, каково оно есть сейчас.
LLM-клиент с MCP – дорогой и неэффективный подход в разработке