it_police Dec 3 2025 at 20:46

LLM-клиент с MCP – дорогой и неэффективный подход в разработке

Medium

4 min

Programming * Python * Development for e-commerce *

Opinion

Comments 8

Akuma Dec 3 2025 at 21:29

Обычно кешированные запросы стоят раз в 10 дешевле. Так что в целом пофиг получается.

На счет того, что не нужно это всё в контексте - спорно. Модель может понять что она делал и продолжать, например использовать разные поисковые запросы и тп.

it_police Dec 3 2025 at 22:17

Но может и не понять, из-за перегруза контекста. Меньше контекста- выше точность ответа и меньше шансов поймать галюна.

mst_72 Dec 5 2025 at 05:18

Да, но можно и в кэш не попасть - тогда наступает интересная история с "дороже". Вроме того, защита вида <random> промпт </random> убивает кеш - и становится совсем грустно для кеширования :)

Akuma Dec 5 2025 at 06:40

Ну так кто промпты то делает?)) Попадайте

gmtd Dec 3 2025 at 21:33

Я написал свой собственный mcp-сервер для работы с иконками в своём проекте (показать какие иконки есть, с поиском).

Замерил в курсоре расход токенов при работе с этим mcp-сервером и без на одном и том же запросе. Без - в 6-8 раз больше.

Это практика супротив вашей теории. Не говоря уже о том что нет глюков, и всё быстрее и надёжнее происходит.

it_police Dec 3 2025 at 22:21

Да, стоило оговориться, что я не противник этого подхода, если он обоснован и не превращает работу с нейронкой в бесконечный цикл вызовов модели и инструментов. К сожалению, не очень понял, как в вашем случае курсор выполняет те же действия без инструментов, но вероятно это тот случай, когда все сделано прямыми руками и нужными средствами.

gmtd Dec 4 2025 at 04:01

Курсор сам либо придумывает, что иконка есть, либо лезет в файловую систему и проверяет, что есть. С поддиректориями это куча запросов.

То же самое мср сервера-документации каких-то библиотек очень много экономят токенов и нервов

starfair Dec 4 2025 at 05:54

Он превращается в таковой, когда из дисциплинированного запроса на следующих итерациях, пользователь начинает нервничать (или наоборот -расслабляется от успехов удачных первых шагов) и разговаривать с ИИ как с джуном, переставая давать полные и четкие указания. MCP не панацея, и что хуже того - качественно написанных не так и много, но если привыкаешь, то не смотря на некоторый лишний трафик токенов, потом может существенно их сократить , когда к примеру сам находит по записям в memory что впал в цикла, из которого его ранее выведен способом, который на том этапе записал в напоминалку. Так что, просто нужно постоянно учиться пользоваться инструментами ИИ, пока состояние с разработкой с их помощью, на той стадии, каково оно есть сейчас.