2025 年 весь год AI-инженерное сообщество бурно спорило о том, что лучше для вызова инструментов агентами — «MCP vs CLI». Опубликованная в ноябре 2025 года статья Anthropic «Code execution with MCP» переопределила проблему с точки зрения первых принципов. akshay_pachaar 5/10 собрал thread и пояснил: дело никогда не в самом протоколе, а в старой привычке — на старте session пихать в context описание всех инструментов целиком; решение Anthropic заключается в том, чтобы модель писала код для вызова инструментов, а runtime отвечал за управление деталями инструментов. Новую схему называют «Code Mode».
Проблема старого режима: в 150 тыс. tokens большая часть не используется
Пустая трата в старом MCP-режиме:
Playwright MCP: 13,7 тыс. tokens (один раз целиком)
Chrome DevTools MCP: 18 тыс. tokens
5 серверов настроек: еще не начали работу — уже сожгли 55 тыс. tokens
Один workflow с полным выполнением: может раздуваться до 150 тыс. tokens
Фактически используемая моделью: подавляющее большинство не нужно
Критики считают, что надо переходить на CLI, но CLI в multi-tenant приложениях легко ломается, не хватает typed contract, а агенту, чтобы распарсить вывод текста при работе с незнакомым API, приходится делать лишние итерации. Обе стороны по-своему правы, но обе неверно определяют, где именно проблема.
Решение: модель пишет код вызова инструментов, больше не делает direct call из context
Ключевые принципы предложенного Anthropic «Code Mode»:
Переворот роли модели: не модель вызывает инструменты через context, а модель пишет код, и runtime вызывает инструменты
Инструменты живут в runtime, а модель видит только то, что она import’нула
type следует за import’ом: какая модель import’ит tool, такую типизированную контрактную связку она и получает
Вызов через Bash уже установленных бинарников (git, curl и т.д.)
Вызов через typed module imports специализированного API
Пример Anthropic: текстовый поток записей Google Drive поступает в Salesforce CRM для обновления. Старый подход загружает schema для обеих сторон и передает модели весь отрезок текста дважды; новый подход — 10 строк TypeScript: только import нужного, тот же сценарий сжимается с исходных 150 тыс. до 2 тыс. tokens, то есть на 98,7%.
Cloudflare довела до предела: 2 500 endpoint’ов API — сжатие с 1,17 млн tokens до 1 тыс.
Cloudflare сделала самый радикальный вариант:
Исходный масштаб API: 2 500 endpoint’ов, суммарно schema = 1,17 млн tokens
Новый подход: раскрываем только две функции search и execute, всего 1 тыс. tokens
Агент пишет код: сначала search по каталогу инструментов, затем execute для соответствующего инструмента
Коэффициент сжатия: более чем в 1k раз
Фраза «MCP уже умерла» неверна — Anthropic сообщила, что скачивания MCP SDK достигли 300 млн, в начале года было 100 млн; это один из самых быстрорастущих элементов инфраструктуры для агентных систем. Умирает не MCP, а подход «на старте session загружать все инструменты целиком» — а это и правда плохая идея. Для разработчиков агентов в 2026 году правила простые: определения инструментов относятся к коду, а не к context; модель пишет несколько строк кода для вызова, а остальное делает runtime.
Конкретные события, которые можно отслеживать дальше: скорость роста скачиваний MCP SDK с 300 млн; станет ли Anthropic стандартизировать Code Mode как официально рекомендованный режим в рамках MCP-спецификации; и прогресс внедрения Code Mode в других агентных платформах вроде OpenAI, Google, Cursor.
Эта статья о том, как Code Mode в Anthropic решает спор MCP vs CLI: инструменты живут в runtime, а tokens сжимаются с 150 тыс. до 2 тыс. — впервые появилась в «цепных новостях» ABMedia.
Related News
Anthorpic запускает финансового AI-агента для профессионалов, инсайдеры в отрасли раскрывают ключевой момент: Claude не может заменить аналитиков
OpenAI раскрывает неожиданные последствия оценки CoT: сохранение мониторинга цепочек рассуждений — ключевая линия защиты для настройки AI-агентов к целям
Инженер Anthropic: HTML — лучший формат вывода для Claude Code, а не Markdown
Клод/GPT слишком любят угождать? Одна подсказка из Claude.md заставляет ИИ выдавать жёсткие и точные ответы
Руководитель Claude Code Борис: ИИ-агенты повышают производительность людей и переписывают историю разработки программного обеспечения