AI-инженер Akshay Pachaar 10 мая в X опубликовал полную схему Claude Code, разделив всю систему на 6 уровней и подчеркнув, что «модель — всего лишь один из узлов в цикле». В посте Pachaar ссылается на его большое эссе от 6 апреля《The Anatomy of an Agent Harness》— суть в том, что Claude Code кажется «магией» не из‑за самой модели, а благодаря тонкой инженерии harness.
6-уровневая архитектура: модель — лишь один узел
6 уровней Claude Code, которые собрал Pachaar:
Input Layer(уровень ввода):отвечает за управление session, контроль прав и настройку trust-level через YAML. Любые команды перед входом в модель сначала проходят этот уровень.
Knowledge Layer(уровень знаний):включает skill registry, context compressor (3 уровня с порогом срабатывания 92%), task graph и хранилище памяти между session. Здесь находится «интеллект» harness — он существует отдельно от весов модели.
Execution Layer(уровень выполнения):через typed registry распределяет вызовы инструментов, и у каждого инструмента — свой handler: bash、read、write、grep、glob、revert. Streaming runtime поддерживает параллельное выполнение, prompt cache повторно использует стабильные префиксы, а стоимость опускается до 10%.
Integration Layer(интеграционный уровень):MCP runtime подключает внешние серверы (filesystem、git、кастомные инструменты). Инструменты регистрируются внутрь, а память записывается наружу в agent_memory.md.
Multi-Agent Layer(уровень мультиагентов):включает subagent spawner, teammate mailboxes для связи через redis pub/sub, протокол конечных автоматов с ограниченным числом состояний (IDLE→REQUEST→WAIT→RESPOND), autonomous board с атомарными блокировками, а также изоляцию worktree (каждое задание — свой git branch).
Observability Layer(уровень наблюдаемости):оборачивает event bus всех уровней и lifecycle hooks, а фоновые исполнители работают в режиме daemon thread, не блокируя выполнение.
В центре — «master agent loop»(основной агентский цикл):восприятие → действие → наблюдение. Anthropic сам определяет этот цикл как «dumb loop»(тупой цикл)— весь «ум» находится в выводе модели, а harness отвечает за диспетчеризацию.
Ключевой дизайн: context compressor и изоляция worktree
Несколько деталей, на которые стоит обратить внимание:
Context compressor: сжатие в 3 слоя и порог 92%:когда контекст приближается к 92% объёма, срабатывают суммаризация и сжатие — сохраняются архитектурные решения и нерешённые bug, выбрасываются повторяющиеся выходы инструментов. Это перекликается с публичным «guidelines по context engineering» от Anthropic: собрать минимальный набор токенов с высокой информативностью и максимизировать вероятность достижения цели.
Изоляция Worktree:каждый subagent работает в отдельном git worktree и на отдельной ветке; при объединении выполняется детект конфликтов. Эта схема делает возможными параллельные изменения одним и тем же репозиторием несколькими агентами без взаимного «наступания на пятки». В трёх режимах субагентного выполнения Claude Code — «Fork / Teammate / Worktree» — Worktree даёт самую сильную степень изоляции.
Стоимость 10% для prompt cache:за счёт кэша стабильных префиксов (system prompt、определения инструментов、CLAUDE.md) повторные вызовы с одинаковыми префиксами платят только 10% стоимости стандартных токенов. Это ключ к тому, чтобы длительные задания в рамках одной сессии могли держаться в контролируемом бюджете.
Почему этот разбор нашёл отклик в сообществе
Пост Pachaar набрал 522 лайка и 115 репостов, в комментариях появилось: «Я думал, это просто CLI-инструмент», «Думал, что Claude Code = model + доступ к терминалу, не знал, что в multi-agent layer столько всего работает» и т. п. Это отражает то, что многие разработчики всё ещё понимают Claude Code как «Claude API, обёрнутый в слой CLI», недооценивая сложность инженерии harness.
Pachaar приводит слова Vivek Trivedy из LangChain как центральный аргумент: «Если ты не модель, то ты harness». Тесты LangChain на TerminalBench 2.0 доказывают это: при одних и тех же весах модели, но при изменении только внешнего harness ранжирование поднимается с 30-го места до 5-го.
Для читателей abmedia этот разбор даёт конкретную опору: когда вы видите различия между агентскими продуктами вроде Claude Code, Codex, Gemini Code Assist и др., большинство отличий — не в самой модели, а в дизайне harness: стратегии управления контекстом, охват инструментов, верификационный цикл, режимы кооперации мультиагентов. Версия модели обновляется — и выбор инженерии harness определяет, насколько «высоким» будет пользовательский опыт продукта.
Эта статья: Akshay разобрал архитектуру Claude Code на 6 уровней — модель — лишь один узел в цикле. Впервые опубликовано в 鏈新聞 ABMedia.
Related News
Руководители Google Cloud и PayPal: AI-агентный бизнес будет работать в контуре криптовалютных платежей
Stanford запускает Agent Island: AI-модели в игре в стиле Survivor устраивают стратегические предательства и взаимное устранение
Режим кода от Anthropic: спор вокруг MCP vs CLI — инструменты удерживают runtime, а токены сжали с 150 тыс. до 2 тыс.
Гарри Тан: Я сейчас очень редко даю ИИ подсказки! Генеральный директор YC объясняет «компонуемый AI-воркфлоу»
OpenAI раскрывает неожиданные последствия оценки CoT: сохранение мониторинга цепочек рассуждений — ключевая линия защиты для настройки AI-агентов к целям