Akshay analisa a arquitetura em 6 camadas do Claude Code: o modelo é apenas um nó num ciclo

ChainNewsAbmedia

2026-05-11 14:25:46

O engenheiro de IA Akshay Pachaar publicou no X, a 10 de maio, um diagrama completo da arquitetura do Claude Code, mostrando como todo o sistema é decomposto em 6 níveis e destacando que «o modelo é apenas um dos nós no ciclo». A publicação de Pachaar cita o seu ensaio de longa extensão de 6 de abril, «The Anatomy of an Agent Harness», e a ideia central é que o Claude Code parece «magia» não por causa do próprio modelo, mas sim devido ao design meticuloso da engenharia do harness.

Arquitetura em 6 camadas: o modelo é apenas um dos nós

O Claude Code em 6 camadas organizado por Pachaar:

Input Layer (camada de entrada): responsável por gerir a sessão, o controlo de permissões e a definição de níveis de confiança em YAML. Qualquer instrução que entre no modelo passa primeiro por esta camada.

Knowledge Layer (camada de conhecimento): inclui um skill registry, um context compressor (compressão em 3 níveis, com disparo num limiar de 92%), um task graph e armazenamento de memória entre sessões. É aqui que existe a «inteligência» do harness, independente dos pesos do modelo.

Execution Layer (camada de execução): faz despachar chamadas de ferramentas via typed registry, com um handler por ferramenta — bash, read, write, grep, glob, revert. O runtime de streaming suporta execução paralela, o prompt cache reutiliza prefixos estáveis, reduzindo o custo para 10%.

Integration Layer (camada de integração): o MCP runtime liga-se a servidores externos (filesystem, git e ferramentas personalizadas). As ferramentas registam-se para dentro, e a memória é escrita para fora no agent_memory.md.

Multi-Agent Layer (camada multi-agente): inclui subagent spawner, teammate mailboxes que comunicam via redis pub/sub, um protocolo de máquina de estados finitos (IDLE→REQUEST→WAIT→RESPOND), um autonomous board com lock atómico e isolamento por worktree (cada tarefa em branch git independente).

Observability Layer (camada de observabilidade): envolve todas as camadas com uma event bus de agregação e lifecycle hooks; um executor em segundo plano opera em modo daemon thread, sem bloqueio.

No centro está o «master agent loop» (ciclo do agente principal): percecionar → agir → observar. A própria Anthropic posiciona este ciclo como um «dumb loop» (ciclo estúpido) — toda a inteligência está na inferência do modelo; o harness apenas faz a orquestração.

Design-chave: context compressor e isolamento por worktree

Alguns detalhes de design que valem a pena destacar:

Context compressor com compressão em 3 níveis e limiar de 92%: quando o contexto se aproxima de 92% da capacidade, dispara-se uma sumarização e compressão, preservando decisões de arquitetura e bugs ainda não resolvidos, e descartando saídas repetidas das ferramentas. Isto remete para as «context engineering guidelines» publicadas pela Anthropic: encontrar o conjunto mínimo de tokens com maior sinal, maximizando a probabilidade de atingir objetivos.

Isolamento por worktree: cada subagent trabalha num worktree git independente e numa branch independente, fazendo deteção de conflitos ao fazer merge. Esta arquitetura torna possível a modificação paralela da mesma base de código por vários agentes, sem se atropelarem. Entre os três modos de execução de subagentes — «Fork / Teammate / Worktree» — o Worktree é o nível de isolamento mais forte.

Custo de 10% no prompt cache: através de cache de prefixos estáveis (system prompt, definições de ferramentas, CLAUDE.md), chamadas repetidas com o mesmo prefixo pagam apenas 10% do custo padrão em tokens. É uma peça-chave para manter os custos controlados em tarefas longas em sessão.

Porque é que esta análise teve eco na comunidade

A publicação de Pachaar recebeu 522 gostos e 115 retweets; na secção de comentários surgiram respostas como «Achei que era só uma ferramenta CLI», «Achei que o Claude Code era igual a model + acesso ao terminal, não sabia que a multi-agent layer tinha tanta coisa a correr» e outras. Isto reflete que a maioria dos programadores ainda entende o Claude Code como «a API da Claude com uma camada CLI», subestimando a complexidade da engenharia do harness.

Pachaar usa como argumento principal uma frase de Vivek Trivedy, da LangChain: «Se não és o modelo, então és o harness.» Os testes da LangChain no TerminalBench 2.0 provam isto — com os mesmos pesos do modelo, mudando apenas o harness periférico, a classificação salta do 30.º lugar para o 5.º.

Para os leitores da abmedia, esta análise fornece um ponto de referência concreto: quando virem diferenças entre produtos de agentes como Claude Code, Codex, Gemini Code Assist, na verdade a maioria das diferenças não está no próprio modelo, mas sim no design do harness — estratégia de gestão de contexto, âmbito das ferramentas, ciclos de validação e modos de colaboração multi-agente. Quando a versão do modelo sobe, são as escolhas do harness que determinam o nível da experiência do produto.

Este artigo com a análise de Akshay sobre a arquitetura do Claude Code em 6 camadas: o modelo é apenas um nó no ciclo. Primeira aparição em Cadeia de Notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.