A Anthropic Identifica Três Mudanças na Camada de Produto Por Trás da Queda de Qualidade do Claude Code, e Não um Problema de Modelo

2026-04-23 23:53:58

Mensagem do Gate News, 23 de abril — A equipe de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code relatada pelos usuários no último mês se deveu a três mudanças independentes na camada de produto, e não a problemas de API ou do modelo subjacente. Os três problemas foram corrigidos em 7 de abril, 10 de abril e 20 de abril, respectivamente, com a versão final agora em v2.1.116.

A primeira mudança ocorreu em 4 de março, quando a equipe reduziu o nível de esforço de raciocínio padrão do Claude Code de "high" para "medium" para tratar picos ocasionais de latência extrema no Opus 4.6 sob alta intensidade de raciocínio. Após queixas generalizadas dos usuários sobre desempenho reduzido, a equipe reverteu a mudança em 7 de abril. O padrão atual agora é "xhigh" para o Opus 4.7 e "high" para outros modelos.

O segundo problema foi um bug introduzido em 26 de março. O sistema foi projetado para limpar registros antigos de raciocínio após a inatividade da conversa exceder uma hora, para reduzir custos de recuperação de sessão. Porém, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente, em vez de uma única vez, fazendo com que o modelo perdesse progressivamente o contexto de raciocínio anterior. Isso se manifestou como aumento da falta de memória, operações repetidas e invocações anormais de ferramentas. O bug também resultou em falhas de cache em toda solicitação, acelerando o consumo do limite de cota do usuário. Dois experimentos internos não relacionados mascararam as condições de reprodução, estendendo o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipe revisou o código problemático usando o Opus 4.7 e descobriu que o Opus 4.7 conseguia identificar o bug enquanto o Opus 4.6 não.

A terceira mudança foi lançada em 16 de abril junto com o Opus 4.7. A equipe adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento a interação com outros prompts degradou a qualidade de codificação. Avaliações estendidas revelaram uma queda de desempenho de 3% tanto no Opus 4.6 quanto no 4.7, levando a um rollback em 20 de abril.

Essas três mudanças afetaram grupos de usuários diferentes em momentos diferentes, e seu efeito combinado gerou uma queda de qualidade ampla e inconsistente, complicando o diagnóstico. A Anthropic afirmou que agora será necessário que mais funcionários internos usem a mesma versão pública de build que os usuários, executem conjuntos completos de avaliação do modelo para cada modificação no prompt do sistema e implementem períodos de rollout em etapas. Como compensação, a Anthropic redefiniu as cotas de uso de todos os usuários assinantes.

Ver fonte

Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.

Notícias relacionadas

04-23 20:42

Brecha de Segurança da Vercel se Expande para Centenas de Usuários; Desenvolvedores de IA em Maior Risco

04-23 13:58

UE vai redigir diretrizes exigindo que o Google forneça às IAs de terceiros acesso Android igual ao do Gemini

04-23 08:33

Anthropic lança /ultrareview para o Claude Code: revisão de código em nuvem com multiagentes

04-23 05:28

Google Jules é rebrandada como plataforma de desenvolvimento de produtos agentic ponta a ponta e abre lista de espera para nova versão

04-23 02:22

Austrália Trabalha Com a Anthropic para Abordar Riscos de Cibersegurança do Mythos AI

Análise aprofundada

A Anthropic revela que o Claude Code tem três bugs em cascata: degradação do raciocínio, esquecimento de cache e instruções de 25 caracteres com efeito colateral adverso

ChainNewsAbmedia04-23 18:14

O Google Jules divulga uma lista de possíveis nomes do novo lançamento aberto e a reposiciona como uma plataforma de desenvolvimento de produtos ponta a ponta

Market Whisper04-23 06:13

Claude Mythos encontra 271 vulnerabilidades no Firefox, e os defensores podem obter uma vantagem decisiva

Market Whisper04-22 05:36

Comentário

0/400

Sem comentários