A Anthropic Identifica Três Mudanças na Camada de Produto Por Trás da Queda de Qualidade do Claude Code, e Não um Problema de Modelo

Mensagem do Gate News, 23 de abril — A equipe de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code relatada pelos usuários no último mês se deveu a três mudanças independentes na camada de produto, e não a problemas de API ou do modelo subjacente. Os três problemas foram corrigidos em 7 de abril, 10 de abril e 20 de abril, respectivamente, com a versão final agora em v2.1.116.

A primeira mudança ocorreu em 4 de março, quando a equipe reduziu o nível de esforço de raciocínio padrão do Claude Code de “high” para “medium” para tratar picos ocasionais de latência extrema no Opus 4.6 sob alta intensidade de raciocínio. Após queixas generalizadas dos usuários sobre desempenho reduzido, a equipe reverteu a mudança em 7 de abril. O padrão atual agora é “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido em 26 de março. O sistema foi projetado para limpar registros antigos de raciocínio após a inatividade da conversa exceder uma hora, para reduzir custos de recuperação de sessão. Porém, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente, em vez de uma única vez, fazendo com que o modelo perdesse progressivamente o contexto de raciocínio anterior. Isso se manifestou como aumento da falta de memória, operações repetidas e invocações anormais de ferramentas. O bug também resultou em falhas de cache em toda solicitação, acelerando o consumo do limite de cota do usuário. Dois experimentos internos não relacionados mascararam as condições de reprodução, estendendo o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipe revisou o código problemático usando o Opus 4.7 e descobriu que o Opus 4.7 conseguia identificar o bug enquanto o Opus 4.6 não.

A terceira mudança foi lançada em 16 de abril junto com o Opus 4.7. A equipe adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento a interação com outros prompts degradou a qualidade de codificação. Avaliações estendidas revelaram uma queda de desempenho de 3% tanto no Opus 4.6 quanto no 4.7, levando a um rollback em 20 de abril.

Essas três mudanças afetaram grupos de usuários diferentes em momentos diferentes, e seu efeito combinado gerou uma queda de qualidade ampla e inconsistente, complicando o diagnóstico. A Anthropic afirmou que agora será necessário que mais funcionários internos usem a mesma versão pública de build que os usuários, executem conjuntos completos de avaliação do modelo para cada modificação no prompt do sistema e implementem períodos de rollout em etapas. Como compensação, a Anthropic redefiniu as cotas de uso de todos os usuários assinantes.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Pesquisadores da OpenAI: Sistemas de IA Podem Lidar com Grande Parte do Trabalho de Pesquisa em Dois Anos

Mensagem do Gate News, 29 de abril — Pesquisadores da OpenAI, Sébastien Bubeck e Ernest Ryu, dizem que sistemas de IA poderiam realizar a maior parte do trabalho de pesquisa humano dentro de dois anos, apresentando a matemática como uma medida clara do progresso da IA. Diferentemente de testes de desempenho vagos, problemas matemáticos oferecem uma verificação precisa: as respostas são ou corretas ou incorretas, sem espaço para ambiguidades:

GateNews15m atrás

Rei Charles III se reúne com seis CEOs de tecnologia dos EUA, incluindo Jensen Huang, Jeff Bezos e Tim Cook, para discutir financiamento de startups do Reino Unido

Mensagem da Gate News, 29 de abril — Durante sua visita de Estado aos Estados Unidos, o rei Charles III se reuniu com seis proeminentes líderes de tecnologia americanos na Blair House, em Washington: o CEO da NVIDIA, Jensen Huang, o fundador da Amazon, Jeff Bezos, o CEO da Apple, Tim Cook, o CEO da AMD, Su Zifeng, o CEO da Salesforce, Marc Benioff, e

GateNews23m atrás

Remessas Globais de Óculos de Realidade Aumentada Disparam 98% em 2025, Impulsionadas pelo Ray-Ban Display e pela Tecnologia de Onda-Guia da Meta

Mensagem do Gate News, 29 de abril — As remessas de óculos inteligentes de realidade aumentada (AR) cresceram 98% em 2025, com as remessas no segundo semestre disparando 148% ano a ano, segundo a Counterpoint Research. O crescimento foi impulsionado por uma produção ampliada

GateNews34m atrás

O lendário gestor de fundos de hedge fala sobre o P/L das ações dos EUA: para quem comprar o índice de mercado nos próximos anos, será muito difícil obter lucro

O gestor de hedge fund Paul Tudor Jones (Jones) concede uma entrevista, alertando que lacunas na regulamentação de IA podem trazer consequências catastróficas, por sua capacidade de causar riscos inéditos ao padrão de destruição—iteração. Ele também aponta que a capitalização do mercado dos EUA como proporção do PIB chegou a 252% e que o P/L está alto demais; a longo prazo, investir no índice dificilmente trará lucros. Ele usa a analogia do boxe para dizer que as oportunidades de negociação são raras e pede cooperação global para criar regulamentação para a IA.

ChainNewsAbmedia37m atrás

Cognition estabelece Singapura como sede da APAC e mira expansão regional

Mensagem da Gate News, 29 de abril — A Cognition, a startup de codificação com IA por trás da Devin, anunciou em 29 de abril que estabelecerá Singapura como sua sede na Ásia-Pacífico para supervisionar a expansão regional por toda a Sudeste Asiático, Austrália, Índia e Coreia do Sul. Richard Spence liderará as operações da APAC

GateNews1h atrás

Google e o Pentágono assinam acordo secreto de IA, carta aberta de funcionários se opõe

De acordo com o The Information, em 28 de abril, a Google assinou um acordo para fornecer ao Pentágono dos EUA modelos de IA (inteligência artificial) usados para trabalhos confidenciais. O New York Times, citando fontes familiarizadas com o assunto, disse que o acordo permite que o Departamento de Defesa dos EUA use a IA da Google para fins governamentais legítimos, com natureza semelhante aos acordos confidenciais de implantação de IA que o Pentágono assinou com a OpenAI e a xAI no mês passado.

MarketWhisper1h atrás
Comentário
0/400
Sem comentários