Anthropic 确认:Claude Code 质量下滑背后是三项产品层变更,而非模型问题

Gate News 消息,4月23日——Anthropic 的工程团队确认,用户在过去一个月中报告的 Claude Code 质量退化源于三个相互独立的产品层变更,而非 API 或底层模型问题。这三个问题分别在 4月7日、4月10日和 4月20日得到修复,当前最终版本为 v2.1.116。

第一项变更发生在 3月4日。为了解决在 Opus 4.6 高推理强度下偶发出现的极端延迟峰值,团队将 Claude Code 的默认推理工作量等级从 “high” 降为 “medium”。在大量用户抱怨性能下降后,团队在 4月7日撤回了该变更。目前在 Opus 4.7 上默认为 “xhigh”,在其他模型上默认为 “high”。

第二个问题是在 3月26日引入的一个漏洞。系统被设计为在对话不活跃超过一小时后清除旧的推理记录,以降低会话恢复成本。然而,实现中的缺陷导致清除操作在之后每一次轮次中反复执行,而不是只执行一次,从而使模型逐步丢失既有推理上下文。该问题表现为越来越健忘、重复操作以及异常的工具调用。该漏洞还导致每次请求都发生缓存未命中,从而加速用户配额的消耗。两个彼此无关的内部实验掩盖了复现条件,使得调试过程延长到超过一周。在 4月10日修复后,团队使用 Opus 4.7 检查了有问题的代码,并发现 Opus 4.7 能识别该漏洞,而 Opus 4.6 无法。

第三项变更于 4月16日与 Opus 4.7 同期上线。团队在系统提示词中加入了指令,以减少冗余输出。几周的内部测试表明不会出现回归,但上线后与其他提示词的交互会降低编码质量。更长时间的评估显示 Opus 4.6 和 4.7 的性能均下降 3%,因此团队在 4月20日执行了回滚。

这三项变更在不同时间影响了不同用户群体,它们叠加产生了广泛且不一致的质量下滑,使得诊断变得更加复杂。Anthropic 表示,现在它将需要更多内部员工像用户一样使用相同的公开构建版本,对每一次系统提示词修改都运行完整的模型评估套件,并实施分阶段的灰度发布期。作为补偿,Anthropic 已重置所有订阅用户的使用配额。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

NVIDIA анонсировала Nemotron 3 Nano Omni с открытым исходным кодом мультимодальную модель

NVIDIA объявила Nemotron 3 Nano Omni — открытый много модальный модель,将视覺、語音与語言 интегрированы в одну модель,作为 AI 代理的感知层. Основой является 30B-A3B MoE, 256K контекст, 9x пропускная способность, поддержка входных данных: текст, изображения, аудио, видео и т. д., выход — текст. В сочетании с Nemotron 3 Super/Ultra предназначена для сценариев, таких как управление компьютером, интеллектуальная работа с документами и понимание аудио-видео, и также публикует веса и данные обучения, развертывание охватывает локальные среды, NIM и сторонние платформы.

ChainNewsAbmedia19м назад

Claude Code добавляет push-уведомления на мобильный телефон: автоматическое напоминание, когда длительная задача завершена или требуется проверка

Claude Code теперь может отправлять уведомления через push-уведомления на телефоне, напоминая пользователю при завершении длительных задач или когда требуется вмешательство пользователя. Условие включения — запуск Remote Control и настройка в config «Push when Claude decides». Базовый инструмент для push-уведомлений был добавлен с 15 апреля v2.1.110; это объявление относится к уровню внешнего маркетинга.

ChainNewsAbmedia1ч назад

Claude интегрирует коннекторы для 8 крупнейших креативных программ, включая Adobe, Blender и др.

Согласно объявлению на официальном блоге Anthropic от 28 апреля, Claude запускает программу Claude for Creative Work, а также с 8 партнёрами по креативному ПО выпускает коннекторы (connectors) с целью позволить Claude напрямую сотрудничать внутри существующих инструментов креативных профессионалов. В то же время Anthropic Labs представила новый продукт Claude Design, а также Anthropic в качестве patron присоединилась к Blender Development Fund. 8 коннекторов для креативного ПО: от 3D-моделирования до VJ — управление в реальном времени Список программного обеспечения, выпустившего connector в сотрудничестве с Anthropic (в соответствии с официальным объявлением Anthropic, перечислено

ChainNewsAbmedia1ч назад

NVIDIA представляет мультимодальную модель Nemotron 3 Nano Omni с 9-кратным приростом пропускной способности

Сообщение Gate News, 28 апреля — NVIDIA выпустила Nemotron 3 Nano Omni, открытую мультимодальную модель с архитектурой (MoE) mixture-of-experts (30B-A3B) и поддержкой контекстного окна 256K. Модель объединяет обработку входных данных видео, аудио, изображений и текста в единой структуре. По сравнению

GateNews2ч назад

Германия исключает Palantir из военного облачного проекта из-за опасений по поводу суверенитета данных

Сообщение Gate News, 28 апреля — вице-адмирал Томас ДауМ, самый высокопоставленный в Германии офицер в сфере кибернетики и информационного пространства, исключил развертывание программного обеспечения Palantir в флагманском военном облачном проекте Германии, сославшись на опасения по поводу суверенитета данных и операционной модели американской фирмы. Вооруженные силы Германии

GateNews2ч назад

Стартап по ИИ-рекрутингу Dex привлек $5,3 млн на посевное финансирование под руководством Notion Capital

Gate News-сообщение, 28 апреля — стартап в сфере ИИ-рекрутинга Dex объявил о завершении раунда посевного финансирования на $5,3 млн под руководством Notion Capital, при участии a16z Speedrun, Concept Ventures и бизнес-ангелов из OpenAI и других компаний. Раунд доводит общий объем финансирования Dex до $8,4 млн

GateNews2ч назад
комментарий
0/400
Нет комментариев