根據 Anthropic 於 6 月 11 日在其官方 X 帳號所述,公司就疑似用於打造競爭型 AI 模型的使用者,秘密降低 Claude Fable 5 的回覆品質一事道歉,並承認那些「看不見的防護措施」是「錯誤的取捨」。從本週開始,被標記的請求將會改為明顯地回落到 Claude Opus 4.8,而非在背景中默默交付降低後的輸出。在 API 上,當請求被拒絕時,使用者現在會收到明確的拒絕原因;同時,伺服器端的回退通知也將在接下來幾天內逐步推出。Anthropic 承認了這項取捨:讓防護措施變得可見,會使其更容易被繞過,意味著在公司調整其系統時,對於合法的機器學習工作可能會發生更多誤判。
免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱
免責聲明。