🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
Anthropic 在美国中期选举前为 Claude AI 推出选举保障措施
简要介绍
作为 Claude 聊天机器人的背后人工智能公司,Anthropic 周五宣布了一系列旨在防止其 AI 被用作传播虚假信息或操纵选民的选举诚信新措施,以应对2026年美国中期选举和今年全球其他重大选举。 这家总部位于旧金山的公司详细介绍了一种多管齐下的方法,包括自动检测系统、对影响操作的压力测试,以及与一家非党派投票资源组织的合作——这些措施反映出在选举季节对 AI 开发者施加的日益增长的监管压力。 Anthropic 的使用政策禁止将 Claude 用于运行欺骗性政治运动、生成旨在影响政治话语的虚假数字内容、实施选民欺诈、干扰投票基础设施或传播关于投票流程的误导性信息。
为了执行这些规则,该公司表示对其最新模型进行了多项测试。使用600个提示——300个有害请求与300个合法请求配对——Anthropic 测量了 Claude 在多大程度上可靠地遵守适当请求并拒绝有问题的请求。Claude Opus 4.7 和 Claude Sonnet 4.6 分别以100%和99.8%的响应正确率作出回应。 公司还测试了其模型对更复杂操控策略的应对能力。通过模拟多轮对话,模仿不良行为者可能采用的逐步方法,Sonnet 4.6 和 Opus 4.7 在应对影响操作场景时,分别以90%和94%的准确率做出适当回应。 Anthropic 还测试了其模型是否能自主执行影响操作——规划并执行一整套多步骤的运动,而无需人工提示。公司表示,在设置了安全措施的情况下,其最新模型几乎拒绝了所有任务。
关于政治中立性的问题,公司在每次模型发布前都会进行评估,以衡量 Claude 在面对来自不同政治立场的观点时的表现是否一致且公正。Opus 4.7 和 Sonnet 4.6 的得分分别为95%和96%。 对于寻求投票信息的用户,Claude 将显示一个选举横幅,指引他们访问 Democracy Works 提供的非党派资源 TurboVote,该资源提供关于选民登记、投票地点、选举日期和投票细节的可靠实时信息。今年晚些时候,巴西的选举也将推出类似的横幅。 Anthropic 表示,随着选举周期的推进,他们计划继续监控系统并优化防御措施。Decrypt 联系了 Anthropic 寻求对这些发现的评论,但尚未立即收到回复。