Anthropic承认Claude系列模型近期存在降智问题

2026年4月23日，Anthropic在官方博客发布公告，正式承认旗下Claude系列模型近期存在降智问题，明确指出三大核心bug导致用户体验全面下滑，并宣布重置所有用户的使用额度作为补偿。巧合的是，此次公告发布正值OpenAI官宣GPT-5.5发布的前后脚，这一时间节点引发行业广泛猜测，被不少网友解读为Anthropic应对竞争对手压力的应急举措。

Claude“降智”问题已在用户社区发酵近两个月，此前一直被网友广泛吐槽，但Anthropic始终未正面回应。直至AMD AI组高级总监Stella Laurenzo在GitHub发布硬核审计报告，才让这一问题逐渐浮出水面。分析结果显示，Claude从2月份开始，推理深度出现断崖式下滑，思考中位数从2200字符暴跌至600字符，且开始陷入推理循环，倾向于选择“最简单的修复”而非正确方案，编辑前阅读文件的次数也从6.6次锐减至2次。

同期，BridgeMind的BridgeBench测试数据也引发行业震动，Claude Opus 4.6的准确率从83.3%骤降至68.3%，全球排名从第2名跌至第10名，幻觉率几乎翻倍。尽管该测试后续被研究者质疑方法论存在问题，前后测试任务数量不一致，但“Claude变蠢”的叙事已在行业内广泛传播。

在此次发布的公告中，Anthropic详细披露了导致模型“降智”的三大具体bug。

一、Claude Code的默认推理等级从高调整为中

3月4日，Claude Code的默认推理等级被偷偷从“高”调整为“中”，官方给出的理由是“高”模式延迟过高，但界面仍显示为“高”，导致用户误以为使用的是满血版模型，直至一个多月后才完成回滚。

二、缓存优化功能出现代码bug

3月26日上线的缓存优化功能出现代码bug，原本计划会话空闲超过一小时后清空旧思考记录，实际却每轮对话都执行清除操作，导致模型出现健忘、重复、工具调用混乱等问题，且token消耗大幅飙升，该bug耗时15天才修复。

三、系统提示中新增词数限制

4月16日，系统提示中新增“工具调用之间文字不超过25个词，最终回复不超过100个词”的限制，导致Opus 4.6和4.7版本性能下降3%，四天后完成回滚。

这并非Anthropic首次出现类似问题。去年8月，该公司曾发布类似公告，承认Opus 4.0和4.1版本存在“降智”情况，当时官方说辞同样为“从未有意降低模型质量”。

目前，网友对Anthropic的回应呈现两极分化。部分用户认为，官方主动披露bug并发布详细公告，且Claude之父Boris Cherny亲自在黑客新闻评论区逐一回复用户疑问，透明度值得肯定；但更多用户对其“延迟回应”“暗调性能”“变相涨价”等行为表示不满，质疑缓存优化的真实动机并非降低延迟，而是为了节省成本，且此前两个月官方未通过正式渠道回应用户诉求，仅靠员工零星回复，严重消耗用户信任。

业内人士分析指出，Claude此次“降智”事件，本质上是Anthropic成本焦虑与产品迭代失误的叠加结果。在GPT-5.5发布、DeepSeek V4等竞品就位的背景下，Anthropic不仅需要快速修复产品bug，更需重建用户信任。此前“写代码就用Claude”的行业共识已被打破，留给Anthropic的修复与调整窗口正在不断缩小，而这场AI巨头之间的较量，也将随着双方的产品迭代进一步加剧，用户体验与商业化平衡或将成为未来竞争的核心焦点。

你也可能对此有兴趣

Anthropic承认Claude系列模型近期存在降智问题

一、Claude Code的默认推理等级从高调整为中

二、缓存优化功能出现代码bug

三、系统提示中新增词数限制

你也可能对此有兴趣

ClaudeOpus4.8被发现疑似蒸馏国产开源模型

黄仁勋即将加入清华大学经管学院顾问委员会

小米AI极致降价改写行业Token定价与竞争逻辑

中国AI突破大模型参数瓶颈

DeepSeek永久降价开启大模型全新竞争阶段

GitHub深陷多重危机不复往日行业巅峰