2026年4月23日,Anthropic在官方博客发布公告,正式承认旗下Claude系列模型近期存在降智问题,明确指出三大核心bug导致用户体验全面下滑,并宣布重置所有用户的使用额度作为补偿。巧合的是,此次公告发布正值OpenAI官宣GPT-5.5发布的前后脚,这一时间节点引发行业广泛猜测,被不少网友解读为Anthropic应对竞争对手压力的应急举措。
Claude“降智”问题已在用户社区发酵近两个月,此前一直被网友广泛吐槽,但Anthropic始终未正面回应。直至AMD AI组高级总监Stella Laurenzo在GitHub发布硬核审计报告,才让这一问题逐渐浮出水面。分析结果显示,Claude从2月份开始,推理深度出现断崖式下滑,思考中位数从2200字符暴跌至600字符,且开始陷入推理循环,倾向于选择“最简单的修复”而非正确方案,编辑前阅读文件的次数也从6.6次锐减至2次。
同期,BridgeMind的BridgeBench测试数据也引发行业震动,Claude Opus 4.6的准确率从83.3%骤降至68.3%,全球排名从第2名跌至第10名,幻觉率几乎翻倍。尽管该测试后续被研究者质疑方法论存在问题,前后测试任务数量不一致,但“Claude变蠢”的叙事已在行业内广泛传播。
在此次发布的公告中,Anthropic详细披露了导致模型“降智”的三大具体bug。
一、Claude Code的默认推理等级从高调整为中
3月4日,Claude Code的默认推理等级被偷偷从“高”调整为“中”,官方给出的理由是“高”模式延迟过高,但界面仍显示为“高”,导致用户误以为使用的是满血版模型,直至一个多月后才完成回滚。
二、缓存优化功能出现代码bug
3月26日上线的缓存优化功能出现代码bug,原本计划会话空闲超过一小时后清空旧思考记录,实际却每轮对话都执行清除操作,导致模型出现健忘、重复、工具调用混乱等问题,且token消耗大幅飙升,该bug耗时15天才修复。
三、系统提示中新增词数限制
4月16日,系统提示中新增“工具调用之间文字不超过25个词,最终回复不超过100个词”的限制,导致Opus 4.6和4.7版本性能下降3%,四天后完成回滚。
这并非Anthropic首次出现类似问题。去年8月,该公司曾发布类似公告,承认Opus 4.0和4.1版本存在“降智”情况,当时官方说辞同样为“从未有意降低模型质量”。
目前,网友对Anthropic的回应呈现两极分化。部分用户认为,官方主动披露bug并发布详细公告,且Claude之父Boris Cherny亲自在黑客新闻评论区逐一回复用户疑问,透明度值得肯定;但更多用户对其“延迟回应”“暗调性能”“变相涨价”等行为表示不满,质疑缓存优化的真实动机并非降低延迟,而是为了节省成本,且此前两个月官方未通过正式渠道回应用户诉求,仅靠员工零星回复,严重消耗用户信任。
业内人士分析指出,Claude此次“降智”事件,本质上是Anthropic成本焦虑与产品迭代失误的叠加结果。在GPT-5.5发布、DeepSeek V4等竞品就位的背景下,Anthropic不仅需要快速修复产品bug,更需重建用户信任。此前“写代码就用Claude”的行业共识已被打破,留给Anthropic的修复与调整窗口正在不断缩小,而这场AI巨头之间的较量,也将随着双方的产品迭代进一步加剧,用户体验与商业化平衡或将成为未来竞争的核心焦点。