↩️ Anthropic 被曝暗中下调 Claude 算力配置以节省成本，引发核心用户强烈不满科技圈🎗在花频道📮:第三方评测称 Claude Opus 4.6 幻觉率大幅上升，排名从第二跌至第十 AI 评测平台 BridgeMind 发布测试结果称，Claude Opus 4.6 在 BridgeBench 幻觉基准测试中的准确率从上周的 83.3%（排名第 2）下降至 68.3%（排名第 10），降幅约 15 个百分点

↩️ Anthropic 被曝暗中下调 Claude 算力配置以节省成本，引发核心用户强烈不满

科技圈🎗在花频道📮:

第三方评测称 Claude Opus 4.6 幻觉率大幅上升，排名从第二跌至第十 AI 评测平台 BridgeMind 发布测试结果称，Claude Opus 4.6 在 BridgeBench 幻觉基准测试中的准确率从上周的 83.3%（排名第 2）下降至 68.3%（排名第 10），降幅约 15 个百分点。推测认为模型推理能力遭到削弱，原因不明。 BridgeBench 公布的榜单显示，同期头部模型的准确率普遍在 80% 以上。BridgeMind 建议用户在新版本正式发布前暂缓部署，目前 Anthropic…

Anthropic 被曝暗中下调 Claude 算力配置以节省成本，引发核心用户强烈不满

人工智能公司 Anthropic 近日因悄然降低 Claude 模型的默认"努力程度"（effort level）以节省算力成本，导致模型在复杂编程等任务中性能显著下滑。据公司高管 Boris Cherny 回应，Anthropic 于 3 月初将 Claude 的默认设置从"高努力"调整为"中等努力"，以减少每个请求处理的 token 数量。使得模型在代码生成等复杂工作流程中频繁出现不遵循指令、采取不当捷径及错误率上升等问题，被 AMD 高级总监 Stella Laurenzo 等人评价为"已无法胜任复杂工程任务"。

这一性能争议正值 Anthropic 筹备 IPO 的关键节点，用户对其缺乏透明度的做法表示愤怒，认为这与其长期标榜的品牌形象相悖。尽管公司否认因算力短缺而故意降级，但外界仍质疑其数据中心资源储备不足。同时期，OpenAI 内部备忘录更指 Anthropic 在算力扩张上犯下"战略失误"。

Fortune

🌸 在花频道｜茶馆讨论｜投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel