↩️ Anthropic 被曝暗中下调 Claude 算力配置以节省成本,引发核心用户强烈不满


科技圈🎗在花频道📮:

第三方评测称 Claude Opus 4.6 幻觉率大幅上升,排名从第二跌至第十 AI 评测平台 BridgeMind 发布测试结果称,Claude Opus 4.6 在 BridgeBench 幻觉基准测试中的准确率从上周的 83.3%(排名第 2)下降至 68.3%(排名第 10),降幅约 15 个百分点。推测认为模型推理能力遭到削弱,原因不明。 BridgeBench 公布的榜单显示,同期头部模型的准确率普遍在 80% 以上。BridgeMind 建议用户在新版本正式发布前暂缓部署,目前 Anthropic…

Anthropic 被曝暗中下调 Claude 算力配置以节省成本,引发核心用户强烈不满

人工智能公司 Anthropic 近日因悄然降低 Claude 模型的默认"努力程度"(effort level)以节省算力成本,导致模型在复杂编程等任务中性能显著下滑。据公司高管 Boris Cherny 回应,Anthropic 于 3 月初将 Claude 的默认设置从"高努力"调整为"中等努力",以减少每个请求处理的 token 数量。使得模型在代码生成等复杂工作流程中频繁出现不遵循指令、采取不当捷径及错误率上升等问题,被 AMD 高级总监 Stella Laurenzo 等人评价为"已无法胜任复杂工程任务"。

这一性能争议正值 Anthropic 筹备 IPO 的关键节点,用户对其缺乏透明度的做法表示愤怒,认为这与其长期标榜的品牌形象相悖。尽管公司否认因算力短缺而故意降级,但外界仍质疑其数据中心资源储备不足。同时期,OpenAI 内部备忘录更指 Anthropic 在算力扩张上犯下"战略失误"。

Fortune

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]