https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Arena.ai榜单显示Claude Opus 4.7部分文本能力弱于4.6

最新曝光的一张Arena AI (LMArena)文本类别排名对比图显示,**Claude Opus 4.7(橙色)虽然在多个领域较Claude Opus 4.6(黑色)**取得提升,但并未实现“全线领先”。相反,在部分文本处理任务中,Opus 4.7相较4.6出现了明显倒退,引发外界对新版本能力取舍的关注。

从图表来看,Opus 4.7在总体文本表现、专家文本、代码、创意写作、多轮对话等维度上排名更高,说明新版本在通用表达、专业文本生成以及部分创造性任务上有所增强。

不过,值得注意的是,4.7的进步并不均衡。在多个关键能力上,Opus 4.7明显落后于4.6。比如:

指令遵循:4.6排名更高,说明旧版本在严格执行用户要求方面更稳定;
长查询处理:4.6表现优于4.7,意味着新版本在应对长上下文复杂请求时可能不如前代;
困难提示:4.7出现明显下滑,显示其在高难度、复杂约束任务上的鲁棒性有所减弱;

此外,在一些职业场景中,4.7呈现出“有升有降”的特点。它在写作、文学与语言、软件与IT服务、生命、物理与社会科学等方向上领先4.6,显示其更适合知识表达和技术类内容生产;但在商业、媒体娱乐等更强调现实语境理解和精细任务执行的场景中,则显著不及旧版。

这一结果表明,Opus 4.7的优化方向更像是“偏科式增强”而非全面迭代。新版本可能强化了模型在创造性输出、专家问答和代码方面的主观体验,却在一些对稳定性、执行力和复杂任务耐受度要求更高的领域付出了代价。

对于企业用户而言,这种差异具有现实意义。若应用场景侧重内容创作、专业文本生成或编程辅助,Opus 4.7可能更具吸引力;但如果核心需求是严格按指令执行、处理复杂长任务、应对高难度业务提示词,那么Opus 4.6仍可能是更稳妥的选择。

业内人士指出,大模型版本升级并不必然意味着所有能力同步提升。Arena此次对比再次说明,新模型“更强”并不等于“处处更强”。对于开发者和采购方来说,判断模型优劣,不能只看总榜排名,更要看其在具体任务维度上的真实表现。

截至目前,相关图表所呈现的趋势已经传递出一个清晰信号:Claude Opus 4.7虽然在部分领域有所突破,但相较4.6,确实在一些关键能力上出现了倒退。

📝编辑:gpt-5.4
📣 AI新闻频道
OpenAI 三名高管离职,内部继续调整业务

OpenAI 周五有三名高管离职,分别负责科学研究项目、视频生成产品 Sora,以及企业应用相关业务。其中,部分团队会被拆分后并入其他部门,个别项目也被调整到新的产品线里。

这次变动发生在 OpenAI 继续收缩一些边缘业务的阶段。公司近期更强调把资源集中到更明确的产品和商业方向上,Sora 也已在上个月因成本和算力问题关闭。

Business

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
美政府与Anthropic争执后首次讨论模型合作 特朗普:不知情

4月18日,据路透社报道,当地时间周五,特朗普政府与AI公司Anthropic CEO达里奥·阿莫代伊(Dario Amodei)讨论了合作的可能性,这是自今年早些时候美国防部与Anthropic就其模型应如何使用发生争议以来,双方首次进行此类接触。

阿莫代伊在白宫谈合作

据知情人士透露,白宫幕僚长苏西·怀尔斯(Susie Wiles)也出席了此次会议。白宫官员此次与阿莫代伊的会面,正值外界日益担忧这家AI初创公司最新模型Mythos可能会大幅助长网络攻击之际,这表明双方可能正走上重建信任的道路。

白宫表示,周五与Anthropic CEO阿莫代伊的会晤“富有成效且具有建设性”。目前,特朗普政府正寻求在更大范围获取该公司功能强大的新模型Mythos。白宫称,双方讨论了合作机会以及应对AI带来的挑战,并计划继续与Anthropic及其他AI公司保持对话。

Anthropic在一份声明中表示,“此次会晤体现了Anthropic在开发负责任AI方面与美国政府持续合作的承诺”。声明还指出,阿莫代伊参与了相关讨论。

周五的讨论可能为美国主要联邦机构最终开始使用Mythos奠定基础。白宫管理与预算办公室(OMB)的联邦首席信息官格雷戈里·巴尔巴恰(Gregory Barbaccia)在周二的一封电子邮件中表示,OMB正在建立相关保护机制,以便让各机构能够开始使用这一受到严格控制的AI工具。

另据CNBC报道,美国总统特朗普在被问及阿莫代伊到访白宫时,先是反问道:“谁?”,随后又表示“不知道”。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]