xAI发布Grok4.20:推理性能提升显著,不幻觉率78%创行业纪录

2026年3月12日,xAI正式发布新一代大语言模型Grok4.20Beta,该模型在保持价格竞争力的同时,凭借极高的事实可靠性刷新了行业纪录。

根据Artificial Analysis的最新评估,Grok4.20在启用推理功能的智能指数(Intelligence Index)中获得48分,较前代版本提升6分。尽管在综合基准测试中仍与Gemini3.1Pro Preview和GPT-5.4(均为57分)存在差距,但其在AA全知测试中的表现极为出色,非幻觉率高达78%,有效解决了AI模型普遍存在的虚假信息编造问题。

在产品矩阵与工程参数方面,xAI同步推出了带推理功能、不带推理功能以及多智能体模式的三种API版本。该模型支持高达200万个令牌的上下文窗口,其定价策略极具市场渗透力,每百万令牌成本仅为2美元至6美元,较Grok4显著降低。技术层面,Grok4.20在面对未知领域时表现出极强的克制力,承认“不知道”的频率大幅提升,错误率仅约为五分之一。

当前全球大模型竞争已从单纯的参数规模转向推理深度与事实准确性的双重博弈。Grok4.20的推出,标志着xAI在追求通用人工智能(AGI)的过程中,正试图通过强化“诚实性”与“低幻觉率”来构建差异化优势。这种对事实可靠性的极致追求,不仅提升了AI在严谨行业应用中的落地潜力,也为未来多智能体协同协作提供了更为稳固的信息信任基础。

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]