https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
xAI发布Grok4.20:推理性能提升显著,不幻觉率78%创行业纪录

2026年3月12日,xAI正式发布新一代大语言模型Grok4.20Beta,该模型在保持价格竞争力的同时,凭借极高的事实可靠性刷新了行业纪录。

根据Artificial Analysis的最新评估,Grok4.20在启用推理功能的智能指数(Intelligence Index)中获得48分,较前代版本提升6分。尽管在综合基准测试中仍与Gemini3.1Pro Preview和GPT-5.4(均为57分)存在差距,但其在AA全知测试中的表现极为出色,非幻觉率高达78%,有效解决了AI模型普遍存在的虚假信息编造问题。

在产品矩阵与工程参数方面,xAI同步推出了带推理功能、不带推理功能以及多智能体模式的三种API版本。该模型支持高达200万个令牌的上下文窗口,其定价策略极具市场渗透力,每百万令牌成本仅为2美元至6美元,较Grok4显著降低。技术层面,Grok4.20在面对未知领域时表现出极强的克制力,承认“不知道”的频率大幅提升,错误率仅约为五分之一。

当前全球大模型竞争已从单纯的参数规模转向推理深度与事实准确性的双重博弈。Grok4.20的推出,标志着xAI在追求通用人工智能(AGI)的过程中,正试图通过强化“诚实性”与“低幻觉率”来构建差异化优势。这种对事实可靠性的极致追求,不仅提升了AI在严谨行业应用中的落地潜力,也为未来多智能体协同协作提供了更为稳固的信息信任基础。

via AI新闻资讯 (author: AI Base)
手机端“养虾”战火升级 阿里云上线手机版OpenClaw“龙虾”JVSClaw

2026年3月13日,阿里云宣布其手机版OpenClaw“龙虾”应用——JVSClaw正式登陆各大应用商店,标志着主流云厂商在AI移动端入口的争夺进入白热化阶段。

该产品在同步开放官网访问的同时,延续了前期的免费内测优惠,用户可创建1个自定义Bot并获赠8000Credits模型额度。与此同时,腾讯旗下的“小龙虾”版本WorkBuddy也于3月12日完成关键更新,通过打通微信一键直连及新增企业微信长链接接入,显著提升了在即时通讯生态中的连接稳定性。

当前,OpenClaw正带动大模型Token消耗量创下新高,国产模型凭借极高的性价比优势在基础设施与应用端协同发力。

via AI新闻资讯 (author: AI Base)