https://api.oaibest.com - API中转2.8折起
https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
🤖 **xAI 发布 Grok 4 Fast,性能媲美 Gemini 2.5 Pro,成本低至 1/25** xAI 推出新一代大模型 Grok 4 Fas...

Poll: 大家目前正在使用的输入法软件?(多选)

iOS/macOS自带输入法
安卓厂商定制版输入法
Gboard
微软拼音输入法
微信输入法
搜狗/QQ输入法
百度输入法
讯飞输入法
2345王牌输入法
其它

🤖 xAI 发布 Grok 4 Fast,性能媲美 Gemini 2.5 Pro,成本低至 1/25

xAI 推出新一代大模型 Grok 4 Fast,在智能水平上达到 Gemini 2.5 Pro 的水准,但成本仅为后者的约 1/25。根据测试,Grok 4 Fast 在推理模式下于 Artificial Analysis Intelligence Index 上获得 60 分,表现与 Gemini 2.5 Pro 和 Claude 4.1 Opus 持平,且在 LiveCodeBench 编程评测中排名第一,超越自家更大模型 Grok 4。该模型输入端价格为每百万 tokens 0.2 美元,输出端为 0.5 美元,且 token 效率高,完成同一测试仅需 6100 万 tokens,远低于 Gemini 2.5 Pro 的 9300 万和 Grok 4 的 1.2 亿。API 速度方面,Grok 4 Fast 输出速度为每秒 344 tokens,约为 GPT-5 的 2.5 倍。

X

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮
微软生态报告:Windows on Arm原生应用可覆盖用户90%使用时间

微软宣布 Copilot+ PC 的 Arm 应用生态加速扩展,原生 Arm 版本已覆盖用户 90% 的使用时间。这些 PC 具备超 40 TOPS AI 算力,续航支持 15 小时网页浏览或 22 小时本地视频播放。

性能方面,Copilot+ PC 相较 MacBook Air M2 提升最高达 85%,Office 效率提升约 35%。微软正推动更多开发者与 ISV 借助 Arm 咨询服务和 App Assure 团队加入生态,加速应用适配。

Windows Developer Blog

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮

Invalid media: image
Google 在美推出 Gemini AI 🤖 集成 Chrome 浏览器

Google 宣布自本周四起,在美国地区为 Mac 和 Windows 桌面版 Chrome 浏览器用户推出 Gemini AI 集成功能,首批适用于英文界面用户。未来,iOS 和 Android 用户及 Google Workspace 企业客户也将陆续获得该功能。Gemini 能够智能回答地址栏中的问题、自动摘要长文、查找历史页面,并与日历、地图、YouTube 等应用联动,还将支持多步骤操作如订票、整理文档等。此外,Gemini 将加强浏览器的安全功能,包括防诈骗、密码管理和安全浏览建议。

CryptopolitanGemini

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮
🟠 小米开源首个原生端到端语音大模型 MiMo-Audio

9 月 19 日,小米正式开源首个原生端到端语音模型 Xiaomi-MiMo-Audio,该模型基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于 ICL 的少样本泛化,并在预训练中观察到明显的"涌现"行为。

在多项标准评测中,MiMo-Audio 大幅超越同参数量开源模型,取得 7B 最佳性能。在音频理解基准 MMAU 标准测试集上超过 Google 闭源语音模型 Gemini-2.5-Flash,在 Big Bench Audio S2T 任务中超越 OpenAI 闭源语音模型 GPT-4o-Audio-Preview。

新浪科技 | Hugging Face

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮
👉 名称:Agentic Design Patterns
🤖 类型:👀资料
👏 介绍:《Agentic Design Patterns》是由 Antonio Gulli 撰写的一本关于构建智能系统的实用指南,本书详细介绍了智能体的设计模式,包括如何通过提示链(Prompt Chaining)、路由(Routing)、并行化(Parallelization)、反射(Reflection)、工具使用(Tool Use)、规划(Planning)和多智能体系统(Multi-Agent)等技术来构建智能系统。书中还涵盖了内存管理、学习与适应、模型上下文协议(MCP)、目标设定与监控等关键概念。此外,还讨论了异常处理与恢复、人在回路(Human-in-the-Loop)、知识检索(RAG)、智能体之间的通信(A2A)、资源感知优化、推理技术、守护轨迹 / 安全模式、评估与监控、优先级设定、探索与发现等高级主题。

via 老胡周刊资源分享频道 - Telegram Channel
🖼 👉 名称:zcf

👉 名称:zcf
🤖 类型:🎯项目
👏 介绍:UfoMiao/zcf 是一个零配置的 Claude 代码流程工具,支持多语言操作,提供了一个交互式菜单来简化安装和配置流程,包括安装 Claude Code、导入工作流程、配置 APICCR 代理、设置 MCP 服务、选择默认模型、配置 AI 记忆以及安装其他辅助工具等功能。

via 老胡周刊资源分享频道 - Telegram Channel
🤖 OpenAI研究:AI幻觉在数学上不可避免,先进模型更易“说谎”

OpenAI研究人员在预印本平台arxiv上发表论文指出,由于大模型使用的统计学特性和计算限制,AI幻觉在数学上是不可避免的,即使有完美数据也无法避免产生貌似可信但实际错误的输出。研究强调,这并非工程缺陷,而是源于训练模型的统计学特性,无法通过更先进的工程技术解决。论文指出,大模型在不确定时会“猜测”而非承认无知,损害用户信任。研究测试了包括DeepSeek-V3、Meta AI、Claude 3.7 Sonnet及OpenAI自家GPT系列模型,发现ChatGPT存在幻觉,GPT-5虽有减少但仍会发生。值得注意的是,更先进的推理模型反而更容易产生幻觉:o1推理模型幻觉率为16%,而较新的o3和o4-mini分别高达33%和48%。研究识别出三个导致幻觉不可避免的数学因素:训练数据信息过少时的认知不确定性、模型局限性及计算难解性。

(科技情报)

via 茶馆 - Telegram Channel
OpenAI 研究人员称 AI 幻觉在数学上是不可避免的

OpenAI 研究人员在预印本平台 arxiv 上发表了一篇论文,指出由于大模型使用的统计学特性以及计算限制,即使有完美的数据,AI 仍然会产生貌似可信但实际上错误的输出。研究人员承认,AI 幻觉在数学上是不可避免的,无法通过更先进的工程技术解决。研究人员在论文中称,类似面对考试难题的学生,大模型会在不确定的情况下猜测,产生貌似可信但实际错误的表述,而不是承认不确定性。即使是最先进的 AI 系统,幻觉仍然存在,会破坏信任。研究人员证明,幻觉源于训练大模型使用的统计学特性,而非实现缺陷。研究人员测试了竞争对手 DeepSeek-V3 模型、Meta AI 和 Claude 3.7 Sonnet,以及 OpenAI 自己的 GPT 系列模型。研究人员称,ChatGPT 也会产生幻觉,GPT-5 有更少的幻觉,但幻觉仍然会发生,且更先进的推理模型比简单的系统更容易产生幻觉:o1 推理模型 16% 的时间会产生幻觉,而较新的 o3 和 o4-mini 分别有 33% 和 48% 的时间会产生幻觉。OpenAI 的研究识别了三个导致幻觉不可避免的数学因素:当训练数据集中信息过少时的认知不确定性,模型局限性和计算难解性。

来源:Solidot

via LoopDNS资讯播报 - Telegram Channel
OpenAI 研究人员称 AI 幻觉在数学上是不可避免的

2025-09-21 22:41 by 彩虹尽头

OpenAI 研究人员在预印本平台 arxiv 上发表了一篇论文,指出由于大模型使用的统计学特性以及计算限制,即使有完美的数据,AI 仍然会产生貌似可信但实际上错误的输出。研究人员承认,AI 幻觉在数学上是不可避免的,无法通过更先进的工程技术解决。研究人员在论文中称,类似面对难题的学生,大模型会在不确定的情况下猜测,产生貌似可信但实际错误的表述,而不是承认不确定性。即使是最先进的 AI 系统,幻觉仍然存在,会破坏信任。研究人员证明,幻觉源于训练大模型使用的统计学特性,而非实现缺陷。研究人员测试了竞争对手 DeepSeek-V3 模型、Meta AI 和 Claude 3.7 Sonnet,以及 OpenAI 自己的 GPT 系列模型。研究人员称,ChatGPT 也会产生幻觉,GPT-5 有更少的幻觉,但幻觉仍然会发生,且更先进的推理模型比简单的系统更容易产生幻觉:o1 推理模型 16% 的时间会产生幻觉,而较新的 o3 和 o4-mini 分别有 33% 和 48% 的时间会产生幻觉。OpenAI 的研究识别了三个导致幻觉不可避免的数学因素:当训练数据集中信息过少时的认知不确定性,模型局限性和计算难解性。

www.computerworld.com/article/4059383/openai-admits-ai-hallucinations-are-mathematically-inevitable-not-just-engineering-flaws.html
arxiv.org/pdf/2509.04664

#人工智能

via Solidot - Telegram Channel
Reddit与Google讨论新的内容授权协议

美国知名互联网论坛 Reddit 此前已经与Google等人工智能开发商达成协议,其中Google每年向 Reddit 支付 6000 万美元获得内容授权,可以利用该论坛的帖子训练 AI 模型。

不过 Reddit 认为现有的固定价格授权模式不太好,有不愿意透露姓名的 Reddit 高管称,目前该公司正在与Google重新谈判,此次谈判的重点包括Google帮助该论坛获得更多用户以及 Reddit 希望修改授权模式。

目前Google为该论坛提供大量的自然搜索流量,然而大多数用户点开帖子看完后就会离开,并不会注册账户并发帖,这对 Reddit 论坛来说会损失太多用户和内容。

Reddit 希望能够解决这个问题从而获得更多用户和更多帖子,而更多帖子又是Google等 AI 公司需要的训练素材,这也有助于 Reddit 继续提高自己的价值并获得更多营收。

还有个授权模式方面的变化则是 Reddit 希望根据内容质量来支付费用:

Reddit 高管认为目前与 AI 公司的合作条款并未反映该论坛数据对人工智能公司的价值,Reddit 相较于大多数平台更有优势,其帖子等数据对人工智能模型来说非常有用。

在这个混乱不堪的互联网时代,Reddit 的帖子是真人真心发布的 (注:此前 OpenAI 萨姆奥尔特曼吐槽该论坛太多机器人发帖),内容按照主题精心排序,并且所有排名都是基于人工投票系统而非算法。
数据也显示 Reddit 论坛的帖子是Google搜索 AI 概览和 Perplexity AI 搜索引用率最高的网站,在Google AI 概览中经常出现引用的 Reddit 帖子,所以 Reddit 认为 AI 公司应该为这部分引用支付费用。

所以 Reddit 的想法是在未来的授权协议中采用动态定价模式,根据内容对 AI 工具生成答案的有用性或重要性来决定报酬,包括 ChatGPT 和其他 AI 工具的联网搜索功能和引用。

不过现阶段只是在谈判还未确定,对 Reddit 来说这应该可以继续提高收入,只不过对用户来说自己发布的帖子被卖去训练 AI 模型,可能心理上有些不太好受。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:蓝点网)
xAI 发布 Grok 4 Fast:性能接近 Grok 4,成本下降约 98%

2025 年 9 月 19 日,xAI 宣布推出新模型 Grok 4 Fast。该模型在主要推理基准测试中表现接近 Grok 4,同时平均 token 使用量减少约 40%,在同等性能下实现约 98% 的成本下降。

Grok 4 Fast 采用统一架构,可在推理与非推理模式间切换,提供 2M token 上下文窗口。在 LMArena 搜索测试中,其 Elo 得分达到 1163,高于同类模型。在网络检索与工具使用场景中,Grok 4 Fast 也展现出较高效率。

该模型已在 grok.com、iOS 和 Android 应用上线,所有用户(包括免费用户)均可使用。同时,开发者可通过 xAI API、OpenRouter、Vercel AI Gateway 调用 grok-4-fast-reasoning 与 grok-4-fast-non-reasoning 两个版本。

openrouter 正在提供 xAI: Grok 4 Fast (免费), 有兴趣的可以自己测试

来源:xAI 官方
x.ai
Grok 4 Fast | xAI

Pushing the Frontier of Cost-Efficient Intelligence


via LoopDNS资讯播报 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]