https://api.oaibest.com - API中转2.8折起
https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
OpenAI 研究人员称 AI 幻觉在数学上是不可避免的

2025-09-21 22:41 by 彩虹尽头

OpenAI 研究人员在预印本平台 arxiv 上发表了一篇论文,指出由于大模型使用的统计学特性以及计算限制,即使有完美的数据,AI 仍然会产生貌似可信但实际上错误的输出。研究人员承认,AI 幻觉在数学上是不可避免的,无法通过更先进的工程技术解决。研究人员在论文中称,类似面对难题的学生,大模型会在不确定的情况下猜测,产生貌似可信但实际错误的表述,而不是承认不确定性。即使是最先进的 AI 系统,幻觉仍然存在,会破坏信任。研究人员证明,幻觉源于训练大模型使用的统计学特性,而非实现缺陷。研究人员测试了竞争对手 DeepSeek-V3 模型、Meta AI 和 Claude 3.7 Sonnet,以及 OpenAI 自己的 GPT 系列模型。研究人员称,ChatGPT 也会产生幻觉,GPT-5 有更少的幻觉,但幻觉仍然会发生,且更先进的推理模型比简单的系统更容易产生幻觉:o1 推理模型 16% 的时间会产生幻觉,而较新的 o3 和 o4-mini 分别有 33% 和 48% 的时间会产生幻觉。OpenAI 的研究识别了三个导致幻觉不可避免的数学因素:当训练数据集中信息过少时的认知不确定性,模型局限性和计算难解性。

www.computerworld.com/article/4059383/openai-admits-ai-hallucinations-are-mathematically-inevitable-not-just-engineering-flaws.html
arxiv.org/pdf/2509.04664

#人工智能

via Solidot - Telegram Channel
Reddit与Google讨论新的内容授权协议

美国知名互联网论坛 Reddit 此前已经与Google等人工智能开发商达成协议,其中Google每年向 Reddit 支付 6000 万美元获得内容授权,可以利用该论坛的帖子训练 AI 模型。

不过 Reddit 认为现有的固定价格授权模式不太好,有不愿意透露姓名的 Reddit 高管称,目前该公司正在与Google重新谈判,此次谈判的重点包括Google帮助该论坛获得更多用户以及 Reddit 希望修改授权模式。

目前Google为该论坛提供大量的自然搜索流量,然而大多数用户点开帖子看完后就会离开,并不会注册账户并发帖,这对 Reddit 论坛来说会损失太多用户和内容。

Reddit 希望能够解决这个问题从而获得更多用户和更多帖子,而更多帖子又是Google等 AI 公司需要的训练素材,这也有助于 Reddit 继续提高自己的价值并获得更多营收。

还有个授权模式方面的变化则是 Reddit 希望根据内容质量来支付费用:

Reddit 高管认为目前与 AI 公司的合作条款并未反映该论坛数据对人工智能公司的价值,Reddit 相较于大多数平台更有优势,其帖子等数据对人工智能模型来说非常有用。

在这个混乱不堪的互联网时代,Reddit 的帖子是真人真心发布的 (注:此前 OpenAI 萨姆奥尔特曼吐槽该论坛太多机器人发帖),内容按照主题精心排序,并且所有排名都是基于人工投票系统而非算法。
数据也显示 Reddit 论坛的帖子是Google搜索 AI 概览和 Perplexity AI 搜索引用率最高的网站,在Google AI 概览中经常出现引用的 Reddit 帖子,所以 Reddit 认为 AI 公司应该为这部分引用支付费用。

所以 Reddit 的想法是在未来的授权协议中采用动态定价模式,根据内容对 AI 工具生成答案的有用性或重要性来决定报酬,包括 ChatGPT 和其他 AI 工具的联网搜索功能和引用。

不过现阶段只是在谈判还未确定,对 Reddit 来说这应该可以继续提高收入,只不过对用户来说自己发布的帖子被卖去训练 AI 模型,可能心理上有些不太好受。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:蓝点网)
xAI 发布 Grok 4 Fast:性能接近 Grok 4,成本下降约 98%

2025 年 9 月 19 日,xAI 宣布推出新模型 Grok 4 Fast。该模型在主要推理基准测试中表现接近 Grok 4,同时平均 token 使用量减少约 40%,在同等性能下实现约 98% 的成本下降。

Grok 4 Fast 采用统一架构,可在推理与非推理模式间切换,提供 2M token 上下文窗口。在 LMArena 搜索测试中,其 Elo 得分达到 1163,高于同类模型。在网络检索与工具使用场景中,Grok 4 Fast 也展现出较高效率。

该模型已在 grok.com、iOS 和 Android 应用上线,所有用户(包括免费用户)均可使用。同时,开发者可通过 xAI API、OpenRouter、Vercel AI Gateway 调用 grok-4-fast-reasoning 与 grok-4-fast-non-reasoning 两个版本。

openrouter 正在提供 xAI: Grok 4 Fast (免费), 有兴趣的可以自己测试

来源:xAI 官方
x.ai
Grok 4 Fast | xAI

Pushing the Frontier of Cost-Efficient Intelligence


via LoopDNS资讯播报 - Telegram Channel
《守望先锋2》艺术图再陷AI制作争议 暴雪坚决否认

《守望先锋2》开发商暴雪就“这款竞技英雄射击游戏的新喷漆由AI生成”的指控作出回应,坚决否认此类说法。该游戏玩家纷纷前往X平台、Reddit等平台发声,指出描绘“探奇”“朱诺”以及新英雄“无漾”卡通形象的喷漆中,存在他们认为是AI生成的明显痕迹。

X平台一名用户以“探奇与朱诺背靠背姿势”的喷漆为例,提到其中的“头发与线条艺术”存在问题;另一名用户则称,喷漆中存在“业内艺术家不太可能出现的诡异错误与奇怪细节”,例如朱诺的一侧眉毛在头发上方,另一侧却在头发下方。

暴雪发言人在向媒体发布的声明中表示:“所提及的喷漆均由艺术家创作。”

这并非暴雪首次收到与《守望先锋2》相关的AI生成指控。今年8月,《守望先锋》官方X账号发布帖子,宣传该品牌与手办及毛绒玩具公司Youtooz的合作,观察人士认为帖子背景图中存在AI生成的艺术内容。

该帖子随后被删除,《守望先锋》账号回复澄清,称相关图片来自暴雪的“电商供应商”,并补充表示“公司要求此类图片需由艺术家创作,符合我们的政策”。

今年4月,玩家指控暴雪在《守望先锋2》与高达的联动活动中,为角色的德语本地化版本加入了AI生成的语音台词。暴雪一名公关经理在暴雪论坛回应,否认该指控,并表示“近期部分暴雪游戏内容中的特定本地化语音台词目前无法使用或已进行调整”。

AI在游戏开发中的应用仍是颇具争议的话题:玩家往往会对任何可能存在的AI生成内容强烈反对,而索尼等3A游戏公司则在持续尝试使用大语言模型等AI工具。早在2023年,就有报道称暴雪自身已开发出一款名为“Blizzard Diffusion”的AI工具,用于生成概念艺术。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:3DMGame)
AI初创公司正在推动谷歌云蓬勃发展

谷歌云周四宣布,新增超40家初创公司都已选择谷歌云作为其云计算提供商之一,包括 AI 编程初创公司 Lovable 和 Windsurf。谷歌云是该公司增长最快的业务线之一,预计未来两年将新增 580 亿美元的收入,赢得领先 AI 初创公司的合同似乎是增长的一大驱动力。谷歌云目前已与全球十大领先 AI 实验室中的九个(包括Safe Superintelligence和OpenAI)以及全球60%的生成式 AI 初创公司合作,去年选择谷歌云的新兴 AI 初创公司数量增长了20%。众多 AI 初创公司选择与谷歌云合作,部分原因在于其提供的优厚待遇。许多与谷歌合作的 AI 初创公司都是通过谷歌云初创企业计划起步的,该计划提供 35 万美元的云积分,以及为 Y Combinator 项目中的初创公司提供专用的 Nvidia GPU 集群。

—— TechCrunch

via 风向旗参考快讯 - Telegram Channel
2025年9月21日
🌍资讯快读
1、武汉大学通报图书馆事件调查复核情况
https://www.jiemian.com/article/13376773.html
2、字节跳动:将按中国法律要求推进TikTok美国公司相关工作
https://www.jiemian.com/article/13376464.html
3、国家医保局:4.6万家医疗机构参加了第十一批药品集采报量
https://www.jiemian.com/article/13377321.html
4、西贝否认存在“采购总监张明华”预制菜相关微信对话:没有截图中情况,也没有该姓名员工
https://www.jiemian.com/article/13377043.html
5、025 InnoMatch技术转移大会在沪开幕
https://www.jiemian.com/article/13377113.html

👬即刻镇小报
1、人生一定要修炼的能力「精神不受力」
https://m.okjike.com/originalPosts/68caa1042393a294a651be21
2、谷歌发布Gemini官方提示词指南,帮助用户更好使用Gemini for Google Workspace提高生产力。
https://m.okjike.com/originalPosts/68ca4d7e2393a294a64b3720
3、写作,是普通人最大的红利
https://m.okjike.com/originalPosts/68ca36e61e5664293d7e64d1
4、没想到成都有这么专业的推理书店
https://m.okjike.com/originalPosts/68ca327a1e5664293d7e0ab7

今日即刻镇小报内容来自 @fountain_ @WanderMoon @广屿Ocean @刘脱力 ,感谢以上即友的创作与分享。 #一觉醒来发生了什么
界面新闻
武汉大学通报图书馆事件调查复核情况

武汉大学9月20日通报图书馆事件调查复核情况。近期,肖某瑫与杨某媛的矛盾纠纷引发社会关注。武汉大学组建调查复核专家组,实事求是、依法依规对肖某瑫纪律处分、杨某媛学位论文等进行全面调查复核,在此基础上认真开展处置工作。现将有关情况通报如下。


via 即刻精选 - Telegram Channel
GitHub Copilot 中国用户禁止访问 Claude 模型选项

近日,多位开发者反馈称,在 GitHub Copilot 的 VS Code 插件中,Claude 模型已从模型选择下拉框中消失,用户无法再使用 Claude 进行代码生成或辅助。

根据社区讨论与测试,这一问题主要出现在中国用户群体中,海外用户目前仍可正常使用 Claude。多名开发者推测,这与 Anthropic 对中国地区访问的限制有关,而 GitHub Copilot 本身作为模型代理方,可能被迫下线了 Claude 的选项。

这一变动已在 VS Code 官方仓库中被开发者报告,同时 Reddit 的 Copilot 版块也有相关讨论。

Claude背景政策历史补充: adversarial nations like China

有趣的是使用VPN您仍然可以看到并使用Claude模型

reddit
Github

via LoopDNS资讯播报 - Telegram Channel
Users Unable to Create Projects

Status: Investigating

We are investigating the issue for the listed services.

Affected components
Mobile - iOS (Degraded performance)
Mobile - Android (Degraded performance)
Web (Degraded performance)

via OpenAI status
Borumi —— 适合 Demo 的录频工具

📹 因为最近开始做一些视频内容,所以入手了一款适合在 Mac 上使用的录频工具。我的需求主要是录制教程、Demo 和分享类的内容,可以设置 Zoom-in 并支持简单的剪辑。对比了 Screen Studio和 CleanShot X,最后选择了 Borumi,花了 59 刀

🎞️ Borumi 支持两种录制模式:

结构型录制 - 将文稿匹配屏幕,分段录制然后拼合用于编辑;

快速录制 - 直接录屏,然后编辑背景、视频布局和 Zoom focus 即可导出

📼 体验下来,Borumi 的录屏质量和轻量编辑都很出色,Zoom 效果也十分顺滑。有预算的话可以考虑 Borumi;如果不怕上手稍麻烦,免费开源的 OBS Studio 也是不错的选择

📮 这篇文章是转发给你的吗?点击这里加入频道,一起探索更多有趣的内容!

via Roller | AI AGENT 中文社区 - Telegram Channel
#Update #Grok

Grok 4 Fast 现已发布:

- 大幅降低成本,宣称性能略低于 Grok 4
- 限时全平台免费提供,含 OpenRouter
- 官方 API 定价(每百万 Token,输入/输出):0.2/0.5 USD

via AI Copilot - Telegram Channel
马斯克称到11月X的算法将完全由AI驱动

马斯克表示,到11月,其社交媒体平台X所使用的算法将完全由人工智能(AI)驱动。马斯克是在回应X平台产品主管尼基塔··比尔(Nikita Bier)的一篇帖子,后者表示,该社交平台正试图帮助用户摆脱“主流算法和政治运动”,找到属于自己的独特领域。

马斯克回应称:“到11月时,算法将完全由人工智能驱动,并且在此过程中会取得重大进展。我们每隔两周左右就会公开算法的源代码。到11月或者最晚12月,你只需向 Grok 发出指令,就能动态地调整你的信息流了。”

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
华为和浙江大学发布 DeepSeek-R1-Safe

2025-09-20 00:11 by 飞行中的阴影

华为和浙江大学合作使用华为昇腾芯片和 MindSpeedLLM 等框架发布了 DeepSeek R1 模型的安全加强版 DeepSeek-R1-Safe(中国联通也有相似名字的安全版本模型)。源代码发表在 GitHub 等平台上。研究人员称他们基于国内外法律法规与核心价值观,构建了中英文双语的安全语料。其中语料不仅包含了带有安全思维链的标注,还提供了相应的安全回复,可用于大模型的安全训练、微调以及测试。测试结果表明,DeepSeek-R1-Safe 针对有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题整体防御成功率近 100%,针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过40%。其综合安全防御能力达83%,在同样测试设置下超过Qwen-235B和DeepSeek-R1-671B等多个同期模型8%至15%。此外,在MMLU、GSM8K、CEVAL等通用能力基准测试中,DeepSeek-R1-Safe相比于DeepSeek-R1的性能损耗在1%以内。这些结果表明DeepSeek-R1-Safe不仅显著提升了安全防护能力,也保障了模型的可用性,达成了安全能力与通用性能之间的有效平衡。

github.com/ZJUAISafety/DeepSeek-R1-Safe
github.com/UnicomAI/DeepSeek-R1-Safee
新浪财经 DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

#审查

via Solidot - Telegram Channel
[retroactive] Elevated errors on Claude Haiku 3.5 and Claude Haiku 3

Sep 20, 10:41 UTC
Resolved - This incident has been resolved.

Sep 20, 10:37 UTC
Investigating - From Sep 19 19:00 PT (Sep 20 02:00 UTC) until Sep 19 22:00 PT (Sep 20 05:00 UTC) the Claude Haiku 3 model experienced a very high error rate.

From Sep 19 19:30 PT (Sep 20 02:30 UTC) until Sep 19 20:30 PT (Sep 20 03:30 UTC) the Claude Haiku 3.5 model experienced a very high error rate.

This is a retroactive incident.

via Claude Status - Incident History
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]