ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

23:03 · 2025年9月21日 · 周日

OpenAI 研究人员称 AI 幻觉在数学上是不可避免的

2025-09-21 22:41 by 彩虹尽头

OpenAI 研究人员在预印本平台 arxiv 上发表了一篇论文，指出由于大模型使用的统计学特性以及计算限制，即使有完美的数据，AI 仍然会产生貌似可信但实际上错误的输出。研究人员承认，AI 幻觉在数学上是不可避免的，无法通过更先进的工程技术解决。研究人员在论文中称，类似面对难题的学生，大模型会在不确定的情况下猜测，产生貌似可信但实际错误的表述，而不是承认不确定性。即使是最先进的 AI 系统，幻觉仍然存在，会破坏信任。研究人员证明，幻觉源于训练大模型使用的统计学特性，而非实现缺陷。研究人员测试了竞争对手 DeepSeek-V3 模型、Meta AI 和 Claude 3.7 Sonnet，以及 OpenAI 自己的 GPT 系列模型。研究人员称，ChatGPT 也会产生幻觉，GPT-5 有更少的幻觉，但幻觉仍然会发生，且更先进的推理模型比简单的系统更容易产生幻觉：o1 推理模型 16% 的时间会产生幻觉，而较新的 o3 和 o4-mini 分别有 33% 和 48% 的时间会产生幻觉。OpenAI 的研究识别了三个导致幻觉不可避免的数学因素：当训练数据集中信息过少时的认知不确定性，模型局限性和计算难解性。

www.computerworld.com/article/4059383/openai-admits-ai-hallucinations-are-mathematically-inevitable-not-just-engineering-flaws.html
arxiv.org/pdf/2509.04664

#人工智能

via Solidot - Telegram Channel

22:39 · 2025年9月21日 · 周日

微软的Gaming Copilot更像是AI版的查攻略

via cnBeta.COM - 中文业界资讯站 (author: 稿源：3DMGame)

Telegraph

微软的Gaming Copilot更像是AI版的查攻略

微软的Copilot AI从下周开始就要登陆Windows PC上的Xbox游戏栏（Xbox Game Bar）。这项名为“游戏Copilot”的新功能刚在上个月公布，截至周四，它已开始在PC上进行全面Beta测试，并将于10月登陆Xbox移动app。顾名思义，它是Copilot的游戏专属版本，微软称之为“你的个人游戏伙伴”。玩家可以使用Gaming Copilot来寻求提示、建议、摘要、成就信息等。它可以分析屏幕上的内容以获取上下文，例如识别你正在与之交谈的NPC（尽管NPC的名字通常都会显示在屏幕上）。…

20:19 · 2025年9月21日 · 周日

Reddit与Google讨论新的内容授权协议

美国知名互联网论坛 Reddit 此前已经与Google等人工智能开发商达成协议，其中Google每年向 Reddit 支付 6000 万美元获得内容授权，可以利用该论坛的帖子训练 AI 模型。

不过 Reddit 认为现有的固定价格授权模式不太好，有不愿意透露姓名的 Reddit 高管称，目前该公司正在与Google重新谈判，此次谈判的重点包括Google帮助该论坛获得更多用户以及 Reddit 希望修改授权模式。

目前Google为该论坛提供大量的自然搜索流量，然而大多数用户点开帖子看完后就会离开，并不会注册账户并发帖，这对 Reddit 论坛来说会损失太多用户和内容。

Reddit 希望能够解决这个问题从而获得更多用户和更多帖子，而更多帖子又是Google等 AI 公司需要的训练素材，这也有助于 Reddit 继续提高自己的价值并获得更多营收。

还有个授权模式方面的变化则是 Reddit 希望根据内容质量来支付费用：

Reddit 高管认为目前与 AI 公司的合作条款并未反映该论坛数据对人工智能公司的价值，Reddit 相较于大多数平台更有优势，其帖子等数据对人工智能模型来说非常有用。

在这个混乱不堪的互联网时代，Reddit 的帖子是真人真心发布的 (注：此前 OpenAI 萨姆奥尔特曼吐槽该论坛太多机器人发帖)，内容按照主题精心排序，并且所有排名都是基于人工投票系统而非算法。

数据也显示 Reddit 论坛的帖子是Google搜索 AI 概览和 Perplexity AI 搜索引用率最高的网站，在Google AI 概览中经常出现引用的 Reddit 帖子，所以 Reddit 认为 AI 公司应该为这部分引用支付费用。

所以 Reddit 的想法是在未来的授权协议中采用动态定价模式，根据内容对 AI 工具生成答案的有用性或重要性来决定报酬，包括 ChatGPT 和其他 AI 工具的联网搜索功能和引用。

不过现阶段只是在谈判还未确定，对 Reddit 来说这应该可以继续提高收入，只不过对用户来说自己发布的帖子被卖去训练 AI 模型，可能心理上有些不太好受。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：蓝点网)

19:47 · 2025年9月21日 · 周日

马斯克xAI百天血战：100天狂招100人联创实权被削

via cnBeta.COM - 中文业界资讯站 (author: 稿源：新智元)

Telegraph

马斯克xAI百天血战：100天狂招100人联创实权被削

整个夏天，马斯克都住在xAI办公室。不为别的，只为心无旁骛将全部精力投入AI，追赶OpenAI势不可挡的成功。可最终，一切仍是一地碎片。在一次罕见全公司会议上，马斯克再次向全员，描绘了xAI的未来蓝图——构建追求真理的超级AI。同时，他还预告了打造微软竞争对手“Macrohard”（巨软）的计划。整个夏天，全力押注xAI 在一个长达1.5小时的演讲中，马斯克多次强调，“我们是唯一一家，以真相为使命的公司”。如果强迫AI撒谎，或相信不真实的事情，你将极有可能创造一个反乌托邦的未来。自6月，与特朗普闹…

17:42 · 2025年9月21日 · 周日

xAI 发布 Grok 4 Fast：性能接近 Grok 4，成本下降约 98%

2025 年 9 月 19 日，xAI 宣布推出新模型 Grok 4 Fast。该模型在主要推理基准测试中表现接近 Grok 4，同时平均 token 使用量减少约 40%，在同等性能下实现约 98% 的成本下降。

Grok 4 Fast 采用统一架构，可在推理与非推理模式间切换，提供 2M token 上下文窗口。在 LMArena 搜索测试中，其 Elo 得分达到 1163，高于同类模型。在网络检索与工具使用场景中，Grok 4 Fast 也展现出较高效率。

该模型已在 grok.com、iOS 和 Android 应用上线，所有用户（包括免费用户）均可使用。同时，开发者可通过 xAI API、OpenRouter、Vercel AI Gateway 调用 grok-4-fast-reasoning 与 grok-4-fast-non-reasoning 两个版本。

openrouter 正在提供 xAI: Grok 4 Fast (免费), 有兴趣的可以自己测试

来源：xAI 官方

x.ai
Grok 4 Fast | xAI

Pushing the Frontier of Cost-Efficient Intelligence

via LoopDNS资讯播报 - Telegram Channel

17:13 · 2025年9月21日 · 周日

📌程序员瑟瑟发抖，TRAE SOLO 内置 Figma📌

via 掘金人工智能本月最热 (author: 盏灯)

Telegraph

📌程序员瑟瑟发抖，TRAE SOLO 内置 Figma📌

TRAE SOLO 内置 Figma，我们就给它一点时间，先喝杯茶，回过头来，页面就已经生成好了。怎么样，效果是不是非常棒？还可以一键部署！

15:11 · 2025年9月21日 · 周日

《守望先锋2》艺术图再陷AI制作争议暴雪坚决否认

《守望先锋2》开发商暴雪就“这款竞技英雄射击游戏的新喷漆由AI生成”的指控作出回应，坚决否认此类说法。该游戏玩家纷纷前往X平台、Reddit等平台发声，指出描绘“探奇”“朱诺”以及新英雄“无漾”卡通形象的喷漆中，存在他们认为是AI生成的明显痕迹。

X平台一名用户以“探奇与朱诺背靠背姿势”的喷漆为例，提到其中的“头发与线条艺术”存在问题;另一名用户则称，喷漆中存在“业内艺术家不太可能出现的诡异错误与奇怪细节”，例如朱诺的一侧眉毛在头发上方，另一侧却在头发下方。

暴雪发言人在向媒体发布的声明中表示：“所提及的喷漆均由艺术家创作。”

这并非暴雪首次收到与《守望先锋2》相关的AI生成指控。今年8月，《守望先锋》官方X账号发布帖子，宣传该品牌与手办及毛绒玩具公司Youtooz的合作，观察人士认为帖子背景图中存在AI生成的艺术内容。

该帖子随后被删除，《守望先锋》账号回复澄清，称相关图片来自暴雪的“电商供应商”，并补充表示“公司要求此类图片需由艺术家创作，符合我们的政策”。

今年4月，玩家指控暴雪在《守望先锋2》与高达的联动活动中，为角色的德语本地化版本加入了AI生成的语音台词。暴雪一名公关经理在暴雪论坛回应，否认该指控，并表示“近期部分暴雪游戏内容中的特定本地化语音台词目前无法使用或已进行调整”。

AI在游戏开发中的应用仍是颇具争议的话题：玩家往往会对任何可能存在的AI生成内容强烈反对，而索尼等3A游戏公司则在持续尝试使用大语言模型等AI工具。早在2023年，就有报道称暴雪自身已开发出一款名为“Blizzard Diffusion”的AI工具，用于生成概念艺术。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：3DMGame)

14:18 · 2025年9月21日 · 周日

Gemini“灵魂人物”官宣加盟xAI 马斯克火速转推

via cnBeta.COM - 中文业界资讯站 (author: 稿源：新智元)

Telegraph

Gemini“灵魂人物”官宣加盟xAI 马斯克火速转推

Gemini核心开发者Dustin Tran昨天官宣从GoogleDeepMind跳槽到xAI，研发新一代Grok！马斯克也于第一时间转发推文，确认了这位新同事的加盟xAI消息属实：从官宣中得知，Dustin Tran已经加入xAI至少几周了，参与了Grok 4 Fast的开发，但直到今天才修改自己的对外头衔介绍，甚至慢于马斯克转发推文。这也被眼尖的网友发现并调侃了： Dustin Tran的新同事，xAI创始成员，同时也是之前从GoogleDeepMind跳槽过来的Toby Pohlen，也于第一时间转发推文欢迎新同事：…

09:49 · 2025年9月21日 · 周日

AI初创公司正在推动谷歌云蓬勃发展

谷歌云周四宣布，新增超40家初创公司都已选择谷歌云作为其云计算提供商之一，包括 AI 编程初创公司 Lovable 和 Windsurf。谷歌云是该公司增长最快的业务线之一，预计未来两年将新增 580 亿美元的收入，赢得领先 AI 初创公司的合同似乎是增长的一大驱动力。谷歌云目前已与全球十大领先 AI 实验室中的九个（包括Safe Superintelligence和OpenAI）以及全球60%的生成式 AI 初创公司合作，去年选择谷歌云的新兴 AI 初创公司数量增长了20%。众多 AI 初创公司选择与谷歌云合作，部分原因在于其提供的优厚待遇。许多与谷歌合作的 AI 初创公司都是通过谷歌云初创企业计划起步的，该计划提供 35 万美元的云积分，以及为 Y Combinator 项目中的初创公司提供专用的 Nvidia GPU 集群。

—— TechCrunch

via 风向旗参考快讯 - Telegram Channel

09:21 · 2025年9月21日 · 周日

2025年9月21日
🌍资讯快读
1、武汉大学通报图书馆事件调查复核情况
https://www.jiemian.com/article/13376773.html
2、字节跳动：将按中国法律要求推进TikTok美国公司相关工作
https://www.jiemian.com/article/13376464.html
3、国家医保局：4.6万家医疗机构参加了第十一批药品集采报量
https://www.jiemian.com/article/13377321.html
4、西贝否认存在“采购总监张明华”预制菜相关微信对话：没有截图中情况，也没有该姓名员工
https://www.jiemian.com/article/13377043.html
5、025 InnoMatch技术转移大会在沪开幕
https://www.jiemian.com/article/13377113.html

👬即刻镇小报
1、人生一定要修炼的能力「精神不受力」
https://m.okjike.com/originalPosts/68caa1042393a294a651be21
2、谷歌发布Gemini官方提示词指南，帮助用户更好使用Gemini for Google Workspace提高生产力。
https://m.okjike.com/originalPosts/68ca4d7e2393a294a64b3720
3、写作，是普通人最大的红利
https://m.okjike.com/originalPosts/68ca36e61e5664293d7e64d1
4、没想到成都有这么专业的推理书店
https://m.okjike.com/originalPosts/68ca327a1e5664293d7e0ab7

今日即刻镇小报内容来自 @fountain_ @WanderMoon @广屿Ocean @刘脱力，感谢以上即友的创作与分享。 #一觉醒来发生了什么

界面新闻
武汉大学通报图书馆事件调查复核情况

武汉大学9月20日通报图书馆事件调查复核情况。近期，肖某瑫与杨某媛的矛盾纠纷引发社会关注。武汉大学组建调查复核专家组，实事求是、依法依规对肖某瑫纪律处分、杨某媛学位论文等进行全面调查复核，在此基础上认真开展处置工作。现将有关情况通报如下。

via 即刻精选 - Telegram Channel

08:16 · 2025年9月21日 · 周日

GitHub Copilot 中国用户禁止访问 Claude 模型选项

近日，多位开发者反馈称，在 GitHub Copilot 的 VS Code 插件中，Claude 模型已从模型选择下拉框中消失，用户无法再使用 Claude 进行代码生成或辅助。

根据社区讨论与测试，这一问题主要出现在中国用户群体中，海外用户目前仍可正常使用 Claude。多名开发者推测，这与 Anthropic 对中国地区访问的限制有关，而 GitHub Copilot 本身作为模型代理方，可能被迫下线了 Claude 的选项。

这一变动已在 VS Code 官方仓库中被开发者报告，同时 Reddit 的 Copilot 版块也有相关讨论。

Claude背景政策历史补充: adversarial nations like China

有趣的是使用VPN您仍然可以看到并使用Claude模型

reddit
Github

via LoopDNS资讯播报 - Telegram Channel

04:01 · 2025年9月21日 · 周日

Users Unable to Create Projects

Status: Investigating

We are investigating the issue for the listed services.

Affected components
● Mobile - iOS (Degraded performance)
● Mobile - Android (Degraded performance)
● Web (Degraded performance)

via OpenAI status

01:55 · 2025年9月21日 · 周日

Borumi —— 适合 Demo 的录频工具

📹 因为最近开始做一些视频内容，所以入手了一款适合在 Mac 上使用的录频工具。我的需求主要是录制教程、Demo 和分享类的内容，可以设置 Zoom-in 并支持简单的剪辑。对比了 Screen Studio和 CleanShot X，最后选择了 Borumi，花了 59 刀

🎞️ Borumi 支持两种录制模式：

结构型录制 - 将文稿匹配屏幕，分段录制然后拼合用于编辑；

快速录制 - 直接录屏，然后编辑背景、视频布局和 Zoom focus 即可导出

📼 体验下来，Borumi 的录屏质量和轻量编辑都很出色，Zoom 效果也十分顺滑。有预算的话可以考虑 Borumi；如果不怕上手稍麻烦，免费开源的 OBS Studio 也是不错的选择

📮 这篇文章是转发给你的吗？点击这里加入频道，一起探索更多有趣的内容！

via Roller | AI AGENT 中文社区 - Telegram Channel

00:38 · 2025年9月21日 · 周日

#Update #Grok

Grok 4 Fast 现已发布：

- 大幅降低成本，宣称性能略低于 Grok 4
- 限时全平台免费提供，含 OpenRouter
- 官方 API 定价（每百万 Token，输入/输出）：0.2/0.5 USD

via AI Copilot - Telegram Channel

23:02 · 2025年9月20日 · 周六

马斯克称到11月X的算法将完全由AI驱动

马斯克表示，到11月，其社交媒体平台X所使用的算法将完全由人工智能（AI）驱动。马斯克是在回应X平台产品主管尼基塔··比尔（Nikita Bier）的一篇帖子，后者表示，该社交平台正试图帮助用户摆脱“主流算法和政治运动”，找到属于自己的独特领域。

马斯克回应称：“到11月时，算法将完全由人工智能驱动，并且在此过程中会取得重大进展。我们每隔两周左右就会公开算法的源代码。到11月或者最晚12月，你只需向 Grok 发出指令，就能动态地调整你的信息流了。”

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

21:20 · 2025年9月20日 · 周六

华为和浙江大学发布 DeepSeek-R1-Safe

2025-09-20 00:11 by 飞行中的阴影

华为和浙江大学合作使用华为昇腾芯片和 MindSpeedLLM 等框架发布了 DeepSeek R1 模型的安全加强版 DeepSeek-R1-Safe（中国联通也有相似名字的安全版本模型）。源代码发表在 GitHub 等平台上。研究人员称他们基于国内外法律法规与核心价值观，构建了中英文双语的安全语料。其中语料不仅包含了带有安全思维链的标注，还提供了相应的安全回复，可用于大模型的安全训练、微调以及测试。测试结果表明，DeepSeek-R1-Safe 针对有毒有害言论、政治敏感内容、违法行为教唆等14个维度的普通有害问题整体防御成功率近 100%，针对情境假设、角色扮演、加密编码等多个越狱模式整体防御成功率超过40%。其综合安全防御能力达83%，在同样测试设置下超过Qwen-235B和DeepSeek-R1-671B等多个同期模型8%至15%。此外，在MMLU、GSM8K、CEVAL等通用能力基准测试中，DeepSeek-R1-Safe相比于DeepSeek-R1的性能损耗在1%以内。这些结果表明DeepSeek-R1-Safe不仅显著提升了安全防护能力，也保障了模型的可用性，达成了安全能力与通用性能之间的有效平衡。

github.com/ZJUAISafety/DeepSeek-R1-Safe
github.com/UnicomAI/DeepSeek-R1-Safee
新浪财经 DeepSeek-R1-Safe 基础大模型在华为全联接大会2025正式发布

#审查

via Solidot - Telegram Channel

18:48 · 2025年9月20日 · 周六

[retroactive] Elevated errors on Claude Haiku 3.5 and Claude Haiku 3

Sep 20, 10:41 UTC
Resolved - This incident has been resolved.

Sep 20, 10:37 UTC
Investigating - From Sep 19 19:00 PT (Sep 20 02:00 UTC) until Sep 19 22:00 PT (Sep 20 05:00 UTC) the Claude Haiku 3 model experienced a very high error rate.

From Sep 19 19:30 PT (Sep 20 02:30 UTC) until Sep 19 20:30 PT (Sep 20 03:30 UTC) the Claude Haiku 3.5 model experienced a very high error rate.

This is a retroactive incident.

via Claude Status - Incident History

16:57 · 2025年9月20日 · 周六

OpenAI首批智能硬件传出新消息

via cnBeta.COM - 中文业界资讯站 (author: 稿源：财联社)

Telegraph

OpenAI首批智能硬件传出新消息

北京时间周五深夜，围绕着“OpenAI智能硬件”这一话题又有了新鲜爆料。作为背景，OpenAI今年5月宣布作价65亿美元（约合人民币468亿元）收购前苹果首席设计师乔纳森·艾维（Jony Ive）创办的AI硬件初创公司io，明确表示将推出一批“AI计算机”。周五的最新市场消息显示，OpenAI正在开发的神秘硬件设备包括一款“无显示屏的智能音箱”，另外公司也考虑过开发眼镜、录音笔和“可佩戴别针”。首批设备发布的目标节点为2026年末或2027年初。奥尔特曼此前曾表示，他们设想中的首款产品是“可放入口袋…

14:21 · 2025年9月20日 · 周六

“逆龄大脑药”首次人体试验奥特曼押注RTR242 返老还童将要成真？

via cnBeta.COM - 中文业界资讯站 (author: 稿源：创事记)

Telegraph

“逆龄大脑药”首次人体试验奥特曼押注RTR242 返老还童将要成真？

AI教父奥特曼，本该忙着把OpenAI打造成算力帝国。可就在外界以为他只会谈模型、芯片和数据的时候，他却转身丢出一颗“年轻大脑药丸”。这家公司叫Retro Biosciences。奥特曼首投1.8亿美元，如今宣布要在年底前，让第一位临床受试者吃下实验药 RTR242。它的使命，是清理大脑里的“垃圾”，重启衰老细胞的自噬系统，让记忆重新闪亮。如果 ChatGPT颠覆了人与机器的关系，那么奥特曼正试图用另一种方式，颠覆我们和时间的关系。 Retro 的十年豪赌：押注“年轻大脑” Retro Biosci…

Before

After