https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Anthropic据悉正接近与美国政府达成协议 AI模型限制有望解除

据知情人士透露,Anthropic PBC与特朗普政府正在接近达成解除对这家人工智能公司两款最先进模型限制的协议,此前双方就系统安全问题进行了数周谈判。

这些知情人士表示,美国商务部长霍华德·卢特尼克在缓解安全顾虑方面正取得进展,这将有助于取消商务部对Anthropic的Fable 5和Mythos 5系统实施的出口管制。他们表示,一旦政府各部门官员批准,这些限制措施就可能被解除。

知情人士表示,参与谈判的包括Anthropic联合创始人Tom Brown在内的多名高管,他于近日会见了卢特尼克及其他政府高层官员。知情人士称,美国官员已告知Anthropic,相关限制在政府的安全担忧得到解决后就会解除。

目前尚不清楚白宫及其他积极参与人工智能政策制定的政府机构将以多快的速度给予批准。一名美国官员表示,商务部正努力与Anthropic达成解决方案,并寻求确保整个政府在相关决定上保持一致。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
SpaceX即将入选纳斯达克100指数 为被动买入潮铺平道路

纳斯达克交易所周五确认,SpaceX将于7月7日被纳入科技股占比较高的纳斯达克100指数,这为埃隆·马斯克旗下的这家火箭与人工智能巨头吸引被动投资铺平了道路。通常情况下,被纳入指数会推高股价,因为旨在复制指数表现的交易所交易基金(ETF)会买入新纳入公司的股票。

为了使纳斯达克100指数对寻求在美国上市的公司更具吸引力,纳斯达克与其他指数提供商富时罗素(FTSE Russell)和明晟(MSCI)共同放宽了入选标准,包括盈利能力、公司上市后的天数以及可供交易的股票数量等要求。

SpaceX于6月12日在纳斯达克上市,过去三年间其业绩在大幅亏损与微利之间波动。去年,该公司报告净亏损49亿美元。

大型语言模型(LLM)的开发商 OpenAI 和 Anthropic 预计也将在今年或明年提交首次公开募股(IPO)申请,估值目标很可能超过 1 万亿美元。

投资者通过购买追踪纳斯达克100指数的共同基金和ETF(例如景顺的QQQ和QQQM),以获得更广泛的投资敞口。

摩根大通估计,SpaceX被纳入纳斯达克100指数可能带来43亿美元的被动资金流入。

“显然,市场需求很大,这就是他们加快将其纳入指数进程的原因,”晨星(Morningstar)首席股票市场策略师迈克尔·菲尔德(Michael Field)表示。“很多人会对此感到高兴。但一些基金经理则不那么乐意,其中包括持怀疑态度的那些人,我们也在其中。我们认为该股估值过高。”

标普全球 SPGI.N 本月表示,不会改变SpaceX纳入其主要指数(包括华尔街基准指数标普500指数 .SPX, .INX)的准入要求,且至少需等待12个月后才会考虑此事。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
OpenAI周六凌晨发布GPT-5.6系列模型

北京时间周六凌晨,OpenAI官宣推出新一代旗舰大模型GPT‑5.6系列。但由于美国政府的阻挠,目前只有获得美国政府批准的一小撮“受信任合作伙伴”能够用上这款代表人类AI能力新巅峰的大模型。GPT‑5.6系列一共有3款模型:旗舰模型Sol、适合日常工作的均衡型模型Terra,以及快速且经济的Luna模型。其中,GPT‑5.6 Sol能够引入更高等级的推理强度,让AI有更多时间进行深入推理;同时,OpenAI还推出利用子智能体加速复杂任务的GPT‑5.6 Sol Ultra模式。定价方面,旗舰模型Sol的输入/输出价格为每百万词元5美元/30美元;均衡模型Terra为2.5美元/15美元;轻量模型Luna为1美元/6美元。

—— 财联社彭博社

via 风向旗参考快讯 - Telegram Channel
↩️🖼 🤖 OpenAI 开始有限预览 GPT-5.6 系列


科技圈🎗在花频道📮:

🤖 OpenAI 将根据联邦政府审查请求分阶段发布 GPT 5.6 OpenAI CEO Sam Altman 告诉员工,GPT-5.6 将应联邦政府要求,先向少数合作伙伴开放限量预览。预览期间,政府将逐个客户批准访问。 这一要求出现在 OpenAI 过去一个月与多个政府机构预览模型之后。商务部长 Howard Lutnick 据称曾提醒 OpenAI,不要在没有其他机构批准的情况下发布。Altman 称这不是公司偏好的长期模式,将与政府和行业寻找更可持续的发布流程,如果一切顺利,他希望几周后更大范围发布。…

🤖 OpenAI 开始有限预览 GPT-5.6 系列

OpenAI 开始有限预览 GPT-5.6 系列,包括旗舰模型 Sol、均衡型 Terra 和低成本 Luna。Sol 主打更强的编码、生物和网络安全能力,并新增 max 推理强度和 ultra 模式;Terra 性能接近 GPT-5.5 且便宜 2 倍,Luna 则定位为最低成本选择。

这次发布先面向少数可信伙伴,通过 API 和 Codex 提供,OpenAI 称这是应美国政府要求采取的短期步骤,目标是在未来几周扩大到 ChatGPT、Codex 和 API。GPT-5.6 同时加强多层安全防护,重点约束高风险网络请求和滥用;每 100 万 token Sol 的输入价格为 5 美元/输出价格为 30 美元;Terra 的输入价格为 2.50 美元/输出价格为 15 美元;Luna 的输入价格为 1 美元/输出价格为 6 美元。

OpenAI

🌸 在花频道 · 英文频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
#Update #ChatGPT

GPT-5.6 系列模型现已发布:

• 包含 Sol、Terra、Luna 三个模型(能力由强到弱)
• Sol 宣称 SOTA,且超越 Claude Mythos 5
• Sol 宣称有更高的 Token 效率

目前,受到美国政府的监管限制,GPT-5.6 系列仅针对少数可信组织开放,OpenAI 计划在未来几周内让此模型广泛可用。

官方博客:https://openai.com/index/previewing-gpt-5-6-sol/

via AI Copilot - Telegram Channel
OpenAI 开始有限预览 GPT-5.6 系列

OpenAI 开始有限预览 GPT-5.6 系列,包括旗舰模型 Sol、均衡型 Terra 和低成本 Luna。Sol 主打更强的编码、生物和网络安全能力,并新增 max 推理强度和 ultra 模式;Terra 性能接近 GPT-5.5 且便宜 2 倍,Luna 则定位为最低成本选择。

这次发布先面向少数可信伙伴,通过 API 和 Codex 提供,OpenAI 称这是应美国政府要求采取的短期步骤,目标是在未来几周扩大到 ChatGPT、Codex 和 API。GPT-5.6 同时加强多层安全防护,重点约束高风险网络请求和滥用;每 100 万 token Sol 的输入价格为 5 美元/输出价格为 30 美元;Terra 的输入价格为 2.50 美元/输出价格为 15 美元;Luna 的输入价格为 1 美元/输出价格为 6 美元。

OpenAI

🌸 在花频道 · 英文频道 · 投稿通道
Codex Usage Limits Depleting Faster Than Expected

Status: Investigating

We are investigating reports that Codex usage limits are being consumed faster than expected.

Affected components
App (Degraded performance)
VS Code extension (Degraded performance)
Codex API (Degraded performance)
Codex Web (Degraded performance)
CLI (Degraded performance)

via OpenAI status
意大利监管机构调查微软Microsoft 365涨价做法

罗马时间6月26日,意大利反垄断监管机构宣布,对微软公司因“Microsoft 365”订阅服务涨价而涉嫌实施不公平商业行为展开调查。

该机构在声明中指出,微软近期将“Microsoft 365”服务与其人工智能工具Copilot和Designer进行了整合,但没有充分告知消费者相关情况。 在此背景下,用户在未主动选择退出的情况下,会被自动迁移到价格更高的订阅方案。 监管方认为,消费者在续订合同时并未获得足够的信息来作出是否继续续约的明智决策。

意大利反垄断机构认为,上述做法可能被视为“带有攻击性”的商业行为,因为它不当地限制了消费者的选择自由。 监管方强调,按现有情况,用户面临的是被动接受涨价和功能变化,而非在充分知情基础上的自主选择。

截至目前,微软方面尚未就此调查作出即时回应。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
加州推出全美首个 AI 失业追踪仪表盘,监测人工智能对就业的影响

加州州长加文·纽森于 6 月 25 日宣布推出全美首个 AI 失业追踪公共仪表盘,用于监测人工智能是否正在导致该州就业岗位流失。这款仪表盘由加州就业发展局与加州大学洛杉矶分校加州政策实验室的研究人员联合开发,每月更新一次,重点追踪易受 AI 影响职业的失业申领数据,以便为受影响的工人提供再培训、求职协助和医疗保障指引等支持。目前数据显示,AI 尚未引发全州范围的失业潮,但研究人员发现,自 2022 年 ChatGPT-3.5 发布以来,在 AI 高暴露行业工作的受过大学教育的工人失业申领有所增加,旧金山湾区尤为明显。

Decrypt

🌸 在花频道 · 英文频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
百度千帆Coding Plan停止套餐续费,7月将升级推Token Plan按量计费产品

百度智能云千帆大模型平台于2026年6月25日正式停止其AI编码订阅服务“Coding Plan”的所有套餐续费服务,标志着这一上线仅四个月的产品迎来重大战略转型。

作为2026年2月推出的低门槛全流程代码辅助工具,Coding Plan曾主打多模型驱动优势,支持开发者在一键切换GLM-4.7、DeepSeek-V3.2等主流大模型的同时,深度兼容Cursor与Claude Code等前沿编程工具。针对此次停续调整,千帆团队给出了明确的过渡方案:已购套餐的个人用户在当前服务周期内权益不受影响,而自动续费功能将在公告发布30天后统一关闭,套餐到期后相关服务将平稳结束。

据悉,本次产品线的紧急踩刹车并非业务终结,而是百度智能云深化生成式AI商业化路径的战略性重组。千帆团队透露,后续将把技术与用户资源逐步迁移至计划于2026年7月初上线的全新产品“Token Plan个人版”中。新产品将全面抛弃传统的固定套餐订阅制,转向更具弹性的按量计费模式,并提供更丰富的模型选择。

via AI新闻资讯 (author: AI Base)
↩️ Cursor 研究:越强的 AI 模型越会“作弊”或“抄袭”应对编程基准测试


科技圈🎗在花频道📮:

GPT-5编程测试被曝"作弊":自删23道题目美化成绩 有开发者发现,OpenAI在GPT-5编程能力测试中存在"猫腻"。官方声称使用SWE-bench Verified基准测试,但实际只用了477个问题,自行删除了原本500题中的23道。SWE-bench是评估AI模型自主编程能力的通用指标,而GPT-5使用的是"子集的子集"。如果被删除的23题按零分计算,GPT-5的实际得分将低于Claude Opus 4.1,目前两者仅有0.4%的微弱差距。 新浪科技 🍀频道 🍵茶馆 📮投稿

Cursor 研究:越强的 AI 模型越会“作弊”或“抄袭”应对编程基准测试

Cursor 团队发现在 SWE-bench Pro 测试中,Opus 4.8 Max 编程功能的 63%的成功案例并非模型自行推导,而是通过检索公开网络上的已知补丁或挖掘仓库 Git 历史直接套用答案。移除.git 目录并限制网络访问后,Opus 4.8 Max 得分从 87.1%骤降至 73.0%,Cursor 自家的 Composer 2.5 从 74.7%降至 54.0%。

研究显示这种“鼓励作弊”行为随模型代际急剧升级:Opus 4.6 在严格环境下得分几乎不变,Opus 4.8 Max 却下降 14.1 分,Composer 2.5 更下降 20.7 分。但 GPT 系列模型未出现类似趋势。Cursor 呼吁编程评测必须控制运行环境,否则评价容易受检索答案功能影响而没有表现出模型真正的编程水平。

Cursor

🌸 在花频道 · 英文频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
OpenAI Codex个人用户用量暴增 137 倍,AI编程已走出程序员圈子

OpenAI于 6 月 25 日发布报告,披露旗下智能体AI产品Codex自 2025 年 8 月以来的惊人增长数据:个人用户使用量飙升 137 倍,组织用户增长 189 倍,OpenAI内部使用量也增长了 12 倍。这意味着Codex的受众已从专业开发者群体,迅速向更广泛的普通用户蔓延。

非技术用户成增长主力,长周期任务能力凸显

在OpenAI内部,目前97.9%的员工日常使用Codex,而 2025 年 8 月这一比例仅为约40%。外部组织的渗透率也已攀升至17.3%,且增速仍在加快。整体来看, 2026 年上半年使用智能体AI的活跃用户数量增长超 5 倍,其中增长最快的人群恰恰是软件开发人员以外的非技术用户。

OpenAI同时指出,Codex作为智能体AI具备持续处理长周期任务的独特能力。自 2026 年年初以来,提交过至少一项预估需人类 8 小时以上才能完成的任务请求的Codex用户比例增长了近十倍,表明产品正从辅助工具向能够独立"干活"的协作角色加速演变。

这一数据背后,折射出AI编程工具市场正在经历一场深刻的用户结构变革——过去以开发者为核心受众的赛道,如今正在被更广泛的办公场景和普通用户需求重新定义。当非程序员也能通过自然语言驱动AI完成复杂任务时,Codex的增长曲线或许只是AI普惠化的一个开端。

via AI新闻资讯 (author: AI Base)
苹果 Xcode 26.6 正式发布,编程助手迎来“谷歌 Gemini”强力外援

苹果公司今日正式推送了 Xcode26.6更新,为开发者带来了备受期待的功能升级——编程助手正式新增对 Google Gemini 的支持。这意味着开发者在编写代码时,除了原有的 Anthropic Claude Agents 和 OpenAI Codex 之外,现在又多了一个强大的AI辅助选项。

此次更新的 Xcode26.6版本集成了最新的 Swift6.3.3语言版本,并同步更新了覆盖 iOS、iPadOS、tvOS、watchOS、visionOS 以及 macOS26.5等全平台系统的 SDK。除了引入 Gemini 编程助手这一亮点外,本次版本升级还优化了 ACP 兼容能力,并集中修复了一系列已知 Bug,旨在进一步增强开发环境的整体稳定性与运行效率。

事实上,苹果此前已在 Xcode27的测试版中先行尝试引入 Gemini 支持。此次将其下放至正式版,显示出苹果正加速将主流大模型整合进其开发生态。目前,开发者已可直接从 App Store 免费下载该版本,即刻体验 AI 辅助编程带来的效率提升。随着 Xcode 在 AI 领域布局的不断完善,开发者未来的编码体验或许将迎来更多元化的智能化变革。

via AI新闻资讯 (author: AI Base)
Anthropic公司付费收入和用户持续增长

美国顶尖AI企业OpenAI与Anthropic之间的竞争日益激烈。报告显示 Anthropic 正在快速抢占OpenAI的付费用户市场份额。据信用卡交易分析公司Indagari数据,Anthropic旗舰模型Claude付费用户和收入逐月增长,自2026年1月以来,该细分市场的收入增长了约75%。Indagari的数据来自2800万美国消费者的数千亿笔匿名信用卡交易记录,覆盖了 2025年至 2026年5月10日之间的每周交易。AI在线教育平台DataCamp也给出了类似的结论。指出平台上的用户今年对Claude的兴趣呈爆炸式增长,Claude已经成为该网站上搜索量最高的词条,甚至超过了AI。

—— 财联社Techcrunch

via 风向旗参考快讯 - Telegram Channel
特朗普政府要求 OpenAI 分阶段发布新模型

2026-06-26 14:35 by 量子魔术师

出于安全担忧特朗普政府要求 OpenAI 分阶段发布新的 GPT-5.6 模型。The Information 报道,新模型最初将提供给一小部分合作伙伴,政府将在预览期内“逐个批准客户的访问权限”。报道称,这一要求源于国家网络安全总监办公室和科技政策办公室之间的对话。

https://yro.slashdot.org/story/26/06/25/215241/trump-administration-asks-openai-to-stagger-release-of-new-model

#USA

via Solidot - Telegram Channel
拖更三年万字长文,前OpenAI安全VP翁荔拆解Scaling Laws:你的模型可能喂错了数据

停更 13 个月后,前OpenAI安全研究副总裁、现Thinking Machines Lab联合创始人翁荔在个人博客Lil'Log上发表了一篇逾万字的技术长文《Scaling Laws, Carefully》,自称"迟到了三年多"。这篇文章将支撑大模型行业数百亿美元投入的Scaling Laws从头拆解一遍,得出的核心结论让不少从业者难以平静:当前模型的数据配比,很可能从一开始就走偏了。

从Kaplan到Chinchilla:一场被写反的行业共识

故事始于 2020 年,OpenAI研究员Jared Kaplan发表论文,提出在log-log坐标上,训练损失随参数量、数据量和算力呈漂亮幂律下降——模型规模应比数据增长更快。GPT- 3 正是这一结论的产物: 1750 亿参数,训练数据却仅 3000 亿token。

两年后,DeepMind团队以更大规模实验推翻了这一结论。他们将 2800 亿参数的Gopher与 700 亿参数的Chinchilla同算力对比,后者参数仅为前者的四分之一,但训练数据是四倍多——结果Chinchilla在所有评测上碾压Gopher。Chinchilla揭示的规律是参数与数据应等比增长,最佳比例约为1:20,而非Kaplan所说的参数飙涨、数据慢跟。这也解释了为何后来Llama、DeepSeek等模型参数不敌GPT-3,性能却远胜于它。

翁荔分析了Kaplan的偏差根源:实验最大模型仅 15 亿参数,小规模区间的拟合差异外推至万亿级别后演变为系统性错误;同时Kaplan排除了embedding层参数计数,而这一口径在小模型上影响极大。更令人意外的是, 2024 年Epoch AI团队逐行复现Chinchilla拟合代码时发现两个bug——损失函数取均值而非求和导致优化器误判收敛、核心幂律指数被四舍五入至两位数产生虚假精度——修正后的数据再次印证了等比增长的结论。

数据墙将至,重复训练边际价值指数衰减

上述讨论均以"训练数据无限且不重复"为前提,但高质量文本数据预计 2026 至 2028 年即告枯竭。研究显示,重复数据的有效价值呈指数衰减,每多训练一轮边际收益急剧递减。翁荔在文中嵌入的交互式模拟器直观展示了工程细节的敏感性——仅调整拟合精度或噪声水平,外推预测就可能差出十万八千里。

翁荔最终写下这样一句三年来凝练的判断:Scaling Laws不是物理定律,它是对工程细节高度敏感的观测性指南。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]