ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

1 天前

三星电子将从下月开始允许员工使用外部AI模型

三星电子周二发布的一份内部备忘录显示，该公司将从下个月开始允许员工使用其他公司开发的生成式人工智能（AI）模型，例如ChatGPT。

备忘录称，三星计划于6月正式推出一项外部生成式AI服务，目标用户是其设备体验（DX）部门的员工，该部门涵盖公司的显示器、移动设备和家电业务。

据业内人士透露，三星还计划在下半年开设人工智能应用方面的培训课程，预计将有来自三星电子及其主要附属公司的约 2000 名高管参加。

此前，出于安全考虑，三星员工仅被允许使用其内部人工智能模型Samsung Gauss。

据公司高管透露，员工必须接受安全培训才能获得外部人工智能模型的访问权限。他们还补充说，外部人工智能模型的使用仍将仅限于公司半导体或器件解决方案（DS）部门。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

1 天前

OpenAI高薪招募安全专家应对AI自我进化风险

via cnBeta.COM - 中文业界资讯站 (author: 稿源：环球市场播报)

Telegraph

OpenAI高薪招募安全专家应对AI自我进化风险

OpenAI的目标是开发一种能够自我优化的AI工具。如今，这家公司正在为随之而来的风险做准备。在过去六个月里，OpenAI和Anthropic的编程工具取得了巨大进步之后，AI系统所谓“递归式自我改进”的潜力，已经成为AI行业负责人关注的重点。 Demis Hassabis本周表示，人类如今正站在“奇点”的脚下——也就是AI开始自我发展，并超越人类智能的那个时刻。计划于今年上市的OpenAI，最近发布了一个不同寻常的招聘岗位：公司正在寻找一名安全研究员，专门研究“当AI能够训练出更优秀版本的自己时”所带来的后果。…

1 天前

阿里 Qwen3.7-Max 编程能力全球登顶第二！Code Arena 1541 分，仅次 Claude，35 小时自主任务刷新生产力上限

via AI新闻资讯 (author: AI Base)

Telegraph

阿里 Qwen3.7-Max 编程能力全球登顶第二！Code Arena 1541 分，仅次 Claude，35 小时自…

AIbase 报道5月26日，全球权威编程榜单 Code Arena 最新放榜，阿里巴巴 Qwen3.7-Max 以1541分强势登上全球第二，仅次于 Claude 系列模型，成为国产大模型在编程领域的新标杆。这一成绩超越了包括 GPT-5.5、Gemini3.5Flash 等多款前沿模型，标志着中国 AI 在 Agentic Coding 和长时程任务上的重大突破。

1 天前

支付宝披露：3亿笔AI付、支持95%通用智能体、发布AI钱包和Token Pay

via AI新闻资讯 (author: AI Base)

Telegraph

支付宝披露：3亿笔AI付、支持95%通用智能体、发布AI钱包和Token Pay

5月26日，支付宝宣布，“AI支付”已完成3亿笔AI智能体支付、支持95%通用智能体框架，成为全球首个大规模商用的AI原生支付基建。同时，支付宝发布全球首个Token Pay服务和AI钱包产品，连同此前推出的AI付与AI收，构建了面向AI时代的全栈AI原生支付体系，涵盖了从授权到管理、从支付到结算、从安全到信任的完整服务。这也是继快捷支付、扫码支付分别助力电商时代、移动互联网时代之后，支付宝再次以创新的AI支付助力AI时代。蚂蚁集团首席执行官韩歆毅表示:“AI时代下商业本质未变，但智能体新角色重构一…

1 天前

隐藏的恶意“周报”！微软 Copilot 曝间接提示词注入漏洞风险

安全研究机构 PromptArmor 近日发布报告披露，微软 Microsoft 365 旗下的 AI 智能体服务 Copilot Cowork 存在严重的安全漏洞。攻击者可利用一种名为“间接提示词注入”的技术，在无需用户批准的情况下，秘密窃取并外泄组织内部的企业云盘机密文件。

潜伏于办公模板中的恶意指令

作为深度集成的 AI 助手，Cowork 本身拥有代替用户发送邮件、发布 Teams 消息以及检索 OneDrive 和 SharePoint 组织内部信息的极高权限。然而研究人员发现，攻击者只需将恶意指令隐藏在网页、文档或看似普通的办公自动化模板（如“每周工作回顾”）中，即可诱骗智能体上钩。

一旦用户调用 Cowork 处理了这个包含恶意提示词的文件，智能体便会受到操纵，谎称需要生成文档预览。随后，它会自动抓取相关高敏感文件的预认证下载链接，并将这些链接通过 Teams 消息隐蔽地发回给攻击者，整个外传过程在后台悄然进行，用户极难察觉。

定时任务放大风险且防范治理困难

报告指出，由于 Copilot Cowork 具备定时自动执行任务的功能，这让安全风险被成倍放大。例如，像“周报汇总”这类被设定为周期性运行的自动化任务，即使在用户离开屏幕、无人值守的情况下，也会在后台反复触发并执行攻击链。

在安全测试中，该攻击方法实现了 5 次测试全部完整跑通的惊人成功率。更糟糕的是，管理员对这类“技能文件”的可见性和治理难度极高，且该漏洞不仅在自动模式下有效，在明确指定调用 Claude Opus 4.7 等更强大的大模型时同样无法幸免。

via AI新闻资讯 (author: AI Base)

1 天前

全球AI监管转折点：从“承诺制”迈向“发布前强制测试”

随着人工智能大模型能力的指数级跃升，全球监管逻辑正在发生根本性重构：从过去仅停留在原则与自愿承诺的“软约束”，转向由政府主导、前置化、基于实证的“硬测试”。这一转变，标志着 AI 监管已进入“硬核”实操时代。

一、新常态：谁来给 AI 模型做“体检”？

以往，大模型厂商往往通过内部“红队测试”或发布安全报告的方式进行自我评估。然而，这种“考生给自己判分”的模式已无法满足国家安全层面的监管需求。

当前，英国 AI 安全研究院（AISI，现已更名为 AI Security Institute）与美国商务部下属的 AI 标准与创新中心（CAISI，原美国 AI 安全研究院）正在引领这一范式变革。模型发布前进行国家安全评估，正成为行业公认的“入场券”。

● 具体测什么？ 评估重心已从宽泛的“原则管理”落实到具体的技术红线：模型是否会被用于大规模网络攻击？是否会降低制造危险生物/化学物质的门槛？在关键基础设施应用中能否绕过安全保护层？
● 谁在接受测试？ 截至目前，Google DeepMind、Microsoft、xAI、Anthropic 以及 OpenAI 等全球 AI 领军企业，均已与美英监管机构达成协议，在模型公开发布前配合开展安全评估。

二、联动协作：构建全球 AI 监管“防御网”

监管的力量不仅在于单一国家，更体现在国际间的信息互认与资源协同。

● 英澳协作： 5 月 25 日，英国与澳大利亚正式签署谅解备忘录（MoU），深化两国 AI 安全研究院（AISI）在安全评估与前沿风险研究领域的合作。双方将共享 AI 能力洞察，并共同推动国际最佳测试实践，以应对全球网络安全威胁的快速迭代。
● 跨境实战： 此类合作框架意味着，跨国 AI 企业在面临不同市场的监管合规时，将面对一套日益统一的“发布前安全评估”流程。这种趋势正将安全测试能力从单一的研发成本，重塑为企业参与全球竞争的核心资质。

三、行业新规则：安全能力即商业竞争力

对于 AI 创业公司及大模型厂商而言，监管环境的变化带来了深远的战略影响：

1. 产品开发的前置约束： 评估流程将嵌入模型开发生命周期。模型能力越强，企业所需提供的访问权限与技术材料越详尽。
2. 安全技术的溢价： 随着政府采购、企业采购及国际合规准入门槛的提高，具备完善安全防护与通过政府测试能力的 AI 产品，将在市场上获得显著的竞争优势。
3. 从“原则声明”到“实测过关”： 监管机构的关注点不再是公司有没有写过“AI 安全承诺书”，而是有没有通过专业的测试机构进行真实场景下的压力测试。

四、结语：迈向更加务实的监管时代

AI 治理的本质，是创新活力与风险管控之间的动态平衡。美英等国推行的“强制性安全评估”模式，虽然增加了模型上线的流程复杂性与技术成本，但它为人工智能的长久发展构建了必要的稳定器。

这种基于现实问题、实证驱动的监管范式，无疑比原则声明更麻烦、更具挑战，但它也更接近现实，为构建一个安全、可控、值得信赖的智能社会奠定了基石。对于身处 AI 浪潮中的企业而言，拥抱这一监管趋势，将不再是负担，而是通往未来市场的必备通行证。

via AI新闻资讯 (author: AI Base)

1 天前

国产模型大突破！昆仑万维发布天工高性能 Agent 模型 SkyClaw-v1.0

昆仑万维集团今日正式推出了面向真实工作流的高性能 Agent 模型——SkyClaw-v1.0，并同步发布了兼顾性能与性价比的轻量化版本 SkyClaw-v1.0-lite。该模型的上线，标志着国产大模型在智能体生态建设与长文本处理领域迈出了坚实的一步。

支持百万上下文与多步任务执行

SkyClaw-v1.0 具备支持百万 token 的超长上下文能力，并针对复杂工具调用、多轮任务执行、代码生成以及交互式应用构建等真实智能体场景进行了深度优化。模型目前已原生接入天工 Skywork 平台，可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中流畅运行。

在主流 Agent 评测中，SkyClaw-v1.0 展现出了极为稳定的多步任务执行能力。其综合性能不仅全面超越了 Minimax 2.7、DeepSeek V4 Flash 等主流开源模型，在特定任务上的表现更是直逼 DeepSeek V4 Pro、Claude Opus 4.6 等更大规模的顶级旗舰。

极具性价比并开启限时免费试用

除了技术性能的突破，SkyClaw-v1.0 在商业化普及上也带来了巨大的诚意。该模型的市场定价极具竞争力，直接低于 Minimax 2.7 与 Qwen 3.6 系列模型的一半，为高性能 Agent 能力的规模化调用奠定了坚实的成本基础。

为了让开发者与企业用户抢先体验其卓越的性能，昆仑万维宣布即日起正式开放为期 2 至 4 周的免费试用。用户只需登录官网打开天工 Skywork，即可免配置直接在真实任务中体验其长上下文理解、工具调用和研究型数据分析等全套核心能力。

via AI新闻资讯 (author: AI Base)

1 天前

攻克悬置 56 年难题！谷歌AlphaProof Nexus颠覆数学界

谷歌DeepMind团队近日正式推出了全新的AI框架“AlphaProof Nexus”。该系统凭借强大的人工智能推理与形式化验证能力，在数学研究领域取得了里程碑式的突破，成功解开了两道已悬而未决长达 56 年的Erdős（埃尔德什）数学难题。

独创四级智能体架构协同破局

AlphaProof Nexus在架构设计上极具创新，由 4 个复杂度递增的AI智能体组合而成。系统从最基础的Gemini模型与Lean编译器循环交互开始，逐步引入代码补全片段机制和类似AlphaEvolve的进化机制，最终通过功能最完整的智能体实现多个证明草稿的共享、评分与排序。

在针对 353 个开放的Erdős问题进行的自主测试中，该系统不仅成功解决了 9 个问题，还顺带证明了整数序列在线百科全书中的 44 个开放猜想。令人惊叹的是，AlphaProof Nexus完成单个复杂问题的推理成本仅仅需要数百美元。

编译器反馈锚定推动AI进化

除了在组合数学、数论等领域斩获颇丰，该系统还成功解决了一个存在 15 年的Hilbert函数问题，并显著改进了凸优化中的已知界限。研究团队在分析实验数据时发现，即使是最简单的基础智能体，在强大的Lean编译器反馈“锚定”作用下，也能成功攻克部分难题。

这一发现表明，底层模型能力的持续提升与严格的代码形式化验证相结合，正在为AI注入逻辑严密的数学直觉。谷歌此次的技术飞跃，不仅标志着AI驱动的科学发现迈向新高度，也预示着人类正迎来与AI深度协作攻克科学禁区的新时代。

via AI新闻资讯 (author: AI Base)

1 天前

微软 Webwright 开源：网页智能体从“点击式”进化为“代码式”

via AI新闻资讯 (author: AI Base)

Telegraph

微软 Webwright 开源：网页智能体从“点击式”进化为“代码式”

微软研究院近日开源了全新网页智能体（Web Agent）框架 Webwright。该框架摒弃了当前主流的“截图/DOM 点击”预测模式，转而让 AI 模型直接在终端内编写 Playwright 代码及执行 Bash 命令，以更高效、更具逻辑性的方式完成复杂网页任务。

1 天前

NVIDIA首款Vera CPU正式交付黄仁勋想卖给中国市场

NVIDIA CEO黄仁勋近日抵达中国台北时表示，NVIDIA对2000亿美元CPU市场的预测涵盖中国市场，显示在美中科技紧张局势持续下，NVIDIA仍高度看好中国市场长期需求。黄仁勋面对媒体提问上述市场预估是否包含中国时，坦言“应该是的”。

随着能自主执行任务的代理式AI（Agentic AI）快速发展，市场需求正从GPU扩展至CPU。

黄仁勋日前在财报会议中指出，NVIDIA新推出的Vera CPU，将让NVIDIA切入全新的2000亿美元市场，并持续推升AI芯片业务成长。

目前NVIDIA已获美国政府许可，可向中国出口H200 AI芯片，但中国官方尚未批准相关销售。

黄仁勋表示：“H200已获准出口到中国，如果能服务那个市场将非常棒。中国市场非常重要，而且规模非常庞大“。

NVIDIA 近日宣布，首款面向智能体（代理式AI）的专用CPU Vera正式投产交付。首批设备已至Anthropic、OpenAI、SpaceX AI及甲骨文云等公司。

Vera搭载88颗NVIDIA自研的Olympus核心，内存带宽达1.2TB/s，单核性能提升50%，适配编排、强化学习、长上下文管理等场景。

Vera可搭配Rubin GPU、BlueField 4 DPU等组件协同运作，依托统一内存架构，数据供给能效较传统设施提升2倍，助力大规模智能体AI高效运行。

随着能自主执行任务的代理式AI快速发展，市场需求正从单一GPU扩展至CPU与GPU 协同的完整算力体系。Vera的正式交付，不仅为NVIDIA开辟了全新的增长曲线，也将加速全球AI基础设施向智能体时代的全面转型。

via cnBeta.COM - 中文业界资讯站 (author: 稿源：快科技)

1 天前

Telegraph

微软最新文档宣称Windows 11已成企业级“AI 操作系统”

微软近日发布一份长度为 14 页的电子书，系统阐述其在 Windows 11 中推进人工智能（AI）深度集成的思路，强调在企业级 AI 堆栈中，操作系统本身已经成为最关键、最具战略意义的一环。在这份文档中，微软将 Windows 11 定位为一款“AI 操作系统”，认为真正的工作场景应在系统层实现智能化，而不是简单在现有工作流之上叠加额外的 AI 工具。针对外界关注的“削弱 Copilot”“提升系统质量”等近期调整，微软在电子书中的论调是：公司并未放弃在 Windows 11 中发展 AI，相反，AI…

1 天前

Horizon Summary: 2026-05-26 (ZH)

via Horizon Daily - 中文摘要

Telegraph

Horizon Summary: 2026-05-26 (ZH)

从 28 条内容中筛选出 9 条重要资讯。教宗良十四世发布人工智能伦理通谕 ⭐️ 9.0/10 用人工智能更慢地写出更好的代码 ⭐️ 8.0/10 Mullvad 推出针对 VPN 出口 IP 指纹识别的缓解措施 ⭐️ 8.0/10 加州提议豁免 Linux 于年龄验证法 ⭐️ 8.0/10 LSFMM+BPF 峰会讨论基于 LLM 的内核补丁审查 ⭐️ 8.0/10 SFC 回应 Bambu 违反 AGPLv3 协议 ⭐️ 8.0/10 半存活人脑用于药物测试 ⭐️ 8.0/10 欧盟初步调查：谷歌违反《数字市场法》…

1 天前

活宝团队试验让AI当老板结果做什么赔什么底裤都不剩

via cnBeta.COM - 中文业界资讯站 (author: 稿源：GeekPark极客公园)

Telegraph

活宝团队试验让AI当老板结果做什么赔什么底裤都不剩

随着 AI 和 Agent 迅猛发展的当下，硅谷大量裁员，所有人都在心里问一句话：明天，我会被 AI 取代吗？面对这样的疑问，有人默默打开李一舟老师的 AI 课程；有人则呼吁让 AI 交税。但是，也有奇怪的一群人，决定让这个未来，提前到来，看看 AI 到底能不能代替人类，接管一切。国外一个团队，叫 Andon Labs，他们并非正经的商业初创团队，更像一个披着科技外衣的社会实验室。他们拿着市面上最聪明的几个大模型，把它扔进真实的社会里，再撤走人类监管，看 AI 自己能结出什么果。结果是一场全面翻车。…

1 天前

OpenAI Codex 新增“锁屏运行”功能：Mac 桌面代理进入自动化新阶段

5 月 21 日至 22 日，OpenAI 正式宣布其桌面代理产品 Codex 新增 “Locked Use”（锁屏运行） 功能。该功能打破了传统 AI 代理必须在“解锁且屏幕常亮”状态下工作的限制，允许开发者在 Mac 锁定或息屏状态下，依然能够通过远程指令操控本地应用程序。

一、核心突破：不再需要“看守”你的电脑

在过去，执行长时长的复杂工程任务（如大型代码仓库编译、GUI 自动化测试）时，开发者往往需要通过“咖啡因”插件或外接假显示器来强行维持 Mac 处于唤醒状态。

Locked Use 的发布改变了这一现状：

● 后台自动化： 用户可以从手机发送任务指令，Codex 即可在 Mac 锁屏状态下自动执行 UI 操作、调整设置或运行桌面应用流程。
● 开发体验优化： 这一功能极大地提升了“多小时任务”的可行性，开发者无需再为维持电脑唤醒而“看守”设备。

二、技术实现与安全机制

为了在保证系统安全的前提下实现这一功能，OpenAI 采取了严谨的权限与约束架构：

● Apple 授权插件： 该功能通过一个特定的 Apple 授权插件实现。它并非一个通用的远程解锁路径，而是仅允许 Codex 代理在受限的行为约束下执行特定任务。
● 严格的权限管理： 运行该功能需要用户明确授予 屏幕录制（Screen Recording） 和 辅助功能（Accessibility） 权限。
● 行为“护栏”： ● 禁区限制： 该功能明确限制了代理对系统的底层控制，例如无法自动化控制终端（Terminal）或 Codex 自身，从而有效规避了恶意利用或失控风险。 ● 地理限制： 出于对区域性法律法规及 AI 智能体监管政策的考量，该功能在发布初期不适用于欧洲经济区（EEA）、英国及瑞士。 ● 操作约束： 若 MacBook 处于合盖状态（触发特定的休眠模式），该功能将无法继续工作。

三、行业视角：桌面代理安全的新命题

Codex 这一功能的推出，标志着桌面级 AI 代理正从“云端协作”走向“深度系统集成”。业内专家指出，这也引发了企业端对终端安全的新思考：

1. 合规性挑战： 这种能够绕过锁屏进行操作的“特权代理”，对于企业信息安全管理（尤其是涉及生产凭证的开发机器）提出了更高的审计与监控要求。
2. 信任模型升级： 操作系统如何为这类“信任代理”设定更精细化的权限等级，将成为未来 macOS 等桌面系统迭代的核心看点。
3. 安全审计需求： 目前，开发者仍无法完全“黑盒”化该进程。未来，如何提供操作日志回溯或 session 监控，将是企业大规模部署该类 AI 工具时的关键门槛。

四、功能适用范围

● 适用平台： 仅限安装了 Codex 桌面代理的 macOS 设备。
● 配置方式： 用户可在 Codex 设置界面中找到“Locked Use”选项进行开启。
● 场景建议： 主要面向重现 GUI 界面 Bug、自动化调整桌面应用配置、以及无需人工干预的离线任务处理。

OpenAI 此次更新，不仅进一步夯实了其在 AI 辅助开发领域的领跑地位，也为未来“无感化”的 AI 办公体验探索了一条高标准、强监管的落地路径。

via AI新闻资讯 (author: AI Base)

1 天前

Degraded Performance for Agent Sessions

May 26, 03:04 UTC
Investigating - We are monitoring a service degradation affecting Agents sessions in IDE

via Cursor Status - Incident History

1 天前

7 个实用技巧，让Claude Code的Token消耗爆降80%

via 掘金人工智能本月最热 (author: 程序新视界)

Telegraph

7 个实用技巧，让Claude Code的Token消耗爆降80%

不要只优化 Prompt，更要优化 Context。 Claude Code 很强大，这在前面的实践文章中我们已经验证过了，但与此同时，也有不少朋友说Token消耗过多，成本过高。面对这个问题，很多人第一反应是：是不是Prompt写得太啰嗦了？其实，很多时候真正“烧 Token”的，并不是输入的那句话，而是Claude背后带着的整段上下文。它们可能包括：之前的聊天记录已经读取过的代码文件工具调用输出像 CLAUDE.md 这样的记忆文件系统或后台注入的额外指令也就是说，当Token消耗…

1 天前

苹果 Siri 重磅升级：1.2 万亿参数谷歌定制模型“掌脑”，本地运行速度成关键

北京时间 5 月 26 日，据多家媒体援引知情人士消息，苹果并非简单将 Gemini 集成到 Siri 中，而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型，作为下一代 Siri 核心 overhaul 的“大脑”。

这一规模远超当前主流移动端模型，引发业界高度关注。

模型规模碾压：1.2T vs Gemini 3.5 Flash 300B

据估算，Gemini 3.5 Flash 的参数量约为 3000 亿，而苹果此次采用的定制模型达到1.2 万亿参数，规模显著更大。AIbase分析指出，如此庞大的模型若能高效部署，将为 Siri 带来更强的理解、推理和复杂任务处理能力，尤其在多模态交互和上下文理解方面有望实现质的飞跃。

性能与速度：本地响应是最大考验

尽管模型参数激增，但苹果一贯注重用户隐私与实时性。报道强调，简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快，又要兼顾功耗和发热控制。

AIbase认为，模型“够大”并不必然等于“够好”。在移动场景下，延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署，将直接决定这次 Siri overhaul 的用户体验。

下半年 AI 大战一触即发

随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合，全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括：

● WWDC：Apple Intelligence 全面亮相，Siri 与 Gemini 定制模型结合
● GPT-5.6：OpenAI 下一代模型进展
● Sonnet 4.8 / Opus 4.8：Anthropic 可能同步迭代
● Gemini 3.5 Pro：谷歌已确认即将推出

AIbase将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛，正越来越接近消费者日常使用场景。谁能最终胜出，拭目以待。

via AI新闻资讯 (author: AI Base)

2 天前

Elevated errors for Claude Code in Slack

May 26, 01:56 UTC
Investigating - We are currently investigating this issue.

via Claude Status - Incident History

Before

After