https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
三星电子周二发布的一份内部备忘录显示,该公司将从下个月开始允许员工使用其他公司开发的生成式人工智能(AI)模型,例如ChatGPT。
备忘录称,三星计划于6月正式推出一项外部生成式AI服务,目标用户是其设备体验(DX)部门的员工,该部门涵盖公司的显示器、移动设备和家电业务。
据业内人士透露,三星还计划在下半年开设人工智能应用方面的培训课程,预计将有来自三星电子及其主要附属公司的约 2000 名高管参加。
此前,出于安全考虑,三星员工仅被允许使用其内部人工智能模型Samsung Gauss。
据公司高管透露,员工必须接受安全培训才能获得外部人工智能模型的访问权限。他们还补充说,外部人工智能模型的使用仍将仅限于公司半导体或器件解决方案(DS)部门。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
安全研究机构 PromptArmor 近日发布报告披露,微软 Microsoft 365 旗下的 AI 智能体服务 Copilot Cowork 存在严重的安全漏洞。攻击者可利用一种名为“间接提示词注入”的技术,在无需用户批准的情况下,秘密窃取并外泄组织内部的企业云盘机密文件。
潜伏于办公模板中的恶意指令
作为深度集成的 AI 助手,Cowork 本身拥有代替用户发送邮件、发布 Teams 消息以及检索 OneDrive 和 SharePoint 组织内部信息的极高权限。然而研究人员发现,攻击者只需将恶意指令隐藏在网页、文档或看似普通的办公自动化模板(如“每周工作回顾”)中,即可诱骗智能体上钩。
一旦用户调用 Cowork 处理了这个包含恶意提示词的文件,智能体便会受到操纵,谎称需要生成文档预览。随后,它会自动抓取相关高敏感文件的预认证下载链接,并将这些链接通过 Teams 消息隐蔽地发回给攻击者,整个外传过程在后台悄然进行,用户极难察觉。
定时任务放大风险且防范治理困难
报告指出,由于 Copilot Cowork 具备定时自动执行任务的功能,这让安全风险被成倍放大。例如,像“周报汇总”这类被设定为周期性运行的自动化任务,即使在用户离开屏幕、无人值守的情况下,也会在后台反复触发并执行攻击链。
在安全测试中,该攻击方法实现了 5 次测试全部完整跑通的惊人成功率。更糟糕的是,管理员对这类“技能文件”的可见性和治理难度极高,且该漏洞不仅在自动模式下有效,在明确指定调用 Claude Opus 4.7 等更强大的大模型时同样无法幸免。
via AI新闻资讯 (author: AI Base)
全球AI监管转折点:从“承诺制”迈向“发布前强制测试”
随着人工智能大模型能力的指数级跃升,全球监管逻辑正在发生根本性重构:从过去仅停留在原则与自愿承诺的“软约束”,转向由政府主导、前置化、基于实证的“硬测试”。这一转变,标志着 AI 监管已进入“硬核”实操时代。
一、新常态:谁来给 AI 模型做“体检”?
以往,大模型厂商往往通过内部“红队测试”或发布安全报告的方式进行自我评估。然而,这种“考生给自己判分”的模式已无法满足国家安全层面的监管需求。
当前,英国 AI 安全研究院(AISI,现已更名为 AI Security Institute)与美国商务部下属的 AI 标准与创新中心(CAISI,原美国 AI 安全研究院)正在引领这一范式变革。模型发布前进行国家安全评估,正成为行业公认的“入场券”。
● 具体测什么? 评估重心已从宽泛的“原则管理”落实到具体的技术红线:模型是否会被用于大规模网络攻击?是否会降低制造危险生物/化学物质的门槛?在关键基础设施应用中能否绕过安全保护层?
● 谁在接受测试? 截至目前,Google DeepMind、Microsoft、xAI、Anthropic 以及 OpenAI 等全球 AI 领军企业,均已与美英监管机构达成协议,在模型公开发布前配合开展安全评估。
二、联动协作:构建全球 AI 监管“防御网”
监管的力量不仅在于单一国家,更体现在国际间的信息互认与资源协同。
● 英澳协作: 5 月 25 日,英国与澳大利亚正式签署谅解备忘录(MoU),深化两国 AI 安全研究院(AISI)在安全评估与前沿风险研究领域的合作。双方将共享 AI 能力洞察,并共同推动国际最佳测试实践,以应对全球网络安全威胁的快速迭代。
● 跨境实战: 此类合作框架意味着,跨国 AI 企业在面临不同市场的监管合规时,将面对一套日益统一的“发布前安全评估”流程。这种趋势正将安全测试能力从单一的研发成本,重塑为企业参与全球竞争的核心资质。
三、行业新规则:安全能力即商业竞争力
对于 AI 创业公司及大模型厂商而言,监管环境的变化带来了深远的战略影响:
1. 产品开发的前置约束: 评估流程将嵌入模型开发生命周期。模型能力越强,企业所需提供的访问权限与技术材料越详尽。
2. 安全技术的溢价: 随着政府采购、企业采购及国际合规准入门槛的提高,具备完善安全防护与通过政府测试能力的 AI 产品,将在市场上获得显著的竞争优势。
3. 从“原则声明”到“实测过关”: 监管机构的关注点不再是公司有没有写过“AI 安全承诺书”,而是有没有通过专业的测试机构进行真实场景下的压力测试。
四、结语:迈向更加务实的监管时代
AI 治理的本质,是创新活力与风险管控之间的动态平衡。美英等国推行的“强制性安全评估”模式,虽然增加了模型上线的流程复杂性与技术成本,但它为人工智能的长久发展构建了必要的稳定器。
这种基于现实问题、实证驱动的监管范式,无疑比原则声明更麻烦、更具挑战,但它也更接近现实,为构建一个安全、可控、值得信赖的智能社会奠定了基石。对于身处 AI 浪潮中的企业而言,拥抱这一监管趋势,将不再是负担,而是通往未来市场的必备通行证。
via AI新闻资讯 (author: AI Base)
随着人工智能大模型能力的指数级跃升,全球监管逻辑正在发生根本性重构:从过去仅停留在原则与自愿承诺的“软约束”,转向由政府主导、前置化、基于实证的“硬测试”。这一转变,标志着 AI 监管已进入“硬核”实操时代。
一、新常态:谁来给 AI 模型做“体检”?
以往,大模型厂商往往通过内部“红队测试”或发布安全报告的方式进行自我评估。然而,这种“考生给自己判分”的模式已无法满足国家安全层面的监管需求。
当前,英国 AI 安全研究院(AISI,现已更名为 AI Security Institute)与美国商务部下属的 AI 标准与创新中心(CAISI,原美国 AI 安全研究院)正在引领这一范式变革。模型发布前进行国家安全评估,正成为行业公认的“入场券”。
● 具体测什么? 评估重心已从宽泛的“原则管理”落实到具体的技术红线:模型是否会被用于大规模网络攻击?是否会降低制造危险生物/化学物质的门槛?在关键基础设施应用中能否绕过安全保护层?
● 谁在接受测试? 截至目前,Google DeepMind、Microsoft、xAI、Anthropic 以及 OpenAI 等全球 AI 领军企业,均已与美英监管机构达成协议,在模型公开发布前配合开展安全评估。
二、联动协作:构建全球 AI 监管“防御网”
监管的力量不仅在于单一国家,更体现在国际间的信息互认与资源协同。
● 英澳协作: 5 月 25 日,英国与澳大利亚正式签署谅解备忘录(MoU),深化两国 AI 安全研究院(AISI)在安全评估与前沿风险研究领域的合作。双方将共享 AI 能力洞察,并共同推动国际最佳测试实践,以应对全球网络安全威胁的快速迭代。
● 跨境实战: 此类合作框架意味着,跨国 AI 企业在面临不同市场的监管合规时,将面对一套日益统一的“发布前安全评估”流程。这种趋势正将安全测试能力从单一的研发成本,重塑为企业参与全球竞争的核心资质。
三、行业新规则:安全能力即商业竞争力
对于 AI 创业公司及大模型厂商而言,监管环境的变化带来了深远的战略影响:
1. 产品开发的前置约束: 评估流程将嵌入模型开发生命周期。模型能力越强,企业所需提供的访问权限与技术材料越详尽。
2. 安全技术的溢价: 随着政府采购、企业采购及国际合规准入门槛的提高,具备完善安全防护与通过政府测试能力的 AI 产品,将在市场上获得显著的竞争优势。
3. 从“原则声明”到“实测过关”: 监管机构的关注点不再是公司有没有写过“AI 安全承诺书”,而是有没有通过专业的测试机构进行真实场景下的压力测试。
四、结语:迈向更加务实的监管时代
AI 治理的本质,是创新活力与风险管控之间的动态平衡。美英等国推行的“强制性安全评估”模式,虽然增加了模型上线的流程复杂性与技术成本,但它为人工智能的长久发展构建了必要的稳定器。
这种基于现实问题、实证驱动的监管范式,无疑比原则声明更麻烦、更具挑战,但它也更接近现实,为构建一个安全、可控、值得信赖的智能社会奠定了基石。对于身处 AI 浪潮中的企业而言,拥抱这一监管趋势,将不再是负担,而是通往未来市场的必备通行证。
via AI新闻资讯 (author: AI Base)
昆仑万维集团今日正式推出了面向真实工作流的高性能 Agent 模型——SkyClaw-v1.0,并同步发布了兼顾性能与性价比的轻量化版本 SkyClaw-v1.0-lite。该模型的上线,标志着国产大模型在智能体生态建设与长文本处理领域迈出了坚实的一步。
支持百万上下文与多步任务执行
SkyClaw-v1.0 具备支持百万 token 的超长上下文能力,并针对复杂工具调用、多轮任务执行、代码生成以及交互式应用构建等真实智能体场景进行了深度优化。模型目前已原生接入天工 Skywork 平台,可在 OpenClaw、Hermes、Nanobot 等主流 Agent 环境中流畅运行。
在主流 Agent 评测中,SkyClaw-v1.0 展现出了极为稳定的多步任务执行能力。其综合性能不仅全面超越了 Minimax 2.7、DeepSeek V4 Flash 等主流开源模型,在特定任务上的表现更是直逼 DeepSeek V4 Pro、Claude Opus 4.6 等更大规模的顶级旗舰。
极具性价比并开启限时免费试用
除了技术性能的突破,SkyClaw-v1.0 在商业化普及上也带来了巨大的诚意。该模型的市场定价极具竞争力,直接低于 Minimax 2.7 与 Qwen 3.6 系列模型的一半,为高性能 Agent 能力的规模化调用奠定了坚实的成本基础。
为了让开发者与企业用户抢先体验其卓越的性能,昆仑万维宣布即日起正式开放为期 2 至 4 周的免费试用。用户只需登录官网打开天工 Skywork,即可免配置直接在真实任务中体验其长上下文理解、工具调用和研究型数据分析等全套核心能力。
via AI新闻资讯 (author: AI Base)
谷歌DeepMind团队近日正式推出了全新的AI框架“AlphaProof Nexus”。该系统凭借强大的人工智能推理与形式化验证能力,在数学研究领域取得了里程碑式的突破,成功解开了两道已悬而未决长达 56 年的Erdős(埃尔德什)数学难题。
独创四级智能体架构协同破局
AlphaProof Nexus在架构设计上极具创新,由 4 个复杂度递增的AI智能体组合而成。系统从最基础的Gemini模型与Lean编译器循环交互开始,逐步引入代码补全片段机制和类似AlphaEvolve的进化机制,最终通过功能最完整的智能体实现多个证明草稿的共享、评分与排序。
在针对 353 个开放的Erdős问题进行的自主测试中,该系统不仅成功解决了 9 个问题,还顺带证明了整数序列在线百科全书中的 44 个开放猜想。令人惊叹的是,AlphaProof Nexus完成单个复杂问题的推理成本仅仅需要数百美元。
编译器反馈锚定推动AI进化
除了在组合数学、数论等领域斩获颇丰,该系统还成功解决了一个存在 15 年的Hilbert函数问题,并显著改进了凸优化中的已知界限。研究团队在分析实验数据时发现,即使是最简单的基础智能体,在强大的Lean编译器反馈“锚定”作用下,也能成功攻克部分难题。
这一发现表明,底层模型能力的持续提升与严格的代码形式化验证相结合,正在为AI注入逻辑严密的数学直觉。谷歌此次的技术飞跃,不仅标志着AI驱动的科学发现迈向新高度,也预示着人类正迎来与AI深度协作攻克科学禁区的新时代。
via AI新闻资讯 (author: AI Base)
OpenAI Codex 新增“锁屏运行”功能:Mac 桌面代理进入自动化新阶段
5 月 21 日至 22 日,OpenAI 正式宣布其桌面代理产品 Codex 新增 “Locked Use”(锁屏运行) 功能。该功能打破了传统 AI 代理必须在“解锁且屏幕常亮”状态下工作的限制,允许开发者在 Mac 锁定或息屏状态下,依然能够通过远程指令操控本地应用程序。
一、核心突破:不再需要“看守”你的电脑
在过去,执行长时长的复杂工程任务(如大型代码仓库编译、GUI 自动化测试)时,开发者往往需要通过“咖啡因”插件或外接假显示器来强行维持 Mac 处于唤醒状态。
Locked Use 的发布改变了这一现状:
● 后台自动化: 用户可以从手机发送任务指令,Codex 即可在 Mac 锁屏状态下自动执行 UI 操作、调整设置或运行桌面应用流程。
● 开发体验优化: 这一功能极大地提升了“多小时任务”的可行性,开发者无需再为维持电脑唤醒而“看守”设备。
二、技术实现与安全机制
为了在保证系统安全的前提下实现这一功能,OpenAI 采取了严谨的权限与约束架构:
● Apple 授权插件: 该功能通过一个特定的 Apple 授权插件实现。它并非一个通用的远程解锁路径,而是仅允许 Codex 代理在受限的行为约束下执行特定任务。
● 严格的权限管理: 运行该功能需要用户明确授予 屏幕录制(Screen Recording) 和 辅助功能(Accessibility) 权限。
● 行为“护栏”: ● 禁区限制: 该功能明确限制了代理对系统的底层控制,例如无法自动化控制终端(Terminal)或 Codex 自身,从而有效规避了恶意利用或失控风险。 ● 地理限制: 出于对区域性法律法规及 AI 智能体监管政策的考量,该功能在发布初期不适用于欧洲经济区(EEA)、英国及瑞士。 ● 操作约束: 若 MacBook 处于合盖状态(触发特定的休眠模式),该功能将无法继续工作。
三、行业视角:桌面代理安全的新命题
Codex 这一功能的推出,标志着桌面级 AI 代理正从“云端协作”走向“深度系统集成”。业内专家指出,这也引发了企业端对终端安全的新思考:
1. 合规性挑战: 这种能够绕过锁屏进行操作的“特权代理”,对于企业信息安全管理(尤其是涉及生产凭证的开发机器)提出了更高的审计与监控要求。
2. 信任模型升级: 操作系统如何为这类“信任代理”设定更精细化的权限等级,将成为未来 macOS 等桌面系统迭代的核心看点。
3. 安全审计需求: 目前,开发者仍无法完全“黑盒”化该进程。未来,如何提供操作日志回溯或 session 监控,将是企业大规模部署该类 AI 工具时的关键门槛。
四、功能适用范围
● 适用平台: 仅限安装了 Codex 桌面代理的 macOS 设备。
● 配置方式: 用户可在 Codex 设置界面中找到“Locked Use”选项进行开启。
● 场景建议: 主要面向重现 GUI 界面 Bug、自动化调整桌面应用配置、以及无需人工干预的离线任务处理。
OpenAI 此次更新,不仅进一步夯实了其在 AI 辅助开发领域的领跑地位,也为未来“无感化”的 AI 办公体验探索了一条高标准、强监管的落地路径。
via AI新闻资讯 (author: AI Base)
5 月 21 日至 22 日,OpenAI 正式宣布其桌面代理产品 Codex 新增 “Locked Use”(锁屏运行) 功能。该功能打破了传统 AI 代理必须在“解锁且屏幕常亮”状态下工作的限制,允许开发者在 Mac 锁定或息屏状态下,依然能够通过远程指令操控本地应用程序。
一、核心突破:不再需要“看守”你的电脑
在过去,执行长时长的复杂工程任务(如大型代码仓库编译、GUI 自动化测试)时,开发者往往需要通过“咖啡因”插件或外接假显示器来强行维持 Mac 处于唤醒状态。
Locked Use 的发布改变了这一现状:
● 后台自动化: 用户可以从手机发送任务指令,Codex 即可在 Mac 锁屏状态下自动执行 UI 操作、调整设置或运行桌面应用流程。
● 开发体验优化: 这一功能极大地提升了“多小时任务”的可行性,开发者无需再为维持电脑唤醒而“看守”设备。
二、技术实现与安全机制
为了在保证系统安全的前提下实现这一功能,OpenAI 采取了严谨的权限与约束架构:
● Apple 授权插件: 该功能通过一个特定的 Apple 授权插件实现。它并非一个通用的远程解锁路径,而是仅允许 Codex 代理在受限的行为约束下执行特定任务。
● 严格的权限管理: 运行该功能需要用户明确授予 屏幕录制(Screen Recording) 和 辅助功能(Accessibility) 权限。
● 行为“护栏”: ● 禁区限制: 该功能明确限制了代理对系统的底层控制,例如无法自动化控制终端(Terminal)或 Codex 自身,从而有效规避了恶意利用或失控风险。 ● 地理限制: 出于对区域性法律法规及 AI 智能体监管政策的考量,该功能在发布初期不适用于欧洲经济区(EEA)、英国及瑞士。 ● 操作约束: 若 MacBook 处于合盖状态(触发特定的休眠模式),该功能将无法继续工作。
三、行业视角:桌面代理安全的新命题
Codex 这一功能的推出,标志着桌面级 AI 代理正从“云端协作”走向“深度系统集成”。业内专家指出,这也引发了企业端对终端安全的新思考:
1. 合规性挑战: 这种能够绕过锁屏进行操作的“特权代理”,对于企业信息安全管理(尤其是涉及生产凭证的开发机器)提出了更高的审计与监控要求。
2. 信任模型升级: 操作系统如何为这类“信任代理”设定更精细化的权限等级,将成为未来 macOS 等桌面系统迭代的核心看点。
3. 安全审计需求: 目前,开发者仍无法完全“黑盒”化该进程。未来,如何提供操作日志回溯或 session 监控,将是企业大规模部署该类 AI 工具时的关键门槛。
四、功能适用范围
● 适用平台: 仅限安装了 Codex 桌面代理的 macOS 设备。
● 配置方式: 用户可在 Codex 设置界面中找到“Locked Use”选项进行开启。
● 场景建议: 主要面向重现 GUI 界面 Bug、自动化调整桌面应用配置、以及无需人工干预的离线任务处理。
OpenAI 此次更新,不仅进一步夯实了其在 AI 辅助开发领域的领跑地位,也为未来“无感化”的 AI 办公体验探索了一条高标准、强监管的落地路径。
via AI新闻资讯 (author: AI Base)
Degraded Performance for Agent Sessions
May 26, 03:04 UTC
Investigating - We are monitoring a service degradation affecting Agents sessions in IDE
via Cursor Status - Incident History
May 26, 03:04 UTC
Investigating - We are monitoring a service degradation affecting Agents sessions in IDE
via Cursor Status - Incident History
苹果 Siri 重磅升级:1.2 万亿参数谷歌定制模型“掌脑”,本地运行速度成关键
北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。
这一规模远超当前主流移动端模型,引发业界高度关注。
模型规模碾压:1.2T vs Gemini 3.5 Flash 300B
据估算,Gemini 3.5 Flash 的参数量约为 3000 亿,而苹果此次采用的定制模型达到1.2 万亿参数,规模显著更大。AIbase分析指出,如此庞大的模型若能高效部署,将为 Siri 带来更强的理解、推理和复杂任务处理能力,尤其在多模态交互和上下文理解方面有望实现质的飞跃。
性能与速度:本地响应是最大考验
尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。
AIbase认为,模型“够大”并不必然等于“够好”。在移动场景下,延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署,将直接决定这次 Siri overhaul 的用户体验。
下半年 AI 大战一触即发
随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:
● WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
● GPT-5.6:OpenAI 下一代模型进展
● Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
● Gemini 3.5 Pro:谷歌已确认即将推出
AIbase将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛,正越来越接近消费者日常使用场景。谁能最终胜出,拭目以待。
via AI新闻资讯 (author: AI Base)
北京时间 5 月 26 日,据多家媒体援引知情人士消息,苹果并非简单将 Gemini 集成到 Siri 中,而是正在采用一款由谷歌定制的1.2 万亿参数大型语言模型,作为下一代 Siri 核心 overhaul 的“大脑”。
这一规模远超当前主流移动端模型,引发业界高度关注。
模型规模碾压:1.2T vs Gemini 3.5 Flash 300B
据估算,Gemini 3.5 Flash 的参数量约为 3000 亿,而苹果此次采用的定制模型达到1.2 万亿参数,规模显著更大。AIbase分析指出,如此庞大的模型若能高效部署,将为 Siri 带来更强的理解、推理和复杂任务处理能力,尤其在多模态交互和上下文理解方面有望实现质的飞跃。
性能与速度:本地响应是最大考验
尽管模型参数激增,但苹果一贯注重用户隐私与实时性。报道强调,简单查询预计将优先在本地设备上运行。这意味着苹果必须解决大模型在 iPhone 等终端上的高效推理难题——既要保证回答日常问题的速度足够快,又要兼顾功耗和发热控制。
AIbase认为,模型“够大”并不必然等于“够好”。在移动场景下,延迟、能耗和准确率的平衡才是成败关键。苹果是否能在 1.2T 参数模型上实现高效本地 / 混合部署,将直接决定这次 Siri overhaul 的用户体验。
下半年 AI 大战一触即发
随着苹果在 WWDC 上即将展示 Apple Intelligence 与 Gemini 的深度融合,全球 AI 巨头竞赛进入新阶段。未来几个月值得期待的重磅更新包括:
● WWDC:Apple Intelligence 全面亮相,Siri 与 Gemini 定制模型结合
● GPT-5.6:OpenAI 下一代模型进展
● Sonnet 4.8 / Opus 4.8:Anthropic 可能同步迭代
● Gemini 3.5 Pro:谷歌已确认即将推出
AIbase将持续跟踪苹果 Siri 升级进展及大模型在终端侧的落地表现。这场由参数规模、推理速度、隐私保护共同定义的 AI 竞赛,正越来越接近消费者日常使用场景。谁能最终胜出,拭目以待。
via AI新闻资讯 (author: AI Base)
Elevated errors for Claude Code in Slack
May 26, 01:56 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History
May 26, 01:56 UTC
Investigating - We are currently investigating this issue.
via Claude Status - Incident History