https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
谷歌云发布开放知识格式 OKF,打造 AI 代理标准化知识底座

谷歌云(Google Cloud)近日正式推出“开放知识格式”(Open Knowledge Format,简称 OKF),旨在通过标准化手段打破企业内部数据的碎片化僵局,为 AI 代理(AI Agents)构建高效的知识输入体系。在当前生成式 AI 落地进程中,PDF、Office 及各类专有系统中的非结构化文档因解析难度大,严重制约了大模型的语义理解精度与响应质量。OKF 的发布,标志着谷歌在 AI 基础设施层面的关键布局。

该格式将零散文档统一转化为带有 YAML 元数据的 Markdown 形式,正式确立了“LLM-Wiki”模式的开放标准。OKF v0.1版本强调厂商中立性与互操作性,允许开发者在无需专有平台或 SDK 的情况下,构建可跨模型、跨代理流动的知识库。其核心价值在于将复杂的企业知识解构为易于检索的“知识原子”,并通过 Markdown 链接构建起丰富的语义关联图谱。

行业专家指出,在全球 AI 领域加速迈向代理化(Agentic)的背景下,OKF 的推出是对检索增强生成(RAG)架构的底层优化。在 Anthropic 发布“电脑使用”功能、OpenAI 推出 Swarm 框架的行业周期内,谷歌选择深耕知识表征层,试图从数据标准入手降低企业构建私有化 AI 引擎的门槛。这不仅提升了 AI 代理的可靠性,也为未来企业级 AI 规模化协作奠定了坚实的标准化基石。

via AI新闻资讯 (author: AI Base)
上海交大等团队推出 SWE-Explore 基准测试,揭示 AI 编码智能体行级定位缺陷

一个由上海交通大学参与的国际研究团队今日正式推出全新基准测试工具 SWE-Explore,该工具通过将代码搜索与实际修复阶段进行解耦评估,首次量化揭示了当前 AI 编码智能体在“行级精度”上的重大技术短板。这一研究打破了以往仅依赖“最终修复率”的单一评估模式,为智能体上游搜索质量的直接衡量提供了全新标准,正推动 AI 软件工程评测向深水区演进。

传统的 SWE-bench 等基准测试因仅关注端到端的结果,往往掩盖了智能体在代码阅读与理解阶段的真实缺陷。为此,研究团队基于 GPT-5.4、Gemini3Pro、Claude Sonnet4.6及 Kimi K2.6等主流大模型的成功运行轨迹,提取出多条独立解路径交汇的共识代码段作为参考值,构建了包含10种编程语言、203个开源项目的848个缺陷任务数据集。

评测结果显示,尽管 Claude Code、OpenHands 等通用编码智能体在“文件级”定位上表现卓越,但在聚焦到具体的“代码行”时,其核心区域覆盖率骤降至14% 到19% 之间。消融实验进一步证实了“最小上下文阈值”效应的存在:当关键核心区域的可见比例低于50% 时,模型修复基本宣告失败;而一旦跨越50% 至75% 的阈值,修复成功率才会出现断崖式回升。

这一研究成果表明,当前 AI 智能体的瓶颈并非完全在于补丁编写能力,而在于对关键上下文的精准过滤与捕捉。在当前行业内诸如项目经理拒绝半数自动化采纳方案的现实背景下,SWE-Explore 提出的“少过滤、多阅读”技术导向,不仅为下一代专门化代码定位系统(如 CoSIL 等)的架构优化指明了方向,也将加速自动化软件工程从“暴力生成”向“精准检索”的范式转变。

via AI新闻资讯 (author: AI Base)
AI数据库交互迎来里程碑:谷歌新模型Gemini-SQL2 刷新行业标杆

在人工智能技术快速演进的今天,让AI精准理解并处理数据库查询任务一直是行业攻克的重点。6月12日,Google Research正式发布了全新模型Gemini-SQL2。这款基于Gemini3.1Pro打造的专用模型,在处理“文本转SQL”(Text-to-SQL)任务上表现出卓越能力,一举登顶权威评测榜单。

所谓“文本转SQL”,核心在于让计算机读懂人类的日常对话,并将其转化为可执行的数据库查询指令。在企业级应用、数据自助分析及SaaS平台等场景中,这项技术能极大地降低用户与复杂数据库交互的门槛。然而,数据库表结构复杂、字段定义存在歧义以及业务逻辑繁琐,长期以来都是AI处理该类任务的主要障碍。

在这一背景下,Gemini-SQL2的优势尤为突出。根据行业基准测试平台BIRD的最新数据显示,Gemini-SQL2在单模型赛道上达到了80.04%的执行准确率,成功超越了谷歌此前的模型版本。值得关注的是,BIRD评测集包含了来自37个专业领域的95个数据库,总计超过1.2万组问题,不仅模拟了真实的企业环境,还特意加入了脏数据与需要外部知识辅助的测试项,含金量十足。

该模型的应用前景十分广阔。未来,企业员工无需掌握晦涩的代码,只需通过自然语言提问,例如“上季度区域销售流失情况如何”,系统便能自动调取数据并生成精准的分析报告。

尽管外界对该模型的落地充满期待,但截至目前,谷歌尚未公布Gemini-SQL2的具体模型标识、API接口细节或详细技术报告,也未透露哪些产品将率先集成该能力。这一顶尖AI模型后续将如何改变数据分析的作业流程,值得业内持续关注。

via AI新闻资讯 (author: AI Base)
用满 200 刀订阅能吃掉1. 4 万刀算力?大模型巨头正面临严峻的成本风暴

行业分析机构SemiAnalysis最新对OpenAI与Anthropic的订阅方案进行了实测。结果显示,在看似平价的固定月费背后,隐藏着由大模型厂商自行承担的巨额算力补贴缺口。

测试人员通过购买两家公司的各类订阅计划,并持续运行长周期编程和智能体等重型任务,直至触及每周的使用上限。随后按照公开的API价格折算出这些实际使用量对应的理论费用,数字令人震惊。

极限使用拉满算力补贴

测算结果显示,如果用户完全用满OpenAI价格为 200 美元的“ChatGPT Pro 20x”订阅,其对应的API计费最高可达到约1. 4 万美元。而以同样价格定价的Anthropic “Claude Max 20x”方案,在极限使用情况下,理论Token成本也可逼近 8000 美元。

这意味着一小部分重度用户就足以吞噬掉订阅模式下原本有限的利润空间,让厂商陷入严重亏损。对于ChatGPT Plus这类 20 美元的入门订阅,一旦用户利用率超过11.4%,OpenAI就开始在该用户身上亏本。

企业精细化分流成新趋势

在此背景下,以多步、自主调用工具为代表的智能体系统正在推高成本压力,其Token消耗可达到传统单轮对话的千倍级。包括微软、Meta、亚马逊在内的大型企业,已对此前鼓励员工大规模试用AI的做法有所收缩,以控制内部快速膨胀的账单。

为了应对高昂的算力开支,越来越多企业开始采用将复杂问题交由顶级模型、常规办公下放给便宜或开源模型的精细化分流策略。这种任务路由方式最高可将整体AI成本削减95%,同时也迫使大模型服务商在用户体验与高昂的基础设施投入之间艰难寻找平衡。

via AI新闻资讯 (author: AI Base)
OpenAI斥资1. 5 亿美元启动合作伙伴网络,全面加速企业AI转型

全球人工智能巨头OpenAI今日正式宣布推出“OpenAI合作伙伴网络”计划。该项目旨在携手全球合作伙伴,共同构建、销售并交付基于OpenAI技术的创新解决方案,协助各大企业将AI雄心转化为实际成果。为了全力支持这一生态系统的蓬勃发展,OpenAI率先投入了1. 5 亿美元的巨额资金。官方计划通过该网络提供全方位的资源、赋能渠道和技术支持,并在 2026 年底前培养和认证出 30 万名专业顾问。

随着人工智能技术的迅猛发展,企业实现AI价值的瓶颈已经不再是模型本身的能力。相反,如何精准识别应用场景、重塑业务流程以及推动组织内部的变革管理,成为了企业转型落地的核心挑战。

构建全球AI转型生态

OpenAI合作伙伴网络引入了分级激励机制,合作伙伴可根据销售业绩、技术实力以及部署经验,逐步晋升为精选、高级或精英三个级别。随着平台的持续升级,伙伴们未来还能获取Codex、网络安全和智能体等高影响力领域的专业认证。

此外,OpenAI正在面向部分创始合作伙伴试点“前沿部署专家”项目,帮助顶尖技术人员与OpenAI的专属工程团队深度对接。通过这种紧密的协同合作,参与者能够率先接触到前沿的技术蓝图与转型模式,从而将更具原生优势的AI经验注入到客户的实际应用环境中。

多元合作共享AI红利

这个全新的生态系统汇聚了来自系统集成、管理咨询、技术创新和数据处理等多个领域的全球领军企业。目前,包括埃森哲、贝恩咨询、波士顿咨询、麦肯锡以及普华永道在内的多家顶尖机构已首批加入该网络。

在具体实践中,波士顿咨询正协助安捷伦科技加速全业务流程的AI部署,而埃森哲则凭借深厚的行业经验帮助企业重构价值链。OpenAI强调,没有任何一家公司能够独自满足所有市场和客户的需求,只有通过生态化合作才能让AI红利真正走向普惠。

via AI新闻资讯 (author: AI Base)
AI冲击初级岗位引发技术抵触,谷歌CEO呼吁重塑“乐观视角”

谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)日前在斯坦福大学毕业典礼发表演讲,反常地对其执掌的谷歌核心战略——人工智能(AI)只字未提。这一动作背景在于当前全球年轻人对AI重塑就业市场的抵触情绪日益高涨。此前,谷歌前CEO埃里克·施密特及Big Machine Records CEO斯科特·博尔切塔在其他高校谈及AI时均遭学生嘘声,而皮查伊此次演讲亦遭遇数十名学生离场抗议。

面对OpenAI CEO萨姆·奥尔特曼、Anthropic CEO达里奥·阿莫迪关于“AI或彻底取代传统入门岗位”的行业警告,以及今年十余家大厂以AI为由裁员、应届生陷入求职困境的现实,皮查伊在演讲中通过分享自身90年代初到加州的经历,将看似不尽如人意的“枯黄”之景重新解读为充满希望的“金黄”,以此委婉回应年轻人的焦虑,鼓励毕业生“选择乐观”并转变看待世界的视角。

自2015年执掌谷歌以来,身为斯坦福校友的皮查伊见证了硅谷多轮技术浪潮。他近期在《Hard Fork》播客中曾指出,AI带来的变革人类前所未见。此次回归校园,他克制地将技术宏图转化为人文关怀,强调本届毕业生既是推动这场技术变革的中坚力量,也将直面其带来的种种影响。这反映出在AI重塑社会结构的转型期,科技巨头在公众沟通上正从单纯的技术激进转向对社会心理的审慎安抚。

via AI新闻资讯 (author: AI Base)
毕马威报告含有关于AI优势的AI“幻觉”内容

毕马威一份关于全球企业如何使用人工智能(AI)的报告,引用了似乎源自AI幻觉的虚假案例,夸大了这项技术的采用程度。这份10月发布、题为《在自主式AI时代重新定义卓越》的报告,对多家机构使用AI的情况作出了大量不实陈述,其中包括瑞银、英国国家医疗服务体系,以及公共交通机构瑞士联邦铁路和伦敦交通局。这些不准确之处被研究机构GPTZero认定为AI幻觉。瑞银在获悉这一问题后表示,将要求毕马威删除这些错误说法。这家四大会计师事务所周四已从其部分网站撤下该报告。毕马威国际一名发言人表示,该公司“严肃对待其公开发布内容的准确性和完整性”,并表示,在调查该报告发布相关情况期间,已将该报告从网站上撤下。

—— 英国金融时报

via 风向旗参考快讯 - Telegram Channel
智谱GLM-5. 2 全量开源,力推前沿智能全民化

在AI技术竞赛日益激烈的当下,全球人工智能的发展路径正出现明显分化。近日,美国方面针对Anthropic旗下两款前沿AI模型实施了严格的出口管制,明确限制非美国用户的使用权限。这种将技术“闭关锁国”的策略,不仅让AI领域的竞争火药味渐浓,也引发了全球开发者对技术垄断泛化的担忧。

面对这种行业困局,国产AI阵营选择以“开放”作为回应。 6 月 13 日,智谱正式官宣旗下最强开源模型GLM-5. 2 全量开放。这一决策的核心理念在于:前沿智能技术不应被少数规则与权力所束缚,而应属于每一位创新的开发者。

作为智谱目前能力最顶尖的开源产品,GLM-5. 2 在性能上表现亮眼,不仅实现了真正意义上可用的1M上下文长程处理能力,在长序列任务的逻辑理解上也维持着行业领先水准。针对开发者关注的编程辅助能力,该模型也进行了深度优化,被视为当前国产AI在代码生成领域的重要标杆。

根据官方时间表,GLM-5. 2 已面向GLM Coding Plan全量版本用户开启抢先体验。该模型的API接口及完整开源代码将于下周正式上线,并将采用MIT协议,极大地降低了技术接入的门槛。

不仅是智谱,近期国产AI生态展现出了集体突围的姿态。此前,稀宇科技开源了MiniMax M3 大模型,月之暗面同步宣布Kimi K2. 7 延续开源路线,DeepSeek更是坚定地将AGI(通用人工智能)作为最高目标,持续推进开源开放的生态建设。

尽管在部分性能指标上,国产大模型与国际顶尖水平仍存在追赶空间,但通过坚定不移的开源策略与高性价比的定价体系,国产AI正在为开发者提供一个更具包容性与竞争力的技术底座。随着更多优质国产模型走向开源,人工智能技术的发展正逐步摆脱对单一闭源体系的依赖,走向更具生命力的全民创新时代。

via AI新闻资讯 (author: AI Base)
美国出口管制影响 Anthropic AI 模型,欧盟积极评估应对措施

根据路透社的报道,欧盟委员会最近宣布,正在认真评估美国对人工智能公司 Anthropic 实施的出口管制指令所带来的实际影响。该指令的实施导致 Anthropic 突然停止对外籍用户开放其最先进的人工智能模型 Mythos 5/Fable 5 的使用权限,这一举动引发了广泛关注。

Anthropic 表示,美国政府出于国家安全考虑,要求该公司立即停止向外籍人士提供其高性能人工智能模型的使用。这一决策使得 Anthropic 被迫 “突然禁用” 其人工智能模型,以遵循新的政策规定。该公司的行动引发了关于技术出口管制和国际合作的讨论。

欧盟委员会发言人托马斯・勒尼耶在声明中指出,当前新一代高性能人工智能模型正在不断推出,这些模型能够带来许多好处,如帮助提升网络安全防御能力。然而,这些技术的快速发展同样引发了亟待解决的网络安全风险。

勒尼耶强调,欧盟在制定相关应急措施时,必须确保不歧视与合作伙伴的关系。他指出,这一事件再次突显了欧洲加强自身技术自主权的必要性。欧盟将继续密切关注这一事件对区域内相关服务用户的具体影响,以便采取适当的应对措施。

随着全球人工智能技术的迅速发展,各国在技术合作与出口控制之间的平衡显得愈加重要。此次事件不仅关乎 Anthropic 的商业运作,也可能对未来人工智能技术的国际合作产生深远影响。

划重点:

🌍 欧盟委员会正在评估美国对 Anthropic 实施的出口管制指令的影响。

🔒 Anthropic 因国家安全原因停止向外籍用户提供其 AI 模型 Mythos 5/Fable 5 的使用权限。

⚖️ 欧盟强调,在制定应急措施时,必须确保不歧视与合作伙伴的关系,促进技术自主权。



via AI新闻资讯 (author: AI Base)
MiniMax陷入增长困境:一场关于涨价、解禁与市场信任的风暴

近日,AI独角兽MiniMax因为一次模型升级后的定价调整,意外卷入了舆论漩涡。新一代旗舰模型M3 发布的同时,公司将计费模式由传统的按次调整为按Token计费,且月租套餐价格大幅上调。由于缺乏前期沟通与缓冲期,这一变动直接导致大量开发者在毫无准备的情况下遭遇额度骤减,甚至测算出实际成本涨幅高达257%,不少用户直指公司此举无异于背刺。

这场涨价风波并非单一的运营失误,而是MiniMax商业模式深层矛盾的集中体现。长期以来,该公司高度依赖C端虚拟陪伴应用Talkie带来的营收,来供养高昂的基座模型研发。然而,随着算力成本不断攀升,加之今年行业内激烈的价格战,原本低价获客的生存策略已难以为继。面对质疑,MiniMax母公司稀宇科技随后发布致歉公告,并针对新老用户推出了补偿措施,试图平息信任危机。

从技术与产品层面分析,M3 模型具备前沿编程能力、超长上下文及原生多模态等核心优势,在多个基准测试中表现出色,确实具备一定的行业竞争力。但在当前的国内市场,面对DeepSeek、小米等厂商的降价攻势,MiniMax的定价策略显得尤为尴尬。如果无法在真实的B端企业应用场景中实现量价齐升,其高定价策略将面临严峻的市场考验。

除此之外,MiniMax正处于“七月围城”的关键节点。 7 月 9 日,公司将迎来大规模限售股解禁,流通盘将成倍增加,这对本就脆弱的市场情绪构成了巨大抛压。与此同时,随着Anthropic、OpenAI等全球顶尖AI企业进入上市流程,二级市场对大模型公司的估值逻辑已发生根本性转变——投资者不再单纯追捧Benchmark分数,而是更看重可验证的商业化数据与盈利能力。

为了应对融资需求与估值压力,MiniMax近期已启动“A+H”双资本平台布局。然而,科创板的融资溢价能否兑现,归根结底取决于其是否能从被视为“可替代的API商品”转型为具备核心护城河的企业级服务商。

对于MiniMax而言,涨价风波只是一个行业缩影。在技术光环逐渐褪去、商业现实要求日益严苛的背景下,如何平稳度过解禁洪峰,并证明自身拥有可持续的造血能力,将是这家独角兽公司在接下来的半年内所面临的最艰难考验。

via AI新闻资讯 (author: AI Base)
美对Anthropic出口管制 加拿大总理:过度依赖少数模型存在风险

加拿大总理卡尼表示,美国实施出口禁令禁止所有外国用户访问Anthropic最新人工智能模型,这凸显了仅依赖少数几个强大AI工具的风险。卡尼周日在访问爱尔兰期间对记者表示:“我们目前在Mythos和Fable模型上共同面临的这种情况,正是过度依赖某些模型可能导致的后果。”“在这件事上,没有人做错什么。但如果我们只是接受现状,不从中吸取教训,不去拓展和多元化,那就是我们的问题。”卡尼说。这番表态与卡尼自出任总理以来一直强调的核心政策主题 “多元化” 不谋而合。这一理念最直接体现在加拿大对美国贸易依赖的问题上。

—— 凤凰网科技彭博社

via 风向旗参考快讯 - Telegram Channel
ChatGPT 应用的月活跃用户数突破十亿

尽管公众反对声浪日益高涨,全球人工智能使用量仍飙升至历史新高。根据市场情报公司Sensor Tower的最新估计,OpenAI公司旗下的ChatGPT应用在五月份的月活跃用户数已突破10亿。这家市场情报公司称,包括Anthropic的Claude在内的其他人工智能应用的用户数实现了三位数的同比增长率。上述市场情报公司表示,凭借其10亿月活跃用户数,ChatGPT成为有史以来最快达到这一里程碑的应用,超越了谷歌地图 App创下的先前纪录,后者在推出后大约用了五年时间才达到相同的使用量。

—— CNBC

via 风向旗参考快讯 - Telegram Channel
加拿大一母亲起诉奥尔特曼与OpenAI,指控ChatGPT诱导女儿自杀

一名加拿大母亲于周四在美国法院起诉人工智能初创企业OpenAI及其首席执行官奥尔特曼,指控聊天机器人ChatGPT诱导其女儿走向自杀。近期已有多起诉讼指责该公司未能管控用户与聊天机器人之间的危险对话,本案是最新一例。这起诉讼提交至旧金山州法院。原告克里斯蒂·卡里尔说,女儿艾丽斯离世前曾十数次向ChatGPT倾诉自杀念头,但OpenAI的安全系统既未将相关对话标记并转交人工审核,也没有终止对话。OpenAI方面称,公司对模型进行过专项训练,当用户流露自残、自杀倾向时,模型会引导其寻求帮助,并对接现实中的救助资源。

—— 新浪财经

via 风向旗参考快讯 - Telegram Channel
↩️ 据称触发白宫 Anthropic 模型限制的是来自 Amazon 的安全研究


科技圈🎗在花频道📮:

🤖 因美政府发函限制,Anthropic 已关闭两款 Mythos 模型对所有客户的访问 美国政府以国家安全权限向 Anthropic 发出出口管制指令,要求暂停任何外国公民在美国境内外访问 Fable 5 和 Mythos 5。Axios 报道称,商务部此举与对模型被越狱后可能带来安全风险的担忧有关。 Anthropic 表示,为确保合规,将关闭这两款模型对所有客户的访问,外国籍员工也在限制范围内;其他 Claude 模型不受影响,公司称正在争取尽快恢复访问。 Axios | Anthropic …

据称触发白宫 Anthropic 模型限制的是来自 Amazon 的安全研究

Amazon 的安全研究据称发现,可通过特定提示词让 Anthropic 的 Fable 5 模型输出可用于网络攻击的信息。Amazon CEO Andy Jassy 将结果告知美国政府后,当局随即限制外国公民使用 Fable 5 和 Mythos 5,连 Anthropic 的外籍研究人员也被切断访问权限。Anthropic 反驳称这并非模型“越狱”,类似漏洞在 GPT 5.5 等公开模型中同样存在,部分安全研究员认同这一说法。

The Verge

🌸 在花频道 · 备用频道 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]