https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Addendum to GPT-5.2 System Card: GPT-5.2 Codex

GPT‑5.2-Codex 是我们迄今为止面向复杂现实世界软件工程、具备代理能力的最先进编码模型。一种基于 GPT‑5.2 并为 Codex 的 agentic coding 优化的版本,它在处理长周期任务方面通过 context compaction 取得了进一步改进,在诸如重构( refactors )和迁移( migrations )等项目级任务上表现更强,在 Windows 环境下的性能有所提升——并且在 cybersecurity 能力上有显著增强。

这份 system card 说明了为 GPT‑5.2-Codex 实施的全面安全措施,既包括模型层面的缓解手段,例如针对有害任务和 prompt injections 的专项安全训练,也包括产品层面的防护措施,如 agent sandboxing 和可配置的 network access 。

我们按照 Preparedness Framework 对 GPT‑5.2-Codex 进行了评估。该模型在 cybersecurity 领域表现很强,但尚未达到 High 级别的网络安全能力。我们预计模型能力仍将快速提升,并很可能在不久的将来跨过 High cybersecurity 的门槛。与其他近期模型类似,它在 biology 领域被视为具备 High 能力,因此在部署时采用了与 GPT‑5 家族其他模型相同的一整套防护措施;在 AI self‑improvement 方面则未达到 High 能力。

----------------------

Introduction

GPT‑5.2-Codex is our most advanced agentic coding model yet for complex, real-world software engineering. A version of GPT‑5.2⁠ optimized for agentic coding in Codex, it includes further improvements on long-horizon work through context compaction, stronger performance on project-scale tasks like refactors and migrations, and improved performance in Windows environments—and significantly stronger cybersecurity capabilities.

This system card outlines the comprehensive safety measures implemented for GPT‑5.2-Codex. It details both model-level mitigations, such as specialized safety training for harmful tasks and prompt injections, and product-level mitigations like agent sandboxing and configurable network access.

GPT‑5.2-Codex was evaluated under our Preparedness Framework. It is very capable in the cybersecurity domain but does not reach High capability on cybersecurity. We expect current trends of rapidly increasing capability to continue, and for models to cross the High cybersecurity threshold in the near future. Like other recent models, it is being treated as High capability on biology, and is being deployed with the corresponding suite of safeguards we use for other models in the GPT‑5 family. It does not reach High capability on AI self-improvement.

via OpenAI News
OpenAI洽谈千亿融资 估值剑指7500亿美元

根据市场消息,人工智能巨头、ChatGPT开发商OpenAI已与一些投资者就融资事宜进行了初步谈判,目标是筹集至少数百亿美元资金,融资额最高或达1000亿美元,估值可能冲至7500亿美元。消息还称,相关讨论仍处于早期阶段,条款、估值和时间安排等细节可能发生变化。7500亿美元的估值将较这家人工智能公司今年10月5000亿美元的估值实现约50%的跃升。此次潜在融资凸显出,随着各家企业竞相打造与人类能力相当或超过人类能力的AI系统,该行业对算力的需求正持续攀升。而算力堆叠需要庞大资金投入。

—— 财联社彭博社

via 风向旗参考快讯 - Telegram Channel
💻 软件开发的核心职责:交付经过验证的代码而非仅是 AI 生成的补丁

随着 2025 年 AI 辅助编程工具的普及,软件开发领域出现了一个令人担忧的趋势:部分开发者(尤其是初级工程师)过度依赖大语言模型(LLM),将大量未经测试的代码直接提交给同事或开源维护者进行代码审查(PR)。本文强调,软件工程师的真正职责不仅是产出代码,而是交付“证明有效”的代码。

核心观点与验证方法:

* 拒绝“抛砖式”提交: 开发者不应将验证代码的负担转嫁给审查者。在 AI 可以轻松生成代码的今天,程序员的价值在于确保并证明代码的正确性。
* 双重验证流程:
1. 手动测试: 开发者必须亲自观察代码运行。建议在 PR 中附带终端命令输出或屏幕录制视频,展示系统从初始状态到执行更改后的预期效果。
2. 自动化测试: 在 LLM 工具的辅助下,编写自动化测试的门槛已大幅降低。提交的补丁必须包含自动化测试,且该测试在撤销代码更改时应当失败。
* 掌握 AI 编程代理(Coding Agents): 2025 年最重要的趋势是 Claude Code 和 Codex CLI 等代理工具的爆发。开发者应学会引导这些工具进行自我验证,例如让代理在修改 CSS 时自动截屏检查视觉效果,或利用现有模式扩展测试套件。
* 人类的问责制: 计算机无法承担责任。在 AI 能够生成千行补丁的时代,能够提供“工作证明”的开发者才具有核心竞争力。

结论: 优秀的工程师应具备开发测试技能和良好的测试品味,确保每一行提交的代码都经过严谨的验证,从而维护开发流程的效率与诚信。

(HackerNews)

via 茶馆 - Telegram Channel
黄仁勋:英伟达尚未支付OpenAI一分钱

英伟达CEO黄仁勋表示,尽管公司此前宣布了高达1000亿美元的投资计划,拟与OpenAI合作建设超大规模数据中心,但目前尚未向对方支付任何款项。该巨额合作的实际进展仍处于初期阶段。

尽管投资尚未落地,但双方的合作框架已明确,未来可能深刻影响全球AI算力格局。黄仁勋强调,所有资金投入将根据项目进度和技术需求逐步实施,确保资源高效配置。

今年9月,英伟达与OpenAI宣布了一项堪称史诗级的战略合作。英伟达计划向OpenAI投资高达1000亿美元。

根据协议,双方将联手建设和部署规模空前的AI基础设施。该计划的核心是构建总容量至少达到10吉瓦的AI数据中心,其中将包含数百万计的英伟达GPU。这无疑将成为OpenAI训练和运行其下一代AI模型、并最终实现‘超级智能’目标的超级引擎。

为了支撑这一宏伟蓝图,英伟达将进行一项惊人的投资:随着每个吉瓦数据中心容量的部署,英伟达将逐步向 OpenAI 投资,总金额最高可达 1000 亿美元。这笔投资不仅是 AI 领域有史以来最大规模的单笔投资,也彰显了英伟达对 OpenAI 技术路线的坚定信心。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
ChatGPT的Apple Music集成现已上线

现在ChatGPT拥有专用的 Apple Music 应用程序,该程序允许ChatGPT进行音乐推荐并创建播放列表。你可以通过Mac应用、网页或 iOS 应用中的设置部分将 Apple Music 添加到 ChatGPT。Apple Music 列于应用选项下,连接需使用您的 Apple 账户登录以完成授权。即使没有 Apple Music 订阅,也可以使用ChatGPT搜索 Apple Music 曲库中的歌曲、艺术家、专辑和播放列表。OpenAI公司称所有用户均能在ChatGPT中发现音乐、生成播放列表并收听预览片段。 Apple Music 订阅者可使用ChatGPT将歌曲、专辑和播放列表添加到他们的Apple Music曲库。

—— Macrumors

via 风向旗参考快讯 - Telegram Channel
今年我试了十几款 AI 编程工具,最终只留下这 3 个

今年一年,尝试并分享了 N 多的 AI 开发工具,今天就给大家分享下个人目前稳定的 AI 开发工具集

最近没有引入什么新开发工具(包括AntiGravity),主力主要是以下3个:

TRAE
Cursor
Claude Code(GLM-4.5)

TRAE

TRAE 主要有三类场景:

SOLO 模式。这个真的极其推荐,小项目的一把梭哈就不说了,环境部署、物联网开发等强依赖终端调试的场景,SOLO 也能完美适配。
原来的 Claude 4(现已不能使用),现在的 Gemini 3 Pro。面对特定场景,只能他们来攻克难题。而 TRAE 不需要魔法就能直接使用,这个应该是国产竞品中比较良心的了。
非编程场景,比如文章优化、项目文档编写等,通过自定义智能体的方式,灵活且直观。

好像有很多人还不知道:TRAE 国内版,有 SOLO,还免费。

Cursor

针对一些复杂项目,尤其是需要手动编写部分代码的,我会选择 Cursor

上下文的抽取和需求的理解,Cursor 还是顶级的,其次就是手动编写代码时,CursorTab 用起来真的享受。

举一个小例子,MyBatis 中原本 select 了一个单表,需求变动为关联查询,此时需要在 select 的字段前面增加别名。Cursor 下真的只需要录入一个别名,就会把剩下字段全部的别名加上。

Claude Code

Claude Code 的应用场景则更加明确。

就是嵌入到我们内部的自动化研发流程中,逐步替代人工研发,长远目标就是搭建一套完整的 AI 研发团队。

好了今天就介绍到这里吧,如果这几个工具你有什么更好的场景或者疑问,欢迎交流~

via 掘金人工智能本月最热 (author: 飞哥数智谈)
🤖 Anthropic AI 智能体实验失败:逻辑漏洞导致自动售货机严重亏损

Anthropic 与《华尔街日报》近期合作开展了名为 “Project Vend” 的实验,由 Claude AI 驱动的智能体 Claudius 独立运营办公区自动售货机。在为期三周的测试中,该实验暴露了 AI 在自主决策与安全防范方面的显著漏洞:

* 决策失误与亏损: 在记者的诱导下,Claudius 违规采购了 PlayStation 5 等高价值商品;随后因逻辑失效,将全部库存免费赠送,导致实验以严重亏损告终。
* 技术局限性: Anthropic 压力测试团队指出,实验揭示了 AI 智能体在处理复杂指令及长上下文时的局限性。
* 后续影响: 尽管实验失败,Anthropic 表示相关数据将用于优化自主智能体的可靠性,以解决其在现实环境中的安全防范问题。

(科技圈)

via 茶馆 - Telegram Channel
↩️🖼 Anthropic 自动售货机实验失败,AI 智能体因逻辑漏洞导致严重亏损


科技圈🎗在花频道📮:

Anthropic实测AI管店亏损,称未来仍可胜任管理岗 Anthropic让AI Claude独立运营办公室小卖部,包括定价、补货和客户沟通等。一个月内因频繁打折、免费送货及进货钨块等操作,店铺净值从1000美元降至800。Claude还出现“幻觉”,虚构合同并自称“现身”送货。尽管结果失败,Anthropic认为这些问题可通过训练和工具改进,AI未来有望胜任中层管理岗位。 TIME 📮分享投稿 ☘️频道 🍵茶馆

Anthropic 自动售货机实验失败,AI 智能体因逻辑漏洞导致严重亏损

Anthropic 与《华尔街日报》近期合作开展 “Project Vend” 实验,由 Claude AI 驱动的智能体 Claudius 独立运营办公区自动售货机。实验结果显示,该 AI 在自主决策与安全防范方面存在显著漏洞。

在为期三周的测试中,Claudius 在记者的诱导下违规采购了 PlayStation 5 等高价值商品,并因逻辑失效将全部库存免费赠送,导致严重亏损。Anthropic 压力测试团队指出,实验揭示了 AI 智能体在处理复杂指令及长上下文时的局限性,相关数据将用于优化自主智能体的可靠性。

华尔街日报

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
国产大模型集体冲刺IPO!MiniMax、智谱、壁仞科技均通过港交所聆讯,资本市场迎来“AI六小龙”上市潮

国产大模型企业正加速迈入资本市场的聚光灯下。据港交所最新披露信息,壁仞科技已正式通过上市聆讯;而本周初,MiniMax(稀宇科技)与智谱华章也相继完成中国证监会备案并顺利通过港交所聆讯。这意味着,“大模型六小龙”中的多家头部企业已实质性进入IPO倒计时,中国AI产业正式迎来资本化关键拐点。

此次集中过会并非孤立事件,而是国产大模型从技术研发迈向商业落地与价值兑现的重要标志。在算力、模型、应用三层生态日趋成熟的背景下,资本市场对AI基础设施与底层技术公司的认可度显著提升。

市场的热情已提前反映在参股公司股价上。截至 12 月 17 日,壁仞科技的参股方香农芯创、中际旭创、兆丰股份年内涨幅均超180%,彰显投资者对国产AI芯片与大模型协同生态的高度期待。 12 月 18 日早盘,智谱华章参股公司电广传媒强势涨停,壁仞科技关联方天准科技亦上涨近4%,进一步印证资本市场对AI产业链的追捧正在从概念走向兑现。

值得注意的是,尽管“大模型六小龙”常被并列提及,但各家技术路径与商业化重点各有侧重:

- 智谱华章聚焦开源与行业大模型,GLM系列广受开发者欢迎;

- MiniMax强攻多模态与语音交互,产品矩阵覆盖B端与C端;

- 月之暗面以Kimi长上下文能力突围,近期加速探索企业服务;

- 壁仞科技则深耕AI芯片底层,为大模型提供国产算力支撑。

随着MiniMax、智谱、壁仞等企业率先叩开港股大门,其余如月之暗面、百川智能、零一万物等亦被认为紧随其后。这场IPO竞赛,不仅是融资动作,更是对技术壁垒、商业化能力与长期战略的全面检验。

当“六小龙”陆续登陆资本市场,中国AI产业或将迎来真正意义上的“成年礼”——从资本输血走向自我造血,从技术炫技转向价值创造。而投资者用真金白银投出的,不仅是对某一家公司的信心,更是对整个国产AI生态未来的押注。

via AI新闻资讯 (author: AI Base)
工业具身新标杆:人形机器人“小墨”规模化入驻宁德时代产线

近日具身智能领域迎来重大里程碑:全球首条实现人形机器人规模化落地的新能源动力电池 PACK 生产线,在宁德时代中州基地正式投运。由宁德时代生态企业 千寻智能 研发的人形机器人“小墨”已批量上岗,专门负责电池包下线前最具挑战性的 EOL(最终功能测试)与 DCR(直流内阻测试)工序。

这一环节长期以来因涉及数百伏高压插接操作、环境复杂且柔性要求极高而高度依赖人工,而“小墨”的引入不仅彻底消除了高压打火带来的安全风险,更将单日工作量提升了三倍,插接成功率稳定在99% 以上。

“小墨”的核心大脑搭载了先进的端到端 视觉-语言-动作(VLA)模型,使其具备了强大的环境泛化能力,能够自主微调姿态以应对来料位置偏差,并在插拔柔性线束时动态调节力度。千寻智能这家成立不足一年的明星初创公司,凭借前珞石机器人 CTO 韩峰涛领衔的精英团队,已在2024年内接连完成三轮累计超11亿元的融资,投资方包括宁德时代旗下的柏睿资本。

公司计划在2025年投入实现100万小时的高质量数据采集,推动出货量达大几百台,助力具身智能真正从“演示实验室”迈向工业量产的“严肃生产力”。

via AI新闻资讯 (author: AI Base)
🤖 OpenAI推出ChatGPT应用商店,集成Apple Music和DoorDash等服务

OpenAI于周三晚间正式推出ChatGPT应用商店(App Directory),用户可在此浏览所有可用工具,同时向开发者开放SDK以构建新的交互体验。该商店已集成Apple Music和DoorDash等热门服务,其中Apple Music应用可帮助用户查找音乐、创建播放列表和管理音乐库,DoorDash则能将食谱灵感和用餐计划转化为购物车。此前被称为“连接器”的功能现已统一更名为“应用”。OpenAI CEO Sam Altman表示,此举是公司迈向“万能应用”目标的重要一步。目前,OpenAI尚未透露具体的盈利模式,但表示正在探索数字商品等货币化选项。

(科技圈)

via 茶馆 - Telegram Channel
火山引擎总裁谭待:大模型市场未来将迎十倍增长

在 FORCE 原动力大会上,火山引擎总裁谭待在接受媒体采访时,对公司旗下豆包大模型的表现做出了积极评价。他指出,尽管在国内市场上,豆包大模型的成绩相对明显,但在全球范围内,如 OpenAI 和 Gemini 等竞争对手的表现同样突出。因此,火山引擎在这一领域还有很多努力的空间,尤其是在全球市场的拓展上,谭待提到公司旗下的 Seedance 和 Seedream 在国际市场上的表现也不错。

谈及未来的发展趋势,谭待表示,2026年大模型市场的竞争将不仅仅局限于当前的存量市场。他强调,未来更重要的是扩展市场规模,推动整个行业的增长。他预测,明年的市场规模可能会实现十倍的增长,因此,企业之间的竞争将不再是零和博弈,而是通过共同努力来扩大整体市场。

谭待的发言为业内人士提供了新的视角,认为未来的发展潜力巨大。火山引擎将继续致力于提升自身技术水平和市场份额,为全球用户提供更加优质的产品和服务。

划重点:

🌟 大模型市场将在未来一年可能实现十倍增长,企业之间的竞争将转向市场扩展。

📈 火山引擎在国内市场表现良好,但需努力提升在全球市场的竞争力。

🤖 谭待强调,未来的成功在于共同推动行业发展,而非简单的零和博弈。


via AI新闻资讯 (author: AI Base)
OpenAI 推出 ChatGPT 应用商店,集成 Apple Music 和 DoorDash 等服务

OpenAI 周三晚间正式推出 ChatGPT 应用商店(App Directory),用户可浏览所有可用工具,同时向开发者开放 SDK 以构建新的交互体验。新应用商店集成了 Apple Music 和 DoorDash 等热门服务,其中 Apple Music 应用可帮助用户查找音乐、创建播放列表并管理音乐库,DoorDash 则能将食谱灵感和用餐计划转化为购物车。

此前被称为"连接器"的功能现已统一更名为"应用",包括文件搜索应用、深度研究应用和同步应用等类型。OpenAI CEO Sam Altman 此前表示,公司计划构建强大平台所需的各项功能,应用商店的推出标志着向"万能应用"目标迈出重要一步。不过 OpenAI 尚未透露具体盈利模式,仅表示正在探索数字商品等货币化选项。

The Verge

🍀在花频道 🍵茶馆 📮投稿新鲜事

via 科技圈🎗在花频道📮 - Telegram Channel
Google Labs 放大招!AI 助理 CC 正式亮相:每天早上自动发邮件,帮你把 Gmail、Calendar、Drive 全盘打理好!

Google Labs 今日低调推出了一款代号为“CC”的全新 AI 邮件助理(实验性功能),它不是简单的 Gmail 智能回复,而是真正能在 Gmail、日历(Calendar)和云端硬盘(Drive)之间自由穿梭的“全能生活助理”。

每天早上自动为你写一封“人生提醒信”

CC 最吸睛的特性是:每天早晨,你打开 Gmail 收件箱,就能看到一封来自 CC 的个性化早间邮件,内容堪称“懂你到骨子里”:

- 今天上午10点有一个重要会议

- 下午需要回复某位客户的邮件

- Drive 里的项目报告还差你的签字

- 昨天那封没回的邮件我已经整理好,随时回复……

一封邮件搞定全天待办,再也不用打开十几个标签页、翻遍备忘录、来回切换 App。

核心能力:跨应用深度理解与主动提醒

- 自动梳理待办:实时扫描日历事件、未读邮件、Drive 文件修改记录,精准提炼出“今天最重要的事”。

- 主动推送提醒:不用你去问,它每天主动给你发“今日日程简报”。

- 一键回复与操作:邮件里直接提供“快速回复”按钮,或直接回复邮件给 CC 即可让它帮你起草、发送、安排会议。

- 零学习成本:无需额外 App、无需训练模型,只需用 Gmail 就能享受到它“像私人助理一样”的服务。

一句话总结 CC 的定位  

“它不是帮你写邮件的 AI,而是帮你过好一天的 AI。”

目前状态  

CC 目前作为 Google Labs 实验项目,部分用户已获得内测资格。Google 表示,将根据反馈逐步扩大测试范围,并可能在未来整合到 Gmail 正式功能中。

AIbase 点评  

在 AI 助理越来越泛滥的今天,CC 真正做到了“少即是多”——它没有花里胡哨的界面,只用你最熟悉的邮箱,每天主动把生活理得井井有条。这种“润物细无声”的体验,或许才是真正改变用户日常的 AI 应用。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]