https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
OpenAI 首席执行官 Sam Altman 正式宣布推出全新编程大模型GPT-5.3-Codex。作为 Codex 系列的最新迭代版本,该模型在技术指标与实际应用层面均实现了跨越式突破,标志着 AI 在辅助编程与计算机自动化操作领域进入了更成熟的阶段。
在性能表现上,GPT-5.3-Codex 刷新了多项权威评测纪录。其在 SWE-Bench Pro 编程评测中达到了57%,而在更侧重系统操作的 TerminalBench2.0和 OSWorld 评测中,分别取得了76% 和64% 的高分。这意味着该模型不仅能写代码,还具备了极为出色的计算机实操能力,能够像人类工程师一样理解并执行复杂的操作系统任务。
值得关注的是,新模型在运行效率上表现惊人。OpenAI 表示,在完成同等复杂度的任务时,GPT-5.3-Codex 的令牌(Token)消耗量较上一代5.2版本减少了超过一半,同时单令牌的处理速度提升了25% 以上。这种“高速度、低能耗”的特性,将显著降低企业和开发者集成 AI 编程能力的成本。此外,模型还支持在任务执行过程中进行实时调控与动态更新,极大增强了开发流程的灵活性。
安全性方面,GPT-5.3-Codex 是 OpenAI 首款在安全防护框架的网络安全维度获评“高等级”的模型。为了进一步构建防御体系,OpenAI 同步推出了可信访问框架试点计划,并投入1000万美元的 API 额度,旨在通过 AI 技术加速全球网络安全防御建设。
划重点:
● 💻 编程与实操双进化:模型在 SWE-Bench Pro 等多项评测中创下新高,具备成熟的计算机系统自主操作与复杂编程能力。
● ⚡ 运行效率大幅跃升:相比5.2版本,同任务令牌消耗降低超50%,处理速度提升超25%,显著提升了任务执行的经济性。
● 🛡️ 安全防御等级登顶:首获网络安全维度“高等级”评价,OpenAI 拨付千万美元额度专项助力网络安全体系建设。
via AI新闻资讯 (author: AI Base)
随着2026年春节临近,国内领先的AI应用千问APP于今日正式宣布开启“春节30亿大免单”系列活动。首波福利直击年轻消费群体,以“请全国人民喝奶茶”为主题,力求通过AI技术与生活服务的深度融合,为用户带来科技感十足的新春贺礼。
据官方发布的消息显示,此次活动门槛极低且覆盖面极广。用户只需将千问APP更新至最新版本,即可无门槛获得一张价值25元的奶茶免单卡。该免单券支持在包括喜茶、奈雪的茶、瑞幸咖啡及蜜雪冰城在内的全国30多万家线下门店使用。用户可以通过千问APP体验“一句话AI下单”,真正实现从语音指令到免单消费的无缝衔接。
除了基础福利,千问还推出了强社交属性的“邀新计划”。用户每成功邀请一位新朋友,双方均可额外获得一杯免单。根据活动规则,个人最高可累积获得21张免单卡,总价值达525元。以蜜雪冰城为例,这意味着单人最高可免费畅饮84杯柠檬水。
此外,针对春节期间的家庭社交场景,千问APP还设置了“千问AI生活卡”抽奖环节,总价值达万元。相关幸运名单将于2月7日至13日在官方微博每日公示。此次活动不仅是千问APP抢占春节流量高地的重要举措,更通过大规模的市场补贴,向大众普及了AI在日常消费场景中的便捷应用。
via AI新闻资讯 (author: AI Base)
2026年2月5日,Anthropic 正式发布了新一代旗舰模型 Claude Opus4.6。此次更新距离上一代 Opus4.5仅时隔两个月,展现了 Anthropic 极快的迭代速度,其核心进化方向锁定在“自主性”与“任务持久力”上。
核心突破:100万上下文与更强的“自主意识”
Claude Opus4.6不再仅仅是一个对话工具,它正向着具备“自主意识”的智能体(Agent)进化:
超大上下文窗口:首次在 Opus 级别模型中引入100万 token 的超大上下文窗口(测试版),能够轻松吞下整个代码库或海量财务报表。
任务持久力(Agentic tasks):模型在处理复杂任务时表现出更强的专注度,能够主动发现并修正错误,显著减少了用户与 AI 之间的往复指令,实现“少说多产”。
代码全流程进化:在代码规划、调试及审查能力上实现显著提升,是开发者应对大规模代码库的可靠伙伴。
办公神器:深度集成 Excel 与 PowerPoint
为了让 AI 真正落地办公场景,Claude Opus4.6带来了极具杀伤力的功能:
财务与图表自动化:升级了现有的 Excel 集成,能自主运行复杂的财务分析并生成电子表格。
PPT 制作预览:推出了 PowerPoint 集成的研究预览版,AI 可以根据行业研究结果自动创建演示文稿,包揽从数据整理到视觉呈现的全流程。
加量不加价:定价保持平稳
尽管性能大幅跃升,Anthropic 依然维持了极具竞争力的定价方案:
输入成本:每百万 token5美元。
输出成本:每百万 token25美元。
目前,Claude Opus4.6已在官方 API、claude.ai 网页版及主流云平台同步上线,用户可以即刻体验这款专注编程与专业办公的“最强大脑”。
via AI新闻资讯 (author: AI Base)
进一步提升编码性能!OpenAI推出GPT-5.3-Codex
当地时间 2 月 5 日,OpenAI 推出了其最新的编码模型 ——GPT-5.3-Codex。这款模型在之前的版本 GPT-5.2-Codex 的基础上进行了重大升级,不仅提升了编码性能,还融合了更强的推理能力和专业知识,让它在复杂任务的处理上展现出更大的潜力。
GPT-5.3-Codex 实现了性能的 “双飞跃”,运行速度更是提升了 25%。这样的提升使得它能够高效地处理各种长期任务,尤其是在涉及研究和工具使用等复杂场景时表现得尤为出色。用户在使用 GPT-5.3-Codex 时,能够像与同事协作一样,实时引导和互动,从而保持上下文的连贯性。这一创新让用户体验更加流畅,为开发者和研究者提供了更为强大的支持。
OpenAI 的这项技术进步,不仅让编码变得更加高效,还可能改变开发者与 AI 之间的互动方式。在如今快速发展的科技环境中,能够实现更高效的工作流程,无疑将使企业和个人在竞争中脱颖而出。
此外,OpenAI 并未止步于此。为了进一步扩大其在市场上的影响力,OpenAI 正积极招聘数百名 “前沿部署工程师”,旨在赢得大型企业的业务。这一策略显示了 OpenAI 对未来的雄心壮志,力求在 AI 行业中继续保持领先地位。
随着 GPT-5.3-Codex 的发布,OpenAI 再次向我们展示了人工智能的无限可能,未来将会是一个充满机遇与挑战的时代。
via AI新闻资讯 (author: AI Base)
当地时间 2 月 5 日,OpenAI 推出了其最新的编码模型 ——GPT-5.3-Codex。这款模型在之前的版本 GPT-5.2-Codex 的基础上进行了重大升级,不仅提升了编码性能,还融合了更强的推理能力和专业知识,让它在复杂任务的处理上展现出更大的潜力。
GPT-5.3-Codex 实现了性能的 “双飞跃”,运行速度更是提升了 25%。这样的提升使得它能够高效地处理各种长期任务,尤其是在涉及研究和工具使用等复杂场景时表现得尤为出色。用户在使用 GPT-5.3-Codex 时,能够像与同事协作一样,实时引导和互动,从而保持上下文的连贯性。这一创新让用户体验更加流畅,为开发者和研究者提供了更为强大的支持。
OpenAI 的这项技术进步,不仅让编码变得更加高效,还可能改变开发者与 AI 之间的互动方式。在如今快速发展的科技环境中,能够实现更高效的工作流程,无疑将使企业和个人在竞争中脱颖而出。
此外,OpenAI 并未止步于此。为了进一步扩大其在市场上的影响力,OpenAI 正积极招聘数百名 “前沿部署工程师”,旨在赢得大型企业的业务。这一策略显示了 OpenAI 对未来的雄心壮志,力求在 AI 行业中继续保持领先地位。
随着 GPT-5.3-Codex 的发布,OpenAI 再次向我们展示了人工智能的无限可能,未来将会是一个充满机遇与挑战的时代。
via AI新闻资讯 (author: AI Base)
马斯克预言: 36 个月内太空将成AI部署“价格洼地”,电力荒或致芯片堆积
埃隆·马斯克在最新播客节目中抛出了一个惊人观点:由于地球电力增长陷入停滞,未来 3 年内,太空将成为部署人工智能(AI)成本最低且效率最高的地方。这一言论再次将“太空GPU”这一前沿话题推向了全球资本市场的风口浪尖。
马斯克指出,目前全球正面临严峻的电力瓶颈。相比于呈指数级增长的芯片产出,电力产出的增长几乎持平。他大胆预言,到 2026 年底,人类可能会面临“空有芯片山,却无足够电力开机”的窘境。而在太空中,太阳能电池板的发电效率是地面上的 5 倍,且无需昂贵的储能电池来度过夜晚,这使得太空部署在经济性上具有压倒性优势。
除了能源优势,马斯克还谈到了地面建设的繁杂审批手续。他认为在地面大规模扩张电力设施极其困难,而太空部署则能免去这些行政束缚。他预计,这种成本结构的彻底倒挂将在 30 到 36 个月内发生。对于外界担忧的维护问题,他表示芯片在地面完成初始调试后可靠性极高,太空维护并不会成为核心障碍。
针对目前数据中心的运营压力,马斯克披露了xAI孟菲斯数据中心的细节:仅制冷一项就增加了40%的电力消耗。此外,美国昂贵的光伏关税和稀缺的本土产能也限制了地面电力的扩张。马斯克最后提到,为了实现这一愿景,未来的TeraFab工厂可能需要实现从逻辑芯片到存储及封装的全流程自产,以应对内存芯片价格暴涨带来的挑战。
划重点:
● 🌌 太空部署性价比登顶:马斯克预测 36 个月内,由于太空光照效率更高且无需电池储备,其AI部署成本将远低于地面。
● ⚡ 全球面临电力瓶颈:地面电力增长无法跟上芯片产出, 2026 年底可能出现因缺电导致大型计算集群无法开机的现象。
● 🏗️ 产业链纵向整合:为克服燃气轮机买不到及内存价格高昂等困难,马斯克计划让其工厂自产逻辑与存储芯片,并实现自主封装。
via AI新闻资讯 (author: AI Base)
埃隆·马斯克在最新播客节目中抛出了一个惊人观点:由于地球电力增长陷入停滞,未来 3 年内,太空将成为部署人工智能(AI)成本最低且效率最高的地方。这一言论再次将“太空GPU”这一前沿话题推向了全球资本市场的风口浪尖。
马斯克指出,目前全球正面临严峻的电力瓶颈。相比于呈指数级增长的芯片产出,电力产出的增长几乎持平。他大胆预言,到 2026 年底,人类可能会面临“空有芯片山,却无足够电力开机”的窘境。而在太空中,太阳能电池板的发电效率是地面上的 5 倍,且无需昂贵的储能电池来度过夜晚,这使得太空部署在经济性上具有压倒性优势。
除了能源优势,马斯克还谈到了地面建设的繁杂审批手续。他认为在地面大规模扩张电力设施极其困难,而太空部署则能免去这些行政束缚。他预计,这种成本结构的彻底倒挂将在 30 到 36 个月内发生。对于外界担忧的维护问题,他表示芯片在地面完成初始调试后可靠性极高,太空维护并不会成为核心障碍。
针对目前数据中心的运营压力,马斯克披露了xAI孟菲斯数据中心的细节:仅制冷一项就增加了40%的电力消耗。此外,美国昂贵的光伏关税和稀缺的本土产能也限制了地面电力的扩张。马斯克最后提到,为了实现这一愿景,未来的TeraFab工厂可能需要实现从逻辑芯片到存储及封装的全流程自产,以应对内存芯片价格暴涨带来的挑战。
划重点:
● 🌌 太空部署性价比登顶:马斯克预测 36 个月内,由于太空光照效率更高且无需电池储备,其AI部署成本将远低于地面。
● ⚡ 全球面临电力瓶颈:地面电力增长无法跟上芯片产出, 2026 年底可能出现因缺电导致大型计算集群无法开机的现象。
● 🏗️ 产业链纵向整合:为克服燃气轮机买不到及内存价格高昂等困难,马斯克计划让其工厂自产逻辑与存储芯片,并实现自主封装。
via AI新闻资讯 (author: AI Base)
苹果内部大会细节曝光:库克深度解读AI机遇,并首度细谈“接班人”蓝图
苹果公司CEO 蒂姆·库克(Tim Cook)在周四举行的全体员工大会上发表了重要演讲。在此次内部交流中,库克不仅针对近期备受关注的 AI 技术布局、CEO 接班人规划等核心议题进行了正面回应,还向员工展示了公司未来十年的战略雄心。
在谈及 AI 这一科技浪潮时,库克表现出了极大的信心。他将其定义为“一生中最具深刻影响的机遇之一”,并直言苹果具备独特的优势,能够以更有意义的方式帮助客户运用 AI 技术。针对外界对苹果在 AI 领域竞争力的担忧,库克表示,AI 将催生全新的产品和服务类别,这正为苹果开启前所未有的机遇大门。
除了技术布局,库克此次罕见地公开谈论了公司的“接班人”问题。他透露,自己花费了大量时间思考未来五年、十年乃至十五年后的领导层架构。近期苹果多位高管宣布退休,库克解释称这是经过精心安排的自然更替,并非突发状况,并强调制定长期的领导力计划是公司稳定发展的基石。
针对目前困扰科技行业的硬件供应链问题,库克坦诚公司正面临内存芯片短缺的挑战。目前,苹果首席运营官正带领团队评估并实施多项备选方案,以确保产品供应的稳定性。
此外,库克还回顾了公司创纪录的业绩表现,并预告苹果将在今年 4 月举行隆重的 50 周年庆祝活动。在海外市场方面,他特别点名了印度和马来西亚等新兴市场,认为这些地区蕴含着巨大的增长潜力。
划重点:
● 🤖 AI战略核心化:库克坚信 AI 是当下的核心机遇,苹果将通过软硬件结合推出全新的 AI 产品类别。
● 👥 接班人计划透明化:库克透露正在进行长达 15 年跨度的领导力规划,强调高管变动属于有计划的自然更替。
● ⚠️ 应对供应链挑战:承认内存芯片短缺问题,目前已启动多套备选方案,由顶尖团队协同解决供应困境。
via AI新闻资讯 (author: AI Base)
苹果公司CEO 蒂姆·库克(Tim Cook)在周四举行的全体员工大会上发表了重要演讲。在此次内部交流中,库克不仅针对近期备受关注的 AI 技术布局、CEO 接班人规划等核心议题进行了正面回应,还向员工展示了公司未来十年的战略雄心。
在谈及 AI 这一科技浪潮时,库克表现出了极大的信心。他将其定义为“一生中最具深刻影响的机遇之一”,并直言苹果具备独特的优势,能够以更有意义的方式帮助客户运用 AI 技术。针对外界对苹果在 AI 领域竞争力的担忧,库克表示,AI 将催生全新的产品和服务类别,这正为苹果开启前所未有的机遇大门。
除了技术布局,库克此次罕见地公开谈论了公司的“接班人”问题。他透露,自己花费了大量时间思考未来五年、十年乃至十五年后的领导层架构。近期苹果多位高管宣布退休,库克解释称这是经过精心安排的自然更替,并非突发状况,并强调制定长期的领导力计划是公司稳定发展的基石。
针对目前困扰科技行业的硬件供应链问题,库克坦诚公司正面临内存芯片短缺的挑战。目前,苹果首席运营官正带领团队评估并实施多项备选方案,以确保产品供应的稳定性。
此外,库克还回顾了公司创纪录的业绩表现,并预告苹果将在今年 4 月举行隆重的 50 周年庆祝活动。在海外市场方面,他特别点名了印度和马来西亚等新兴市场,认为这些地区蕴含着巨大的增长潜力。
划重点:
● 🤖 AI战略核心化:库克坚信 AI 是当下的核心机遇,苹果将通过软硬件结合推出全新的 AI 产品类别。
● 👥 接班人计划透明化:库克透露正在进行长达 15 年跨度的领导力规划,强调高管变动属于有计划的自然更替。
● ⚠️ 应对供应链挑战:承认内存芯片短缺问题,目前已启动多套备选方案,由顶尖团队协同解决供应困境。
via AI新闻资讯 (author: AI Base)
🤖 Anthropic Opus 4.6 代理团队成功构建可编译 Linux 的 C 编译器
Anthropic 研究员 Nicholas Carlini 近期展示了一项实验成果:利用 Opus 4.6 模型组成的代理团队,在不访问互联网的“洁净室”环境下,从零开始构建了一个包含 10 万行 Rust 代码的 C 编译器。该项目通过约 2,000 个 Claude Code 会话完成,API 耗资约 2 万美元。
该编译器支持 x86、ARM 和 RISC-V 多种后端架构,能够成功编译 Linux 6.9 内核、QEMU、FFmpeg、PostgreSQL 及《毁灭战士》(Doom)等复杂软件,并在 GCC 酷刑测试中达到 99% 的通过率。尽管具备强大的兼容性,但其生成的代码效率较低,即便在最高优化级别下仍不及 GCC 的无优化输出。
技术细节显示,该编译器并非完全独立,它依赖 GNU binutils 进行汇编和链接,且在处理 Linux 引导所需的 16 位 x86 代码时需调用 GCC 辅助。开发过程中,团队利用 GCC 作为“真值来源”构建了自动化测试方案,以解决代理协作中的代码冲突。
此项目引发了技术社区对 AI 辅助编程能力的广泛讨论。虽然其在处理大规模工程任务上表现出显著进步,但开发者也指出,项目已触及当前模型的能力瓶颈,后期维护中频繁出现“修复旧漏洞引发新错误”的现象。此外,关于模型训练数据是否导致其并非真正“洁净室”实现的争议依然存在。
(HackerNews)
via 茶馆 - Telegram Channel
Anthropic 研究员 Nicholas Carlini 近期展示了一项实验成果:利用 Opus 4.6 模型组成的代理团队,在不访问互联网的“洁净室”环境下,从零开始构建了一个包含 10 万行 Rust 代码的 C 编译器。该项目通过约 2,000 个 Claude Code 会话完成,API 耗资约 2 万美元。
该编译器支持 x86、ARM 和 RISC-V 多种后端架构,能够成功编译 Linux 6.9 内核、QEMU、FFmpeg、PostgreSQL 及《毁灭战士》(Doom)等复杂软件,并在 GCC 酷刑测试中达到 99% 的通过率。尽管具备强大的兼容性,但其生成的代码效率较低,即便在最高优化级别下仍不及 GCC 的无优化输出。
技术细节显示,该编译器并非完全独立,它依赖 GNU binutils 进行汇编和链接,且在处理 Linux 引导所需的 16 位 x86 代码时需调用 GCC 辅助。开发过程中,团队利用 GCC 作为“真值来源”构建了自动化测试方案,以解决代理协作中的代码冲突。
此项目引发了技术社区对 AI 辅助编程能力的广泛讨论。虽然其在处理大规模工程任务上表现出显著进步,但开发者也指出,项目已触及当前模型的能力瓶颈,后期维护中频繁出现“修复旧漏洞引发新错误”的现象。此外,关于模型训练数据是否导致其并非真正“洁净室”实现的争议依然存在。
(HackerNews)
via 茶馆 - Telegram Channel
Anthropic法律服务工具引发的软件股大跌尚未平息,该公司周四又发布了其最强人工智能(AI)模型的新版本,主要用于执行金融研究。该公司称,这款名为Claude Opus 4.6的版本能够检视企业数据、监管备案文件和市场信息,并生成详细的金融分析报告,通常这类工作通常需要人工耗时数天才能完成。此外,Opus 4.6还将提升一系列其他办公功能,包括制作电子表格和演示文稿,以及软件开发。
该消息发布后,金融服务公司股价应声下跌,FactSet Research Systems Inc.跌幅一度高达10%,标普全球、穆迪和纳斯达克股价也均大幅走低。
Anthropic及其竞争对手OpenAI过去一年中的大部分时间里都在开发人工智能工具,试图简化包括金融服务、医疗保健在内多个专业领域的任务,目标是吸引更多企业客户并为自身高昂的估值提供合理依据。目前,Anthropic正在洽谈按照3,500亿美元的估值进行新一轮融资,而OpenAI正在进行的融资谈判对公司估值高达8,300亿美元。
OpenAI还推出了AI编程助手Codex的更新版本,旨在进一步简化代码编写和调试流程,并可用于构建复杂的视频游戏和应用程序等软件。该公司强调,这一产品的功能已从编写软件延伸至一系列相关文档和演示工作,例如协助制作幻灯片和分析用户数据。
Anthropic拥有超过30万家企业客户,这些客户利用其模型来辅助一些工作任务,特别是在计算机编程领域。凭借Claude Code,Anthropic已成为该市场的领导者。
这种向编程以外领域的扩张近来令华尔街感到不安。Anthropic此前低调发布的一款自动化法律服务工具在本周引发软件股暴跌,投资者担心一些软件最终会被淘汰。
Anthropic的Claude模型产品负责人表示,公司计划重点提升在网络安全、生命科学、医疗保健和金融服务等相关领域的执行能力。
“这些是我们将会全力投入的领域,”他说道。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
🚀 OpenAI 发布 GPT-5.3-Codex:性能提升 25% 的全能智能体编程模型
模型发布与核心性能
OpenAI 正式推出 GPT-5.3-Codex,该模型集成了 GPT-5.2-Codex 的前沿编程性能与 GPT-5.2 的推理及专业知识,运行速度较前代提升 25%。作为目前最强的智能体编程模型,它能够处理涉及研究、工具调用和复杂执行的长期任务。在基准测试中,GPT-5.3-Codex 在 SWE-Bench Pro 上达到 56.8% 的行业领先水平,并在 Terminal-Bench 2.0(77.3%)和 OSWorld(64.7%)等测试中刷新纪录。
智能体能力与交互演进
GPT-5.3-Codex 实现了从单纯编写代码到全流程计算机操作的跨越,支持调试、部署、监控、撰写 PRD 及数据分析等任务。用户可在模型工作期间进行实时交互、提问并引导解决方案,而无需丢失上下文。值得注意的是,该模型在自身开发过程中发挥了关键作用,OpenAI 团队利用其早期版本进行训练调试、部署管理及测试诊断,显著加速了研发进程。
网络安全与防御支持
在网络安全领域,GPT-5.3-Codex 是首个被 Preparedness Framework 评为“高能力”且经过专门漏洞识别训练的模型。为应对潜在风险,OpenAI 部署了包括安全训练、自动化监控及威胁情报在内的综合安全栈,并启动“网络安全信任访问”试点计划。此外,公司承诺提供 1000 万美元的 API 额度,以支持开源软件和关键基础设施的防御研究。
订阅支持与硬件协作
目前,GPT-5.3-Codex 已向 ChatGPT 付费用户开放,涵盖应用端、CLI、IDE 扩展及网页版,API 访问权限将于近期开启。该模型基于 NVIDIA GB200 NVL72 系统进行协同设计、训练与服务。OpenAI 表示,Codex 已从单一的编程工具演变为通用的计算机协作智能体,进一步扩展了技术开发的边界。
(@OpenAI)
via 茶馆 - Telegram Channel
模型发布与核心性能
OpenAI 正式推出 GPT-5.3-Codex,该模型集成了 GPT-5.2-Codex 的前沿编程性能与 GPT-5.2 的推理及专业知识,运行速度较前代提升 25%。作为目前最强的智能体编程模型,它能够处理涉及研究、工具调用和复杂执行的长期任务。在基准测试中,GPT-5.3-Codex 在 SWE-Bench Pro 上达到 56.8% 的行业领先水平,并在 Terminal-Bench 2.0(77.3%)和 OSWorld(64.7%)等测试中刷新纪录。
智能体能力与交互演进
GPT-5.3-Codex 实现了从单纯编写代码到全流程计算机操作的跨越,支持调试、部署、监控、撰写 PRD 及数据分析等任务。用户可在模型工作期间进行实时交互、提问并引导解决方案,而无需丢失上下文。值得注意的是,该模型在自身开发过程中发挥了关键作用,OpenAI 团队利用其早期版本进行训练调试、部署管理及测试诊断,显著加速了研发进程。
网络安全与防御支持
在网络安全领域,GPT-5.3-Codex 是首个被 Preparedness Framework 评为“高能力”且经过专门漏洞识别训练的模型。为应对潜在风险,OpenAI 部署了包括安全训练、自动化监控及威胁情报在内的综合安全栈,并启动“网络安全信任访问”试点计划。此外,公司承诺提供 1000 万美元的 API 额度,以支持开源软件和关键基础设施的防御研究。
订阅支持与硬件协作
目前,GPT-5.3-Codex 已向 ChatGPT 付费用户开放,涵盖应用端、CLI、IDE 扩展及网页版,API 访问权限将于近期开启。该模型基于 NVIDIA GB200 NVL72 系统进行协同设计、训练与服务。OpenAI 表示,Codex 已从单一的编程工具演变为通用的计算机协作智能体,进一步扩展了技术开发的边界。
(@OpenAI)
via 茶馆 - Telegram Channel
🔁 #Update #Codex
Forwarded From Agent Copilot
#Update #Codex
GPT-5.3-Codex 现已在 Codex 可用。
via AI Copilot - Telegram Channel
Forwarded From Agent Copilot
#Update #Codex
GPT-5.3-Codex 现已在 Codex 可用。
via AI Copilot - Telegram Channel
科技圈🎗在花频道📮:
🤖 OpenAI 发布 GPT-5.2-Codex,显著提升智能编程与网络安全能力 OpenAI 于 12 月 19 日发布 GPT-5.2-Codex,旨在处理复杂的真实世界软件工程任务。该模型通过上下文压缩优化了长周期工作流,在 SWE-Bench Pro 等基准测试中取得领先成绩,并显著增强了 Windows 环境下的自主编程与网络安全防御能力。此前,安全研究员已利用该系列模型发现并修复了 React 框架的安全漏洞。目前,该模型已面向 ChatGPT 付费用户开放,API 接入将于近期开启。 OpenAI…
OpenAI 发布 GPT-5.3-Codex 编程模型,推理速度提升 25%
OpenAI 发布 GPT-5.3-Codex,系目前性能最强的智能体编程模型。该模型整合了 GPT-5.2 的推理能力与前代 Codex 的编程性能,运行速度提升 25%,可自主执行调研、工具调用及复杂任务处理。在 SWE-Bench Pro 和 Terminal-Bench 2.0 等多项基准测试中,GPT-5.3-Codex 均创下行业新高。
该模型是 OpenAI 首个参与自身开发过程的模型,曾辅助团队进行代码调试与部署管理。此外,GPT-5.3-Codex 被归类为具备“高能力”级别的网络安全模型,可直接识别软件漏洞。目前,该模型已面向 ChatGPT 付费用户开放,涵盖 App、CLI 及 IDE 插件等平台。
OpenAI
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
GPT-5.3-Codex System Card
Introduction
GPT‑5.3-Codex is the most capable agentic coding model to date, combining the frontier coding performance of GPT‑5.2-Codex with the reasoning and professional knowledge capabilities of GPT‑5.2. This enables it to take on long-running tasks that involve research, tool use, and complex execution. Much like a colleague, you can steer and interact with GPT‑5.3-Codex while it’s working, without losing context.
Like other recent models, it is being treated as High capability on biology, and is being deployed with the corresponding suite of safeguards we use for other models in the GPT‑5 family. It does not reach High capability on AI self-improvement.
This is the first launch we are treating as High capability in the Cybersecurity domain under our Preparedness Framework, activating the associated safeguards. We do not have definitive evidence that this model reaches our High threshold, but are taking a precautionary approach because we cannot rule out the possibility that it may be capable enough to reach the threshold. Our safeguards for high capability in cybersecurity rely on a layered safety stack designed to impede and disrupt threat actors, while we work to make these same capabilities as easily available as possible for cyber defenders.
via OpenAI News
Introduction
GPT‑5.3-Codex is the most capable agentic coding model to date, combining the frontier coding performance of GPT‑5.2-Codex with the reasoning and professional knowledge capabilities of GPT‑5.2. This enables it to take on long-running tasks that involve research, tool use, and complex execution. Much like a colleague, you can steer and interact with GPT‑5.3-Codex while it’s working, without losing context.
Like other recent models, it is being treated as High capability on biology, and is being deployed with the corresponding suite of safeguards we use for other models in the GPT‑5 family. It does not reach High capability on AI self-improvement.
This is the first launch we are treating as High capability in the Cybersecurity domain under our Preparedness Framework, activating the associated safeguards. We do not have definitive evidence that this model reaches our High threshold, but are taking a precautionary approach because we cannot rule out the possibility that it may be capable enough to reach the threshold. Our safeguards for high capability in cybersecurity rely on a layered safety stack designed to impede and disrupt threat actors, while we work to make these same capabilities as easily available as possible for cyber defenders.
via OpenAI News
🚀 Anthropic 发布 Claude Opus 4.6:支持自适应思考与超长上下文
Anthropic 正式推出 Claude Opus 4.6 模型,将标准上下文窗口提升至 200K(测试版支持 100 万 token),最大输出限制从 64K 翻倍至 128K。该模型引入自适应思考模式,可根据问题复杂度动态调整思考深度,并新增最高级别的 max effort 参数。新版本具备上下文压缩功能,通过自动总结早期内容实现近乎无限长度的对话。在数据管理方面,用户现可指定推理运行位置为全球或仅限美国。此外,Anthropic 宣布弃用传统思考模式和旧版输出格式参数。
(科技圈)
via 茶馆 - Telegram Channel
Anthropic 正式推出 Claude Opus 4.6 模型,将标准上下文窗口提升至 200K(测试版支持 100 万 token),最大输出限制从 64K 翻倍至 128K。该模型引入自适应思考模式,可根据问题复杂度动态调整思考深度,并新增最高级别的 max effort 参数。新版本具备上下文压缩功能,通过自动总结早期内容实现近乎无限长度的对话。在数据管理方面,用户现可指定推理运行位置为全球或仅限美国。此外,Anthropic 宣布弃用传统思考模式和旧版输出格式参数。
(科技圈)
via 茶馆 - Telegram Channel