https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Google 搜索巨变!Canvas 正式全美公测:一键把搜索结果变成 App,百万 Token 窗口硬刚 ChatGPT

Google 近日宣布,此前仅在 Google Labs 实验阶段的 Canvas 功能,现已正式通过 Gemini 的 AI Mode 向全美用户开放。这一举措标志着 Google 搜索正在从“信息检索工具”向“全能创作平台”转型。

Canvas 的核心使命是帮助用户整理信息、规划项目以及进行深度研究。现在,用户不仅能在搜索界面中起草文稿,甚至能直接生成定制化的数字化工具。

核心功能:从学习笔记到可运行的 App

Canvas 的功能覆盖了从学术研究到代码开发的多个维度,被视为 Google 对抗 Notebook LM 重叠功能并集成至搜索场景的“杀手锏”:

文档深加工:用户可以上传课堂笔记或资料,由 Canvas 自动生成结构化的学习指南。它还能将枯燥的研究报告转化为精美的网页、测验题,甚至是音频概览。

自然语言编程:开发者或普通用户只需用自然语言描述创意,Canvas 就能即时生成代码,并将其转化为可以分享的小应用或小游戏。

长文本处理神器:对于订阅了 Google AI Pro 和 Ultra 的用户,Canvas 支持最新的 Gemini3模型,并提供高达100万 token 的上下文窗口,足以处理整本书籍或超大型项目的调研。

交互体验:侧边栏里的“第二大脑”

在使用流程上,Google 强调了交互的直观性。用户只需在 AI 模式下点击工具菜单中的“+”号并选择 Canvas,界面侧边便会弹出专属面板。

在这里,用户可以汇总来自网页和 Google 知识图谱的权威信息。如果你正在构建一个原型应用,你可以一边查看底层代码,一边通过与 Gemini 的对话实时微调应用行为,实现“所见即所得”的开发体验。

行业竞争:主动唤起 vs 自动触发

在 AI 赛道上,Canvas 的直接竞争对手是 OpenAI 的 Canvas 和 Anthropic 的 Claude Artifacts。

与 ChatGPT 根据提问自动触发 Canvas 不同,Google 和 Anthropic 更强调用户的主动选择权。Google 试图通过搜索产品巨大的流量覆盖面,将 Canvas 渗透进用户的日常搜索习惯中,从而在与 OpenAI 的拉力战中占据先机。目前该功能仅限美国地区英语用户使用,全球推广时间表尚未公布。

想让我为您实时监测 Canvas 在复杂 Python 代码生成时的报错率表现,或者对比一下它与 ChatGPT Canvas 在撰写长篇学术论文时的逻辑结构差异吗?

via AI新闻资讯 (author: AI Base)
User may experience errors in ChatGPT

Status: Investigating

We are investigating the issue for the listed services.

Affected components
Conversations (Degraded performance)

via OpenAI status
视频创作“大片化”!Google 升级 NotebookLM:电影级视觉概览功能正式上线

Google 旗下的智能笔记与研究工具 NotebookLM 迎来重磅升级。据 cnBeta 报道,该工具近日推出了“电影级视频概览”(Cinematic Video Overviews)功能。这标志着 NotebookLM 的输出形式从简单的叙述性幻灯片,正式进化为具备流畅动画与精细视觉效果的专业级视频。

此次升级深度集成了 Google 最前沿的生成式 AI 矩阵。系统调用 Gemini3作为“创意总监”,负责构建叙事结构并把控视觉风格;同时结合 Nano Banana Pro 与 Veo3模型,将用户上传的原始研究材料转化为动态感十足的视觉内容。

与此前仅能生成带 AI 主持人的简易动画不同,新功能强调“一致性”与“叙事深度”。AI 会根据用户指定的焦点,自动决定最佳的视觉呈现方式,并对画面进行反复优化,确保成片效果不仅是资料的堆砌,更像是一部条理清晰的专题短片。

目前,这一功能主要面向网页端和移动端的 Google AI Ultra 订阅者开放,且首发阶段仅支持英语及18岁以上用户。Google 尚未透露该功能何时会下放到普通付费计划或免费版。

值得关注的是,随着 NotebookLM 视频功能的普及,AI 语音的合规性也引发了争议。近期,美国国家公共广播电台(NPR)主持人 David Greene 已对 Google 提起诉讼,指控该工具生成的 AI 男声与其极其相似,导致公众误认。这提醒我们在享受 AI 视频创作便利的同时,技术伦理与版权保护依然是行业亟待解决的课题。

划重点

🎬 视觉效果质变:新增“电影级”视频模式,利用 Veo3等模型创建比传统幻灯片更流畅、更具专业感的 AI 动画。
🧠 AI 导演掌舵:Gemini3自动负责分镜与风格决策,将零散素材转化为具有连贯逻辑的视觉故事。
🔐 订阅者专享:目前仅供 Google AI Ultra 用户在网页及移动端体验,限英语环境使用。

via AI新闻资讯 (author: AI Base)
OpenAI 发布 Windows 版 Codex,160万开发者已抢先体验

在 Mac 版本发布首周便创下百万次下载的惊人纪录后,OpenAI 于今日正式推出了适用于 Windows 系统的 Codex 应用程序。这款人工智能驱动的辅助编程工具,标志着开发者工作流将迎来从“手动辅助”到“智能代理”的质变。

核心功能:异步代理与自动化工作流

Codex 不仅仅是一个代码补全工具,它通过以下三大核心能力重新定义了软件构建方式:

● 多智能体异步运行: 支持在不同项目中同时运行多个 AI 智能体,显著提升多任务处理效率。
● 自动化任务委派: 开发者可将重复性、机械性的编程任务委派给 AI,从而专注于核心架构设计。
● 技能集成系统: 通过“技能”插件,智能体能无缝连接至开发者的现有工具和工作流程。
● 无损上下文交互: 开发者可以随时查看、指导并干预智能体的工作,确保在介入过程中不丢失任何上下文信息。

技术突破:原生沙箱环境

为了解决 Windows 平台的兼容性与安全性,OpenAI 为该版本构建了原生沙箱(Sandbox)。该沙箱在操作系统级别运行,具备受限令牌、独立文件系统访问权限及专用沙箱用户账户。

这意味着 AI 代理可以直接在 PowerShell 等 Windows 原生环境中运行,开发者无需切换到 WSL(Windows Subsystem for Linux)或虚拟机即可完成复杂操作。目前,OpenAI 已将该沙箱代码在 GitHub 上开源。

市场反响与普及程度

Codex 的受欢迎程度远超预期。据官方数据显示:

● Mac 版表现: 首周下载量突破 100万次。
● Windows 版热度: 发布前已有超过 50万名开发者进入候补名单。
● 用户规模: Codex 目前的周活跃用户总数已超过 160万

目前,该应用程序已面向所有 ChatGPT 付费套餐用户开放。随着 Codex 的全面铺开,正如前 OpenAI 研究员 Andrej Karpathy 所言,AI 代理的介入正让编程变得“面目全非”。

via AI新闻资讯 (author: AI Base)
不甘只做“打工人”:Meta 计划自研定制芯片,欲在 AI 训练场实现“算力自由”

尽管近期刚与英伟达、AMD 达成了巨额采购协议,社交媒体巨头 Meta 依然坚定地推进着自己的“造芯”大计。据彭博社 3 月 5 日报道,Meta 首席财务官苏珊·李(Susan Li)在周三的摩根士丹利科技大会上公开表示,公司正致力于研发定制芯片,最终目标是能够独立支撑未来 AI 模型的训练。

目前,Meta 虽非云服务提供商,却是全球数据中心运营规模最大的玩家之一。苏珊·李透露,Meta 的自研之路采取了“由易入难”的策略:最初的定制芯片主要用于排序和推荐这类特定工作负载,并已实现大规模部署。但她强调,Meta 希望随着时间的推移扩大应用范围,最终开发出能胜任核心 AI 模型训练任务的处理器。

在谈及芯片采购策略时,苏珊·李展现了极强的务实态度。她指出,Meta 会根据不同应用场景的需求,在英伟达、AMD 的通用芯片与自研定制芯片之间寻求最佳平衡点。这种“两条腿走路”的方式,既能保证当前 AI 业务的爆发式需求得到满足,又能在长期内减少对单一供应商的依赖,并针对自身算法优化算力效率。

随着 Meta 持续在元宇宙和生成式 AI 领域投入重金,拥有自主可控的底层硬件架构已成为其核心战略。这场从软件到硬件的全面进化,标志着 Meta 试图在 AI 时代的算力竞赛中,掌握更多的议价权与技术主导权。

划重点

🚀 训练芯片自研化:Meta 计划将定制芯片的应用范围从简单的推荐算法扩展到复杂的 AI 模型训练。
🤝 混合采购策略:在自研的同时,Meta 仍将维持与英伟达、AMD 的深度合作,确保算力供应链的灵活性。
💡 量身定制算力:CFO 强调定制芯片在处理特定工作负载时更具优势,是 Meta 优化数据中心成本的关键。

via AI新闻资讯 (author: AI Base)
禁令与冲突交织:美军承包商加速弃用Claude模型

据TechCrunch披露,美国国防科技领域正陷入一场由监管政策冲突引发的供应动荡。尽管Anthropic开发的Claude模型目前仍被美军用于实战支持,但由于特朗普政府近期发布的一系列重叠且互抵的禁令,大量国防科技承包商正加速弃用该系统。

根据最新指令,民事机构被要求立即停止使用Anthropic产品,而国防部则获得六个月的过渡期。然而,在政策尚未完全落地之际,美以与伊朗之间爆发的冲突使得该模型陷入了某种“战时悖论”:一方面,Claude正深度集成于Palantir的Maven系统,协助五角大楼进行实时目标定位与优先级排序;另一方面,国防部长皮特·赫格塞斯已公开承诺将其列为供应链风险名单。

受此预期影响,国防工业界已出现大规模“脱钩”潮。洛克希德·马丁等核心承包商本周已启动模型更换程序,风投机构J2Ventures证实其投资组合中已有10家公司停止在军事场景中使用Claude。

与此同时,竞品市场表现出强劲的替代效应,ChatGPT在相关协议达成后下载量激增295%。这一现象预示着,即便领先的AI实验室在技术上已深入战场腹地,但在国家安全审查与供应链自主化的红线下,技术领先性已不再是留住政府级客户的唯一筹码。随着赫格塞斯可能发起的法律诉讼,AI军事化应用的合规性边界将面临更严苛的重塑。

via AI新闻资讯 (author: AI Base)
微软推出小型多模态 AI 模型 Phi-4:思考与感知的完美结合!

微软近日在其开发者社区发布了一款名为 Phi-4-Reasoning-Vision-15B 的新型开源 AI 模型。这款模型不仅具备高分辨率的视觉感知能力,还能够进行深度推理,标志着 Phi-4 系列的一个重要突破。作为首个同时具备 “看得清楚” 和 “想得深入” 特性的 “小语言模型”(SLM),Phi-4 的问世将为开发者开辟新的智能应用场景。

与传统的视觉模型不同,Phi-4 不仅仅是被动地识别图像中的内容,而是能进行结构化和多步骤的推理。它能够理解图像中的视觉结构,并将其与文本上下文相结合,从而得出可操作的结论。这种能力使得开发者能够创建从数据图表分析到用户界面自动化等多种智能应用。

Phi-4 的设计特色在于其灵活的推理模式。当面对需要深入分析的任务时,比如数学问题或逻辑推理时,模型会切换到 “推理模式”,启用多步骤推理链。而在需要快速反应的场景中,比如 OCR(光学字符识别)或元素定位时,它则能快速输出结果,以降低延迟。这种灵活性大大提升了模型的实用性和效率。

非推理模式

此外,Phi-4 的应用潜力巨大,尤其是在计算机智能体的使用场景中。用户只需提供一个屏幕截图和自然语言指令,模型便能输出所需 UI 元素的标准化边界框坐标,其他智能体模型则可以在此基础上执行点击、滚动等交互操作。这样,Phi-4 将为用户带来更便捷的操作体验。

推理模式

总体来看,Phi-4-Reasoning-Vision-15B 不仅在技术上有所突破,也为智能应用的开发提供了强大的支持。随着这一模型的开源,期待更多开发者能够利用其先进功能,创造出更多令人惊叹的应用场景。

via AI新闻资讯 (author: AI Base)
能自主决定何时“思考”!微软发布 Phi-4 15B 开源模型,主打小型化多模态

微软近日正式发布了全新的开源权重多模态大模型 Phi-4-reasoning-vision-15B。这款模型最大的技术突破在于其具备“自主决定思考时机”的能力——它能够智能判断任务难度,自主选择是快速给出答案,还是启动深度的逻辑推理。这种特性在目前的开源轻量级模型中极为罕见。

作为 Phi-4系列的新成员,该模型拥有150亿参数,专门针对图像描述、界面元素定位及复杂数学推理等高难度场景进行了优化。微软通过在架构中引入“思考模式”控制机制,解决了传统模型需要人工干预切换模式的痛点。简单问题即刻响应,复杂问题则自动拉长思考链条,从而在处理效率与输出质量之间找到了平衡点。

在训练策略上,Phi-415B 走了一条“精训而非海量堆料”的路线。该模型仅使用了约2000亿 Token 的高质量数据进行训练,远低于行业同类模型动辄上万亿的消耗量。尽管微软利用了 GPT-4o 辅助训练以确保逻辑准确性,但研发团队强调,其实际表现仍需在多样的真实应用场景中进一步验证。

目前,微软已在 Hugging Face 以及 Microsoft Foundry 等渠道公开了该模型的权重与配套资源。业内分析认为,虽然目前开源社区的关注点多集中于 Qwen3.5等模型,但 Phi-415B 凭借其多模态集成与“自适应思考”的独特性,对于追求本地化部署及低成本推理的开发者来说,依然是一个值得关注的选项。

划重点

🧠 自适应思考机制:模型号称能自主决定何时进行深度推理,无需用户手动开启“思考模式”,兼顾效率与深度。
🖼️ 多模态能力增强:15B 参数规模下,在图像理解、界面元素定位及数学逻辑任务上表现出色。
📉 高效训练范式:仅耗费2000亿 Token 高质量数据即完成训练,展现了微软在数据优选与模型养成上的技术积累。

via AI新闻资讯 (author: AI Base)
Apple Music拟推AI透明度标签,要求发行商主动标记人工智能内容

苹果公司于3月4日向行业合作伙伴发布简报,宣布将在Apple Music中引入全新的AI透明度标签制度。此举旨在通过升级元数据管理系统,提升平台内人工智能参与创作内容的透明度。根据新规,唱片公司及发行商在上传音乐作品时,需针对AI生成或AI辅助创作的内容进行主动标注。

该功能的核心在于对音频元数据的精细化拓展。发行商现在可以针对歌曲的特定维度——包括封面图、音轨(音乐)、作曲(歌词)以及音乐视频——选择性添加AI标识。这一机制允许系统清晰区分完全由算法生成的作品与仅在部分环节使用AI工具辅助的创意内容。目前,Apple Music采取的是与Spotify类似的“选择性加入”策略,即由权利方手动声明AI的使用情况,而非采用Deezer等平台尝试的自动化内部检测工具。

此项功能的推出响应了近期创作者社区对AI内容分类的迫切需求,标志着主流流媒体平台在应对生成式AI冲击方面迈出了关键一步。随着AI创作门槛的降低,海量低质或侵权风险内容涌入市场,确立标准化的元数据标记规范已成为重塑行业版权秩序、保护人类艺术家权益的必要手段。苹果的入局不仅预示着流媒体行业监管治理的常态化,也将进一步推动AI内容确权与消费者知情权在数字音乐领域的落地。

via AI新闻资讯 (author: AI Base)
谷歌搜索面向全美用户推出Gemini Canvas AI模式

谷歌今日宣布正式向美国所有英语用户开放其搜索引擎中的Gemini Canvas AI模式,标志着这一此前仅限实验室测试的功能进入大规模商用阶段。作为谷歌在生成式AI领域的重要布局,Canvas旨在将传统的搜索体验转化为深度协作的创作空间,帮助用户完成从项目规划到代码生成的复杂任务。

功能层面,Canvas支持用户在AI模式下直接通过工具菜单调取画布,利用侧边栏整合来自网络和谷歌知识图谱的信息。该工具不仅能够辅助创意写作与文档精炼,更具备将研究报告转化为学习指南、网页或音频概述的跨媒介处理能力。针对开发者群体,Canvas提供了实时生成并测试代码的交互环境,允许用户通过与Gemini对话持续优化应用原型。目前,订阅Google AI ProUltra的用户可在此模式下调用Gemini3模型及100万token的超长上下文窗口,以应对更高强度的专业需求。

此次更新反映了谷歌正通过其庞大的搜索入口建立竞争壁垒。与OpenAI的Canvas功能自动触发机制不同,谷歌更强调用户的交互主动性。随着Canvas全面融入搜索生态,谷歌试图证明其不仅能提供信息检索,更能深度参与用户的生产力工作流。在当前AI应用从“问答式”向“协作式”转型的趋势下,谷歌凭借搜索业务的触达能力,正有力地推动大模型工具从极客圈层走向大众市场,进一步加剧了与Anthropic、OpenAI在智能工作区领域的存量竞争。

via AI新闻资讯 (author: AI Base)
API Error Rates

Status: Identified

We have identified that users are experiencing elevated errors for the impacted services. We are working on implementing a mitigation.

Affected components
Realtime (Degraded performance)
Login (Degraded performance)
Sora (Degraded performance)
Batch (Degraded performance)
Chat Completions (Degraded performance)
Audio (Degraded performance)
Fine-tuning (Degraded performance)
Files (Degraded performance)
Embeddings (Degraded performance)
Moderations (Degraded performance)
Responses (Degraded performance)
Images (Degraded performance)

via OpenAI status
黄仁勋称难再向 OpenAI 投入 1000 亿美元,OpenAI 可能于底前上市

在 OpenAI 与 Anthropic 筹备 IPO 之际,Nvidia CEO 黄仁勋在旧金山的 Morgan Stanley 会议上表示,Nvidia 对 OpenAI 的投资不太可能达到此前设想的最高 1000 亿美元,并称 OpenAI 可能在今年底前上市,使进一步加码的空间收窄。

Nvidia 上月参与 OpenAI 约 1000 亿美元融资,出资 300 亿美元,对应估值 7300 亿美元。黄仁勋同时表示,Nvidia 对 Anthropic 的 100 亿美元投资也可能是最后一次,并认为 AI 算力部署已为 Microsoft 等数据中心运营商带来盈利收入;若算力增加 3 倍,销售可提升 3 倍。

Bloomberg

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
黄仁勋:对OpenAI的300亿美元投资“可能是最后一次”

英伟达CEO黄仁勋表示,公司近期对OpenAI的300亿美元投资,可能将是其在该公司上市前的最后一次投资。他预计,OpenAI有望在今年年底前启动IPO。在周三的摩根士丹利技术、媒体和电信会议上,黄仁勋声称,此前两家公司在去年9月披露的涉及1000亿美元的基础设施交易可能不会实现。原因在于他们即将上市。他还提到,英伟达此前宣布向OpenAI的竞争对手Anthropic投资100亿美元,这笔投资很可能也是最后一次。英伟达在去年11月与微软联合发布公告时披露了该投资计划。黄仁勋发表此番言论前,外界数月来持续猜测英伟达与OpenAI合作规模。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
谷歌Gemini被指控教唆佛罗里达男子自杀

谷歌正面临一场诉讼,原告是佛罗里达州一名36岁男子的家属。该男子据称在谷歌旗下Gemini聊天机器人的影响下,曾考虑实施一起大规模伤亡袭击,最终自杀身亡。据周三在加州圣何塞联邦法院提交的诉讼称,乔纳森·加瓦拉斯最初使用Gemini只是为了写作辅助等普通用途。但诉讼指控数月的互动让他陷入危险的精神恶化状态,在此期间他策划了一场可能的暴力行动,最终自杀。加瓦拉斯的父亲乔尔·加瓦拉斯在诉讼中说,儿子使用Gemini的过程,最终演变成为期四天、逐渐陷入暴力计划与被诱导自杀的状态。他称儿子本是一名易受影响的用户,却被变成了 “一场假想战争中的武装执行者” 。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
↩️ 美国国防部将 Anthropic 列入黑名单 国防科技公司停止使用 Claude


科技圈🎗在花频道📮:

美国国防部拟终止与 Anthropic 合作,因 AI 军事用途限制产生分歧 美国国防部正考虑终止与 AI 公司 Anthropic 的合作,主因是双方在模型使用权限上存在严重分歧。Anthropic 坚持禁止将 Claude 模型用于大规模监控及全自动武器系统,而国防部要求获得包括武器研发和战场行动在内的“所有合法用途”授权。 此前,Claude 在抓捕委内瑞拉领导人马杜罗的军事行动中被使用,引发公司对技术涉及实战打击的疑虑。尽管 OpenAI 和 Google 等竞争对手已同意放宽限制,但国防部承认,Anthropic…

美国国防部将 Anthropic 列入黑名单 国防科技公司停止使用 Claude

特朗普政府决定将人工智能公司 Anthropic 列入黑名单并将其技术指定为供应链风险后,多家国防科技公司要求员工停止使用 Claude 模型,并切换至其他人工智能工具。

CNBC

🍀在花频道 🍵茶馆聊天 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
Issues with API Platform Audit Logs

Status: Resolved

We have observed issues with API Platform audit logs.

Affected components
Images (Operational)
Agent (Operational)
Connectors/Apps (Operational)
File uploads (Operational)
Search (Operational)
Responses (Operational)
Fine-tuning (Operational)
Realtime (Operational)
Image Generation (Operational)
ChatGPT Atlas (Operational)
Audio (Operational)
Feed (Operational)
GPTs (Operational)
Moderations (Operational)
Voice mode (Operational)
Batch (Operational)
Chat Completions (Operational)
Codex (Operational)
Login (Operational)
Video generation (Operational)
Image Generation (Operational)
Login (Operational)
Sora (Operational)
Embeddings (Operational)
Conversations (Operational)
Files (Operational)
Login (Operational)
Compliance API (Operational)
Video viewing (Operational)
Deep Research (Operational)

via OpenAI status
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]