ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

8 小时前

突破 300 款！国内最强大模型服务平台上线，AI调用成本直降30%

5月8日，中国移动推出国内首个超大规模AI模型服务平台，集成超300款主流大模型，成为国内模型数量最多的集成化平台。该平台首创“词元集约化”模式，支持成本、效果、均衡三种智能匹配策略，并实现秒级故障切换，保障服务连续性。上线后，AI调用成本降低30%，资源占用减少50%以上，日均调用量突破千亿，显著提升AI应用效率与稳定性。

via Infinitum 资讯聚合 (author: AI Base)

8 小时前

百度发布文心大模型5.1：搜索能力位居国内首位，预训练成本仅为业界6%

百度于5月9日正式发布新一代基础大模型文心大模型5.1，已上线千帆模型广场及文心一言官网，面向企业与开发者开放。该模型采用“多维弹性预训练”技术，预训练成本仅为业界同规模模型的6%，参数规模大幅压缩，但性能持续领先。在LMArena最新排名中，其搜索能力位居国内第一、全球第四，成为榜单前列唯一国产模型。此外，其在智能体、创意写作和推理能力方面均表现强劲，逼近国际领先水平。

via Infinitum 资讯聚合 (author: AI Base)

9 小时前

报道称DeepSeek 计划加速模型发布，V4.1 更新预计将在 6 月亮相

DeepSeek公司近期宣布，将在 6 月推出其 V4 模型的更新版本 V4.1，并计划加快模型发布频率，以追赶行业竞争对手。此前，DeepSeek 因技术深度受到好评，但其模型迭代速度明显滞后于其他 AI 公司，140 天内未发布任何新模型，而同期多家全球主要 AI 公司共发布了约 50 个新模型。

DeepSeek 的 V4 模型本定于 2026 年 2 月发布，但因硬件迁移等问题，发布日期被推迟至 4 月 24 日，最终以预览版形式上线，包含 V4-Pro 和 V4-Flash 两个版本。尽管新版本在文本和代码生成方面表现出色，但仍缺乏图像和音频处理能力。V4.1 将致力于弥补这一短板，力求实现真正的全模态覆盖。

此外，V4.1 将支持 Model Context Protocol（MCP），并提供更丰富的企业级工具链，标志着 DeepSeek 从技术展示向企业应用的转型。此次战略转变正是面对人才流失和算力成本上升的压力，DeepSeek 的创始人梁文锋将个人出资约 200 亿元，以支持公司发展，并吸引外部投资。

DeepSeek 目前正在寻求约 500 亿元人民币的融资，若成功将成为中国 AI 创业公司单轮融资的新纪录。创始人的个人投资和国家集成电路产业投资基金的参与，表明对公司未来的强烈信心。随着 V4.1 的发布及融资的顺利完成，DeepSeek 将朝着可持续商业实体迈出重要一步。

划重点：

🌟 DeepSeek 将在 6 月推出 V4.1 更新，计划加快模型发布频率。

🔍 V4.1 将弥补图像和音频处理能力，实现全模态覆盖。

💰 公司正在寻求约 500 亿元融资，以支持其转型和发展。

via AI新闻资讯 (author: AI Base)

9 小时前

OpenAI 推出 Codex Chrome 扩展程序，提升浏览器操作效率

OpenAI 近日推出了一款适用于 Mac 和 PC 的 Codex Chrome 扩展程序，旨在简化用户在浏览器中执行各种任务的流程。此次更新是为了迎合越来越多用户在浏览器中工作的趋势，使 Codex 能够更加高效地完成 Web 相关的任务。

在此之前，Codex 通过内置的沙盒浏览器和不断扩展的插件库来执行任务，支持 GitHub、Slack、Figma 和 Notion 等服务。但新的 Chrome 扩展程序填补了以往方法无法实现的空白，特别是那些需要用户真实登录的操作。

这款 Chrome 扩展程序使 Codex 能够在 Chrome 浏览器中执行需要登录的任务，特别适合处理 LinkedIn、Salesforce、Gmail 等网站的操作。对于无需登录的公共页面，用户仍然可以使用 Codex 的内置浏览器，确保本地开发和文件预览的流畅性，而不会干扰到 Chrome 的个人资料。

Codex 现已根据任务的不同，使用三个不同的工具层级：有专用集成时使用插件，需要登录时使用 Chrome，其他情况则在本地主机上使用内置浏览器。用户可以通过简单的 @Chrome 语法直接调用 Chrome，系统会自动选择最合适的工具。

扩展程序的功能包括测试 Web 应用、从打开的标签页收集上下文信息，以及在用户执行其他任务时并行使用 Chrome 开发者工具。Codex 的操作以任务特定的标签页组形式进行，因此在执行操作时不会干扰当前的浏览会话。

要安装和使用 Codex Chrome 扩展程序，用户只需按照简易的五个步骤完成安装流程。当前，这一扩展程序支持 macOS 和 Windows，但在欧盟和英国尚不可用。用户需要注意，Codex 需要广泛的浏览器权限以正常运行，同时 OpenAI 也实施了基于站点的确认机制，以降低安全风险。

为确保用户隐私，OpenAI 仅在用户明确添加浏览器活动至聊天上下文时才会存储数据。此外，关闭 “记忆” 功能可确保每个浏览器任务都是独立的，避免受到之前会话的影响。

划重点：

🌐 Codex Chrome 扩展程序上线，支持 LinkedIn、Salesforce 等登录操作。

🔒 安装需五个简单步骤，目前在欧盟和英国不可用。

🛡️ OpenAI 实施安全机制，保护用户隐私与数据安全。

via AI新闻资讯 (author: AI Base)

9 小时前

百度发布文心大模型5.1：搜索能力位居国内首位，预训练成本仅为业界6%

在人工智能竞争白热化的当下，国产大模型再次交出了一份惊艳的答卷。5月9日，百度正式推出了新一代基础大模型——文心大模型5.1。目前，该模型已全面上线百度千帆模型广场及文心一言官网，正式面向企业级用户与开发者开放体验。

本次更新的核心亮点在于其极高的“性价比”与强大的搜索整合能力。据官方介绍，文心5.1采用了创新的“多维弹性预训练”技术。这一技术最早在文心5.0发布时崭露头角，其精髓在于能实现“一次训练，生成多种规模模型”。作为该技术的最新阶段性成果，文心5.1在充分继承5.0版本知识储备的基础上，实现了参数规模的大幅优化:总参数量压缩至约三分之一，激活参数压缩至约二分之一。

令人关注的是，百度通过这一技术将预训练成本降至业界同规模模型的6%左右，却在基础性能上实现了持续领先。在国际权威的大模型竞技场LMArena最新排名中，文心5.1以1223分的成绩夺得搜索榜国内第一、全球第四，成为榜单前列中唯一的国产模型身影。

所谓的“搜索能力”，并非简单的资料堆砌，而是模型对多源信息的快速检索、精准整合及逻辑生成能力。这意味着文心5.1能够输出一致性更高、可靠性更强的回答，在处理复杂业务场景、智能助手交互以及企业知识管理等方面展现出巨大的应用潜力。

除了搜索专长，文心5.1在其他维度也表现强劲。测试数据显示，其Agent（智能体）能力提升显著，已超越DeepSeek-V4-Pro;在创意写作方面，其表现与Gemini3.1Pro旗鼓相当;而在核心的推理能力上，也已逼近全球领先的闭源模型水平。

此前，文心系列模型已多次在文本和视觉理解榜单中稳居国产第一梯队。今年4月底，文心5.1预览版就曾在LMArena文本榜上超越了多款国内外主流模型。

据悉，百度AI开发者大会将于5月13日至14日在北京举行。届时，关于文心5.1的更多技术细节及其在商业化落地方面的具体规划，将得到进一步披露。国产大模型能否凭借这一高效能路线实现弯道超车，业内正拭目以待。

via AI新闻资讯 (author: AI Base)

9 小时前

微软开发的新标签页扩展程序WowTab似乎已经删库跑路官网变成404状态

微软中国团队于2024年1月推出的浏览器新标签页扩展程序 WowTab 疑似已停止维护，官网变为 404，相关域名停止DNS解析，QQ群也已更名。该扩展曾以简洁无广告吸引用户，后期虽加入广告但仍具实用性。目前扩展部分功能仍可运行，但图标加载异常，长期可能面临兼容性问题，建议用户提前寻找替代方案。

via Infinitum 资讯聚合 (author: 山外的鸭子哥)

9 小时前

阶跃星辰发布 StepAudio 2.5 Realtime

5月8日，阶跃星辰发布新一代实时语音大模型 StepAudio 2.5 Realtime，标志着国产大模型在语音交互自然度与智能化方面实现突破。该模型具备“真人级”深度感知能力，能捕捉用户情绪与语境变化，实现智商与情商双重提升，提供更具“人情味”的对话体验。同时支持高度灵活的人设自定义，可适配教育、娱乐、办公等多场景需求。目前模型已全量上线，助力开发者和企业快速接入，推动实时语音交互成为智能设备核心标配。

相关文章：

● 阶跃星辰推出 StepAudio 2.5 Realtime，实时语音 AI 再升级！ - AI新闻资讯
● 阶跃星辰发布StepAudio 2.5 Realtime：赋予大模型真人般的情感与智慧 - AI新闻资讯

via Infinitum 资讯聚合

9 小时前

引用Luke Curley的观点

Luke Curley 批评 WebRTC 在弱网环境下会主动丢弃音频数据包以维持低延迟，导致用户输入的 prompt 不完整。尽管用户宁愿多等 200ms 换取准确性（尤其在使用付费 AI 服务时），但 WebRTC 的设计机制强制优先实时性，无法在浏览器中重传丢失的音频包。这一限制使得语音 AI 应用（如 OpenAI）在追求低延迟的同时，牺牲了输入质量，影响最终响应效果。

via Infinitum 资讯聚合 (author: Simon Willison's Weblog)

9 小时前

2026-05-09日刊

前往官网查看完整版 (hex2077.dev) ### 产品与功能更新 1. 谷歌发布 AI 系统解决数学难题。 2. OpenAI 集成代码模式提升编程体验。 3. 抖音发布新框架解决手机性能瓶颈。 4. Claude 深度集成微软办公软件。 5. OpenAI 发布预览模型寻找代码漏洞。 ### 前沿研究 1. 科研团队实现手机录制生成高保

via Infinitum 资讯聚合

9 小时前

五角大楼在新网站上发布UFO文件

美国国防部（特朗普政府时期更名为“战争部”）近日上线新网站 war.gov/ufo，首次公开一批此前未公开的UFO相关文件，包括不明异常现象（UAP） 的视频、照片及原始政府文件。这些资料经安全审查，但多数尚未分析。文件将持续更新，源于“UAP遭遇解密与报告系统”（PURSUE）跨部门合作。此举回应2017年曝光的2200万美元 Pentagon 秘密项目 AATIP，反映公众对空中异常现象日益增长的关注。

via Infinitum 资讯聚合 (author: Sarah Perez)

9 小时前

阶跃星辰推出 StepAudio 2.5 Realtime，实时语音 AI 再升级！

近日，阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime。该模型现已全面上线，开发者可以通过阶跃星辰开放平台进行接入。StepAudio 2.5 Realtime 旨在为用户提供更为真实的对话体验，围绕副语言感知、人设自定义和对话能力进行了全面的技术提升。

StepAudio 2.5 Realtime 的核心创新在于其对副语言信息的处理能力。副语言包括语调、语速、停顿，以及叹息或轻笑等非文字表达方式，这些细节是传递情感的关键。通过分析这些元素，模型能够感知用户的情绪和潜在意图，例如从低沉的声调中识别出疲惫，或从急促的语速中判断出烦躁情绪，并据此动态调整回复的语气与策略，提升交流的自然感。

在人设自定义方面，StepAudio 2.5 Realtime 允许开发者进行灵活调节。用户可以通过 API 调整 AI 角色的性格特征、背景经历以及语言习惯等。该模型基于超过 10，000 个高质量原生人设，经过算法生成了百万级的人设特征矩阵，并通过大量真实对话数据进行训练。开发团队还进行了强化学习优化，确保模型在极端场景下保持稳定的角色一致性。此外，模型内置了 5 个预设人设，供用户直接体验。

在整体对话能力上，StepAudio 2.5 Realtime 强调智商与情商的双重提升。除了能够深入理解复杂语义、应对交流中的各种情境外，模型还能够调用多领域知识，提供更深层次的对话体验，既能作为情感交流的聊天伙伴，也能模拟专业 HR 进行面试等正式场合。

根据官方最新评测数据显示，该模型在五个测试维度中表现卓越，特别是在用户体验评分中，StepAudio 2.5 Realtime 的得分达到 80.41，显著高于其他同类产品，如 GPT-Realtime-1.5 和 Gemini Live，展示了其强大的性能和应用潜力。

划重点：

🌟 StepAudio 2.5 Realtime 具备先进的副语言处理能力，能精准感知用户情绪。

🎭 用户可通过 API 自定义 AI 角色的性格与背景，提升交互个性化。

📊 官方评测显示，该模型在多项测试中表现优异，得分远超同类产品。

via AI新闻资讯 (author: AI Base)

10 小时前

OpenAI 官宣 Codex 插件接管浏览器，实测复杂任务表现惊人

人工智能领域再次迎来重磅更新。5月7日，OpenAI 官方宣布 Codex for Chrome 扩展功能正式投入应用。这一举动标志着 AI 助手开始深度介入用户的日常网页操作。

该插件的核心逻辑在于赋予 Codex 直接驱动 Chrome 浏览器的能力。在获得用户授权后，Codex 可以像人类一样“阅读”网页内容、操作内部系统，甚至协助填写复杂的表单。这种深度的系统调用，意味着 AI 不再仅仅停留在对话框内，而是成为了能够进入已登录网站执行任务的“数字员工”。

实测表现:简单任务“翻车”，复杂挑战反显身手

在近期的功能测评中，这款扩展程序的表现呈现出一种有趣的反差。

令人意外的是，在处理如整理浏览器标签页等逻辑简单的基础任务时，Codex 偶尔会出现操作失误或识别不精准的情况。然而，当任务难度升级，其展现出的处理能力却让测试者感到惊喜。

在针对苹果、华为、小米等主流品牌旗舰手机的信息搜集任务中，Codex 展现了极高的整合效率。此外，它在生成创作选题、调用 Deepseek 辅助撰稿，以及自动化制作 AI 新闻日报表格等复杂、多步骤的任务中，完成度显著高于预期，展现了极强的生产力属性。

角色定位:值得信赖但需监看的“半自动助手”

尽管展现出了强大的任务处理潜能，但现阶段的 Codex for Chrome 并非完美无缺。

目前的实测反馈显示，该工具在网页元素的精准识别上仍有提升空间。专家建议，现阶段用户应将其视为一名“能干活的半自动助手”。在处理非安全敏感的日常工作时，它能极大地释放人力，但在应对涉及核心隐私或高安全要求的任务时，依然需要人工的全程监看与复核。

随着算法的迭代与识别精度的优化，这种“AI 接管浏览器”的模式，或许将彻底改变我们与互联网信息的交互方式。

via AI新闻资讯 (author: AI Base)

10 小时前

ChatGPT Android 版拆解发现 Codex 手机远控桌面会话功能

ChatGPT Android 版 1.2026.125 的 APK 被拆解发现多处字符串，显示 OpenAI 正在为 Codex 增加手机远程控制桌面会话的能力，支持在手机上查找、重连远程会话，并要求桌面端登录同一账号。这项功能目前仍在开发中，还没有可用预览，正式上线时间也未公布。

Android Authority

🌸在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

10 小时前

谷歌Gmail移动端更新:底部新增“AI Inbox”AI功能快捷入口

谷歌于近期对其移动端Gmail应用进行了交互逻辑的重大调整，正式在界面底部引入了名为“AI Inbox”的全新快捷入口。此举旨在进一步强化其生成式AI写作辅助功能“帮我写”（Help me write）的触达率，通过简化用户唤起大模型能力的路径，加速AI技术在日常生产力场景中的深度渗透。

根据报道显示，这一更新已率先在安卓及iOS平台的移动客户端中上线。新设计的核心变化在于将原先嵌套在菜单中的AI功能外显化，用户在撰写或处理邮件时，通过屏幕底部的常驻入口即可一键激活AI辅助。这种交互布局的改变，标志着谷歌Workspace团队正将AI从“可选插件”转型为“原生核心”，反映出谷歌在移动端办公生态中追求AI入口标准化、直观化的产品策略。

作为谷歌Gemini生态在办公领域的关键应用，“帮我写”功能自推出以来一直处于高频迭代状态。此次UI更新不仅是为了提升操作便利性，更体现了谷歌在与微软Copilot等对手竞争中的战略防御。通过占领移动端有限的屏幕空间，谷歌意在培养用户对Workspace AI的路径依赖，从而巩固其在生产力软件市场的护城河。

随着AI交互入口的重心下移，智能写作与邮件自动处理将不再是隐藏功能，而是成为移动办公的标准配置。这一变化预示着AI大模型正从云端能力全面下沉为终端设备的交互中枢。

via AI新闻资讯 (author: AI Base)

10 小时前

Cloudflare 因 AI 效率提升裁员 1100 人，收入却创历史新高

在最新的季度收益报告中，Cloudflare 宣布将裁员约 20%，相当于 1100 名员工。这一举措使得 Cloudflare 成为又一家在报告收入增长的同时进行大规模裁员的科技公司，类似于 Meta、微软和亚马逊等同行。公司首席执行官马修・普林斯表示，这一裁员并不是因为业绩不佳，而是因为人工智能技术带来了显著的效率提升。

Cloudflare 提供的互联网安全和性能服务如今已覆盖全球数百万个网站。在周四的财报中，该公司公布的季度收入达到 6.398 亿美元，同比增长 34%，创下了公司历史上的单季度收入新高。然而，尽管收入飙升，Cloudflare 的亏损也扩大了，从去年同期的 5320 万美元增至本季度的 6200 万美元。普林斯承认，公司在迅速发展的同时尚未实现持续盈利，但他强调亏损占收入的比例仍然较小。

普林斯在电话会议中指出，裁员的主要原因在于公司内部的人工智能使用率已大幅上升。他透露，自去年 11 月以来，Cloudflare 的员工生产力显著提高，部分团队成员的工作效率提升了 2 倍、10 倍甚至 100 倍。他形象地将这一转变比作 “从手动工具转变为电动工具”。过去三个月，Cloudflare 内部的 AI 使用率增长超过 600%。

不仅开发团队在使用 AI，整个公司的各个部门，包括人力资源、财务和市场营销，都在日常工作中频繁使用 AI 工具来提高工作效率。因此，随着员工效率的提高，对支持角色的需求显著下降。普林斯表示，虽然进行裁员，但公司仍将继续招聘并投资于新员工，因为掌握这些工具的员工比以往更具生产力。他预计到 2027 年，Cloudflare 的员工人数将超过 2026 年的任何时刻。

Cloudflare 在裁员前的员工总数约为 5500 人。这种在收入强劲增长时期裁员的模式在科技行业越来越普遍，未来对此的讨论将持续引发关注。

划重点：

🧑‍💻 Cloudflare 宣布裁员 1100 人，裁员比例达到 20%。

📈 公司季度收入创历史新高，达到 6.398 亿美元，同比增长 34%。

🤖 人工智能的使用效率显著提升，推动了裁员决定。

via AI新闻资讯 (author: AI Base)

11 小时前

下架万部作品！短剧巨头向“劣质AI内容”开刀，行业洗牌加速

近期，短剧市场迎来一场重磅“清网”行动。知名短剧平台红果短剧宣布，针对平台内利用AI技术粗制滥造的低质量内容展开大规模专项整治。截至目前，已有超过一万部AI剧集被清理下架，此举在行业内引发了广泛关注。

据悉，此次治理行动的重点指向了那些内容低俗猎奇、画面视觉粗糙、剧情逻辑严重脱节以及通过渲染极端情绪来博取流量的作品。这些作品普遍存在依赖技术走捷径、忽视创作基本规律的问题，严重影响了用户的观看体验。

红果短剧相关负责人表示，平台并非排斥AI技术的创新应用，而是反对那种“唯技术论”的浮躁创作心态。技术应当是创意的翅膀，而非劣质内容的遮羞布。通过此次“腾笼换鸟”式的治理，平台旨在清理掉阻碍行业健康发展的冗余内容，为优质创作腾出空间，从而构建一个更加公平、良性的竞争生态。

业内分析人士指出，随着AI技术的普及，短剧创作门槛大幅降低，但也导致了内容质量的良莠不齐。红果短剧此次果断“瘦身”，释放出一个明确信号：短剧行业正在从早期的规模扩张阶段，转向追求高质量发展的新阶段。

未来，AI短剧的竞争核心将回归到“内容为王”的本质。单纯依靠算法生成和技术堆砌的作品将难以立足，只有将前沿技术与深厚创意深度协同，才能在瞬息万变的市场中行稳致远。

via AI新闻资讯 (author: AI Base)

11 小时前

蚂蚁百灵发布万亿级思考模型 Ring-2.6-1T，支持推理强度自定义

近日，蚂蚁百灵（Ant Ling）宣布正式发布万亿级旗舰思考模型 Ring-2.6-1T。该模型专为 Agent 工作流、工程开发及科研分析等复杂生产环境打造，核心引入了可调节的 Reasoning Effort 机制，旨在打破大模型推理能力与资源消耗之间的固定配比，解决真实任务中推理成本与执行效率的平衡难题。

Ring-2.6-1T 提供 high 与 xhigh 两种推理强度模式。其中，high 模式针对高频 Agent 协作优化，具备低 Token 开销与快速多步执行特性，适用于多轮交互与任务拆解;xhigh 模式则面向数学竞赛、复杂逻辑探索等极端任务，提供更充分的思考空间。

在真实任务评测中，high 模式于 PinchBench 获得87.60分，超越了 GPT-5.4xHigh 及 Claude-Opus-4.7xhigh 等竞品;而在高难度推理层面，xhigh 模式在 AIME26取得95.83分，GPQA Diamond 达到88.27分，展现出稳健的科学理解能力。

此次发布标志着大模型竞争正从纯粹的参数规模竞赛转向“推理效能”的精细化运营。通过开放可调节的思考深度，Ring-2.6-1T 为开发者提供了更灵活的成本控制工具，有助于推动 AI 智能体在企业级工作流中的常态化落地。目前，该模型已上线 OpenRouter 开放限时一周免费体验，并计划于近期正式开源，此举有望进一步完善开源生态中的万亿级推理模型版图。

via AI新闻资讯 (author: AI Base)

Before

After