https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
突破 300 款!国内最强大模型服务平台上线,AI调用成本直降30%

5月8日,中国移动推出国内首个超大规模AI模型服务平台,集成超300款主流大模型,成为国内模型数量最多的集成化平台。该平台首创“词元集约化”模式,支持成本、效果、均衡三种智能匹配策略,并实现秒级故障切换,保障服务连续性。上线后,AI调用成本降低30%,资源占用减少50%以上,日均调用量突破千亿,显著提升AI应用效率与稳定性。

via Infinitum 资讯聚合 (author: AI Base)
百度发布文心大模型5.1:搜索能力位居国内首位,预训练成本仅为业界6%

百度于5月9日正式发布新一代基础大模型文心大模型5.1,已上线千帆模型广场及文心一言官网,面向企业与开发者开放。该模型采用“多维弹性预训练”技术,预训练成本仅为业界同规模模型的6%,参数规模大幅压缩,但性能持续领先。在LMArena最新排名中,其搜索能力位居国内第一、全球第四,成为榜单前列唯一国产模型。此外,其在智能体、创意写作和推理能力方面均表现强劲,逼近国际领先水平。

via Infinitum 资讯聚合 (author: AI Base)
报道称DeepSeek 计划加速模型发布,V4.1 更新预计将在 6 月亮相

DeepSeek公司近期宣布,将在 6 月推出其 V4 模型的更新版本 V4.1,并计划加快模型发布频率,以追赶行业竞争对手。此前,DeepSeek 因技术深度受到好评,但其模型迭代速度明显滞后于其他 AI 公司,140 天内未发布任何新模型,而同期多家全球主要 AI 公司共发布了约 50 个新模型。

DeepSeek 的 V4 模型本定于 2026 年 2 月发布,但因硬件迁移等问题,发布日期被推迟至 4 月 24 日,最终以预览版形式上线,包含 V4-Pro 和 V4-Flash 两个版本。尽管新版本在文本和代码生成方面表现出色,但仍缺乏图像和音频处理能力。V4.1 将致力于弥补这一短板,力求实现真正的全模态覆盖。

此外,V4.1 将支持 Model Context Protocol(MCP),并提供更丰富的企业级工具链,标志着 DeepSeek 从技术展示向企业应用的转型。此次战略转变正是面对人才流失和算力成本上升的压力,DeepSeek 的创始人梁文锋将个人出资约 200 亿元,以支持公司发展,并吸引外部投资。

DeepSeek 目前正在寻求约 500 亿元人民币的融资,若成功将成为中国 AI 创业公司单轮融资的新纪录。创始人的个人投资和国家集成电路产业投资基金的参与,表明对公司未来的强烈信心。随着 V4.1 的发布及融资的顺利完成,DeepSeek 将朝着可持续商业实体迈出重要一步。

划重点:

🌟 DeepSeek 将在 6 月推出 V4.1 更新,计划加快模型发布频率。

🔍 V4.1 将弥补图像和音频处理能力,实现全模态覆盖。

💰 公司正在寻求约 500 亿元融资,以支持其转型和发展。


via AI新闻资讯 (author: AI Base)
OpenAI 推出 Codex Chrome 扩展程序,提升浏览器操作效率

OpenAI 近日推出了一款适用于 Mac 和 PC 的 Codex Chrome 扩展程序,旨在简化用户在浏览器中执行各种任务的流程。此次更新是为了迎合越来越多用户在浏览器中工作的趋势,使 Codex 能够更加高效地完成 Web 相关的任务。

在此之前,Codex 通过内置的沙盒浏览器和不断扩展的插件库来执行任务,支持 GitHub、Slack、Figma 和 Notion 等服务。但新的 Chrome 扩展程序填补了以往方法无法实现的空白,特别是那些需要用户真实登录的操作。

这款 Chrome 扩展程序使 Codex 能够在 Chrome 浏览器中执行需要登录的任务,特别适合处理 LinkedIn、Salesforce、Gmail 等网站的操作。对于无需登录的公共页面,用户仍然可以使用 Codex 的内置浏览器,确保本地开发和文件预览的流畅性,而不会干扰到 Chrome 的个人资料。

Codex 现已根据任务的不同,使用三个不同的工具层级:有专用集成时使用插件,需要登录时使用 Chrome,其他情况则在本地主机上使用内置浏览器。用户可以通过简单的 @Chrome 语法直接调用 Chrome,系统会自动选择最合适的工具。

扩展程序的功能包括测试 Web 应用、从打开的标签页收集上下文信息,以及在用户执行其他任务时并行使用 Chrome 开发者工具。Codex 的操作以任务特定的标签页组形式进行,因此在执行操作时不会干扰当前的浏览会话。

要安装和使用 Codex Chrome 扩展程序,用户只需按照简易的五个步骤完成安装流程。当前,这一扩展程序支持 macOS 和 Windows,但在欧盟和英国尚不可用。用户需要注意,Codex 需要广泛的浏览器权限以正常运行,同时 OpenAI 也实施了基于站点的确认机制,以降低安全风险。

为确保用户隐私,OpenAI 仅在用户明确添加浏览器活动至聊天上下文时才会存储数据。此外,关闭 “记忆” 功能可确保每个浏览器任务都是独立的,避免受到之前会话的影响。

划重点:

🌐 Codex Chrome 扩展程序上线,支持 LinkedIn、Salesforce 等登录操作。

🔒 安装需五个简单步骤,目前在欧盟和英国不可用。

🛡️ OpenAI 实施安全机制,保护用户隐私与数据安全。



via AI新闻资讯 (author: AI Base)
百度发布文心大模型5.1:搜索能力位居国内首位,预训练成本仅为业界6%

在人工智能竞争白热化的当下,国产大模型再次交出了一份惊艳的答卷。5月9日,百度正式推出了新一代基础大模型——文心大模型5.1。目前,该模型已全面上线百度千帆模型广场及文心一言官网,正式面向企业级用户与开发者开放体验。

本次更新的核心亮点在于其极高的“性价比”与强大的搜索整合能力。据官方介绍,文心5.1采用了创新的“多维弹性预训练”技术。这一技术最早在文心5.0发布时崭露头角,其精髓在于能实现“一次训练,生成多种规模模型”。作为该技术的最新阶段性成果,文心5.1在充分继承5.0版本知识储备的基础上,实现了参数规模的大幅优化:总参数量压缩至约三分之一,激活参数压缩至约二分之一。

令人关注的是,百度通过这一技术将预训练成本降至业界同规模模型的6%左右,却在基础性能上实现了持续领先。在国际权威的大模型竞技场LMArena最新排名中,文心5.1以1223分的成绩夺得搜索榜国内第一、全球第四,成为榜单前列中唯一的国产模型身影。

所谓的“搜索能力”,并非简单的资料堆砌,而是模型对多源信息的快速检索、精准整合及逻辑生成能力。这意味着文心5.1能够输出一致性更高、可靠性更强的回答,在处理复杂业务场景、智能助手交互以及企业知识管理等方面展现出巨大的应用潜力。

除了搜索专长,文心5.1在其他维度也表现强劲。测试数据显示,其Agent(智能体)能力提升显著,已超越DeepSeek-V4-Pro;在创意写作方面,其表现与Gemini3.1Pro旗鼓相当;而在核心的推理能力上,也已逼近全球领先的闭源模型水平。

此前,文心系列模型已多次在文本和视觉理解榜单中稳居国产第一梯队。今年4月底,文心5.1预览版就曾在LMArena文本榜上超越了多款国内外主流模型。

据悉,百度AI开发者大会将于5月13日至14日在北京举行。届时,关于文心5.1的更多技术细节及其在商业化落地方面的具体规划,将得到进一步披露。国产大模型能否凭借这一高效能路线实现弯道超车,业内正拭目以待。

via AI新闻资讯 (author: AI Base)
微软开发的新标签页扩展程序WowTab似乎已经删库跑路 官网变成404状态

微软中国团队于2024年1月推出的浏览器新标签页扩展程序 WowTab 疑似已停止维护,官网变为 404,相关域名停止DNS解析,QQ群也已更名。该扩展曾以简洁无广告吸引用户,后期虽加入广告但仍具实用性。目前扩展部分功能仍可运行,但图标加载异常,长期可能面临兼容性问题,建议用户提前寻找替代方案。

via Infinitum 资讯聚合 (author: 山外的鸭子哥)
阶跃星辰 发布 StepAudio 2.5 Realtime

5月8日,阶跃星辰发布新一代实时语音大模型 StepAudio 2.5 Realtime,标志着国产大模型在语音交互自然度与智能化方面实现突破。该模型具备“真人级”深度感知能力,能捕捉用户情绪与语境变化,实现智商与情商双重提升,提供更具“人情味”的对话体验。同时支持高度灵活的人设自定义,可适配教育、娱乐、办公等多场景需求。目前模型已全量上线,助力开发者和企业快速接入,推动实时语音交互成为智能设备核心标配。

相关文章:

阶跃星辰推出 StepAudio 2.5 Realtime,实时语音 AI 再升级! - AI新闻资讯
阶跃星辰发布StepAudio 2.5 Realtime:赋予大模型真人般的情感与智慧 - AI新闻资讯

via Infinitum 资讯聚合
引用Luke Curley的观点

Luke Curley 批评 WebRTC 在弱网环境下会主动丢弃音频数据包以维持低延迟,导致用户输入的 prompt 不完整。尽管用户宁愿多等 200ms 换取准确性(尤其在使用付费 AI 服务时),但 WebRTC 的设计机制强制优先实时性,无法在浏览器中重传丢失的音频包。这一限制使得语音 AI 应用(如 OpenAI)在追求低延迟的同时,牺牲了输入质量,影响最终响应效果。

via Infinitum 资讯聚合 (author: Simon Willison's Weblog)
2026-05-09日刊

前往官网查看完整版 (hex2077.dev) ### 产品与功能更新 1. 谷歌 发布 AI 系统解决数学难题。 2. OpenAI 集成代码模式提升编程体验。 3. 抖音 发布新框架解决手机性能瓶颈。 4. Claude 深度集成微软办公软件。 5. OpenAI 发布预览模型寻找代码漏洞。 ### 前沿研究 1. 科研团队 实现手机录制生成高保

via Infinitum 资讯聚合
五角大楼在新网站上发布UFO文件

美国国防部(特朗普政府时期更名为“战争部”)近日上线新网站 war.gov/ufo,首次公开一批此前未公开的UFO相关文件,包括不明异常现象(UAP) 的视频、照片及原始政府文件。这些资料经安全审查,但多数尚未分析。文件将持续更新,源于“UAP遭遇解密与报告系统”(PURSUE)跨部门合作。此举回应2017年曝光的2200万美元 Pentagon 秘密项目 AATIP,反映公众对空中异常现象日益增长的关注。

via Infinitum 资讯聚合 (author: Sarah Perez)
阶跃星辰推出 StepAudio 2.5 Realtime,实时语音 AI 再升级!

近日,阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime。该模型现已全面上线,开发者可以通过阶跃星辰开放平台进行接入。StepAudio 2.5 Realtime 旨在为用户提供更为真实的对话体验,围绕副语言感知、人设自定义和对话能力进行了全面的技术提升。

StepAudio 2.5 Realtime 的核心创新在于其对副语言信息的处理能力。副语言包括语调、语速、停顿,以及叹息或轻笑等非文字表达方式,这些细节是传递情感的关键。通过分析这些元素,模型能够感知用户的情绪和潜在意图,例如从低沉的声调中识别出疲惫,或从急促的语速中判断出烦躁情绪,并据此动态调整回复的语气与策略,提升交流的自然感。

在人设自定义方面,StepAudio 2.5 Realtime 允许开发者进行灵活调节。用户可以通过 API 调整 AI 角色的性格特征、背景经历以及语言习惯等。该模型基于超过 10,000 个高质量原生人设,经过算法生成了百万级的人设特征矩阵,并通过大量真实对话数据进行训练。开发团队还进行了强化学习优化,确保模型在极端场景下保持稳定的角色一致性。此外,模型内置了 5 个预设人设,供用户直接体验。

在整体对话能力上,StepAudio 2.5 Realtime 强调智商与情商的双重提升。除了能够深入理解复杂语义、应对交流中的各种情境外,模型还能够调用多领域知识,提供更深层次的对话体验,既能作为情感交流的聊天伙伴,也能模拟专业 HR 进行面试等正式场合。

根据官方最新评测数据显示,该模型在五个测试维度中表现卓越,特别是在用户体验评分中,StepAudio 2.5 Realtime 的得分达到 80.41,显著高于其他同类产品,如 GPT-Realtime-1.5 和 Gemini Live,展示了其强大的性能和应用潜力。

划重点:

🌟 StepAudio 2.5 Realtime 具备先进的副语言处理能力,能精准感知用户情绪。

🎭 用户可通过 API 自定义 AI 角色的性格与背景,提升交互个性化。

📊 官方评测显示,该模型在多项测试中表现优异,得分远超同类产品。



via AI新闻资讯 (author: AI Base)
OpenAI 官宣 Codex 插件接管浏览器,实测复杂任务表现惊人

人工智能领域再次迎来重磅更新。5月7日,OpenAI 官方宣布 Codex for Chrome 扩展功能正式投入应用。这一举动标志着 AI 助手开始深度介入用户的日常网页操作。

该插件的核心逻辑在于赋予 Codex 直接驱动 Chrome 浏览器的能力。在获得用户授权后,Codex 可以像人类一样“阅读”网页内容、操作内部系统,甚至协助填写复杂的表单。这种深度的系统调用,意味着 AI 不再仅仅停留在对话框内,而是成为了能够进入已登录网站执行任务的“数字员工”。

实测表现:简单任务“翻车”,复杂挑战反显身手

在近期的功能测评中,这款扩展程序的表现呈现出一种有趣的反差。

令人意外的是,在处理如整理浏览器标签页等逻辑简单的基础任务时,Codex 偶尔会出现操作失误或识别不精准的情况。然而,当任务难度升级,其展现出的处理能力却让测试者感到惊喜。

在针对苹果、华为、小米等主流品牌旗舰手机的信息搜集任务中,Codex 展现了极高的整合效率。此外,它在生成创作选题、调用 Deepseek 辅助撰稿,以及自动化制作 AI 新闻日报表格等复杂、多步骤的任务中,完成度显著高于预期,展现了极强的生产力属性。

角色定位:值得信赖但需监看的“半自动助手”

尽管展现出了强大的任务处理潜能,但现阶段的 Codex for Chrome 并非完美无缺。

目前的实测反馈显示,该工具在网页元素的精准识别上仍有提升空间。专家建议,现阶段用户应将其视为一名“能干活的半自动助手”。在处理非安全敏感的日常工作时,它能极大地释放人力,但在应对涉及核心隐私或高安全要求的任务时,依然需要人工的全程监看与复核。

随着算法的迭代与识别精度的优化,这种“AI 接管浏览器”的模式,或许将彻底改变我们与互联网信息的交互方式。

via AI新闻资讯 (author: AI Base)
ChatGPT Android 版拆解发现 Codex 手机远控桌面会话功能

ChatGPT Android 版 1.2026.125 的 APK 被拆解发现多处字符串,显示 OpenAI 正在为 Codex 增加手机远程控制桌面会话的能力,支持在手机上查找、重连远程会话,并要求桌面端登录同一账号。这项功能目前仍在开发中,还没有可用预览,正式上线时间也未公布。

Android Authority

🌸在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
谷歌Gmail移动端更新:底部新增“AI Inbox”AI功能快捷入口

谷歌于近期对其移动端Gmail应用进行了交互逻辑的重大调整,正式在界面底部引入了名为“AI Inbox”的全新快捷入口。此举旨在进一步强化其生成式AI写作辅助功能“帮我写”(Help me write)的触达率,通过简化用户唤起大模型能力的路径,加速AI技术在日常生产力场景中的深度渗透。

根据报道显示,这一更新已率先在安卓及iOS平台的移动客户端中上线。新设计的核心变化在于将原先嵌套在菜单中的AI功能外显化,用户在撰写或处理邮件时,通过屏幕底部的常驻入口即可一键激活AI辅助。这种交互布局的改变,标志着谷歌Workspace团队正将AI从“可选插件”转型为“原生核心”,反映出谷歌在移动端办公生态中追求AI入口标准化、直观化的产品策略。

作为谷歌Gemini生态在办公领域的关键应用,“帮我写”功能自推出以来一直处于高频迭代状态。此次UI更新不仅是为了提升操作便利性,更体现了谷歌在与微软Copilot等对手竞争中的战略防御。通过占领移动端有限的屏幕空间,谷歌意在培养用户对Workspace AI的路径依赖,从而巩固其在生产力软件市场的护城河。

随着AI交互入口的重心下移,智能写作与邮件自动处理将不再是隐藏功能,而是成为移动办公的标准配置。这一变化预示着AI大模型正从云端能力全面下沉为终端设备的交互中枢。

via AI新闻资讯 (author: AI Base)
Cloudflare 因 AI 效率提升裁员 1100 人,收入却创历史新高

在最新的季度收益报告中,Cloudflare 宣布将裁员约 20%,相当于 1100 名员工。这一举措使得 Cloudflare 成为又一家在报告收入增长的同时进行大规模裁员的科技公司,类似于 Meta、微软和亚马逊等同行。公司首席执行官马修・普林斯表示,这一裁员并不是因为业绩不佳,而是因为人工智能技术带来了显著的效率提升。

Cloudflare 提供的互联网安全和性能服务如今已覆盖全球数百万个网站。在周四的财报中,该公司公布的季度收入达到 6.398 亿美元,同比增长 34%,创下了公司历史上的单季度收入新高。然而,尽管收入飙升,Cloudflare 的亏损也扩大了,从去年同期的 5320 万美元增至本季度的 6200 万美元。普林斯承认,公司在迅速发展的同时尚未实现持续盈利,但他强调亏损占收入的比例仍然较小。

普林斯在电话会议中指出,裁员的主要原因在于公司内部的人工智能使用率已大幅上升。他透露,自去年 11 月以来,Cloudflare 的员工生产力显著提高,部分团队成员的工作效率提升了 2 倍、10 倍甚至 100 倍。他形象地将这一转变比作 “从手动工具转变为电动工具”。过去三个月,Cloudflare 内部的 AI 使用率增长超过 600%。

不仅开发团队在使用 AI,整个公司的各个部门,包括人力资源、财务和市场营销,都在日常工作中频繁使用 AI 工具来提高工作效率。因此,随着员工效率的提高,对支持角色的需求显著下降。普林斯表示,虽然进行裁员,但公司仍将继续招聘并投资于新员工,因为掌握这些工具的员工比以往更具生产力。他预计到 2027 年,Cloudflare 的员工人数将超过 2026 年的任何时刻。

Cloudflare 在裁员前的员工总数约为 5500 人。这种在收入强劲增长时期裁员的模式在科技行业越来越普遍,未来对此的讨论将持续引发关注。

划重点:

🧑‍💻 Cloudflare 宣布裁员 1100 人,裁员比例达到 20%。

📈 公司季度收入创历史新高,达到 6.398 亿美元,同比增长 34%。

🤖 人工智能的使用效率显著提升,推动了裁员决定。



via AI新闻资讯 (author: AI Base)
下架万部作品!短剧巨头向“劣质AI内容”开刀,行业洗牌加速

近期,短剧市场迎来一场重磅“清网”行动。知名短剧平台红果短剧宣布,针对平台内利用AI技术粗制滥造的低质量内容展开大规模专项整治。截至目前,已有超过一万部AI剧集被清理下架,此举在行业内引发了广泛关注。

据悉,此次治理行动的重点指向了那些内容低俗猎奇、画面视觉粗糙、剧情逻辑严重脱节以及通过渲染极端情绪来博取流量的作品。这些作品普遍存在依赖技术走捷径、忽视创作基本规律的问题,严重影响了用户的观看体验。

红果短剧相关负责人表示,平台并非排斥AI技术的创新应用,而是反对那种“唯技术论”的浮躁创作心态。技术应当是创意的翅膀,而非劣质内容的遮羞布。通过此次“腾笼换鸟”式的治理,平台旨在清理掉阻碍行业健康发展的冗余内容,为优质创作腾出空间,从而构建一个更加公平、良性的竞争生态。

业内分析人士指出,随着AI技术的普及,短剧创作门槛大幅降低,但也导致了内容质量的良莠不齐。红果短剧此次果断“瘦身”,释放出一个明确信号:短剧行业正在从早期的规模扩张阶段,转向追求高质量发展的新阶段。

未来,AI短剧的竞争核心将回归到“内容为王”的本质。单纯依靠算法生成和技术堆砌的作品将难以立足,只有将前沿技术与深厚创意深度协同,才能在瞬息万变的市场中行稳致远。

via AI新闻资讯 (author: AI Base)
蚂蚁百灵发布万亿级思考模型 Ring-2.6-1T,支持推理强度自定义

近日,蚂蚁百灵(Ant Ling)宣布正式发布万亿级旗舰思考模型 Ring-2.6-1T。该模型专为 Agent 工作流、工程开发及科研分析等复杂生产环境打造,核心引入了可调节的 Reasoning Effort 机制,旨在打破大模型推理能力与资源消耗之间的固定配比,解决真实任务中推理成本与执行效率的平衡难题。

Ring-2.6-1T 提供 high 与 xhigh 两种推理强度模式。其中,high 模式针对高频 Agent 协作优化,具备低 Token 开销与快速多步执行特性,适用于多轮交互与任务拆解;xhigh 模式则面向数学竞赛、复杂逻辑探索等极端任务,提供更充分的思考空间。

在真实任务评测中,high 模式于 PinchBench 获得87.60分,超越了 GPT-5.4xHigh 及 Claude-Opus-4.7xhigh 等竞品;而在高难度推理层面,xhigh 模式在 AIME26取得95.83分,GPQA Diamond 达到88.27分,展现出稳健的科学理解能力。

此次发布标志着大模型竞争正从纯粹的参数规模竞赛转向“推理效能”的精细化运营。通过开放可调节的思考深度,Ring-2.6-1T 为开发者提供了更灵活的成本控制工具,有助于推动 AI 智能体在企业级工作流中的常态化落地。目前,该模型已上线 OpenRouter 开放限时一周免费体验,并计划于近期正式开源,此举有望进一步完善开源生态中的万亿级推理模型版图。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]