https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
🤔 《人月神话》:AI“10x”与 Brooks 定律

这场讨论围绕《人月神话》作者 Fred Brooks 的经典观点展开,探讨 AI(如 Claude Code 和 LLM)是否真能实现 10 倍开发效率。尽管部分人认为 AI 是“银弹”,但反对者指出,代码产出增加不等于整体效率提升,且 Brooks 定律(加人反而拖慢项目)在沟通成本高的今天依然适用。讨论还延伸至人口与养老问题,借用“九个月生孩子”比喻,设想通过自动化养老机器人缓解社会压力。核心结论是:工具进步难改软件工程本质规律。

via Infinitum 资讯聚合
🤨 无电发光?发光藻类照明仍离实用很远

发光藻类发光植物虽能实现“无电照明”,但其本质依赖生物代谢供能,并非真正“无能源”,亮度低、稳定性差,实用性远不及传统照明。目前多用于科研展示或装饰,如3D打印凝胶载体或氛围灯,尚无法替代LED等成熟技术。评论普遍认为,此类项目价值在于实验性与审美,而非实际应用。

via Infinitum 资讯聚合
暴涨981%!三七互娱投资智谱“大获全胜”,游戏巨头正集体押注AI下半场

三七互娱因投资企业智谱上市后股价飙升,2026年一季度投资收益达3.59亿元,同比暴涨981.35%,凸显其在AI领域的战略布局成效。公司聚焦游戏主业,通过投资智谱、月之暗面等AI大模型企业,构建技术协同矩阵,并应用于“小七智能体”平台,提升研发效率。当前,游戏行业正掀起AI抢滩潮,米哈游、巨人网络等纷纷押注AI技术与算力,竞争重心转向“AI技术力+算力储备”的综合实力。

via Infinitum 资讯聚合 (author: AI Base)
大模型为何“查无此人”?MiniMax 深度复盘“马嘉祺”消失背后的技术真相

MiniMax M2系列模型在输出“马嘉祺”时出现异常,经排查发现是后训练阶段低频Token退化所致。分词器将“嘉祺”合并为独立Token,但因后训练样本不足,该Token被高频Token挤压偏移,导致模型无法正确输出,转而生成音近词。扫描显示4.9%的Token退化,其中日语退化率高达29.7%,并伴随SEO垃圾词遗忘。MiniMax通过全词表合成数据、混入预训练语料及词表监控三项策略修复,显著提升参数稳定性。

via Infinitum 资讯聚合 (author: AI Base)
报道称DeepSeek 计划加速模型发布,V4.1 更新预计将在 6 月亮相

DeepSeek 宣布将于 6 月 推出 V4.1 模型更新,旨在加快发布节奏以追赶行业步伐。此前其模型迭代滞后,140 天内无新模型发布。V4.1 将弥补 图像与音频处理能力 短板,实现 全模态覆盖,并支持 MCP 协议 和增强企业级工具链,标志其向商业应用转型。公司正寻求 500 亿元融资,创始人梁文锋个人出资约 200 亿元,以应对人才与算力挑战,推动可持续发展。

via Infinitum 资讯聚合 (author: AI Base)
突破 300 款!国内最强大模型服务平台上线,AI调用成本直降30%

5月8日,中国移动推出国内首个超大规模AI模型服务平台,集成超300款主流大模型,成为国内模型数量最多的集成化平台。该平台首创“词元集约化”模式,支持成本、效果、均衡三种智能匹配策略,并实现秒级故障切换,保障服务连续性。上线后,AI调用成本降低30%,资源占用减少50%以上,日均调用量突破千亿,显著提升AI应用效率与稳定性。

via Infinitum 资讯聚合 (author: AI Base)
百度发布文心大模型5.1:搜索能力位居国内首位,预训练成本仅为业界6%

百度于5月9日正式发布新一代基础大模型文心大模型5.1,已上线千帆模型广场及文心一言官网,面向企业与开发者开放。该模型采用“多维弹性预训练”技术,预训练成本仅为业界同规模模型的6%,参数规模大幅压缩,但性能持续领先。在LMArena最新排名中,其搜索能力位居国内第一、全球第四,成为榜单前列唯一国产模型。此外,其在智能体、创意写作和推理能力方面均表现强劲,逼近国际领先水平。

via Infinitum 资讯聚合 (author: AI Base)
报道称DeepSeek 计划加速模型发布,V4.1 更新预计将在 6 月亮相

DeepSeek公司近期宣布,将在 6 月推出其 V4 模型的更新版本 V4.1,并计划加快模型发布频率,以追赶行业竞争对手。此前,DeepSeek 因技术深度受到好评,但其模型迭代速度明显滞后于其他 AI 公司,140 天内未发布任何新模型,而同期多家全球主要 AI 公司共发布了约 50 个新模型。

DeepSeek 的 V4 模型本定于 2026 年 2 月发布,但因硬件迁移等问题,发布日期被推迟至 4 月 24 日,最终以预览版形式上线,包含 V4-Pro 和 V4-Flash 两个版本。尽管新版本在文本和代码生成方面表现出色,但仍缺乏图像和音频处理能力。V4.1 将致力于弥补这一短板,力求实现真正的全模态覆盖。

此外,V4.1 将支持 Model Context Protocol(MCP),并提供更丰富的企业级工具链,标志着 DeepSeek 从技术展示向企业应用的转型。此次战略转变正是面对人才流失和算力成本上升的压力,DeepSeek 的创始人梁文锋将个人出资约 200 亿元,以支持公司发展,并吸引外部投资。

DeepSeek 目前正在寻求约 500 亿元人民币的融资,若成功将成为中国 AI 创业公司单轮融资的新纪录。创始人的个人投资和国家集成电路产业投资基金的参与,表明对公司未来的强烈信心。随着 V4.1 的发布及融资的顺利完成,DeepSeek 将朝着可持续商业实体迈出重要一步。

划重点:

🌟 DeepSeek 将在 6 月推出 V4.1 更新,计划加快模型发布频率。

🔍 V4.1 将弥补图像和音频处理能力,实现全模态覆盖。

💰 公司正在寻求约 500 亿元融资,以支持其转型和发展。


via AI新闻资讯 (author: AI Base)
OpenAI 推出 Codex Chrome 扩展程序,提升浏览器操作效率

OpenAI 近日推出了一款适用于 Mac 和 PC 的 Codex Chrome 扩展程序,旨在简化用户在浏览器中执行各种任务的流程。此次更新是为了迎合越来越多用户在浏览器中工作的趋势,使 Codex 能够更加高效地完成 Web 相关的任务。

在此之前,Codex 通过内置的沙盒浏览器和不断扩展的插件库来执行任务,支持 GitHub、Slack、Figma 和 Notion 等服务。但新的 Chrome 扩展程序填补了以往方法无法实现的空白,特别是那些需要用户真实登录的操作。

这款 Chrome 扩展程序使 Codex 能够在 Chrome 浏览器中执行需要登录的任务,特别适合处理 LinkedIn、Salesforce、Gmail 等网站的操作。对于无需登录的公共页面,用户仍然可以使用 Codex 的内置浏览器,确保本地开发和文件预览的流畅性,而不会干扰到 Chrome 的个人资料。

Codex 现已根据任务的不同,使用三个不同的工具层级:有专用集成时使用插件,需要登录时使用 Chrome,其他情况则在本地主机上使用内置浏览器。用户可以通过简单的 @Chrome 语法直接调用 Chrome,系统会自动选择最合适的工具。

扩展程序的功能包括测试 Web 应用、从打开的标签页收集上下文信息,以及在用户执行其他任务时并行使用 Chrome 开发者工具。Codex 的操作以任务特定的标签页组形式进行,因此在执行操作时不会干扰当前的浏览会话。

要安装和使用 Codex Chrome 扩展程序,用户只需按照简易的五个步骤完成安装流程。当前,这一扩展程序支持 macOS 和 Windows,但在欧盟和英国尚不可用。用户需要注意,Codex 需要广泛的浏览器权限以正常运行,同时 OpenAI 也实施了基于站点的确认机制,以降低安全风险。

为确保用户隐私,OpenAI 仅在用户明确添加浏览器活动至聊天上下文时才会存储数据。此外,关闭 “记忆” 功能可确保每个浏览器任务都是独立的,避免受到之前会话的影响。

划重点:

🌐 Codex Chrome 扩展程序上线,支持 LinkedIn、Salesforce 等登录操作。

🔒 安装需五个简单步骤,目前在欧盟和英国不可用。

🛡️ OpenAI 实施安全机制,保护用户隐私与数据安全。



via AI新闻资讯 (author: AI Base)
百度发布文心大模型5.1:搜索能力位居国内首位,预训练成本仅为业界6%

在人工智能竞争白热化的当下,国产大模型再次交出了一份惊艳的答卷。5月9日,百度正式推出了新一代基础大模型——文心大模型5.1。目前,该模型已全面上线百度千帆模型广场及文心一言官网,正式面向企业级用户与开发者开放体验。

本次更新的核心亮点在于其极高的“性价比”与强大的搜索整合能力。据官方介绍,文心5.1采用了创新的“多维弹性预训练”技术。这一技术最早在文心5.0发布时崭露头角,其精髓在于能实现“一次训练,生成多种规模模型”。作为该技术的最新阶段性成果,文心5.1在充分继承5.0版本知识储备的基础上,实现了参数规模的大幅优化:总参数量压缩至约三分之一,激活参数压缩至约二分之一。

令人关注的是,百度通过这一技术将预训练成本降至业界同规模模型的6%左右,却在基础性能上实现了持续领先。在国际权威的大模型竞技场LMArena最新排名中,文心5.1以1223分的成绩夺得搜索榜国内第一、全球第四,成为榜单前列中唯一的国产模型身影。

所谓的“搜索能力”,并非简单的资料堆砌,而是模型对多源信息的快速检索、精准整合及逻辑生成能力。这意味着文心5.1能够输出一致性更高、可靠性更强的回答,在处理复杂业务场景、智能助手交互以及企业知识管理等方面展现出巨大的应用潜力。

除了搜索专长,文心5.1在其他维度也表现强劲。测试数据显示,其Agent(智能体)能力提升显著,已超越DeepSeek-V4-Pro;在创意写作方面,其表现与Gemini3.1Pro旗鼓相当;而在核心的推理能力上,也已逼近全球领先的闭源模型水平。

此前,文心系列模型已多次在文本和视觉理解榜单中稳居国产第一梯队。今年4月底,文心5.1预览版就曾在LMArena文本榜上超越了多款国内外主流模型。

据悉,百度AI开发者大会将于5月13日至14日在北京举行。届时,关于文心5.1的更多技术细节及其在商业化落地方面的具体规划,将得到进一步披露。国产大模型能否凭借这一高效能路线实现弯道超车,业内正拭目以待。

via AI新闻资讯 (author: AI Base)
微软开发的新标签页扩展程序WowTab似乎已经删库跑路 官网变成404状态

微软中国团队于2024年1月推出的浏览器新标签页扩展程序 WowTab 疑似已停止维护,官网变为 404,相关域名停止DNS解析,QQ群也已更名。该扩展曾以简洁无广告吸引用户,后期虽加入广告但仍具实用性。目前扩展部分功能仍可运行,但图标加载异常,长期可能面临兼容性问题,建议用户提前寻找替代方案。

via Infinitum 资讯聚合 (author: 山外的鸭子哥)
阶跃星辰 发布 StepAudio 2.5 Realtime

5月8日,阶跃星辰发布新一代实时语音大模型 StepAudio 2.5 Realtime,标志着国产大模型在语音交互自然度与智能化方面实现突破。该模型具备“真人级”深度感知能力,能捕捉用户情绪与语境变化,实现智商与情商双重提升,提供更具“人情味”的对话体验。同时支持高度灵活的人设自定义,可适配教育、娱乐、办公等多场景需求。目前模型已全量上线,助力开发者和企业快速接入,推动实时语音交互成为智能设备核心标配。

相关文章:

阶跃星辰推出 StepAudio 2.5 Realtime,实时语音 AI 再升级! - AI新闻资讯
阶跃星辰发布StepAudio 2.5 Realtime:赋予大模型真人般的情感与智慧 - AI新闻资讯

via Infinitum 资讯聚合
引用Luke Curley的观点

Luke Curley 批评 WebRTC 在弱网环境下会主动丢弃音频数据包以维持低延迟,导致用户输入的 prompt 不完整。尽管用户宁愿多等 200ms 换取准确性(尤其在使用付费 AI 服务时),但 WebRTC 的设计机制强制优先实时性,无法在浏览器中重传丢失的音频包。这一限制使得语音 AI 应用(如 OpenAI)在追求低延迟的同时,牺牲了输入质量,影响最终响应效果。

via Infinitum 资讯聚合 (author: Simon Willison's Weblog)
2026-05-09日刊

前往官网查看完整版 (hex2077.dev) ### 产品与功能更新 1. 谷歌 发布 AI 系统解决数学难题。 2. OpenAI 集成代码模式提升编程体验。 3. 抖音 发布新框架解决手机性能瓶颈。 4. Claude 深度集成微软办公软件。 5. OpenAI 发布预览模型寻找代码漏洞。 ### 前沿研究 1. 科研团队 实现手机录制生成高保

via Infinitum 资讯聚合
五角大楼在新网站上发布UFO文件

美国国防部(特朗普政府时期更名为“战争部”)近日上线新网站 war.gov/ufo,首次公开一批此前未公开的UFO相关文件,包括不明异常现象(UAP) 的视频、照片及原始政府文件。这些资料经安全审查,但多数尚未分析。文件将持续更新,源于“UAP遭遇解密与报告系统”(PURSUE)跨部门合作。此举回应2017年曝光的2200万美元 Pentagon 秘密项目 AATIP,反映公众对空中异常现象日益增长的关注。

via Infinitum 资讯聚合 (author: Sarah Perez)
阶跃星辰推出 StepAudio 2.5 Realtime,实时语音 AI 再升级!

近日,阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime。该模型现已全面上线,开发者可以通过阶跃星辰开放平台进行接入。StepAudio 2.5 Realtime 旨在为用户提供更为真实的对话体验,围绕副语言感知、人设自定义和对话能力进行了全面的技术提升。

StepAudio 2.5 Realtime 的核心创新在于其对副语言信息的处理能力。副语言包括语调、语速、停顿,以及叹息或轻笑等非文字表达方式,这些细节是传递情感的关键。通过分析这些元素,模型能够感知用户的情绪和潜在意图,例如从低沉的声调中识别出疲惫,或从急促的语速中判断出烦躁情绪,并据此动态调整回复的语气与策略,提升交流的自然感。

在人设自定义方面,StepAudio 2.5 Realtime 允许开发者进行灵活调节。用户可以通过 API 调整 AI 角色的性格特征、背景经历以及语言习惯等。该模型基于超过 10,000 个高质量原生人设,经过算法生成了百万级的人设特征矩阵,并通过大量真实对话数据进行训练。开发团队还进行了强化学习优化,确保模型在极端场景下保持稳定的角色一致性。此外,模型内置了 5 个预设人设,供用户直接体验。

在整体对话能力上,StepAudio 2.5 Realtime 强调智商与情商的双重提升。除了能够深入理解复杂语义、应对交流中的各种情境外,模型还能够调用多领域知识,提供更深层次的对话体验,既能作为情感交流的聊天伙伴,也能模拟专业 HR 进行面试等正式场合。

根据官方最新评测数据显示,该模型在五个测试维度中表现卓越,特别是在用户体验评分中,StepAudio 2.5 Realtime 的得分达到 80.41,显著高于其他同类产品,如 GPT-Realtime-1.5 和 Gemini Live,展示了其强大的性能和应用潜力。

划重点:

🌟 StepAudio 2.5 Realtime 具备先进的副语言处理能力,能精准感知用户情绪。

🎭 用户可通过 API 自定义 AI 角色的性格与背景,提升交互个性化。

📊 官方评测显示,该模型在多项测试中表现优异,得分远超同类产品。



via AI新闻资讯 (author: AI Base)
OpenAI 官宣 Codex 插件接管浏览器,实测复杂任务表现惊人

人工智能领域再次迎来重磅更新。5月7日,OpenAI 官方宣布 Codex for Chrome 扩展功能正式投入应用。这一举动标志着 AI 助手开始深度介入用户的日常网页操作。

该插件的核心逻辑在于赋予 Codex 直接驱动 Chrome 浏览器的能力。在获得用户授权后,Codex 可以像人类一样“阅读”网页内容、操作内部系统,甚至协助填写复杂的表单。这种深度的系统调用,意味着 AI 不再仅仅停留在对话框内,而是成为了能够进入已登录网站执行任务的“数字员工”。

实测表现:简单任务“翻车”,复杂挑战反显身手

在近期的功能测评中,这款扩展程序的表现呈现出一种有趣的反差。

令人意外的是,在处理如整理浏览器标签页等逻辑简单的基础任务时,Codex 偶尔会出现操作失误或识别不精准的情况。然而,当任务难度升级,其展现出的处理能力却让测试者感到惊喜。

在针对苹果、华为、小米等主流品牌旗舰手机的信息搜集任务中,Codex 展现了极高的整合效率。此外,它在生成创作选题、调用 Deepseek 辅助撰稿,以及自动化制作 AI 新闻日报表格等复杂、多步骤的任务中,完成度显著高于预期,展现了极强的生产力属性。

角色定位:值得信赖但需监看的“半自动助手”

尽管展现出了强大的任务处理潜能,但现阶段的 Codex for Chrome 并非完美无缺。

目前的实测反馈显示,该工具在网页元素的精准识别上仍有提升空间。专家建议,现阶段用户应将其视为一名“能干活的半自动助手”。在处理非安全敏感的日常工作时,它能极大地释放人力,但在应对涉及核心隐私或高安全要求的任务时,依然需要人工的全程监看与复核。

随着算法的迭代与识别精度的优化,这种“AI 接管浏览器”的模式,或许将彻底改变我们与互联网信息的交互方式。

via AI新闻资讯 (author: AI Base)
ChatGPT Android 版拆解发现 Codex 手机远控桌面会话功能

ChatGPT Android 版 1.2026.125 的 APK 被拆解发现多处字符串,显示 OpenAI 正在为 Codex 增加手机远程控制桌面会话的能力,支持在手机上查找、重连远程会话,并要求桌面端登录同一账号。这项功能目前仍在开发中,还没有可用预览,正式上线时间也未公布。

Android Authority

🌸在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]