ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

4 小时前

🤔 《人月神话》：AI“10x”与 Brooks 定律

这场讨论围绕《人月神话》作者 Fred Brooks 的经典观点展开，探讨 AI（如 Claude Code 和 LLM）是否真能实现 10 倍开发效率。尽管部分人认为 AI 是“银弹”，但反对者指出，代码产出增加不等于整体效率提升，且 Brooks 定律（加人反而拖慢项目）在沟通成本高的今天依然适用。讨论还延伸至人口与养老问题，借用“九个月生孩子”比喻，设想通过自动化养老机器人缓解社会压力。核心结论是：工具进步难改软件工程本质规律。

via Infinitum 资讯聚合

4 小时前

🤨 无电发光？发光藻类照明仍离实用很远

发光藻类或发光植物虽能实现“无电照明”，但其本质依赖生物代谢供能，并非真正“无能源”，亮度低、稳定性差，实用性远不及传统照明。目前多用于科研展示或装饰，如3D打印凝胶载体或氛围灯，尚无法替代LED等成熟技术。评论普遍认为，此类项目价值在于实验性与审美，而非实际应用。

via Infinitum 资讯聚合

4 小时前

暴涨981%！三七互娱投资智谱“大获全胜”，游戏巨头正集体押注AI下半场

三七互娱因投资企业智谱上市后股价飙升，2026年一季度投资收益达3.59亿元，同比暴涨981.35%，凸显其在AI领域的战略布局成效。公司聚焦游戏主业，通过投资智谱、月之暗面等AI大模型企业，构建技术协同矩阵，并应用于“小七智能体”平台，提升研发效率。当前，游戏行业正掀起AI抢滩潮，米哈游、巨人网络等纷纷押注AI技术与算力，竞争重心转向“AI技术力+算力储备”的综合实力。

via Infinitum 资讯聚合 (author: AI Base)

4 小时前

大模型为何“查无此人”?MiniMax 深度复盘“马嘉祺”消失背后的技术真相

MiniMax M2系列模型在输出“马嘉祺”时出现异常，经排查发现是后训练阶段低频Token退化所致。分词器将“嘉祺”合并为独立Token，但因后训练样本不足，该Token被高频Token挤压偏移，导致模型无法正确输出，转而生成音近词。扫描显示4.9%的Token退化，其中日语退化率高达29.7%，并伴随SEO垃圾词遗忘。MiniMax通过全词表合成数据、混入预训练语料及词表监控三项策略修复，显著提升参数稳定性。

via Infinitum 资讯聚合 (author: AI Base)

4 小时前

报道称DeepSeek 计划加速模型发布，V4.1 更新预计将在 6 月亮相

DeepSeek 宣布将于 6 月 推出 V4.1 模型更新，旨在加快发布节奏以追赶行业步伐。此前其模型迭代滞后，140 天内无新模型发布。V4.1 将弥补 图像与音频处理能力 短板，实现 全模态覆盖，并支持 MCP 协议 和增强企业级工具链，标志其向商业应用转型。公司正寻求 500 亿元融资，创始人梁文锋个人出资约 200 亿元，以应对人才与算力挑战，推动可持续发展。

via Infinitum 资讯聚合 (author: AI Base)

4 小时前

突破 300 款！国内最强大模型服务平台上线，AI调用成本直降30%

5月8日，中国移动推出国内首个超大规模AI模型服务平台，集成超300款主流大模型，成为国内模型数量最多的集成化平台。该平台首创“词元集约化”模式，支持成本、效果、均衡三种智能匹配策略，并实现秒级故障切换，保障服务连续性。上线后，AI调用成本降低30%，资源占用减少50%以上，日均调用量突破千亿，显著提升AI应用效率与稳定性。

via Infinitum 资讯聚合 (author: AI Base)

4 小时前

百度发布文心大模型5.1：搜索能力位居国内首位，预训练成本仅为业界6%

百度于5月9日正式发布新一代基础大模型文心大模型5.1，已上线千帆模型广场及文心一言官网，面向企业与开发者开放。该模型采用“多维弹性预训练”技术，预训练成本仅为业界同规模模型的6%，参数规模大幅压缩，但性能持续领先。在LMArena最新排名中，其搜索能力位居国内第一、全球第四，成为榜单前列唯一国产模型。此外，其在智能体、创意写作和推理能力方面均表现强劲，逼近国际领先水平。

via Infinitum 资讯聚合 (author: AI Base)

4 小时前

报道称DeepSeek 计划加速模型发布，V4.1 更新预计将在 6 月亮相

DeepSeek公司近期宣布，将在 6 月推出其 V4 模型的更新版本 V4.1，并计划加快模型发布频率，以追赶行业竞争对手。此前，DeepSeek 因技术深度受到好评，但其模型迭代速度明显滞后于其他 AI 公司，140 天内未发布任何新模型，而同期多家全球主要 AI 公司共发布了约 50 个新模型。

DeepSeek 的 V4 模型本定于 2026 年 2 月发布，但因硬件迁移等问题，发布日期被推迟至 4 月 24 日，最终以预览版形式上线，包含 V4-Pro 和 V4-Flash 两个版本。尽管新版本在文本和代码生成方面表现出色，但仍缺乏图像和音频处理能力。V4.1 将致力于弥补这一短板，力求实现真正的全模态覆盖。

此外，V4.1 将支持 Model Context Protocol（MCP），并提供更丰富的企业级工具链，标志着 DeepSeek 从技术展示向企业应用的转型。此次战略转变正是面对人才流失和算力成本上升的压力，DeepSeek 的创始人梁文锋将个人出资约 200 亿元，以支持公司发展，并吸引外部投资。

DeepSeek 目前正在寻求约 500 亿元人民币的融资，若成功将成为中国 AI 创业公司单轮融资的新纪录。创始人的个人投资和国家集成电路产业投资基金的参与，表明对公司未来的强烈信心。随着 V4.1 的发布及融资的顺利完成，DeepSeek 将朝着可持续商业实体迈出重要一步。

划重点：

🌟 DeepSeek 将在 6 月推出 V4.1 更新，计划加快模型发布频率。

🔍 V4.1 将弥补图像和音频处理能力，实现全模态覆盖。

💰 公司正在寻求约 500 亿元融资，以支持其转型和发展。

via AI新闻资讯 (author: AI Base)

4 小时前

OpenAI 推出 Codex Chrome 扩展程序，提升浏览器操作效率

OpenAI 近日推出了一款适用于 Mac 和 PC 的 Codex Chrome 扩展程序，旨在简化用户在浏览器中执行各种任务的流程。此次更新是为了迎合越来越多用户在浏览器中工作的趋势，使 Codex 能够更加高效地完成 Web 相关的任务。

在此之前，Codex 通过内置的沙盒浏览器和不断扩展的插件库来执行任务，支持 GitHub、Slack、Figma 和 Notion 等服务。但新的 Chrome 扩展程序填补了以往方法无法实现的空白，特别是那些需要用户真实登录的操作。

这款 Chrome 扩展程序使 Codex 能够在 Chrome 浏览器中执行需要登录的任务，特别适合处理 LinkedIn、Salesforce、Gmail 等网站的操作。对于无需登录的公共页面，用户仍然可以使用 Codex 的内置浏览器，确保本地开发和文件预览的流畅性，而不会干扰到 Chrome 的个人资料。

Codex 现已根据任务的不同，使用三个不同的工具层级：有专用集成时使用插件，需要登录时使用 Chrome，其他情况则在本地主机上使用内置浏览器。用户可以通过简单的 @Chrome 语法直接调用 Chrome，系统会自动选择最合适的工具。

扩展程序的功能包括测试 Web 应用、从打开的标签页收集上下文信息，以及在用户执行其他任务时并行使用 Chrome 开发者工具。Codex 的操作以任务特定的标签页组形式进行，因此在执行操作时不会干扰当前的浏览会话。

要安装和使用 Codex Chrome 扩展程序，用户只需按照简易的五个步骤完成安装流程。当前，这一扩展程序支持 macOS 和 Windows，但在欧盟和英国尚不可用。用户需要注意，Codex 需要广泛的浏览器权限以正常运行，同时 OpenAI 也实施了基于站点的确认机制，以降低安全风险。

为确保用户隐私，OpenAI 仅在用户明确添加浏览器活动至聊天上下文时才会存储数据。此外，关闭 “记忆” 功能可确保每个浏览器任务都是独立的，避免受到之前会话的影响。

划重点：

🌐 Codex Chrome 扩展程序上线，支持 LinkedIn、Salesforce 等登录操作。

🔒 安装需五个简单步骤，目前在欧盟和英国不可用。

🛡️ OpenAI 实施安全机制，保护用户隐私与数据安全。

via AI新闻资讯 (author: AI Base)

5 小时前

百度发布文心大模型5.1：搜索能力位居国内首位，预训练成本仅为业界6%

在人工智能竞争白热化的当下，国产大模型再次交出了一份惊艳的答卷。5月9日，百度正式推出了新一代基础大模型——文心大模型5.1。目前，该模型已全面上线百度千帆模型广场及文心一言官网，正式面向企业级用户与开发者开放体验。

本次更新的核心亮点在于其极高的“性价比”与强大的搜索整合能力。据官方介绍，文心5.1采用了创新的“多维弹性预训练”技术。这一技术最早在文心5.0发布时崭露头角，其精髓在于能实现“一次训练，生成多种规模模型”。作为该技术的最新阶段性成果，文心5.1在充分继承5.0版本知识储备的基础上，实现了参数规模的大幅优化:总参数量压缩至约三分之一，激活参数压缩至约二分之一。

令人关注的是，百度通过这一技术将预训练成本降至业界同规模模型的6%左右，却在基础性能上实现了持续领先。在国际权威的大模型竞技场LMArena最新排名中，文心5.1以1223分的成绩夺得搜索榜国内第一、全球第四，成为榜单前列中唯一的国产模型身影。

所谓的“搜索能力”，并非简单的资料堆砌，而是模型对多源信息的快速检索、精准整合及逻辑生成能力。这意味着文心5.1能够输出一致性更高、可靠性更强的回答，在处理复杂业务场景、智能助手交互以及企业知识管理等方面展现出巨大的应用潜力。

除了搜索专长，文心5.1在其他维度也表现强劲。测试数据显示，其Agent（智能体）能力提升显著，已超越DeepSeek-V4-Pro;在创意写作方面，其表现与Gemini3.1Pro旗鼓相当;而在核心的推理能力上，也已逼近全球领先的闭源模型水平。

此前，文心系列模型已多次在文本和视觉理解榜单中稳居国产第一梯队。今年4月底，文心5.1预览版就曾在LMArena文本榜上超越了多款国内外主流模型。

据悉，百度AI开发者大会将于5月13日至14日在北京举行。届时，关于文心5.1的更多技术细节及其在商业化落地方面的具体规划，将得到进一步披露。国产大模型能否凭借这一高效能路线实现弯道超车，业内正拭目以待。

via AI新闻资讯 (author: AI Base)

5 小时前

微软开发的新标签页扩展程序WowTab似乎已经删库跑路官网变成404状态

微软中国团队于2024年1月推出的浏览器新标签页扩展程序 WowTab 疑似已停止维护，官网变为 404，相关域名停止DNS解析，QQ群也已更名。该扩展曾以简洁无广告吸引用户，后期虽加入广告但仍具实用性。目前扩展部分功能仍可运行，但图标加载异常，长期可能面临兼容性问题，建议用户提前寻找替代方案。

via Infinitum 资讯聚合 (author: 山外的鸭子哥)

5 小时前

阶跃星辰发布 StepAudio 2.5 Realtime

5月8日，阶跃星辰发布新一代实时语音大模型 StepAudio 2.5 Realtime，标志着国产大模型在语音交互自然度与智能化方面实现突破。该模型具备“真人级”深度感知能力，能捕捉用户情绪与语境变化，实现智商与情商双重提升，提供更具“人情味”的对话体验。同时支持高度灵活的人设自定义，可适配教育、娱乐、办公等多场景需求。目前模型已全量上线，助力开发者和企业快速接入，推动实时语音交互成为智能设备核心标配。

相关文章：

● 阶跃星辰推出 StepAudio 2.5 Realtime，实时语音 AI 再升级！ - AI新闻资讯
● 阶跃星辰发布StepAudio 2.5 Realtime：赋予大模型真人般的情感与智慧 - AI新闻资讯

via Infinitum 资讯聚合

5 小时前

引用Luke Curley的观点

Luke Curley 批评 WebRTC 在弱网环境下会主动丢弃音频数据包以维持低延迟，导致用户输入的 prompt 不完整。尽管用户宁愿多等 200ms 换取准确性（尤其在使用付费 AI 服务时），但 WebRTC 的设计机制强制优先实时性，无法在浏览器中重传丢失的音频包。这一限制使得语音 AI 应用（如 OpenAI）在追求低延迟的同时，牺牲了输入质量，影响最终响应效果。

via Infinitum 资讯聚合 (author: Simon Willison's Weblog)

5 小时前

2026-05-09日刊

前往官网查看完整版 (hex2077.dev) ### 产品与功能更新 1. 谷歌发布 AI 系统解决数学难题。 2. OpenAI 集成代码模式提升编程体验。 3. 抖音发布新框架解决手机性能瓶颈。 4. Claude 深度集成微软办公软件。 5. OpenAI 发布预览模型寻找代码漏洞。 ### 前沿研究 1. 科研团队实现手机录制生成高保

via Infinitum 资讯聚合

5 小时前

五角大楼在新网站上发布UFO文件

美国国防部（特朗普政府时期更名为“战争部”）近日上线新网站 war.gov/ufo，首次公开一批此前未公开的UFO相关文件，包括不明异常现象（UAP） 的视频、照片及原始政府文件。这些资料经安全审查，但多数尚未分析。文件将持续更新，源于“UAP遭遇解密与报告系统”（PURSUE）跨部门合作。此举回应2017年曝光的2200万美元 Pentagon 秘密项目 AATIP，反映公众对空中异常现象日益增长的关注。

via Infinitum 资讯聚合 (author: Sarah Perez)

5 小时前

阶跃星辰推出 StepAudio 2.5 Realtime，实时语音 AI 再升级！

近日，阶跃星辰正式发布了新一代实时语音大模型 StepAudio 2.5 Realtime。该模型现已全面上线，开发者可以通过阶跃星辰开放平台进行接入。StepAudio 2.5 Realtime 旨在为用户提供更为真实的对话体验，围绕副语言感知、人设自定义和对话能力进行了全面的技术提升。

StepAudio 2.5 Realtime 的核心创新在于其对副语言信息的处理能力。副语言包括语调、语速、停顿，以及叹息或轻笑等非文字表达方式，这些细节是传递情感的关键。通过分析这些元素，模型能够感知用户的情绪和潜在意图，例如从低沉的声调中识别出疲惫，或从急促的语速中判断出烦躁情绪，并据此动态调整回复的语气与策略，提升交流的自然感。

在人设自定义方面，StepAudio 2.5 Realtime 允许开发者进行灵活调节。用户可以通过 API 调整 AI 角色的性格特征、背景经历以及语言习惯等。该模型基于超过 10，000 个高质量原生人设，经过算法生成了百万级的人设特征矩阵，并通过大量真实对话数据进行训练。开发团队还进行了强化学习优化，确保模型在极端场景下保持稳定的角色一致性。此外，模型内置了 5 个预设人设，供用户直接体验。

在整体对话能力上，StepAudio 2.5 Realtime 强调智商与情商的双重提升。除了能够深入理解复杂语义、应对交流中的各种情境外，模型还能够调用多领域知识，提供更深层次的对话体验，既能作为情感交流的聊天伙伴，也能模拟专业 HR 进行面试等正式场合。

根据官方最新评测数据显示，该模型在五个测试维度中表现卓越，特别是在用户体验评分中，StepAudio 2.5 Realtime 的得分达到 80.41，显著高于其他同类产品，如 GPT-Realtime-1.5 和 Gemini Live，展示了其强大的性能和应用潜力。

划重点：

🌟 StepAudio 2.5 Realtime 具备先进的副语言处理能力，能精准感知用户情绪。

🎭 用户可通过 API 自定义 AI 角色的性格与背景，提升交互个性化。

📊 官方评测显示，该模型在多项测试中表现优异，得分远超同类产品。

via AI新闻资讯 (author: AI Base)

5 小时前

OpenAI 官宣 Codex 插件接管浏览器，实测复杂任务表现惊人

人工智能领域再次迎来重磅更新。5月7日，OpenAI 官方宣布 Codex for Chrome 扩展功能正式投入应用。这一举动标志着 AI 助手开始深度介入用户的日常网页操作。

该插件的核心逻辑在于赋予 Codex 直接驱动 Chrome 浏览器的能力。在获得用户授权后，Codex 可以像人类一样“阅读”网页内容、操作内部系统，甚至协助填写复杂的表单。这种深度的系统调用，意味着 AI 不再仅仅停留在对话框内，而是成为了能够进入已登录网站执行任务的“数字员工”。

实测表现:简单任务“翻车”，复杂挑战反显身手

在近期的功能测评中，这款扩展程序的表现呈现出一种有趣的反差。

令人意外的是，在处理如整理浏览器标签页等逻辑简单的基础任务时，Codex 偶尔会出现操作失误或识别不精准的情况。然而，当任务难度升级，其展现出的处理能力却让测试者感到惊喜。

在针对苹果、华为、小米等主流品牌旗舰手机的信息搜集任务中，Codex 展现了极高的整合效率。此外，它在生成创作选题、调用 Deepseek 辅助撰稿，以及自动化制作 AI 新闻日报表格等复杂、多步骤的任务中，完成度显著高于预期，展现了极强的生产力属性。

角色定位:值得信赖但需监看的“半自动助手”

尽管展现出了强大的任务处理潜能，但现阶段的 Codex for Chrome 并非完美无缺。

目前的实测反馈显示，该工具在网页元素的精准识别上仍有提升空间。专家建议，现阶段用户应将其视为一名“能干活的半自动助手”。在处理非安全敏感的日常工作时，它能极大地释放人力，但在应对涉及核心隐私或高安全要求的任务时，依然需要人工的全程监看与复核。

随着算法的迭代与识别精度的优化，这种“AI 接管浏览器”的模式，或许将彻底改变我们与互联网信息的交互方式。

via AI新闻资讯 (author: AI Base)

5 小时前

ChatGPT Android 版拆解发现 Codex 手机远控桌面会话功能

ChatGPT Android 版 1.2026.125 的 APK 被拆解发现多处字符串，显示 OpenAI 正在为 Codex 增加手机远程控制桌面会话的能力，支持在手机上查找、重连远程会话，并要求桌面端登录同一账号。这项功能目前仍在开发中，还没有可用预览，正式上线时间也未公布。

Android Authority

🌸在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

Before

After