ChatGPT / AI新闻聚合

https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN

2 小时前

32B 推理性能反超 o1-mini！阿里通义发布 FIPO 算法，让大模型“想得更深”

据报道，阿里通义实验室的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习（RL）在处理复杂逻辑时的瓶颈，让模型在推理长度和准确率上实现双重飞跃。

核心突破：解决“推理长度停滞”

传统模型在面对数学等复杂问题时，往往难以区分哪些 Token 是通往正确答案的关键。FIPO 算法对此进行了针对性重构：

Future-KL 机制： 引入 Future-KL 策略，专门奖励那些对后续推理有显著积极影响的 Token，让 AI 学会“深谋远虑”。

符号对数概率差： 引入这一新机制来精准捕捉模型的优化方向，避免推理过程陷入无效的循环。

推理长度跨越： 在零基础模型上，FIPO 成功将平均推理长度提升至 10，000 Token 以上，彻底解决了推理深度不足的问题。

战绩斐然：32B 模型逆袭 o1-mini

在实测对比中，搭载 FIPO 算法的 32B 规模模型展现出了惊人的“小钢炮”属性：

反超竞品： 在纯强化学习设置下，其推理性能成功反超同规模模型，甚至在部分指标上优于OpenAI 的 o1-mini。

数学潜力： 算法在处理高难度数学推理题目时表现尤为出色，展现了极强的逻辑推导潜力。

行业背景：通义实验室的“智能进化”

阿里通义实验室近期在 AI 底层算法上动作频频。除了本次惊艳的 FIPO 算法，团队在 3 月底刚推出了CoPaw 1.0 新版本，显示出其在提升模型逻辑严密性与交互深度方面的持续深耕。

结语：推理效率的“第二曲线”

当行业还在争论参数规模时，阿里通义通过 FIPO 算法证明了：通过更精细的奖励机制和逻辑诱导，较小规模的模型同样能迸发出顶级的“思考力”。

via AI新闻资讯 (author: AI Base)

2 小时前

小米罗福莉谈 Anthropic 封杀 OpenClaw：低价 Token 并非行业出路

AI 行业再度掀起波澜。Anthropic 宣布切断包括 OpenClaw 在内的多个第三方框架通过其 Claude 订阅服务的调用通道。此举令许多依赖订阅服务的用户感到措手不及。Anthropic 的官方解释指出，部分重度用户仅支付 200 美元的订阅费，却消耗了价值 5000 美元的算力资源，造成公司严重的财务压力。

对此，小米 MiMo 大模型负责人罗福莉发表了看法。她认为，第三方框架由于上下文管理的低效率，导致其 Token 消耗量是原生框架的数十倍。这种情况让 Anthropic 不得不采取止损措施，阻止更多的财务损失。罗福莉警告行业内其他大模型公司，若盲目参与 “Token 价格战”，会面临巨大的财务风险。她表示，在尚未理清订阅定价策略的情况下，低价销售 Token，并开放给第三方工具的做法实际上是一个陷阱。

小米的 MiMo 大模型近期也推出了按量计费的 Token Plan，支持第三方接入。罗福莉强调，行业的未来在于高效框架与优质模型的协同进化，而非单纯追求低价。她认为，短期的成本阵痛将迫使第三方开发者优化技术，这对整个生态系统的长期健康发展是有利的。

Anthropic 的决定无疑引发了行业对于 Token 定价和使用效率的深思。随着算力需求的急剧增长，企业必须找到更为可持续的商业模式，而非仅依赖于降低 Token 价格。

划重点：

🌟 Anthropic 切断第三方框架调用通道，主要因重度用户消耗算力资源过大。

💡 罗福莉警告行业勿陷入低价 Token 的恶性竞争，强调定价策略的重要性。

🚀 小米 MiMo 已推出按量计费的 Token Plan，行业未来在于高效框架与优质模型的共同发展。

via AI新闻资讯 (author: AI Base)

2 小时前

DeepSeek V4 灰度测试曝光：全新视觉版与“专家模式”现身

4 月 7 日，Readhub消息显示，DeepSeek V4正在进行密集的灰度测试。多位程序员及社交媒体博主展示的新界面显示，新一代模型不仅在底层架构上有所突破，在交互逻辑和多模态能力上也迎来了重大升级。

核心亮点：三足鼎立的新功能架构

从曝光的测试界面来看，DeepSeek V4提供了三个核心选项，预示着其产品矩阵的全面进化：

快速版 (DeepSeek V4 Lite)： 主打响应速度，侧重于日常轻量化对话。

专家版 (DeepSeek V4)： 深度逻辑推理模式，可能是基于传闻中梁文锋署名论文提到的“全新记忆架构”打造。

视觉版 (DeepSeek V4 Vision)： 标志着多模态能力的深度集成，可直接处理图像与视频分析任务。

技术路线：坚定的“国产芯”支持者

DeepSeek的崛起不仅在于算法，更在于对本土算力生态的深度适配：

国产 AI 芯片优先： 消息称 DeepSeek 正在开发至少 2 款完全基于国产 AI 芯片的大模型，并已提前开启国产芯片抢货模式。

拒绝依赖： 在此前对美芯片商的测试申请中，DeepSeek 未开放 V4 模型测试，而是优先开放给国内厂商进行协同优化。

行业期待：能否挑战编程巅峰？

除了基础性能的提升，市场对DeepSeek V4还有更多垂直领域的期待：

AI 编程特别版： 业内猜测其将推出专门针对代码生成与工程实现的版本，正面硬刚Anthropic的 Mythos 或OpenAI的 GPT 系列。

超长文本处理： 延续DeepSeek 此前的优势，V4 预计将具备一次性处理百万级 Token 的超长文本能力。

话题追踪：蓄势已久的发布周期

从今年 1 月曝出MODEL1 新架构，到 2 月发布OCR 2 模型，再到如今的频繁灰测，DeepSeek V4的发布已如箭在弦上。随着本月发布窗口的临近，这款主打“原生记忆”与“国产适配”的旗舰模型，或将再次重塑国产大模型的性价比天花板。

结语：更懂中国算力的 AI

从代码自动验证到全新的视觉交互，DeepSeek正在证明，不依赖海外顶级芯片，国产模型依然能跑出令人惊叹的进化曲线。

via AI新闻资讯 (author: AI Base)

2 小时前

Anthropic 发布最强模型 Mythos：专治陈年漏洞

当地时间周二，Anthropic正式推出了其新一代“前沿模型” Mythos 的预览版本。这款被内部誉为“迄今最强大”的 AI，不仅在推理能力上实现了跨越，更在网络安全领域展现出了令人战栗的杀伤力。

核心亮点：AI 界的“超级探针”

不同于以往的通用对话模型，Mythos 在“智能体”级别的编程与推理上表现惊人：

● 漏洞挖掘专家： 在过去几周的封闭测试中，Mythos 已成功扫描出数千个零日漏洞，其中包含大量高危级别。
● 跨越时空的精准： 令人震惊的是，该模型精准锁定了许多隐藏在一二十年前老旧代码中的“历史遗留问题”，这些漏洞在漫长的技术迭代中曾被无数人类专家忽略。
● 防御性部署： 目前该预览版主要用于扫描第一方及开源系统的代码缺陷，旨在抢在黑客之前补上“后门”。

试用门槛：仅限顶级安全“朋友圈”

由于 Mythos 具备极强的攻击性潜力，Anthropic明确表示暂不向公众开放，而是通过名为 “Project Glasswing” 的安全项目进行定向试用。

● 顶级大厂护航： 参与试用的组织包括Apple、Amazon、Microsoft、Cisco以及CrowdStrike等数十家行业巨头。
● 国家级讨论： Anthropic透露已与美国联邦官员展开持续对话，探讨该模型在国家级关键系统中的防御性应用。

意外插曲：一份被误放的“Capybara”草稿

Mythos 的正式亮相其实源于一次尴尬的“人为错误”。

上个月，《财富》杂志爆料，Anthropic一份内部代号为 “Capybara（水豚）” 的博客草稿被错误地存放在公开数据湖中。草稿中毫不掩饰地警告：如果该模型被恶意利用，其发现漏洞的速度将远超防御者的补丁更新速度，甚至可能引发新一轮 AI 驱动的全球安全浪潮。

争议焦点：供应链风险与监管博弈

伴随着强大性能而来的还有激烈的法律纠纷：

● 国防部黑名单： 由于Anthropic拒绝将其技术用于对美国公民的自主打击或监控，美国国防部近期将其列为“供应链风险实体”。
● 伦理边界： 如何在赋予 AI 强大防御能力的同时，防止其成为黑客手中的“万能钥匙”，正成为全行业共同的命题。

结语：AI 时代的“盾”与“矛”

Mythos的出现标志着 AI 已经具备了深度解析人类技术文明“历史漏洞”的能力。当机器比人类更了解我们过去犯下的错误，安全竞赛的规则将被彻底重写。

via AI新闻资讯 (author: AI Base)

2 小时前

Google Maps 引入 AI 功能，自动生成照片说明助力用户分享

Google 于周二宣布，其 Google Maps 应用程序正在推出一项全新功能，旨在提升用户分享照片和视频的体验。利用最新的 Gemini 技术，用户在分享地点照片或视频时，系统将自动生成配图说明（caption），帮助用户轻松表达自己的内容。

具体使用流程非常简单:用户首先选择想要上传的照片或视频，接着 Gemini 会分析画面内容，并生成一段相关的文字说明。用户可以根据自己的需求对这段文字进行确认、修改或直接采纳。这项功能的推出，主要是为了为用户在分享内容时提供一个良好的开头，而不是完全替代用户的描述，确保分享的个性化。

目前，这项新功能已经在美国市场的 iOS 版 Google Maps 中上线，支持英文环境。Google 计划未来将这一功能逐步推广到全球范围，并扩展到 Android 系统。与此同时，Google 也在优化内容贡献的入口设计。当用户在手机设置中开启 “媒体访问权限” 后，Google Maps 的 “Contribute（贡献）” 标签页将直接显示最近拍摄的照片和短视频，便于用户一键选择并发布。

用户上传的照片和视频能够帮助其他用户更好地理解某个地点的 “整体氛围” 或最新的菜单信息，而这类内容现在也变得更容易被找到和分享。为了激励用户持续参与社区内容建设，Google 还在 “Contribute” 标签页中新增了对用户贡献成果的统计功能，用户可以查看自己累计获得的贡献积分总数，以更直观地了解自己的内容对平台的长期影响。

从战略层面看，自动生成照片说明的功能只是 Google 在2026年围绕 Gemini 打造 “AI 服务层” 的一部分。此前，Google 已经将 Gemini 深度整合进 Maps 的对话语音、沉浸式导航等核心场景，旨在进一步降低用户在搜索和规划行程时的认知与操作成本。

划重点:

🌟 Google Maps 新功能使用 Gemini 技术，自动生成照片说明。

📸 用户可轻松确认或修改生成的说明，提升分享体验。

🌍 该功能现已在美国的 iOS 版上线，未来将推广至全球和 Android。

via AI新闻资讯 (author: AI Base)

2 小时前

超越 Seedance 2.0 ！AI 视频赛道神秘黑马 Happy Horse 横空出世

via AI新闻资讯 (author: AI Base)

Telegraph

超越 Seedance 2.0 ！AI 视频赛道神秘黑马 Happy Horse 横空出世

AIbase 报道（2026年4月8日）——AI 视频生成领域再次迎来重磅惊喜。昨日，权威 AI 评测平台 Artificial Analysis 突然在 AI Video Arena 排行榜上引入一款全新未知模型“Happy Horse”(含 V1与 V2版本)。该模型一上线便强势超越此前领先的 Seedance2.0，迅速霸榜首位，引发全球 AI 社区热议。神秘模型强势登顶，性能全面领先根据 Artificial Analysis 最新数据，Happy Horse 在文本到视频（Text-to-…

2 小时前

OpenClaw高危漏洞细节曝光，360漏洞挖掘智能体揭示AI原生应用安全新挑战

]4月7日，360漏洞挖掘智能体宣布成功发现并上报了AI智能体OpenClaw的3项高价值安全漏洞，其中包括1个高危漏洞及2个中危漏洞。目前，相关漏洞均已获官方修复并公开披露。这一进展标志着AI智能体在自动化安全审计领域实现了从传统规则驱动向智能思维驱动的跨越，为AI原生应用的安全治理提供了关键技术支撑。

此次发现的高危漏洞聚焦于本地脚本的审批与执行机制，攻击者可通过篡改已通过审批的脚本内容实现代码非法执行，进而控制用户设备。两处中危漏洞则分别涉及OAuth手动授权流程中的安全校验参数复用，以及语音通话WebSocket数据处理中的资源管控缺陷。前者可能导致用户Google服务账号权限被接管，后者则可能引发系统资源耗尽导致的设备崩溃。这些漏洞直击AI智能体核心运行机制，暴露出当前智能体在权限隔离与协议实现上的深层隐患。

据360方面介绍，该漏洞挖掘智能体体系已累计发现多款主流AI智能体的高价值漏洞。相比传统扫描工具，该系统能够模拟安全专家的攻防直觉，实现漏洞排查、验证及复现的自动化，从而将人力价值释放到更具创造力的风险研判领域。随着AI智能体逐渐深入用户业务流，此类由AI驱动的自动化漏洞挖掘技术将成为保障AI产业链底层安全的关键基础设施，推动行业构建更具韧性的安全防御体系。

via AI新闻资讯 (author: AI Base)

2 小时前

Anthropic 推出强大 AI 模型 Mythos 仅限安全伙伴试用

via AI新闻资讯 (author: AI Base)

Telegraph

Anthropic 推出强大 AI 模型 Mythos 仅限安全伙伴试用

人工智能公司 Anthropic 于周二发布了其新一代 “前沿模型” Mythos 的预览版本。该模型被称为 “迄今最强大”，并将通过名为 “Project Glasswing” 的安全项目，首批交给一小部分合作伙伴使用，专注于网络安全任务。根据公司介绍，Mythos 是 Claude 系统中的一款通用大模型，具有卓越的编程和推理能力。虽然并非专为网络安全而训练，但当前的预览版主要用于扫描第一方和开源软件中的代码漏洞。Anthropic 表示，Mythos 在最近的测试中发现了 “数千个零日漏洞”，其…

2 小时前

开发者自建 48 台 Mac mini 集群，破解云 AI 服务高昂成本

近日，播客应用 Overcast 的开发者 Marco Arment 选择自建一个由 48 台 Mac mini 组成的服务器集群，来应对云端 AI 服务所带来的高昂成本。Arment 指出，使用云端 AI 服务进行播客转录的费用按次计费，随着业务量的增加，每日支出可能高达数千美元，这让他不得不寻求更加经济实惠的解决方案。

在这 48 台 Mac mini 中，Arment 利用 Apple Silicon 芯片的能效和统一内存的优势，运行本地的语音识别模型，从而绕过了云端服务的高昂费用。他认为，尽管前期硬件投入较大，但后续的运营成本更加可控且可预测，这样一来就有效解决了随着业务量线性增长而带来的成本压力。

从技术实现上来看，整个转录过程依靠后端的 Mac mini 集群，通过分布式架构进一步提升处理效率。Arment 还特别强调了苹果芯片在执行语音识别等推理任务中的优越性能，尤其是在能效比和统一内存方面的优势。

在播客分发过程中，动态广告插入技术使得不同听众接收到的音频存在差异，这增加了转录对齐的难度。为了克服这一挑战，Arment 采用了音频指纹识别和去重技术，系统能够生成一份基准转录文本并将其映射到多个版本上。这种方法不仅保证了转录的一致性，还避免了重复计算，进一步提高了工作效率。

这一创新性的举措不仅展示了开发者的技术能力，同时也为其他类似业务提供了新的思路，让他们在面对高昂的云端服务费用时找到更加可行的解决方案。

划重点：

🌐 Arment 自建 48 台 Mac mini 集群，避免了云端 AI 服务的高昂费用。

💡 本地运行语音识别模型使得运营成本更加可控。

🔧 采用音频指纹识别和去重技术，提高转录效率与一致性。

via AI新闻资讯 (author: AI Base)

2 小时前

DeepSeek 推出专家模式，智能搜索再升级

DeepSeek 上线其全新 “专家模式”，进一步提升了用户在处理复杂问题时的体验。此次更新是 DeepSeek 自发布以来首次引入模式分层设计，用户可以在输入框上方看到 “快速模式” 和 “专家模式” 两种选择。

“快速模式” 专为日常对话设计，具备即时响应的能力，并支持识别图片和文件中的文字，便于用户快速获取信息。而 “专家模式” 则专注于解决复杂的问题，支持更深入的思考和智能搜索。尽管当前此模式不支持文件上传及多模态功能，但 DeepSeek 明确表示，使用 “专家模式” 的用户在高峰时段可能需要等待。

在此版本中，用户反映 “专家模式” 的词元（token）吞吐速度极快，尽管尚不确定该模式是否搭载了传闻中的 DeepSeek V4 模型，但从实际使用来看，其表现相当出色。此外，网上有截图显示 DeepSeek 可能还新增了一个视觉模式，但该模式目前在官方界面尚未开放。

DeepSeek 的这次更新，意在增强用户对复杂问题的处理能力，使其在智能搜索的领域中更具竞争力。未来，随着更多功能的推出，DeepSeek 有望在人工智能行业中占据更重要的位置。

划重点：

🌟 DeepSeek 上线 “专家模式”，支持复杂问题的深入思考。

⚡ “快速模式” 用于日常对话，具备即时响应和文字识别功能。

🖼️ 未来可能推出视觉模式，当前尚未在官方界面看到。

via AI新闻资讯 (author: AI Base)

2 小时前

微软必应团队开源27B嵌入模型Harrier，多语言基准测试登顶

4月7日，微软必应（Bing）团队宣布正式开源名为“Harrier”的全新词嵌入模型系列，旨在重塑全球搜索、检索及人工智能代理的底层逻辑。Harrier系列包含三个不同规格的版本，其中旗舰级27B模型在多语言MTEB v2基准测试中超越了OpenAI、亚马逊以及Google Gemini等主流专有模型，位居榜首。

该模型的技术底座展现了极高的工业水准:Harrier支持超过100种语言，其上下文窗口高达32，000个词元。在训练策略上，微软不仅使用了超过20亿个真实示例，更引入了来自GPT-5的合成数据进行强化。这种高质量数据的组合使得Harrier在理解复杂语境与长文本处理上具备显著优势。除了270亿参数的完整版外，为适配不同算力环境，微软同步推出了0.6B和2.7B的小参数版本，并全部通过MIT许可证在Hugging Face平台开放。

嵌入模型作为AI系统组织与检索信息的关键技术，其性能直接决定了RAG（检索增强生成）系统的准确性。微软计划将此技术深度集成至Bing搜索引擎及新型AI代理地面服务中。随着人工智能逐步迈向多步骤任务的自主化，Harrier的开源不仅为开发者提供了可替代专有模型的高性能工具，更标志着开源生态在语义表示能力上已完成对顶尖闭源方案的阶段性跨越，进一步加速了AI代理在全球多语言环境下的落地进程。

via AI新闻资讯 (author: AI Base)

2 小时前

Anthropic 招募微软高管，重塑 AI 基础设施以应对激增需求

近日，人工智能公司 Anthropic PBC 宣布，已从微软挖来资深高管埃里克・博伊德，担任公司基础设施负责人。此举旨在应对 Anthropic 旗下 AI 产品 Claude 及其相关服务日益增长的应用需求。博伊德在领英上表示，人工智能的快速发展令人瞩目，尤其是过去两个月内，Claude Code 所展现出的影响力，让人们更加相信 AI 的无限潜力。

随着用户需求的激增，Anthropic 的服务频繁遭遇不稳定的问题，普通用户和企业客户的需求达到了 “前所未有” 的水平。为了提升服务的稳定性，Anthropic 正积极扩展云计算能力，并承诺将在美国投资 500 亿美元建设 AI 数据中心。这一投资规模在行业内显得十分庞大，相较之下，竞争对手 OpenAI 计划在 2030 年前投入 6000 亿美元于人工智能基础设施的建设。

博伊德曾在微软担任人工智能平台的管理职务，帮助客户和内部团队成功部署大型语言模型。他在微软工作了 16 年，之前还在雅虎担任管理职务。Anthropic 的首席技术官拉胡尔・帕蒂尔也在领英上表示，博伊德在企业级基础设施管理方面的丰富经验将帮助公司满足全球用户创下的使用需求新纪录。

随着 AI 技术的飞速发展，公司的基础设施建设显得愈发重要，Anthropic 希望通过这一举措能够在激烈的市场竞争中占据更有利的地位，确保其产品的可用性和稳定性。

划重点：

🌟 Anthropic 从微软挖来高管博伊德，负责基础设施建设。

💰 公司承诺在美国投资 500 亿美元以扩充 AI 数据中心。

📈 由于用户需求激增，Anthropic 的服务稳定性面临挑战。

via AI新闻资讯 (author: AI Base)

2 小时前

Adobe发布Acrobat Student Spaces:面向学生的免费全流程AI学习工具

Adobe于2026年4月7日正式推出面向学生群体的免费AI学习工具“Student Spaces”，标志着这家创意软件巨头进一步将其AI版图从专业生产力领域扩张至教育生态。

不同于以往主要针对专业人士的Acrobat AI功能，Student Spaces采用独立URL托管且支持免登录使用，旨在为学生提供一站式阅读与资料处理平台。该工具集成了强大的多模态解析能力，支持PDF、Office文档、网页链接及手写笔记等多种格式，可自动生成记忆卡片、思维导图、测验及由Adobe Express驱动的可编辑演示文稿。

值得注意的是，Adobe将其近期在Acrobat中上线的“双人AI播客”功能也引入该工具，允许学生将复杂的课程资料转化为可听化的学习内容。为确保学术严谨性并降低大模型幻觉，该助手基于用户上传的私有文档构建知识库。此举被视为Adobe对谷歌NotebookLM、Goodnotes及Turbo AI等同类竞品的直接反击。

通过对哈佛、伯克利等高校500名学生的深度测试，Adobe试图利用Acrobat原有的文档处理优势，解决学生在不同学习工具间频繁切换的痛点。这一动作预示着AI教育工具正从简单的内容生成向深度集成的“学习中心”转型，而免费策略将成为大厂争夺未来职业用户心智的关键手段。

via AI新闻资讯 (author: AI Base)

2 小时前

封杀 OpenClaw 只是“止损”？小米罗福莉：大模型盲目卷价格是陷阱

4月8日，Anthropic正式切断了包括OpenClaw在内的第三方框架通过 Claude 订阅服务调用的通道。此举不仅引发了重度用户的震动，也揭开了大模型订阅制背后惊人的算力账单。

核心矛盾:200美元订阅费与5000美元算力费

Anthropic官方对此次封杀给出了直白的解释:

成本倒挂: 平台发现部分重度用户通过第三方框架每月仅支付 200美元订阅费，却消耗了价值 5000美元的算力资源。

强制切换: 为了缓解巨大的财务压力，受影响用户目前必须切换至按用量付费的 API 模式，这让依赖订阅模式“薅羊毛”的开发者瞬间陷入停滞。

专家观点:第三方框架是 Token 消耗的“黑洞”

针对这一事件，小米 MiMo 大模型负责人罗福莉发表了犀利点评:

低效陷阱: 她指出，第三方框架因上下文管理效率低下，产生的Token消耗往往是原生框架的数十倍。

止损必然: 面对如此低效的资源消耗，Anthropic的举动实为商业止损，并不令人意外。

行业警告:别让“Token 价格战”变成恶性循环

罗福莉进一步向大模型厂商发出警告，劝诫行业回归理性:

拒绝盲目卷价: 在未理清订阅定价逻辑前，盲目陷入“Token 价格战”并放任第三方工具接入，无异于自掘坟墓。

出路何在: 行业真正的出路不在于更便宜的 Token，而在于高效框架与优质模型的“协同进化”。

小米动态:按量计费才是生态良药

在点评友商举措的同时，罗福莉也透露了小米 MiMo的最新布局:

Token Plan 上线: 小米 MiMo刚上线的 Token 计划已明确支持第三方接入，但采用的是更为健康的按量计费模式。

长期视角: 她认为，短期的成本阵痛将倒逼第三方优化技术，从而推动整个 AI 生态向长期的健康发展迈进。

结语:算力时代的成本红线

当全球算力资源已逐渐跟不上智能体（Agent）的需求增长速度，单纯的低价策略已难以为继。从Anthropic的封杀到小米的按量计费，大模型行业正从“流量至上”回归到“效率优先”的商业本质。

via AI新闻资讯 (author: AI Base)

2 小时前

阿里通义实验室发布FIPO算法，32B模型推理性能反超o1-mini

阿里通义实验室智能计算团队今日正式对外发布了大模型后训练领域的新型算法——FIPO（Future-KL Influenced Policy Optimization）。该算法通过引入创新的“Future-KL”机制，有效解决了纯强化学习（Pure RL）训练过程中普遍存在的“推理长度停滞”技术瓶颈。

在长文本推理与复杂逻辑对齐的训练中，传统强化学习往往难以精准捕捉长序列中的关键决策点。通义团队开发的FIPO算法通过对关键Token实施差异化奖励分配，引导模型在思维链（CoT）生成过程中更具前瞻性。

实验数据显示，在32B规模模型的纯强化学习设定下，搭载FIPO算法的模型性能已率先超越同规模的DeepSeek-Zero-MATH以及OpenAI的o1-mini，标志着国产大模型在逻辑推理与数学计算能力上取得了实质性进展。

当前，大模型竞争的重心正从预训练规模转向推理端的深度对齐。FIPO算法的推出，不仅为解决逻辑推理模型中“思考过程”的质量评估提供了新思路，也预示着开源社区与国产头部实验室在追赶全球顶尖推理模型过程中，正逐步构建起独立的技术演进路径。

via AI新闻资讯 (author: AI Base)

3 小时前

Anthropic 发起 Project Glasswing，联合多家机构用 AI 排查关键软件漏洞

Anthropic 发布网络安全计划 Project Glasswing，联合 AWS、Apple、Google、Microsoft、NVIDIA、JPMorganChase 等机构，将未公开模型 Claude Mythos Preview 用于防御性安全工作，并向 40 多家关键软件基础设施相关组织开放接入。

Anthropic 称，该模型在数周内已发现数千个高危零日漏洞，涉及主要操作系统、浏览器及其他重要软件，部分漏洞已完成修补。公司承诺为该项目提供最高 1 亿美元模型使用额度，并向开源安全组织直接捐赠 400 万美元；该模型暂不计划全面开放，Anthropic 计划在 90 天内公开阶段性成果。

Anthropic

🌸 在花频道｜茶馆讨论｜投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel

3 小时前

马斯克起诉OpenAI案升级：要求罢免CEO

埃隆·马斯克为阻止 OpenAI 转型为营利性公司对其提起了诉讼，现在正寻求罢免OpenAI CEO兼董事会成员萨姆·奥尔特曼在该公司的职务。马斯克在周二提交的一份法院文件中表示，其诉讼的目的是“撤销 OpenAI 的营利性转型及重组”，这将涉及解除奥尔特曼和总裁格雷格·布罗克曼的领导职务。他还寻求法院下令恢复该公司作为非营利研究机构的地位。他还在文件中表示，在本月稍晚时候与奥尔特曼及OpenAI对簿公堂、进行陪审团审理时，若其胜诉获得赔偿，他希望将相关赔偿判给该公司的慈善部门。“马斯克拟寻求的救济措施，完全服务于其提起本次诉讼的目的：防止一个公共慈善机构被置于私人、营利性利益之下。”马斯克在文件中称。

—— 凤凰网科技、彭博社

via 风向旗参考快讯 - Telegram Channel

3 小时前

Horizon Summary: 2026-04-08 (ZH)

via Horizon Daily - 中文摘要

Horizon Daily

Horizon Summary: 2026-04-08 (ZH)

From 51 items, 20 important content pieces were selected

3 小时前

Degraded Performance for Self-Hosted Cloud Agents

Apr 8, 00:12 UTC
Investigating - We are investigating this issue.

via Cursor Status - Incident History

3 小时前

#Update #Claude

Claude Mythos Preview 已正式发布，宣称 SOTA 但并不打算对公众开放使用。

via AI Copilot - Telegram Channel

Before

After

Home