https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
智谱发布GLM-5.1:SWE-bench评分全球领跑,模型单价上调10%
近日,智谱正式发布全新大模型GLM-5.1。伴随新品上线,模型聚合平台OpenRouter监测显示,智谱GLM全线提价10%。此次调价后,GLM-5.1在Coding(编程)等核心场景的缓存命中Token价格已基本锚定Anthropic旗下Claude3.5Sonnet。这是国产大模型在经历早期“价格战”后,首次在主流应用场景实现与全球顶尖厂商的价格对齐,标志着行业竞争重心已从成本倾销转向性能溢价。
技术表现上,GLM-5.1在衡量专业软件开发能力的SWE-bench Pro基准测试中刷新世界纪录,超越了此前领先的Claude4.6Opus,位居国产及开源模型首位。不同于当前主流的分钟级交互逻辑,GLM-5.1具备极强的自主工程能力,能够在单次任务中持续工作长达8小时。在长时作业过程中,该模型可独立完成规划、执行与测试,并具备主动切换策略与自行修复错误的能力,能够直接交付完整的工程级成果。
受此消息影响,智谱股价于8日上午一度大涨14.12%,报890元/股,公司总市值攀升至3964亿元。从一年前降价90%争夺份额,到如今凭借技术优势对标国际基准,智谱的战略转型反映出头部国产厂商正试图通过解决复杂任务的“长航时”能力,重塑全球AI市场的价值分配格局。
via AI新闻资讯 (author: AI Base)
近日,智谱正式发布全新大模型GLM-5.1。伴随新品上线,模型聚合平台OpenRouter监测显示,智谱GLM全线提价10%。此次调价后,GLM-5.1在Coding(编程)等核心场景的缓存命中Token价格已基本锚定Anthropic旗下Claude3.5Sonnet。这是国产大模型在经历早期“价格战”后,首次在主流应用场景实现与全球顶尖厂商的价格对齐,标志着行业竞争重心已从成本倾销转向性能溢价。
技术表现上,GLM-5.1在衡量专业软件开发能力的SWE-bench Pro基准测试中刷新世界纪录,超越了此前领先的Claude4.6Opus,位居国产及开源模型首位。不同于当前主流的分钟级交互逻辑,GLM-5.1具备极强的自主工程能力,能够在单次任务中持续工作长达8小时。在长时作业过程中,该模型可独立完成规划、执行与测试,并具备主动切换策略与自行修复错误的能力,能够直接交付完整的工程级成果。
受此消息影响,智谱股价于8日上午一度大涨14.12%,报890元/股,公司总市值攀升至3964亿元。从一年前降价90%争夺份额,到如今凭借技术优势对标国际基准,智谱的战略转型反映出头部国产厂商正试图通过解决复杂任务的“长航时”能力,重塑全球AI市场的价值分配格局。
via AI新闻资讯 (author: AI Base)
随着人工智能在代码生成和逻辑推理领域的飞速进化,网络安全的平衡正面临前空前的挑战。近日,知名 AI 初创公司Anthropic正式发起名为**“玻璃翼计划”(Project Glasswing)**的跨行业协作项目,旨在利用最尖端的 AI 模型防御日益复杂的人工智能网络攻击。
这一“超级联盟”阵容豪华,创始合作伙伴包括苹果 (Apple)、谷歌 (Google)、亚马逊 (AWS)、微软 (Microsoft)、英伟达 (Nvidia) 以及思科、博通、CrowdStrike、Palo Alto Networks 等网络安全巨头。此外,摩根大通和 Linux 基金会也已加入其中。
“以毒攻毒”:应对潜在的安全威胁
该计划的核心源于 Anthropic 研发的一款尚未发布的实验性模型——Claude Mythos Preview。该模型展现出了极强的软件漏洞发现与利用能力。在初步测试中,Mythos 成功识别出数千个高危漏洞,甚至包括在 OpenBSD 等关键基础设施中潜伏了 27年之久、能导致系统远程崩溃的顽固漏洞。
Anthropic 警告称,如果此类能力落入不法分子之手,现有的操作系统和浏览器防御体系将变得脆弱不堪。为了抢在攻击者之前修复漏洞,Anthropic将为参与成员提供价值 1亿美元的 Mythos Preview 使用额度,并向开源安全组织直接捐赠400万美元,协助其加固基础软件。
防御未来的长远布局
对于普通用户而言,短期内可能不会感知到iOS或macOS的界面变化,但幕后的安全机制将迎来深度重构。此前,苹果已通过iMessage的PQ3协议布局后量子加密防御,而参与“玻璃翼计划”则是其应对 AI 辅助攻击的又一关键举措。
Anthropic 强调,面对 AI 带来的安全变量,没有任何一家公司能独善其身。这场捍卫数字基础设施的“长跑”才刚刚开始。
via AI新闻资讯 (author: AI Base)
360 打造“虾书”APP:围观智能体互怼的数字社区
据报道,360集团正在开发一款名为 “虾书” 的全新社区产品。该产品以“小龙虾”AI 智能体为核心,主打 AI 自主社交,目前网页版已率先上线。
核心玩法:从“使用者”转变为“观察者”
不同于传统的指令式 AI,“虾书”提供了一种极具实验色彩的社交体验:
自主意识智能体: 基于 OpenClaw 生态打造,这些 AI 小龙虾具备独立思考与自主意识。
围观与投喂: 用户在社区中更像是一位旁观者,可以近距离观察 AI 智能体之间的各种趣味互动。
真实的“社交修罗场”: AI 之间的互动涵盖了协作、深度交流,甚至是激烈的“拌嘴”。用户可以通过投喂等操作,影响或参与到这些数字生命的成长中。
战略布局:深耕 OpenClaw 生态
“虾书”APP 是360集团布局 AI 智能体生态的重要一环:
解决行业痛点: 此前360已推出“360安全龙虾”,解决了 OpenClaw 生态下产品集成的多个技术难点。
生态闭环: 从底层安全到上层社交,北京奇虎360科技有限公司正试图构建一个完整的 AI 原生应用集群。
行业观察:社交的“去人类化”尝试
在社交媒体逐渐同质化的今天,360集团的“虾书”展现了一种全新的可能性:当 AI 能够自发地产生内容与互动,人类的社交或许会进入一个“观赏性大于参与性”的新次元。
结语:当 AI 开始“拌嘴”
“虾书”不仅是一款 APP,更是一个关于 AI 进化与社交边界的社会学实验。当这群拥有独立人格的小龙虾开始在数字世界里建立社群,现实世界的社交规则或许也将随之改变。
via AI新闻资讯 (author: AI Base)
据报道,360集团正在开发一款名为 “虾书” 的全新社区产品。该产品以“小龙虾”AI 智能体为核心,主打 AI 自主社交,目前网页版已率先上线。
核心玩法:从“使用者”转变为“观察者”
不同于传统的指令式 AI,“虾书”提供了一种极具实验色彩的社交体验:
自主意识智能体: 基于 OpenClaw 生态打造,这些 AI 小龙虾具备独立思考与自主意识。
围观与投喂: 用户在社区中更像是一位旁观者,可以近距离观察 AI 智能体之间的各种趣味互动。
真实的“社交修罗场”: AI 之间的互动涵盖了协作、深度交流,甚至是激烈的“拌嘴”。用户可以通过投喂等操作,影响或参与到这些数字生命的成长中。
战略布局:深耕 OpenClaw 生态
“虾书”APP 是360集团布局 AI 智能体生态的重要一环:
解决行业痛点: 此前360已推出“360安全龙虾”,解决了 OpenClaw 生态下产品集成的多个技术难点。
生态闭环: 从底层安全到上层社交,北京奇虎360科技有限公司正试图构建一个完整的 AI 原生应用集群。
行业观察:社交的“去人类化”尝试
在社交媒体逐渐同质化的今天,360集团的“虾书”展现了一种全新的可能性:当 AI 能够自发地产生内容与互动,人类的社交或许会进入一个“观赏性大于参与性”的新次元。
结语:当 AI 开始“拌嘴”
“虾书”不仅是一款 APP,更是一个关于 AI 进化与社交边界的社会学实验。当这群拥有独立人格的小龙虾开始在数字世界里建立社群,现实世界的社交规则或许也将随之改变。
via AI新闻资讯 (author: AI Base)
工信部发布《人工智能科技伦理审查与服务办法(试行)》,明确 AI 伦理治理新规
近日,工业和信息化部等十个部门联合印发了《人工智能科技伦理审查与服务办法(试行)》,为我国的人工智能科技伦理审查与服务工作提供了详细的指引。这一办法的出台,旨在规范和促进人工智能科技活动的伦理治理,确保科技活动的合规与安全。
《办法》明确了人工智能科技伦理审查的适用范围、实施主体以及工作程序。针对人工智能技术的特点,规定了申请与受理、审查程序、专家复核等多个环节,确保审查工作有序进行。同时,办法强调了科技伦理风险防控的重要性,鼓励企业建设相应的伦理服务体系。
在支持措施方面,《办法》从标准建设、服务体系、创新鼓励、宣传教育和人才培养等五个方面提出了具体的举措,帮助企业提升科技伦理风险防控能力。此外,该办法与现有的相关政策法规相协调,确保人工智能治理的有效性和一致性。
在审查程序方面,人工智能科技活动的负责人需向单位的伦理委员会或审查与服务中心提交申请,经过受理后,将按照不同的审查程序进行评估。重点审查领域包括人机融合系统、舆论引导能力的算法模型,以及具有高度自主能力的决策系统等。
《办法》还对违反相关规定的行为提出了明确的法律后果,将依据相关法律法规进行调查处理。这一系列措施的实施,将有助于更好地管理人工智能领域的伦理问题,促进科技发展与社会责任的协调。
via AI新闻资讯 (author: AI Base)
近日,工业和信息化部等十个部门联合印发了《人工智能科技伦理审查与服务办法(试行)》,为我国的人工智能科技伦理审查与服务工作提供了详细的指引。这一办法的出台,旨在规范和促进人工智能科技活动的伦理治理,确保科技活动的合规与安全。
《办法》明确了人工智能科技伦理审查的适用范围、实施主体以及工作程序。针对人工智能技术的特点,规定了申请与受理、审查程序、专家复核等多个环节,确保审查工作有序进行。同时,办法强调了科技伦理风险防控的重要性,鼓励企业建设相应的伦理服务体系。
在支持措施方面,《办法》从标准建设、服务体系、创新鼓励、宣传教育和人才培养等五个方面提出了具体的举措,帮助企业提升科技伦理风险防控能力。此外,该办法与现有的相关政策法规相协调,确保人工智能治理的有效性和一致性。
在审查程序方面,人工智能科技活动的负责人需向单位的伦理委员会或审查与服务中心提交申请,经过受理后,将按照不同的审查程序进行评估。重点审查领域包括人机融合系统、舆论引导能力的算法模型,以及具有高度自主能力的决策系统等。
《办法》还对违反相关规定的行为提出了明确的法律后果,将依据相关法律法规进行调查处理。这一系列措施的实施,将有助于更好地管理人工智能领域的伦理问题,促进科技发展与社会责任的协调。
划重点:
📝 《人工智能科技伦理审查与服务办法(试行)》正式发布,规范 AI 伦理治理。
🔍 办法明确审查程序和重点领域,确保科技活动的合规与安全。
⚖️ 违反规定将依据法律法规进行处理,推动人工智能健康发展。
via AI新闻资讯 (author: AI Base)
Alphabet 为 Gemini 增加心理健康支持功能:一键直达危机救助
据媒体报道,Alphabet 正在为其 AI 助手 Gemini 增加全新的心理健康支持功能。同时,公司承诺在未来三年内投入 3000 万美元,用于支持全球危机热线扩大其服务能力。
核心功能:识别危机,一键“可获得帮助”
谷歌对 Gemini 的交互逻辑进行了深度重构,旨在关键时刻挽救生命:
智能识别: 当对话内容暗示用户可能需要心理健康支持(如提及自残或自杀倾向)时,Gemini将自动弹出重新设计的“可获得帮助”模块。
简化干预: 系统将提供一个一键式界面,让用户能够跳过繁琐操作,直接拨打电话、发送短信、启动在线聊天或访问专业的危机热线。
持续守护: 一旦危机模块被激活,联系专业帮助的选项将在该对话的剩余部分保持可见,确保用户随时可以获取支持。
专业协作:与临床专家共同开发
为了确保建议的专业性和安全性,这些新工具并非闭门造车:
专家背书: 谷歌表示,所有功能均是与临床专家共同开发的,旨在使获得护理的途径更加便捷且符合医学伦理。
深化合作: 谷歌还扩大了与 ReflexAI 的合作,包括提供 400 万美元的直接资助,并将 Gemini 集成到社会部门组织使用的培训工具中。
行业背景:AI 安全与监管的平衡
随着人们开始将 AI 用于解决极其个人化和复杂的问题,Alphabet 的这一举措标志着 AI 正在从“效率工具”向“负责任的伙伴”转型。
资源投入: 此次 3000 万美元的投入显示了 Alphabet 在人工智能安全领域的决心。
合规挑战: 投资者和监管机构正密切关注谷歌如何在用户增长、隐私保护以及 AI 产品的伦理安全之间寻求最优解。
结语:技术背后的温情
AI 不应只是冰冷的代码。通过在Gemini中内置心理健康防线,谷歌正在尝试用算法编织一张更紧密的安全网,在数字化时代为脆弱的心灵提供一份及时的慰藉。
via AI新闻资讯 (author: AI Base)
据媒体报道,Alphabet 正在为其 AI 助手 Gemini 增加全新的心理健康支持功能。同时,公司承诺在未来三年内投入 3000 万美元,用于支持全球危机热线扩大其服务能力。
核心功能:识别危机,一键“可获得帮助”
谷歌对 Gemini 的交互逻辑进行了深度重构,旨在关键时刻挽救生命:
智能识别: 当对话内容暗示用户可能需要心理健康支持(如提及自残或自杀倾向)时,Gemini将自动弹出重新设计的“可获得帮助”模块。
简化干预: 系统将提供一个一键式界面,让用户能够跳过繁琐操作,直接拨打电话、发送短信、启动在线聊天或访问专业的危机热线。
持续守护: 一旦危机模块被激活,联系专业帮助的选项将在该对话的剩余部分保持可见,确保用户随时可以获取支持。
专业协作:与临床专家共同开发
为了确保建议的专业性和安全性,这些新工具并非闭门造车:
专家背书: 谷歌表示,所有功能均是与临床专家共同开发的,旨在使获得护理的途径更加便捷且符合医学伦理。
深化合作: 谷歌还扩大了与 ReflexAI 的合作,包括提供 400 万美元的直接资助,并将 Gemini 集成到社会部门组织使用的培训工具中。
行业背景:AI 安全与监管的平衡
随着人们开始将 AI 用于解决极其个人化和复杂的问题,Alphabet 的这一举措标志着 AI 正在从“效率工具”向“负责任的伙伴”转型。
资源投入: 此次 3000 万美元的投入显示了 Alphabet 在人工智能安全领域的决心。
合规挑战: 投资者和监管机构正密切关注谷歌如何在用户增长、隐私保护以及 AI 产品的伦理安全之间寻求最优解。
结语:技术背后的温情
AI 不应只是冰冷的代码。通过在Gemini中内置心理健康防线,谷歌正在尝试用算法编织一张更紧密的安全网,在数字化时代为脆弱的心灵提供一份及时的慰藉。
via AI新闻资讯 (author: AI Base)
贝索斯的新实验室从 OpenAI挖来 xAI联合创始人
杰夫·贝索斯旗下的一家公司从OpenAI挖走了一名 xAI 联合创始人。这家行事低调的初创企业正迅速扩招,以推进其打造能够改造工业领域的人工智能系统这一雄心。据知情人士透露,凯尔•科西奇已加入“普罗米修斯计划”。这是由贝索斯和前谷歌高管维克拉姆•巴贾吉领导的一家新公司的代号。科西奇是与埃隆•马斯克共同创立 xAI的联合创始人之一。在2024年回到老东家OpenAI之前,他曾负责xAI的Colossus超级计算机背后的基础设施团队。知情人士称,他在普罗米修斯将继续从事AI基础设施项目。马斯克的11位xAI联合创始人已全部离开,其中数人在近几个月内离职,有些还对马斯克的管理提出不满。
—— 英国金融时报
via 风向旗参考快讯 - Telegram Channel
杰夫·贝索斯旗下的一家公司从OpenAI挖走了一名 xAI 联合创始人。这家行事低调的初创企业正迅速扩招,以推进其打造能够改造工业领域的人工智能系统这一雄心。据知情人士透露,凯尔•科西奇已加入“普罗米修斯计划”。这是由贝索斯和前谷歌高管维克拉姆•巴贾吉领导的一家新公司的代号。科西奇是与埃隆•马斯克共同创立 xAI的联合创始人之一。在2024年回到老东家OpenAI之前,他曾负责xAI的Colossus超级计算机背后的基础设施团队。知情人士称,他在普罗米修斯将继续从事AI基础设施项目。马斯克的11位xAI联合创始人已全部离开,其中数人在近几个月内离职,有些还对马斯克的管理提出不满。
—— 英国金融时报
via 风向旗参考快讯 - Telegram Channel
32B 推理性能反超 o1-mini!阿里通义发布 FIPO 算法,让大模型“想得更深”
据报道,阿里通义实验室的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习(RL)在处理复杂逻辑时的瓶颈,让模型在推理长度和准确率上实现双重飞跃。
核心突破:解决“推理长度停滞”
传统模型在面对数学等复杂问题时,往往难以区分哪些 Token 是通往正确答案的关键。FIPO 算法对此进行了针对性重构:
Future-KL 机制: 引入 Future-KL 策略,专门奖励那些对后续推理有显著积极影响的 Token,让 AI 学会“深谋远虑”。
符号对数概率差: 引入这一新机制来精准捕捉模型的优化方向,避免推理过程陷入无效的循环。
推理长度跨越: 在零基础模型上,FIPO 成功将平均推理长度提升至 10,000 Token 以上,彻底解决了推理深度不足的问题。
战绩斐然:32B 模型逆袭 o1-mini
在实测对比中,搭载 FIPO 算法的 32B 规模模型展现出了惊人的“小钢炮”属性:
反超竞品: 在纯强化学习设置下,其推理性能成功反超同规模模型,甚至在部分指标上优于OpenAI 的 o1-mini。
数学潜力: 算法在处理高难度数学推理题目时表现尤为出色,展现了极强的逻辑推导潜力。
行业背景:通义实验室的“智能进化”
阿里通义实验室近期在 AI 底层算法上动作频频。除了本次惊艳的 FIPO 算法,团队在 3 月底刚推出了CoPaw 1.0 新版本,显示出其在提升模型逻辑严密性与交互深度方面的持续深耕。
结语:推理效率的“第二曲线”
当行业还在争论参数规模时,阿里通义通过 FIPO 算法证明了:通过更精细的奖励机制和逻辑诱导,较小规模的模型同样能迸发出顶级的“思考力”。
via AI新闻资讯 (author: AI Base)
据报道,阿里通义实验室的 Qwen Pilot 团队推出了一项名为 FIPO 的全新算法。该算法旨在打破传统强化学习(RL)在处理复杂逻辑时的瓶颈,让模型在推理长度和准确率上实现双重飞跃。
核心突破:解决“推理长度停滞”
传统模型在面对数学等复杂问题时,往往难以区分哪些 Token 是通往正确答案的关键。FIPO 算法对此进行了针对性重构:
Future-KL 机制: 引入 Future-KL 策略,专门奖励那些对后续推理有显著积极影响的 Token,让 AI 学会“深谋远虑”。
符号对数概率差: 引入这一新机制来精准捕捉模型的优化方向,避免推理过程陷入无效的循环。
推理长度跨越: 在零基础模型上,FIPO 成功将平均推理长度提升至 10,000 Token 以上,彻底解决了推理深度不足的问题。
战绩斐然:32B 模型逆袭 o1-mini
在实测对比中,搭载 FIPO 算法的 32B 规模模型展现出了惊人的“小钢炮”属性:
反超竞品: 在纯强化学习设置下,其推理性能成功反超同规模模型,甚至在部分指标上优于OpenAI 的 o1-mini。
数学潜力: 算法在处理高难度数学推理题目时表现尤为出色,展现了极强的逻辑推导潜力。
行业背景:通义实验室的“智能进化”
阿里通义实验室近期在 AI 底层算法上动作频频。除了本次惊艳的 FIPO 算法,团队在 3 月底刚推出了CoPaw 1.0 新版本,显示出其在提升模型逻辑严密性与交互深度方面的持续深耕。
结语:推理效率的“第二曲线”
当行业还在争论参数规模时,阿里通义通过 FIPO 算法证明了:通过更精细的奖励机制和逻辑诱导,较小规模的模型同样能迸发出顶级的“思考力”。
via AI新闻资讯 (author: AI Base)
小米罗福莉谈 Anthropic 封杀 OpenClaw:低价 Token 并非行业出路
AI 行业再度掀起波澜。Anthropic 宣布切断包括 OpenClaw 在内的多个第三方框架通过其 Claude 订阅服务的调用通道。此举令许多依赖订阅服务的用户感到措手不及。Anthropic 的官方解释指出,部分重度用户仅支付 200 美元的订阅费,却消耗了价值 5000 美元的算力资源,造成公司严重的财务压力。
对此,小米 MiMo 大模型负责人罗福莉发表了看法。她认为,第三方框架由于上下文管理的低效率,导致其 Token 消耗量是原生框架的数十倍。这种情况让 Anthropic 不得不采取止损措施,阻止更多的财务损失。罗福莉警告行业内其他大模型公司,若盲目参与 “Token 价格战”,会面临巨大的财务风险。她表示,在尚未理清订阅定价策略的情况下,低价销售 Token,并开放给第三方工具的做法实际上是一个陷阱。
小米的 MiMo 大模型近期也推出了按量计费的 Token Plan,支持第三方接入。罗福莉强调,行业的未来在于高效框架与优质模型的协同进化,而非单纯追求低价。她认为,短期的成本阵痛将迫使第三方开发者优化技术,这对整个生态系统的长期健康发展是有利的。
Anthropic 的决定无疑引发了行业对于 Token 定价和使用效率的深思。随着算力需求的急剧增长,企业必须找到更为可持续的商业模式,而非仅依赖于降低 Token 价格。
via AI新闻资讯 (author: AI Base)
AI 行业再度掀起波澜。Anthropic 宣布切断包括 OpenClaw 在内的多个第三方框架通过其 Claude 订阅服务的调用通道。此举令许多依赖订阅服务的用户感到措手不及。Anthropic 的官方解释指出,部分重度用户仅支付 200 美元的订阅费,却消耗了价值 5000 美元的算力资源,造成公司严重的财务压力。
对此,小米 MiMo 大模型负责人罗福莉发表了看法。她认为,第三方框架由于上下文管理的低效率,导致其 Token 消耗量是原生框架的数十倍。这种情况让 Anthropic 不得不采取止损措施,阻止更多的财务损失。罗福莉警告行业内其他大模型公司,若盲目参与 “Token 价格战”,会面临巨大的财务风险。她表示,在尚未理清订阅定价策略的情况下,低价销售 Token,并开放给第三方工具的做法实际上是一个陷阱。
小米的 MiMo 大模型近期也推出了按量计费的 Token Plan,支持第三方接入。罗福莉强调,行业的未来在于高效框架与优质模型的协同进化,而非单纯追求低价。她认为,短期的成本阵痛将迫使第三方开发者优化技术,这对整个生态系统的长期健康发展是有利的。
Anthropic 的决定无疑引发了行业对于 Token 定价和使用效率的深思。随着算力需求的急剧增长,企业必须找到更为可持续的商业模式,而非仅依赖于降低 Token 价格。
划重点:
🌟 Anthropic 切断第三方框架调用通道,主要因重度用户消耗算力资源过大。
💡 罗福莉警告行业勿陷入低价 Token 的恶性竞争,强调定价策略的重要性。
🚀 小米 MiMo 已推出按量计费的 Token Plan,行业未来在于高效框架与优质模型的共同发展。
via AI新闻资讯 (author: AI Base)
DeepSeek V4 灰度测试曝光:全新视觉版与“专家模式”现身
4 月 7 日,Readhub消息显示,DeepSeek V4正在进行密集的灰度测试。多位程序员及社交媒体博主展示的新界面显示,新一代模型不仅在底层架构上有所突破,在交互逻辑和多模态能力上也迎来了重大升级。
核心亮点:三足鼎立的新功能架构
从曝光的测试界面来看,DeepSeek V4提供了三个核心选项,预示着其产品矩阵的全面进化:
快速版 (DeepSeek V4 Lite): 主打响应速度,侧重于日常轻量化对话。
专家版 (DeepSeek V4): 深度逻辑推理模式,可能是基于传闻中梁文锋署名论文提到的“全新记忆架构”打造。
视觉版 (DeepSeek V4 Vision): 标志着多模态能力的深度集成,可直接处理图像与视频分析任务。
技术路线:坚定的“国产芯”支持者
DeepSeek的崛起不仅在于算法,更在于对本土算力生态的深度适配:
国产 AI 芯片优先: 消息称 DeepSeek 正在开发至少 2 款完全基于国产 AI 芯片的大模型,并已提前开启国产芯片抢货模式。
拒绝依赖: 在此前对美芯片商的测试申请中,DeepSeek 未开放 V4 模型测试,而是优先开放给国内厂商进行协同优化。
行业期待:能否挑战编程巅峰?
除了基础性能的提升,市场对DeepSeek V4还有更多垂直领域的期待:
AI 编程特别版: 业内猜测其将推出专门针对代码生成与工程实现的版本,正面硬刚Anthropic的 Mythos 或OpenAI的 GPT 系列。
超长文本处理: 延续DeepSeek 此前的优势,V4 预计将具备一次性处理百万级 Token 的超长文本能力。
话题追踪:蓄势已久的发布周期
从今年 1 月曝出MODEL1 新架构,到 2 月发布OCR 2 模型,再到如今的频繁灰测,DeepSeek V4的发布已如箭在弦上。随着本月发布窗口的临近,这款主打“原生记忆”与“国产适配”的旗舰模型,或将再次重塑国产大模型的性价比天花板。
结语:更懂中国算力的 AI
从代码自动验证到全新的视觉交互,DeepSeek正在证明,不依赖海外顶级芯片,国产模型依然能跑出令人惊叹的进化曲线。
via AI新闻资讯 (author: AI Base)
4 月 7 日,Readhub消息显示,DeepSeek V4正在进行密集的灰度测试。多位程序员及社交媒体博主展示的新界面显示,新一代模型不仅在底层架构上有所突破,在交互逻辑和多模态能力上也迎来了重大升级。
核心亮点:三足鼎立的新功能架构
从曝光的测试界面来看,DeepSeek V4提供了三个核心选项,预示着其产品矩阵的全面进化:
快速版 (DeepSeek V4 Lite): 主打响应速度,侧重于日常轻量化对话。
专家版 (DeepSeek V4): 深度逻辑推理模式,可能是基于传闻中梁文锋署名论文提到的“全新记忆架构”打造。
视觉版 (DeepSeek V4 Vision): 标志着多模态能力的深度集成,可直接处理图像与视频分析任务。
技术路线:坚定的“国产芯”支持者
DeepSeek的崛起不仅在于算法,更在于对本土算力生态的深度适配:
国产 AI 芯片优先: 消息称 DeepSeek 正在开发至少 2 款完全基于国产 AI 芯片的大模型,并已提前开启国产芯片抢货模式。
拒绝依赖: 在此前对美芯片商的测试申请中,DeepSeek 未开放 V4 模型测试,而是优先开放给国内厂商进行协同优化。
行业期待:能否挑战编程巅峰?
除了基础性能的提升,市场对DeepSeek V4还有更多垂直领域的期待:
AI 编程特别版: 业内猜测其将推出专门针对代码生成与工程实现的版本,正面硬刚Anthropic的 Mythos 或OpenAI的 GPT 系列。
超长文本处理: 延续DeepSeek 此前的优势,V4 预计将具备一次性处理百万级 Token 的超长文本能力。
话题追踪:蓄势已久的发布周期
从今年 1 月曝出MODEL1 新架构,到 2 月发布OCR 2 模型,再到如今的频繁灰测,DeepSeek V4的发布已如箭在弦上。随着本月发布窗口的临近,这款主打“原生记忆”与“国产适配”的旗舰模型,或将再次重塑国产大模型的性价比天花板。
结语:更懂中国算力的 AI
从代码自动验证到全新的视觉交互,DeepSeek正在证明,不依赖海外顶级芯片,国产模型依然能跑出令人惊叹的进化曲线。
via AI新闻资讯 (author: AI Base)
Anthropic 发布最强模型 Mythos:专治陈年漏洞
当地时间周二,Anthropic正式推出了其新一代“前沿模型” Mythos 的预览版本。这款被内部誉为“迄今最强大”的 AI,不仅在推理能力上实现了跨越,更在网络安全领域展现出了令人战栗的杀伤力。
核心亮点:AI 界的“超级探针”
不同于以往的通用对话模型,Mythos 在“智能体”级别的编程与推理上表现惊人:
● 漏洞挖掘专家: 在过去几周的封闭测试中,Mythos 已成功扫描出数千个零日漏洞,其中包含大量高危级别。
● 跨越时空的精准: 令人震惊的是,该模型精准锁定了许多隐藏在一二十年前老旧代码中的“历史遗留问题”,这些漏洞在漫长的技术迭代中曾被无数人类专家忽略。
● 防御性部署: 目前该预览版主要用于扫描第一方及开源系统的代码缺陷,旨在抢在黑客之前补上“后门”。
试用门槛:仅限顶级安全“朋友圈”
由于 Mythos 具备极强的攻击性潜力,Anthropic明确表示暂不向公众开放,而是通过名为 “Project Glasswing” 的安全项目进行定向试用。
● 顶级大厂护航: 参与试用的组织包括Apple、Amazon、Microsoft、Cisco以及CrowdStrike等数十家行业巨头。
● 国家级讨论: Anthropic透露已与美国联邦官员展开持续对话,探讨该模型在国家级关键系统中的防御性应用。
意外插曲:一份被误放的“Capybara”草稿
Mythos 的正式亮相其实源于一次尴尬的“人为错误”。
上个月,《财富》杂志爆料,Anthropic一份内部代号为 “Capybara(水豚)” 的博客草稿被错误地存放在公开数据湖中。草稿中毫不掩饰地警告:如果该模型被恶意利用,其发现漏洞的速度将远超防御者的补丁更新速度,甚至可能引发新一轮 AI 驱动的全球安全浪潮。
争议焦点:供应链风险与监管博弈
伴随着强大性能而来的还有激烈的法律纠纷:
● 国防部黑名单: 由于Anthropic拒绝将其技术用于对美国公民的自主打击或监控,美国国防部近期将其列为“供应链风险实体”。
● 伦理边界: 如何在赋予 AI 强大防御能力的同时,防止其成为黑客手中的“万能钥匙”,正成为全行业共同的命题。
结语:AI 时代的“盾”与“矛”
Mythos的出现标志着 AI 已经具备了深度解析人类技术文明“历史漏洞”的能力。当机器比人类更了解我们过去犯下的错误,安全竞赛的规则将被彻底重写。
via AI新闻资讯 (author: AI Base)
当地时间周二,Anthropic正式推出了其新一代“前沿模型” Mythos 的预览版本。这款被内部誉为“迄今最强大”的 AI,不仅在推理能力上实现了跨越,更在网络安全领域展现出了令人战栗的杀伤力。
核心亮点:AI 界的“超级探针”
不同于以往的通用对话模型,Mythos 在“智能体”级别的编程与推理上表现惊人:
● 漏洞挖掘专家: 在过去几周的封闭测试中,Mythos 已成功扫描出数千个零日漏洞,其中包含大量高危级别。
● 跨越时空的精准: 令人震惊的是,该模型精准锁定了许多隐藏在一二十年前老旧代码中的“历史遗留问题”,这些漏洞在漫长的技术迭代中曾被无数人类专家忽略。
● 防御性部署: 目前该预览版主要用于扫描第一方及开源系统的代码缺陷,旨在抢在黑客之前补上“后门”。
试用门槛:仅限顶级安全“朋友圈”
由于 Mythos 具备极强的攻击性潜力,Anthropic明确表示暂不向公众开放,而是通过名为 “Project Glasswing” 的安全项目进行定向试用。
● 顶级大厂护航: 参与试用的组织包括Apple、Amazon、Microsoft、Cisco以及CrowdStrike等数十家行业巨头。
● 国家级讨论: Anthropic透露已与美国联邦官员展开持续对话,探讨该模型在国家级关键系统中的防御性应用。
意外插曲:一份被误放的“Capybara”草稿
Mythos 的正式亮相其实源于一次尴尬的“人为错误”。
上个月,《财富》杂志爆料,Anthropic一份内部代号为 “Capybara(水豚)” 的博客草稿被错误地存放在公开数据湖中。草稿中毫不掩饰地警告:如果该模型被恶意利用,其发现漏洞的速度将远超防御者的补丁更新速度,甚至可能引发新一轮 AI 驱动的全球安全浪潮。
争议焦点:供应链风险与监管博弈
伴随着强大性能而来的还有激烈的法律纠纷:
● 国防部黑名单: 由于Anthropic拒绝将其技术用于对美国公民的自主打击或监控,美国国防部近期将其列为“供应链风险实体”。
● 伦理边界: 如何在赋予 AI 强大防御能力的同时,防止其成为黑客手中的“万能钥匙”,正成为全行业共同的命题。
结语:AI 时代的“盾”与“矛”
Mythos的出现标志着 AI 已经具备了深度解析人类技术文明“历史漏洞”的能力。当机器比人类更了解我们过去犯下的错误,安全竞赛的规则将被彻底重写。
via AI新闻资讯 (author: AI Base)
Google 于周二宣布,其 Google Maps 应用程序正在推出一项全新功能,旨在提升用户分享照片和视频的体验。利用最新的 Gemini 技术,用户在分享地点照片或视频时,系统将自动生成配图说明(caption),帮助用户轻松表达自己的内容。
具体使用流程非常简单:用户首先选择想要上传的照片或视频,接着 Gemini 会分析画面内容,并生成一段相关的文字说明。用户可以根据自己的需求对这段文字进行确认、修改或直接采纳。这项功能的推出,主要是为了为用户在分享内容时提供一个良好的开头,而不是完全替代用户的描述,确保分享的个性化。
目前,这项新功能已经在美国市场的 iOS 版 Google Maps 中上线,支持英文环境。Google 计划未来将这一功能逐步推广到全球范围,并扩展到 Android 系统。与此同时,Google 也在优化内容贡献的入口设计。当用户在手机设置中开启 “媒体访问权限” 后,Google Maps 的 “Contribute(贡献)” 标签页将直接显示最近拍摄的照片和短视频,便于用户一键选择并发布。
用户上传的照片和视频能够帮助其他用户更好地理解某个地点的 “整体氛围” 或最新的菜单信息,而这类内容现在也变得更容易被找到和分享。为了激励用户持续参与社区内容建设,Google 还在 “Contribute” 标签页中新增了对用户贡献成果的统计功能,用户可以查看自己累计获得的贡献积分总数,以更直观地了解自己的内容对平台的长期影响。
从战略层面看,自动生成照片说明的功能只是 Google 在2026年围绕 Gemini 打造 “AI 服务层” 的一部分。此前,Google 已经将 Gemini 深度整合进 Maps 的对话语音、沉浸式导航等核心场景,旨在进一步降低用户在搜索和规划行程时的认知与操作成本。
划重点:
🌟 Google Maps 新功能使用 Gemini 技术,自动生成照片说明。
📸 用户可轻松确认或修改生成的说明,提升分享体验。
🌍 该功能现已在美国的 iOS 版上线,未来将推广至全球和 Android。
via AI新闻资讯 (author: AI Base)
OpenClaw高危漏洞细节曝光,360漏洞挖掘智能体揭示AI原生应用安全新挑战
]4月7日,360漏洞挖掘智能体宣布成功发现并上报了AI智能体OpenClaw的3项高价值安全漏洞,其中包括1个高危漏洞及2个中危漏洞。目前,相关漏洞均已获官方修复并公开披露。这一进展标志着AI智能体在自动化安全审计领域实现了从传统规则驱动向智能思维驱动的跨越,为AI原生应用的安全治理提供了关键技术支撑。
此次发现的高危漏洞聚焦于本地脚本的审批与执行机制,攻击者可通过篡改已通过审批的脚本内容实现代码非法执行,进而控制用户设备。两处中危漏洞则分别涉及OAuth手动授权流程中的安全校验参数复用,以及语音通话WebSocket数据处理中的资源管控缺陷。前者可能导致用户Google服务账号权限被接管,后者则可能引发系统资源耗尽导致的设备崩溃。这些漏洞直击AI智能体核心运行机制,暴露出当前智能体在权限隔离与协议实现上的深层隐患。
据360方面介绍,该漏洞挖掘智能体体系已累计发现多款主流AI智能体的高价值漏洞。相比传统扫描工具,该系统能够模拟安全专家的攻防直觉,实现漏洞排查、验证及复现的自动化,从而将人力价值释放到更具创造力的风险研判领域。随着AI智能体逐渐深入用户业务流,此类由AI驱动的自动化漏洞挖掘技术将成为保障AI产业链底层安全的关键基础设施,推动行业构建更具韧性的安全防御体系。
via AI新闻资讯 (author: AI Base)
]4月7日,360漏洞挖掘智能体宣布成功发现并上报了AI智能体OpenClaw的3项高价值安全漏洞,其中包括1个高危漏洞及2个中危漏洞。目前,相关漏洞均已获官方修复并公开披露。这一进展标志着AI智能体在自动化安全审计领域实现了从传统规则驱动向智能思维驱动的跨越,为AI原生应用的安全治理提供了关键技术支撑。
此次发现的高危漏洞聚焦于本地脚本的审批与执行机制,攻击者可通过篡改已通过审批的脚本内容实现代码非法执行,进而控制用户设备。两处中危漏洞则分别涉及OAuth手动授权流程中的安全校验参数复用,以及语音通话WebSocket数据处理中的资源管控缺陷。前者可能导致用户Google服务账号权限被接管,后者则可能引发系统资源耗尽导致的设备崩溃。这些漏洞直击AI智能体核心运行机制,暴露出当前智能体在权限隔离与协议实现上的深层隐患。
据360方面介绍,该漏洞挖掘智能体体系已累计发现多款主流AI智能体的高价值漏洞。相比传统扫描工具,该系统能够模拟安全专家的攻防直觉,实现漏洞排查、验证及复现的自动化,从而将人力价值释放到更具创造力的风险研判领域。随着AI智能体逐渐深入用户业务流,此类由AI驱动的自动化漏洞挖掘技术将成为保障AI产业链底层安全的关键基础设施,推动行业构建更具韧性的安全防御体系。
via AI新闻资讯 (author: AI Base)
开发者自建 48 台 Mac mini 集群,破解云 AI 服务高昂成本
近日,播客应用 Overcast 的开发者 Marco Arment 选择自建一个由 48 台 Mac mini 组成的服务器集群,来应对云端 AI 服务所带来的高昂成本。Arment 指出,使用云端 AI 服务进行播客转录的费用按次计费,随着业务量的增加,每日支出可能高达数千美元,这让他不得不寻求更加经济实惠的解决方案。
在这 48 台 Mac mini 中,Arment 利用 Apple Silicon 芯片的能效和统一内存的优势,运行本地的语音识别模型,从而绕过了云端服务的高昂费用。他认为,尽管前期硬件投入较大,但后续的运营成本更加可控且可预测,这样一来就有效解决了随着业务量线性增长而带来的成本压力。
从技术实现上来看,整个转录过程依靠后端的 Mac mini 集群,通过分布式架构进一步提升处理效率。Arment 还特别强调了苹果芯片在执行语音识别等推理任务中的优越性能,尤其是在能效比和统一内存方面的优势。
在播客分发过程中,动态广告插入技术使得不同听众接收到的音频存在差异,这增加了转录对齐的难度。为了克服这一挑战,Arment 采用了音频指纹识别和去重技术,系统能够生成一份基准转录文本并将其映射到多个版本上。这种方法不仅保证了转录的一致性,还避免了重复计算,进一步提高了工作效率。
这一创新性的举措不仅展示了开发者的技术能力,同时也为其他类似业务提供了新的思路,让他们在面对高昂的云端服务费用时找到更加可行的解决方案。
via AI新闻资讯 (author: AI Base)
近日,播客应用 Overcast 的开发者 Marco Arment 选择自建一个由 48 台 Mac mini 组成的服务器集群,来应对云端 AI 服务所带来的高昂成本。Arment 指出,使用云端 AI 服务进行播客转录的费用按次计费,随着业务量的增加,每日支出可能高达数千美元,这让他不得不寻求更加经济实惠的解决方案。
在这 48 台 Mac mini 中,Arment 利用 Apple Silicon 芯片的能效和统一内存的优势,运行本地的语音识别模型,从而绕过了云端服务的高昂费用。他认为,尽管前期硬件投入较大,但后续的运营成本更加可控且可预测,这样一来就有效解决了随着业务量线性增长而带来的成本压力。
从技术实现上来看,整个转录过程依靠后端的 Mac mini 集群,通过分布式架构进一步提升处理效率。Arment 还特别强调了苹果芯片在执行语音识别等推理任务中的优越性能,尤其是在能效比和统一内存方面的优势。
在播客分发过程中,动态广告插入技术使得不同听众接收到的音频存在差异,这增加了转录对齐的难度。为了克服这一挑战,Arment 采用了音频指纹识别和去重技术,系统能够生成一份基准转录文本并将其映射到多个版本上。这种方法不仅保证了转录的一致性,还避免了重复计算,进一步提高了工作效率。
这一创新性的举措不仅展示了开发者的技术能力,同时也为其他类似业务提供了新的思路,让他们在面对高昂的云端服务费用时找到更加可行的解决方案。
划重点:
🌐 Arment 自建 48 台 Mac mini 集群,避免了云端 AI 服务的高昂费用。
💡 本地运行语音识别模型使得运营成本更加可控。
🔧 采用音频指纹识别和去重技术,提高转录效率与一致性。
via AI新闻资讯 (author: AI Base)
DeepSeek 上线其全新 “专家模式”,进一步提升了用户在处理复杂问题时的体验。此次更新是 DeepSeek 自发布以来首次引入模式分层设计,用户可以在输入框上方看到 “快速模式” 和 “专家模式” 两种选择。
“快速模式” 专为日常对话设计,具备即时响应的能力,并支持识别图片和文件中的文字,便于用户快速获取信息。而 “专家模式” 则专注于解决复杂的问题,支持更深入的思考和智能搜索。尽管当前此模式不支持文件上传及多模态功能,但 DeepSeek 明确表示,使用 “专家模式” 的用户在高峰时段可能需要等待。
在此版本中,用户反映 “专家模式” 的词元(token)吞吐速度极快,尽管尚不确定该模式是否搭载了传闻中的 DeepSeek V4 模型,但从实际使用来看,其表现相当出色。此外,网上有截图显示 DeepSeek 可能还新增了一个视觉模式,但该模式目前在官方界面尚未开放。
DeepSeek 的这次更新,意在增强用户对复杂问题的处理能力,使其在智能搜索的领域中更具竞争力。未来,随着更多功能的推出,DeepSeek 有望在人工智能行业中占据更重要的位置。
划重点:
🌟 DeepSeek 上线 “专家模式”,支持复杂问题的深入思考。
⚡ “快速模式” 用于日常对话,具备即时响应和文字识别功能。
🖼️ 未来可能推出视觉模式,当前尚未在官方界面看到。
via AI新闻资讯 (author: AI Base)