https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
深度求索发布 DeepSeek-V4 预览版

2026-04-24 15:59 by 约纳丹号历险记

深度求索发布了 DeepSeek-V4 预览版。DeepSeek-V4 有两个版本,其中 Pro 版本有 1.6 万亿参数其中 490 亿活跃参数;Flash 版本有 2840 亿参数其中活跃参数 130 亿。两个版本都支持百万上下文。DeepSeek V4 除了支持英伟达 GPU 还支持华为昇腾 NPU。深度求索称,在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异;Pro 在世界知识测评中,大幅领先其他开源模型,仅稍逊于顶尖闭源模型 Gemini-Pro-3.1;在数学、STEM、竞赛型代码的测评中,V4-Pro 超越当前所有已公开评测的开源模型。

https://mp.weixin.qq.com/s/8bxXqS2R8Fx5-1TLDBiEDg
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf

#人工智能

via Solidot - Telegram Channel
腾讯云 TokenHub 发布 DeepSeek-V4 预览版,百万上下文支持全面上线

腾讯云近日在其 TokenHub 平台上推出了 DeepSeek-V4 的预览版 API 服务,标志着该技术的进一步发展。此次发布的 DeepSeek-V4 支持高达百万的上下文长度,极大提升了自然语言处理能力。腾讯云在此项技术的上线方面与 DeepSeek 官方保持一致的定价策略,确保用户获得最具性价比的服务。

为了更好地服务全球用户,腾讯云还同步在其国际站新加坡节点上架 DeepSeek-V4,确保用户在不同地区均能访问到这一先进的 AI 技术。与此同时,腾讯云的 ADP(智能体开发平台)和 EdgeOne 服务也已整合了 DeepSeek-V4,为用户提供了快速构建基于新模型的智能应用的能力,使得企业可以以零成本将 DeepSeek-V4 嵌入到现有的服务中。

腾讯云的 TI-ONE 和 HCC 高性能计算集群也已完成对 DeepSeek-V4 的适配,旨在为企业提供从模型训练、精调到安全推理的完整解决方案。TI-ONE 平台不仅支持 DeepSeek V4-Pro 与 DeepSeek V4-Flash 的快速部署,还提供了全流程开发能力,助力企业在代码开发、文档处理、智能客服等场景中实现高效的 AI 生产力。

此外,ADP 平台的深度整合了多种核心能力,用户可以在该平台上快速搭建智能体,支持从配置到发布的全链路开发。同时,HCC 计算集群利用腾讯云的 “一云多芯” 架构,为企业提供高性价比的 AI 算力,帮助企业在进行 DeepSeek-V4 的大规模训练与推理时降低成本并提高效率。

腾讯云通过此次 DeepSeek-V4 的发布,向用户展示了其在大模型技术领域的领先地位,并持续为企业提供创新的 AI 解决方案,助力企业实现数字化转型。

划重点:

🌐 深度学习新高度:DeepSeek-V4 预览版 API 支持百万上下文长度,提升自然语言处理能力。

💡 全球覆盖:腾讯云国际站新加坡节点同步上线,确保全球用户均可访问新服务。

⚙️ 高效整合:TI-ONE 与 ADP 平台全面接入 DeepSeek-V4,助力企业快速构建智能应用。



via AI新闻资讯 (author: AI Base)
Cohere 与 Aleph Alpha 达成 200 亿美元跨大西洋人工智能合作

近日,加拿大初创企业 Cohere 与德国初创企业 Aleph Alpha 宣布达成一项价值 200 亿美元的合作协议,旨在共同开发 “主权” 人工智能系统。这一合作意在建立一种不依赖于美国和中国的人工智能架构,推进跨大西洋的技术自主性。

Cohere 专注于自然语言处理技术,而 Aleph Alpha 则致力于构建具有强大推理能力的人工智能模型。这两家公司希望通过这次合作,结合各自的技术优势,加快 AI 系统的开发进程,推动 AI 在各个领域的应用。

据悉,此次合作不仅是两家公司技术上的结合,也是对全球人工智能市场的一次重大响应。随着国际间对技术自主性的重视加剧,Cohere 与 Aleph Alpha 的联合将为市场带来新的竞争力量,并为企业提供更多选择。

Cohere 与 Aleph Alpha 将共同开发一系列新产品,以满足不同行业对人工智能的需求。这一合作还将促进两国之间的技术交流和资源共享,为未来的人工智能发展奠定基础。

此外,双方也计划在数据隐私和安全方面加强合作,确保在开发人工智能系统时,遵循严格的道德和法律标准,以保护用户的数据权益。这一举措表明,Cohere 与 Aleph Alpha 不仅关注技术的进步,也重视社会责任。

这一跨国合作的达成标志着全球人工智能产业发展进入了一个新阶段,未来将进一步推动技术创新和市场竞争,带动更多国家在人工智能领域的发展。

划重点:

🌍 Cohere 与 Aleph Alpha 达成 200 亿美元的合作协议,聚焦于主权 AI 系统的开发。

💡 两家公司将结合各自的技术优势,加快人工智能产品的推出。

🔒 双方重视数据隐私和安全,致力于遵循严格的道德和法律标准。


via AI新闻资讯 (author: AI Base)
宝马发布全新AI智能座舱助手 能理解用户复杂出行需求

在刚刚闭幕的 2026 北京车展上,宝马联合阿里云隆重推出了三款专为中国市场设计的 AI 智能助手。这些助手将全面提升用户在用车和出行方面的体验,让传统的车机语音助手从被动响应变为主动决策,真正做到 “听得懂,办得妥”。

这次发布的三款 AI 智能助手分别是 “用车专家”、“出行伙伴” 和 “百科达人”。其中,全新的 BMW iX3 长轴距版成为首款搭载这三款智能助手的车型,标志着宝马在智能汽车领域迈出了重要的一步。

“出行伙伴” 功能强大,它能够理解用户复杂的出行需求并即时生成个性化行程方案。例如,当用户要求 “帮我找 3 公里内的商场,配备充电桩,最好有评分高、环境好的餐厅,然后去大兴机场赶下午 4 点的航班” 时,这个助手能迅速拆解出行要求,并提供包含距离、充电、餐饮及路线规划的完整方案。这一切得益于千问大模型与高德地图的深度整合,使得智能助手能快速获取海量的地理和时空信息。

而 “用车专家” 则是一个集合了 20 万条宝马专业用车知识的智能助手,能够为车主提供专业的解答,提升用车安全性与便利性。用户在遇到任何用车问题时,都能享受到如同真人技术顾问般的服务。

值得一提的是,这次展会宝马带来了 16 款新车型,其中包括 4 款全球首发和 8 款中国首发的新车。新世代 BMW iX3 与新世代 BMW i3 长轴距版的亮相,彰显了宝马在中国市场的决心与实力。随着智能科技的不断进步,宝马也在不断推陈出新,以满足用户日益增长的出行需求。

在未来的汽车出行中,智能助手将扮演越来越重要的角色。无论是日常用车还是长途旅行,宝马的新一代智能助手将为车主提供无微不至的服务和支持,让出行变得更加轻松愉快。

划重点:

🌟 “出行伙伴” 能够基于自然语言理解复杂出行需求,快速生成个性化行程方案。

🚘 “用车专家” 整合 20 万条用车知识,为车主提供专业解答,提升用车便利性。

🎉 新世代 BMW iX3 长轴距版成为首款搭载 AI 智能助手的车型,展现宝马在智能出行领域的创新。

via AI新闻资讯 (author: AI Base)
斑马智能接入支付宝AI付车载版,补齐智能座舱“关键一环”

4月24日,北京车展期间,支付宝与斑马智能联合发布了集成支付宝“AI付”车载版的全新AI座舱解决方案,推动智能座舱从“能听会说”迈向“能付能办事”的新阶段。目前,该解决方案首期已覆盖影音娱乐与出行生活两大高频场景,车主仅需语音指令,即可完成买门票、订酒店、点餐等AI消费服务。

图说:4月24日,斑马智能集成支付宝“AI付”车载版的全新AI座舱解决方案正式发布

“过去两年,智能座舱在感知与决策能力上实现了跨越式发展。大模型上车后,车能理解、会推荐,但所有服务走到最后一步,用户依然要掏出手机扫码付款——这是AI座舱体验的最后一处断点。”斑马智能CPO蔡明在现场表示,“接入支付宝AI付车载版,意味着这个断点被彻底打通。”

智能化已全面超越电动化,成为各大车企争夺的核心战场。支付作为车内服务的最后一环,对打造全局闭环体验的重要性不言而喻。当前,多数智能座舱尚未进化到原生级AI支付水平,斑马智能集成支付宝AI付车载版,正是对智能座舱服务关键缺口的补齐。

支付宝AI付车载版并非简单将手机支付搬进车机,而是以AI Agent为核心引擎,实现了支付能力的原生重构。基于斑马元神AI的自然语言理解能力,用户只需语音指令即可完成从服务唤起、信息确认到支付结算的全流程——“帮我买两张电影票”,AI筛选场次和座位后,车主通过语音确认即可完成支付,全程无需跳转、无需扫码。

图说:在北京车展,斑马智能与支付宝达成合作

针对车内AI购物场景,斑马智能结合支付宝的声纹识别、多维度风控、实时反欺诈等安全能力进行了专项适配,确保每一笔交易“便捷不降安全,安全不损体验”。当前,这套全新智能座舱解决方案已完成与多家主流主机厂的技术联调,相关服务计划于2026年下半年伴随新车型陆续上市。

据悉,支付宝“AI付”车载版是一套面向全行业的开放能力,车载系统厂商、主机厂商均可将自己的服务接入支付宝AI付,实现从车主身份识别到服务交付、支付核销的全流程贯通。此前,支付宝“AI付”已在千问App与智能眼镜、瑞幸、Rokid智能眼镜等AI多端多场景上线,是全球首个支付笔数与用户数双双破亿的AI原生支付产品,正加速进入普及与大规模商用阶段,助力AI产业与新消费的全面爆发。

via AI新闻资讯 (author: AI Base)
DeepSeek V4官宣同时支持NVIDIA和华为

前不久的一期访谈节目中,NVIDIA CEO黄仁勋表示如果DeepSeek新模型在华为平台上首发,那对美国来说这将是可怕的一天。黄仁勋表示,这意味着AI模型被优化为在中国AI硬件上表现最佳,而这些模型扩散到全球之后,就会推动中国技术成为世界标准。

此前也有报道称DeepSeek V4会支持华为昇腾平台,甚至有报道表示V4只支持华为平台,然而这是不可能的,今天发布的DeepSeek V4明确了同时支持华为及NVIDIA两个平台。

DeepSeek在文章中表示,DeepSeek V4并将细粒度专家并行(EP)方案同时在英伟达GPU和华为昇腾NPU上完成验证。

这意味着黄仁勋最担心的事并没有发生——DeepSeek V4不会只支持华为或者其他国产AI平台,依然会支持NVIDIA的CUDA生态,而且也是首发支持。

当然,今晚还是要关注一下DeepSeek V4第一时间就把华为的昇腾平台纳入支持,这是否会像去年那样冲击NVIDIA的股价,如果股价也稳了,老黄就可以睡个好觉了。

此外,这次的DeepSeek V4还有个问题值得关注,那就是V4 Pro的价格比之前的V3.2大涨了6-8倍,百万Token输出是24元,百万Token输出中未命中缓存是12元,缓存命中则是1元,比Kimi 2.6或者GLM-5.1等国产大模型也是有高有低,没有之前的超级性价比了。

影响成本的因素很多,毕竟V4 Pro是个1.6万亿参数量的大家伙,算力成本注定不可能很低,而且官方API页面还提到,受限于高端算力,目前V4 Pro模型的服务吞吐仍有限。

不过DeepSeek也明确表示了,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调,所以惊喜还得等下半年。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
谷歌 DeepMind 推出解耦式 DiLoCo:提升异步训练架构,容忍硬件故障

谷歌 DeepMind 最近推出了名为 “解耦式 DiLoCo” 的新型分布式训练架构,这一创新旨在提高大规模人工智能模型的训练效率,并增强其在硬件故障情况下的鲁棒性。

传统的训练方式需要所有计算单元在进行梯度更新时进行紧密同步,这使得整个过程容易受到单个硬件故障的影响。为了解决这一问题,解耦式 DiLoCo 将训练过程分散到多个异步、故障隔离的 “计算孤岛” 中,使得每个计算单元可以独立进行训练,而不必等待其他单元。

这一架构的核心在于将训练任务分配到多个被称为 “学习单元” 的集群中。每个学习单元可以在本地进行多次梯度计算,然后再将压缩后的梯度信息传递给外部优化器进行汇总。由于这一过程是异步的,即使某个单元出现故障,其他单元仍可以继续训练,避免了传统方法中因单点故障导致的整体停滞。

通过实验证明,解耦式 DiLoCo 在高硬件故障率的情况下仍能维持 88% 的良好利用率,而标准的数据并行训练方法仅为 27%。此外,这种新架构将跨数据中心所需的带宽从 198 Gbps 大幅降低至 0.84 Gbps,使得在现有商业互联网基础设施下的全球分布式训练成为可能。

值得一提的是,解耦式 DiLoCo 还具备自愈能力。在进行混沌工程测试时,该系统能够在整个学习单元失效后继续训练,并在单元恢复后无缝重新整合。这种灵活性在多种硬件平台上同样适用,支持不同代数的 TPU 芯片在同一次训练中协同工作,从而延长了旧设备的使用寿命,并缓解了硬件更新过程中可能出现的容量瓶颈。

划重点:

🌟 解耦式 DiLoCo 通过分散训练任务到多个异步学习单元,提高了大规模模型训练的鲁棒性。

🌐 该架构将跨数据中心带宽需求降低至 0.84 Gbps,使得全球分布式训练更加可行。

🔧 具备自愈能力的解耦式 DiLoCo 在硬件故障情况下仍能维持高效训练,且支持异构硬件的混合使用。


via AI新闻资讯 (author: AI Base)
港股大模型股 “深跌”!智谱与 Minimax 在 Deepseek V4 发布后遭遇重创

在最近的港股市场中,智谱科技(Zhizhu)和 Minimax 这两家大模型概念股在 Deepseek V4 发布后,出现了显著的股价下跌。这一消息引发了投资者的广泛关注与讨论。

据悉,Deepseek V4 是一款备受期待的深度学习模型,其新版本的发布引入了一系列技术升级和功能增强,吸引了业界的目光。然而,意外的是,智谱和 Minimax 的股价在该版本发布后却出现了不小的回落。这让许多市场观察者感到困惑,毕竟新技术的推出通常会带动相关公司的股价上涨。

在最新交易中,智谱的股价一度下跌了 6.3%,而 Minimax 的股价则下滑了 3.9%。专家分析认为,市场反应的原因可能与投资者对新技术的短期接受度有关。虽然 Deepseek V4 具备强大的技术潜力,但短期内能否转化为实际业绩尚待观察。此外,投资者可能对市场整体形势感到不安,选择在此时回避风险,从而导致股价承压。

值得注意的是,智谱和 Minimax 作为行业内的重要参与者,虽然短期内股价波动明显,但它们的技术实力和市场地位仍然不可小觑。许多分析师表示,长远来看,如果 Deepseek V4 能够在市场上取得成功,相关公司也有望迎来新的增长机遇。因此,投资者在面对当前股市波动时,应保持理性,关注公司的基本面以及行业趋势。

在未来的日子里,智谱和 Minimax 如何应对市场挑战,如何利用新技术推动自身发展,将是投资者和市场关注的焦点。

划重点:

🌟 智谱和 Minimax 在 Deepseek V4 发布后,股价分别下跌 6.3% 和 3.9%,引发市场关注。

🔍 投资者对新技术的短期接受度和整体市场情绪可能导致了这次股价波动。

📈 尽管短期内面临压力,智谱和 Minimax 在行业内的地位和技术实力仍然值得期待。

via AI新闻资讯 (author: AI Base)
谷歌被要求向Gemini竞争对手开放安卓系统

据知情人士透露,欧盟监管机构准备列出谷歌必须采取哪些措施,才能让ChatGPT以及Anthropic旗下Claude等产品在Android上获得与谷歌自家Gemini相同的功能。知情人士还表示,调查结果仍处于草案形式,时间安排可能还会推迟。谷歌旗下Gemini享有访问 Android 核心功能的权限,包括与一系列应用的集成和通信。知情人士表示,欧盟的初步调查结果将具体说明应如何向竞争对手的人工智能服务授予对 Android 功能同样有效水平的访问 —— 例如语音激活和某些搜索工具,以及将竞争对手的人工智能应用与其他 Android 软件集成的能力。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
PerplexityCEO 称 AI 浪潮将强化而非取代iPhone的核心地位

Perplexity首席执行官 Aravind Srinivas 在最新访谈中指出,人工智能的进步并不会颠覆智能手机市场,反而将使iPhone演变为不可或缺的“数字护照”。Srinivas 认为,随着 AI 系统愈发依赖上下文生成结果,存储了支付、健康、通信等海量个人数据的iPhone已成为未来 AI 系统的关键基础设施,其重要性将随 AI 能力的提升而日益凸显。

Srinivas 强调,苹果芯片(Apple Silicon)是该公司长期被低估的核心资产。随着 AI 算力需求从中心化云端向边缘端迁移,具备强大本地处理能力的硬件成为支撑“代理循环”运行的基础。这种端侧处理模式不仅大幅降低了对集中式服务器的依赖,更契合苹果一贯的隐私保护理念,即通过将敏感数据保留在本地来减少泄露风险。

尽管目前Siri在对话能力上仍滞后于 OpenAI 等竞争对手,但苹果在硬件、软件与用户数据控制方面的垂直整合优势,使其在个性化 AI 时代拥有其他公司难以企及的生态闭环。

从行业视角看,这一观点重构了硬件厂商在生成式 AI 竞赛中的角色。在 AI 体验仍由第三方工具主导的当下,控制硬件平台意味着掌握了 AI 运行的底层入口。随着具有情境感知能力的Siri预计于2026年正式亮相,苹果有望通过软硬协同将庞大的存量设备转化为最活跃的 AI 交互终端。这预示着 AI 行业的竞争重点正从单纯的模型参数比拼,转向对本地数据主权与硬件生态控制权的争夺。

via AI新闻资讯 (author: AI Base)
寒武纪宣布实现 DeepSeek-V4全系列模型 Day0适配并开源优化代码

寒武纪今日宣布,已基于 vLLM 推理框架完成对深度求索(DeepSeek)最新开源模型DeepSeek-V4全系列的“Day0”适配。此次改装涵盖285B 参数的 Flash 版本及1.6T 参数的 Pro 版本,确保模型在发布当日即可在寒武纪硬件平台上稳定运行,相关改装代码已正式开源至 GitHub 社区。

针对DeepSeek-V4独有的稀疏注意力与压缩结构,寒武纪通过自研向量融合算子库 Torch-MLU-Ops 对 Compressor 等核心模块进行了专项加速。利用 BangC 高性能编程语言,寒武纪团队编写了稀疏 Attention 及 GroupGemm 等热点算子的极致优化内核,并于 vLLM 框架中全面支持 TP/PP/SP/DP/EP 五维混合并行策略、低精度量化及 PD 分离部署。这些技术手段在满足延迟约束的前提下,显著提升了端到端推理的词元吞吐能力。

硬件层面,寒武纪深度挖掘了 MLU 的访存与排序加速特性,有效应对DeepSeek-V4复杂的索引结构。凭借高互联带宽与低延迟通信优势,该方案最大化降低了 Prefill 与 Decode 场景下的通信损耗,提升了推理利用率。

行业分析指出,DeepSeek-V4凭借百万字(1M)超长上下文及顶尖的逻辑推理性能,对底层算力架构提出了严苛要求。寒武纪在模型发布首日的敏捷适配,不仅展示了国产算力平台对超大规模、复杂结构模型的承载能力,也预示着国产 AI 产业链在软硬协同层面已进入成熟期,为大模型应用普惠提供了高效的算力底座支持。

via AI新闻资讯 (author: AI Base)
华为昇腾超节点系列产品全面支持DeepSeek V4 新品性能近3倍于H20、支持FP4

今天DeepSeek发布了全新系列模型V4的预览版本,并同步开源,华为也第一时间表示,昇腾超节点系列产品全面支持DeepSeek V4。

按照华为官方说法,昇腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。

DeepSeek在官宣文章中还表示:“预计下半年昇腾950超节点批量上市并部署之后,Pro版本的价格也会大幅度下调。

之前,华为中国合作伙伴大会2026上,华为重磅发布并展出了搭载全新昇腾950PR(Ascend 950PR)处理器的AI训练推理加速卡Atlas 350。

与前一代昇腾芯片相比,昇腾950PR在低精度数据格式、向量算力、互联带宽及自研HBM等方面实现大幅提升。

据华为昇腾计算业务总裁张迪煊介绍,Atlas 350的单卡算力达到了英伟达H20的2.87倍,是目前国内唯一支持FP4低精度的推理产品。

此外,该芯片的HBM(高带宽内存)容量是H20的1.16倍,达到了112GB,多模态生成速度可以提升60%;内存访问颗粒度从512字节减少到128字节,小算子访存效率提升4倍。

在大会展厅Atlas 350展台,华为公布的参数是:Atlas 350的FP4精度算力为1.56P,带宽达到了1.4TB/s;功耗为600W,是H20的1.5倍。

Atlas 350除了支持FP16、FP8外,还支持更低精度的FP4。这意味着,集成Atlas 350板块的服务器能够支持更大的模型以及时延更低的推理,精度小了,计算速度就会更快,寄存器效率业会更高。

华为昇腾计算业务总裁张迪煊表示,基于Atlas 350等产品,结合AI发展趋势与客户需求,昇腾将打造大、中、小三大核心算力场景,助力伙伴满足差异化场景需求,共同深耕行业智能化。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
九成游戏开发商悄然使用 AI 技术,谷歌高管揭秘行业现状

在当今的游戏行业,人工智能(AI)的使用已成为一种普遍现象。尽管一些即将发布的 3A 大作对生成式 AI 持谨慎态度,但越来越多的游戏开发商开始积极采用这项新技术。比如,育碧已经在所有招聘岗位中要求应聘者具备生成式 AI 的相关经验。而《ARC Raiders》的开发负责人则表示,他们正通过 AI 技术彻底改革 Nexon 的开发流程。

谷歌云游戏业务全球总监杰克・布瑟(Jack Buser)在一次采访中透露,行业内至少有九成的游戏开发者正在使用 AI 工具。尽管如此,由于担心受到批评,这些开发者通常选择不公开这一点。他指出,许多玩家可能并不知道,自己现在最喜欢的游戏其实是由 AI 辅助开发的。根据去年夏天在科隆游戏展上进行的一项调查,大约 90% 的开发者表示他们正在使用 AI。

布瑟还提到,很多工作室已经在使用谷歌的生成式 AI 工具(例如 Gemini)来加快游戏开发进程,从而推出市场上最受欢迎的作品。他强调,这一趋势对行业是积极的,因为 AI 技术能够加速游戏的发布,并降低成本,使得开发者更敢于承担风险。

在采访中,布瑟还提到卡普空正在利用 Gemini 和 Nano Banana 来处理低价值的任务,为游戏制作内容。他表示,卡普空使用生成式 AI 来生成小型资产(如鹅卵石和草)的创意,而美术总监会要求 Gemini 筛选出最有趣的设计,最终由美术团队进行制作。这样一来,开发者可以将更多精力放在更重要的任务上,比如设计敌人和主角。

via AI新闻资讯 (author: AI Base)
寒武纪成功适配 DeepSeek-V4,推动 AI 模型高效运行

寒武纪公司宣布,他们已成功完成对深度求索公司最新开源 AI 模型 DeepSeek-V4 的 Day 0 适配。此举意味着该模型在发布当天即可实现稳定运行,为用户带来了更高效的人工智能体验。寒武纪利用其自主研发的高性能融合算子库 Torch-MLU-Ops,对模型中的 Compressor、mHC 等模块进行了针对性加速。这项技术的引入大幅提升了推理效率。

在推理框架方面,寒武纪采用了 vLLM(Variable Length Language Model)技术,全面支持多种并行计算方式,包括 TP、PP、SP、DP 和 EP 等。同时,寒武纪还实现了通信计算并行、低精度量化和 PD 分离部署等优化。这些措施使得模型在满足延时约束的情况下,显著提高了处理速度。

此外,寒武纪还深入挖掘了硬件特性,通过优化 MLU 访存与排序,加速了稀疏 Attention 和 Indexer 等结构的运行。高互联带宽和低通信延迟的特性将不同工作负载场景下的通信占比降至最低,有效提高了分布式推理的利用率。

值得一提的是,DeepSeek-V4 模型拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上,达到了国内外开源领域的领先水平。用户可以通过访问官网或官方 App,与最新的 DeepSeek-V4 进行互动,享受超长上下文记忆带来的全新体验。同时,API 服务也已更新,开发者可以轻松调用新模型。

这一系列优化和适配工作不仅提升了模型性能,也为后续的 AI 技术应用提供了坚实基础,展现了寒武纪在人工智能领域的强大实力。

划重点:

🌟 寒武纪完成对 DeepSeek-V4 的 Day 0 适配,模型发布当天稳定运行。

🚀 自主研发的高性能算子库和推理框架优化显著提升推理效率。

📈 DeepSeek-V4 支持百万字超长上下文,带来领先的 AI 体验。


via AI新闻资讯 (author: AI Base)
OpenAI 开源模型监控评估套件,助力提升 AI 系统安全监测能力

OpenAI 近日开源了与其研究论文《Monitoring Monitorability》配套的评估套件,旨在提供标准化工具以提升 AI 模型行为的可监测性。该套件涵盖干预、过程及结果属性三大类评估模型,包含 AIME、GPQA 和 WMDP 等 12 项公开数据集。开发者可利用其中的评估逻辑与提示词模板,分析模型在受到干扰或执行复杂逻辑任务时的表现。

受版权及隐私限制,FrontierMath 等涉及私有数据的评估项未在此次发布之列。OpenAI 披露,由于在 Anti-Scheming 等评估项中发现技术局限,目前正结合 GPT 5.4 Thinking 系统反馈进行迭代优化。该套件遵循 Apache-2.0 协议开源,旨在通过社区协作完善 AI 安全监控标准。

Openai

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
美团秘密试水万亿级 AI 大模型!目前仅对受邀用户开放

近日,美团悄然启动了一项重大技术测试,旨在推出其新一代人工智能大模型。这一模型的参数规模高达万亿级别,标志着 AI 技术的又一次飞跃。据报道,这一模型的训练完全依赖于国产算力集群,这意味着美团在使用国产技术上取得了显著进展,甚至可能在行业内率先实现这一突破。

美团的新大模型目前仅对受邀用户开放,尚未向公众普及。这一举措显示出美团在 AI 领域的雄心,以及对国产算力资源的信心。随着技术的不断演进,AI 大模型的应用范围也在不断扩展,从智能客服到个性化推荐,潜力无穷。

值得注意的是,这一新模型的测试正值国内科技行业蓬勃发展的时刻。近年来,国内企业在 AI 和云计算领域的投资不断增加,推动了国产算力的飞速发展。美团的这一举动,不仅是对自身技术能力的挑战,也是对整个行业发展的积极响应。

此外,该模型的训练完全依托于国产算力集群,意味着美团正在积极减少对外部技术的依赖,助力国家在核心技术领域的自主创新。这一策略将进一步推动国产技术的成熟与普及,为未来更多的应用场景铺平道路。

随着 AI 技术的迅猛发展,未来我们将有机会看到越来越多基于这一新模型的创新应用,相信美团在这一领域的探索将为用户带来更加智能化的服务体验。

划重点:

📊 美团正在秘密测试一款参数达万亿级的新一代 AI 大模型。

🇨🇳 该模型完全基于国产算力集群训练,展示了对国产技术的信心。

🚀 新模型目前仅对受邀用户开放,未来将推动 AI 在多个领域的应用。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]