↩️ 华为昇腾、寒武纪、海光信息适配DeepSeek最新模型LoopDNS资讯播报:DeepSeek发布V3.2-Exp实验模型，引入稀疏注意力机制 DeepSeek正式发布V3.2-Exp实验版模型，这是其下一代架构的中间步骤

↩️ 华为昇腾、寒武纪、海光信息适配DeepSeek最新模型

LoopDNS资讯播报:

DeepSeek发布V3.2-Exp实验模型，引入稀疏注意力机制 DeepSeek正式发布V3.2-Exp实验版模型，这是其下一代架构的中间步骤。该模型在V3.1-Terminus基础上引入了DeepSeek稀疏注意力（DSA）机制，旨在探索和验证长文本场景下的训练与推理效率优化。 DSA实现了细粒度稀疏注意力，在保持模型输出质量几乎不变的情况下，显著提升了长文本处理的计算效率。在多个公开基准测试中，V3.2-Exp展现了与V3.1-Terminus相当的性能表现，标志着DeepSeek在高效Trans…

华为昇腾、寒武纪、海光信息适配DeepSeek最新模型

9月29日，深度求索公司正式发布新一代大语言模型DeepSeek-V3.2-Exp，并于HuggingFace平台同步开源，模型引入稀疏 Attention 架构，这种架构能够降低计算资源消耗并提升模型推理效率。
随后，华为昇腾、寒武纪、海光信息均同步宣布完成适配，其中昇腾实现0day支持并开源推理代码，寒武纪完成适配且开源推理引擎，海光信息达成无缝适配与深度调优，共同以软硬件协同助力国产AI生态发展。

来源：东方财富网

via LoopDNS资讯播报 - Telegram Channel