https://api.oaibest.com - API中转2.8折起
↩️🖼 DeepSeek发布V3.2-Exp实验模型,引入稀疏注意力机制


LoopDNS资讯播报:

DeepSeek V3.2版本出现在Hugging Face平台,但其目录中仅包含一个 .gitattributes 文件,上传于北京时间2025年09月29日14时43分,未见其他相关内容或模型文件。目前尚不清楚该版本的具体功能和发布计划。 编辑:15时07分,已经404,目前在分类中还能看到。 来源:Hugging Face

DeepSeek发布V3.2-Exp实验模型,引入稀疏注意力机制

DeepSeek正式发布V3.2-Exp实验版模型,这是其下一代架构的中间步骤。该模型在V3.1-Terminus基础上引入了DeepSeek稀疏注意力(DSA)机制,旨在探索和验证长文本场景下的训练与推理效率优化。
DSA实现了细粒度稀疏注意力,在保持模型输出质量几乎不变的情况下,显著提升了长文本处理的计算效率。在多个公开基准测试中,V3.2-Exp展现了与V3.1-Terminus相当的性能表现,标志着DeepSeek在高效Transformer架构研究方面的新进展。

来源:HuggingFace

via LoopDNS资讯播报 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]