https://api.oaibest.com - API中转2.8折起
↩️🖼 DeepSeek 发布 V3.2-Exp 实验版本,引入稀疏注意力机制


科技圈🎗在花频道📮:

🤖 社区曝发现 DeepSeek V3.2-Base 模型仓库,随后遭下架 在 r/LocalLLaMA 社区,一位用户称发现了名为 “deepseek-3.2-base” 的模型仓库,疑似在 Hugging Face 平台短暂上线,随后很快显示为 404,疑似被撤下或隐藏。 2025年09月29日14:54: 现已重新上架 2025年09月29日15:03: 又删除了,添加到了Collections 2025年09月29日17:37: 官方群组通知“DeepSeek线上模型已更新版本” Reddit…

DeepSeek 发布 V3.2-Exp 实验版本,引入稀疏注意力机制

DeepSeek-AI 正式发布 DeepSeek-V3.2-Exp 实验版本,这是迈向下一代架构的中间步骤。该版本在 V3.1-Terminus 基础上引入了 DeepSeek 稀疏注意力(DSA)机制,旨在探索和验证长上下文场景下的训练和推理效率优化。

新版本在保持与 V3.1-Terminus 几乎相同模型输出质量的同时,实现了细粒度稀疏注意力,显著提升了长上下文处理的计算效率。在多个公开基准测试中,V3.2-Exp 的表现与 V3.1-Terminus 相当,包括在 MMLU-Pro、GPQA-Diamond 等推理任务以及代码生成和工具使用等方面的评估。

线上版本已更新

GitHub

🍀在花频道 🍵茶馆 📮投稿

via 科技圈🎗在花频道📮 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]