DeepSeek-AI 近日发布了开源模型 DeepSeek-OCR,这是一款 3B 参数的上下文光学压缩模型,旨在通过模态压缩实现文本的高效处理。该模型由 DeepEncoder 和 DeepSeek3B-MoE-A570M 组成,其中 DeepEncoder 专注于高分辨率图像下的文本标注和高压缩率,可将文本 token 压缩到图像 token 的 10 倍以上。DeepSeek-OCR 在 10 倍压缩率下能保持 97% 的 OCR 精度,即使在 20 倍压缩率下,精度仍可达 60%。
GitHub|Hugging Face
🍀在花频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel