DeepSeek大范围开放识图模式:多模态理解功能正式开启内测

DeepSeek于5月9日大幅开放“识图模式”内测,标志着其正式迈入图文多模态交互时代。该功能新增独立入口,支持用户上传图片实现复杂跨媒介交互,具备深度图片识别与语义理解能力,超越传统OCR。此举填补了其在多模态领域的空白,推动国产大模型从文本生成向“视觉语言耦合”转型,有望在自动化办公、工业视觉等场景释放生产力,加速多模态能力普惠。

via Infinitum 资讯聚合 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]