智谱 AI 发布首款多模态编程基础模型 GLM-5V-Turbo,支持原生视觉编码与 Agent 协同

智谱 AI(Z.ai)昨日发布首款多模态编程基础模型 GLM-5V-Turbo,原生支持图像、视频、文本等多模态输入,专注视觉编码任务,可完成“理解环境—规划动作—执行任务”的完整 Agent 闭环。该模型针对 Claude Code、OpenClaw 等 Agent 深度优化,支持 GUI 自主探索、代码调试、网页复现等复杂任务,并扩展了画框、截图、读网页(含图片识别)等多模态工具链。同期升级的还有 GLM-4-Air/Flash 基座模型、GLM-Z1 系列推理模型及支持多引擎切换的 AI 搜索工具。

智谱 AI 开放文档 | Z.AI DEVELOPER DOCUMENT | X

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]