智谱 AI 发布首款多模态编程基础模型 GLM-5V-Turbo,支持原生视觉编码与 Agent 协同
智谱 AI(Z.ai)昨日发布首款多模态编程基础模型 GLM-5V-Turbo,原生支持图像、视频、文本等多模态输入,专注视觉编码任务,可完成“理解环境—规划动作—执行任务”的完整 Agent 闭环。该模型针对 Claude Code、OpenClaw 等 Agent 深度优化,支持 GUI 自主探索、代码调试、网页复现等复杂任务,并扩展了画框、截图、读网页(含图片识别)等多模态工具链。同期升级的还有 GLM-4-Air/Flash 基座模型、GLM-Z1 系列推理模型及支持多引擎切换的 AI 搜索工具。
智谱 AI 开放文档 | Z.AI DEVELOPER DOCUMENT | X
🌸 在花频道|茶馆讨论|投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel
智谱 AI(Z.ai)昨日发布首款多模态编程基础模型 GLM-5V-Turbo,原生支持图像、视频、文本等多模态输入,专注视觉编码任务,可完成“理解环境—规划动作—执行任务”的完整 Agent 闭环。该模型针对 Claude Code、OpenClaw 等 Agent 深度优化,支持 GUI 自主探索、代码调试、网页复现等复杂任务,并扩展了画框、截图、读网页(含图片识别)等多模态工具链。同期升级的还有 GLM-4-Air/Flash 基座模型、GLM-Z1 系列推理模型及支持多引擎切换的 AI 搜索工具。
智谱 AI 开放文档 | Z.AI DEVELOPER DOCUMENT | X
🌸 在花频道|茶馆讨论|投稿通道
via 科技圈🎗在花频道📮 - Telegram Channel