ChatGPT / AI新闻聚合
22:32 · 2025年3月17日 · 周一
大多数AI在读取时钟与计算日期方面都很吃力 错误率甚至高达75% 爱丁堡大学的一个研究小组测试了一些顶级多模态大型语言模型,看看它们能在多大程度上回答基于钟...
via
cnBeta.COM中文业界资讯站 - Telegram Channel
Telegraph
大多数AI在读取时钟与计算日期方面都很吃力 错误率甚至高达75% 爱丁堡大学的一个研究小组测试了一些顶级多模态大型语言模…
大多数AI在读取时钟与计算日期方面都很吃力 错误率甚至高达75%爱丁堡大学的一个研究小组测试了一些顶级多模态大型语言模型,看看它们能在多大程度上回答基于钟表和日历图像的问题。接受测试的系统包括Google DeepMind 的 Gemini 2.0、Anthropic 的 Claude 3.5 Sonnet、Meta 的 Llama 3.2-11B-Vision-Instruct、阿里巴巴的 Qwen2-VL7B-Instruct、ModelBest 的 MiniCPM-V-2.6,以及 OpenAI 的…
Home
Tags
Powered by
BroadcastChannel
&
Sepia
oaibest.com
2023-2025
[email protected]