ChatGPT / AI新闻聚合
12:55 · 2025年3月25日 · 周二
一项具有挑战性的新 AGI 测试难倒了大多数 AI 模型 根据Arc Prize 排行榜,OpenAI 的 o1-pro 和 DeepSeek 的 R1 等“推理”AI 模型在 ARC-AGI-2 上的得分在 1% ...
via
cnBeta.COM中文业界资讯站 - Telegram Channel
Telegraph
一项具有挑战性的新 AGI 测试难倒了大多数 AI 模型 根据Arc Prize 排行榜,OpenAI 的 o1-pro…
一项具有挑战性的新 AGI 测试难倒了大多数 AI 模型根据Arc Prize 排行榜,OpenAI 的 o1-pro 和 DeepSeek 的 R1 等“推理”AI 模型在 ARC-AGI-2 上的得分在 1% 到 1.3% 之间。包括 GPT-4.5、Claude 3.7 Sonnet 和 Gemini 2.0 Flash 在内的强大的非推理模型得分约为 1%。ARC-AGI 测试由一些类似拼图的问题组成,其中人工智能必须从一组不同颜色的方块中识别视觉图案,并生成正确的“答案”网格。这些问题旨在迫使…
Home
Tags
Powered by
BroadcastChannel
&
Sepia
oaibest.com
2023-2025
[email protected]