#Announcement #OpenAIOpenAI 刚刚发布了 LLM 基准测试工具 SWE-bench，用于评估 AI 模型在真实软件工程任务中的表现 | ChatGPT / AI新闻聚合

04:13 · 2024年8月14日 · 周三

#Announcement #OpenAI

OpenAI 刚刚发布了 LLM 基准测试工具 SWE-bench，用于评估 AI 模型在真实软件工程任务中的表现。

详细信息：https://openai.com/index/introducing-swe-bench-verified/

via AI Copilot - Telegram Channel

Powered by BroadcastChannel & Sepia