Meta 新一代AI大模型 Llama 4 即将发布
Meta有望在本月发布的新一代开源大语言模型 Llama 4。此前这款大语言模型的发布已至少经历两次延期,目前仍存在再度推迟可能。这距离前代模型 Llama 3 的发布已过去近一年,凸显出Meta在AI军备竞赛中面临的技术挑战。据Meta内部测试显示 Llama 4 模型在数学推理 (GSM8K 基准) 以及代码生成 (HumanEval) 准确率较 Llama 3 提升37%。这款大语言模型多次延期的主因是多模态训练数据清洗遇阻,特别是视频-文本对齐质量未达预期。该模型需协调16000块H100 GPU集群,能源消耗较 Llama 3 训练增加2.3倍。
—— The Information
via 风向旗参考快讯 - Telegram Channel
Meta有望在本月发布的新一代开源大语言模型 Llama 4。此前这款大语言模型的发布已至少经历两次延期,目前仍存在再度推迟可能。这距离前代模型 Llama 3 的发布已过去近一年,凸显出Meta在AI军备竞赛中面临的技术挑战。据Meta内部测试显示 Llama 4 模型在数学推理 (GSM8K 基准) 以及代码生成 (HumanEval) 准确率较 Llama 3 提升37%。这款大语言模型多次延期的主因是多模态训练数据清洗遇阻,特别是视频-文本对齐质量未达预期。该模型需协调16000块H100 GPU集群,能源消耗较 Llama 3 训练增加2.3倍。
—— The Information
via 风向旗参考快讯 - Telegram Channel