研究称五大头部AI平台50%医学建议有问题
来自美国、加拿大和英国的研究人员评估了五大头部AI平台:ChatGPT、Gemini、Meta AI、Grok和DeepSeek,方法是在五个健康类别下分别向每个平台提出10个问题。根据本周发表在医学期刊《BMJ Open》上的研究结果,在这些AI聊天机器人的所有回答中,约有50%被认为 “有问题”,其中近20%属于“高度有问题”。研究发现,这些聊天机器人在不同类型问题上的表现差异明显:在封闭式提问 (答案确定) 以及与疫苗和癌症相关的问题上表现相对更好,但在开放式问题以及如干细胞研究和营养学等领域表现较差。研究人员表示,这些回答通常以自信和确定的口吻给出,但没有一个聊天机器人在回答任何提示时能提供完整且准确的参考文献列表。
—— 凤凰网科技、彭博社
via 风向旗参考快讯 - Telegram Channel
来自美国、加拿大和英国的研究人员评估了五大头部AI平台:ChatGPT、Gemini、Meta AI、Grok和DeepSeek,方法是在五个健康类别下分别向每个平台提出10个问题。根据本周发表在医学期刊《BMJ Open》上的研究结果,在这些AI聊天机器人的所有回答中,约有50%被认为 “有问题”,其中近20%属于“高度有问题”。研究发现,这些聊天机器人在不同类型问题上的表现差异明显:在封闭式提问 (答案确定) 以及与疫苗和癌症相关的问题上表现相对更好,但在开放式问题以及如干细胞研究和营养学等领域表现较差。研究人员表示,这些回答通常以自信和确定的口吻给出,但没有一个聊天机器人在回答任何提示时能提供完整且准确的参考文献列表。
—— 凤凰网科技、彭博社
via 风向旗参考快讯 - Telegram Channel