英国国家数据图书馆计划面临挑战,数据可用性亟待改善

英国政府正致力于通过国家数据图书馆(NDL)推动人工智能的发展。然而,近日发布的研究表明,如果不能改善公共数据集的可用性,这一计划可能会面临严峻挑战。开放数据研究所(ODI)的一项研究指出,目前可用的数据在实际分析中存在误导性标题和缺乏元数据等问题,导致其难以有效使用。

在 2024 年秋季预算案中,政府确认了 NDL 的计划,并承诺将为研究人员和企业提供重要的数据洞察,促进经济增长和改善生活质量。政府还宣布,该项目将获得 1 亿英镑的投资,这笔资金是政府计划在 2028/29 财年之前向科学、创新和技术部(DSIT)提供的 19 亿英镑预算的一部分。

ODI 最近推出了一个名为 “NDL-Lite” 的原型系统,能够访问超过 10 万个公共数据集。研究发现,部分数据集存在标签不一致、数据过时以及人工智能工具无法有效获取等问题。ODI 警告称,缺乏权威数据时,人工智能系统会转向其他来源,比如新闻报道或商业数据,而这些信息的准确性并不总是有保障。

尽管 ODI 的研究表明构建 NDL 的成本相对较低,但也强调了将数据调整至适合人工智能处理的必要工作量。研究发现,即使是 “犯罪” 等广泛的术语,也难以进行有效分析。一些数据集由于缺乏共享标准,无法整合,导致分析困难。

开放数据研究所的教授 Elena Simperl 表示,公共数据的数量与其实际可用性之间存在日益扩大的差距。她指出,如果政府不能及时更新数据和改善元数据质量,人工智能系统可能会寻求其他更易获取的信息来源。

政府发言人表示,政府希望 “最大化公共部门数据的收益”,以提高服务效率并促进经济增长。为此,政府正在通过数字公共基础设施的现代化计划来改善数据共享和使用的便利性。

国家数据图书馆是帮助研究人员和数据科学家获取公共数据的最新项目,然而,ODI 的研究提醒人们,这一计划必须避免成为错失良机。

划重点:

🔍 NDL 计划旨在通过提供公共数据推动 AI 发展,但面临数据可用性挑战。

💡 ODI 研究显示,现有公共数据集存在标签不规范和数据过时等问题。

📉 如果不改善数据质量,AI 系统可能转向其他不可靠的信息来源。


via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]