[论文解读] The Principles of Data-Centric AI (DCAI)
本文主张以数据为中心的人工智能视角,提出了 DCAI 的六条指导原则,并讨论了在人工智能系统中提升数据质量和动态性基础与方向。
Data is a crucial infrastructure to how artificial intelligence (AI) systems learn. However, these systems to date have been largely model-centric, putting a premium on the model at the expense of the data quality. Data quality issues beset the performance of AI systems, particularly in downstream deployments and in real-world applications. Data-centric AI (DCAI) as an emerging concept brings data, its quality and its dynamism to the forefront in considerations of AI systems through an iterative and systematic approach. As one of the first overviews, this article brings together data-centric perspectives and concepts to outline the foundations of DCAI. It specifically formulates six guiding principles for researchers and practitioners and gives direction for future advancement of DCAI.
研究动机与目标
- 通过将数据质量作为 AI 系统的核心基础设施来强调从以模型为中心向数据为中心的 AI 转变的动机。
- 阐述数据中心化 AI 的基础概念,以及在实际部署中为何数据质量和动态性很重要。
- 制定一组指导原则,以引导 DCAI 的未来研究与实践。
- 为在下游应用中推进数据中心 AI 的理论与实践提供方向。
提出的方法
- 整合文献与实践中的数据中心视角与概念。
- 制定并呈现六条针对 DCAI 的研究者与从业者的指导原则。
- 提供面向未来的数据中心 AI 发展的方向性路线图。
实验结果
研究问题
- RQ1应当引导数据中心 AI (DCAI) 研究与实践的核心原则是什么?
- RQ2数据质量与数据动态性如何影响 AI 系统性能与部署结果?
- RQ3哪些实际方向可以引导未来在 DCAI 中改进数据中心方法学的工作?
主要发现
- 本文提出了数据中心 AI(DCAI)的六条指导原则。
- 它提出了一个以数据质量及其动态性为优先的 AI 系统的基础性视角。
- 该文汇集了数据中心视角,形成一个连贯的 DCAI 框架。
- 它为 DCAI 在研究与实践方面的未来发展提供方向。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。