Skip to main content
QUICK REVIEW

[论文解读] Data Mining for Actionable Knowledge: A Survey

Zengyou He, Xiaofei Xu|ArXiv.org|Jan 27, 2005
Big Data and Business Intelligence被引用 30
一句话总结

本文综述了用于生成可操作知识的数据挖掘技术——即能够使决策者采取具体、盈利性行动的模式。论文提出了两种隐含的可操作知识挖掘框架,通过任务导向和框架导向的视角分析现有研究,并识别出该领域中尚未充分探索的问题,填补了实践性数据挖掘应用研究文献中的关键空白。

ABSTRACT

The data mining process consists of a series of steps ranging from data cleaning, data selection and transformation, to pattern evaluation and visualization. One of the central problems in data mining is to make the mined patterns or knowledge actionable. Here, the term actionable refers to the mined patterns suggest concrete and profitable actions to the decision-maker. That is, the user can do something to bring direct benefits (increase in profits, reduction in cost, improvement in efficiency, etc.) to the organization's advantage. However, there has been written no comprehensive survey available on this topic. The goal of this paper is to fill the void. In this paper, we first present two frameworks for mining actionable knowledge that are inexplicitly adopted by existing research methods. Then we try to situate some of the research on this topic from two different viewpoints: 1) data mining tasks and 2) adopted framework. Finally, we specify issues that are either not addressed or insufficiently studied yet and conclude the paper.

研究动机与目标

  • 解决数据挖掘中可操作知识领域缺乏全面综述的问题,其中挖掘出的模式能直接带来组织效益。
  • 识别并形式化现有研究中用于从数据生成可操作知识的两种隐含框架。
  • 从数据挖掘任务和所采用框架两个视角,对现有可操作知识研究进行分类与分析。
  • 突出可操作知识挖掘中研究不足或尚未充分探讨的问题,以指导未来研究。
  • 通过强调可操作性作为核心目标,弥合理论数据挖掘与实际业务决策之间的差距。

提出的方法

  • 提出两种概念性框架,用于将挖掘出的模式转化为可操作知识,尽管未作为正式模型详细阐述。
  • 根据数据挖掘任务类型(如分类、聚类、关联规则)以及所采用的框架,对现有数据挖掘研究进行分类。
  • 采用系统性综述方法,从可操作知识生成的角度分析文献,重点关注其对决策支持的相关性。
  • 评估现有方法在多大程度上支持直接、盈利性行动,而不仅仅是模式发现。
  • 通过考察研究是否在设计、评估或应用背景中考虑可操作性,识别研究空白。
  • 将分析聚焦于使决策者能够基于知识采取行动并产生可衡量组织影响的目标。

实验结果

研究问题

  • RQ1哪些关键特征能够将可操作知识与一般数据挖掘模式区分开来?
  • RQ2现有数据挖掘方法在多大程度上隐含或明确支持可操作知识的生成?
  • RQ3不同的数据挖掘任务(如分类、聚类)在多大程度上促进或阻碍可操作洞察的产生?
  • RQ4哪些框架或设计原则常用于将挖掘出的模式转化为可操作决策?
  • RQ5可操作知识挖掘的哪些方面在当前研究中仍处于研究不足或未充分解决的状态?

主要发现

  • 在本文之前,数据挖掘领域尚无关于可操作知识的全面综述,存在显著的研究空白。
  • 现有数据挖掘研究通常未能明确说明挖掘出的模式如何导致具体、盈利性行动。
  • 两种隐含的可操作知识挖掘框架在研究中被广泛使用,但未被正式承认或标准化。
  • 可操作知识研究在不同数据挖掘任务之间呈碎片化状态,缺乏整合或跨任务分析。
  • 关键问题如可操作性评估、反馈回路和现实世界部署在现有文献中研究不足。
  • 本文通过将可操作知识确立为数据挖掘的一个独立且关键维度,为未来研究奠定了基础。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。