[论文解读] Latent Dirichlet Allocation (LDA) and Topic modeling: models, applications, a survey
本综述分析了 2003–2016 年基于 LDA 的主题建模文献,概述了模型、应用、挑战,以及常用工具和数据集。
Topic modeling is one of the most powerful techniques in text mining for data mining, latent data discovery, and finding relationships among data, text documents. Researchers have published many articles in the field of topic modeling and applied in various fields such as software engineering, political science, medical and linguistic science, etc. There are various methods for topic modeling, which Latent Dirichlet allocation (LDA) is one of the most popular methods in this field. Researchers have proposed various models based on the LDA in topic modeling. According to previous work, this paper can be very useful and valuable for introducing LDA approaches in topic modeling. In this paper, we investigated scholarly articles highly (between 2003 to 2016) related to Topic Modeling based on LDA to discover the research development, current trends and intellectual structure of topic modeling. Also, we summarize challenges and introduce famous tools and datasets in topic modeling based on LDA.
研究动机与目标
- 研究相关于基于 LDA 的主题建模的学术文章,以了解研究发展。
- 识别该领域的当前趋势与知识结构。
- 总结基于 LDA 的主题建模所面临的关键挑战。
- 介绍在 LDA 主题建模中使用的知名工具和数据集。
提出的方法
- 对 2003–2016 年基于 LDA 的主题建模文献进行综述与综合。
- 分析该领域的发展、趋势与知识结构。
- 汇编并讨论在 LDA 主题建模中使用的著名工具和数据集。
实验结果
研究问题
- RQ12003 年至 2016 年基于 LDA 的主题建模研究的发展轨迹是什么?
- RQ2领域的主导研究主题和知识结构是什么?
- RQ3在基于 LDA 的主题建模中,哪些挑战和局限性最为突出?
- RQ4在该领域中常用的知名工具和数据集有哪些?
主要发现
- 本文识别了基于 LDA 的主题建模文献中的发展与趋势。
- 它概述了领域内的知识结构和主要研究主题。
- 它总结了研究人员在将 LDA 应用于主题建模时面临的关键挑战。
- 它编目了在 LDA 主题建模中使用的知名工具和数据集。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。