Skip to main content
QUICK REVIEW

[論文レビュー] Latent Dirichlet Allocation (LDA) and Topic modeling: models, applications, a survey

Hamed Jelodar, Yongli Wang|arXiv (Cornell University)|Nov 12, 2017
Topic Modeling参考文献 170被引用数 164
ひとこと要約

この調査は、2003年〜2016年のLDAベースのトピックモデリング文献を分析し、モデル、応用、課題、一般的に使用されるツールとデータセットを概説します。

ABSTRACT

Topic modeling is one of the most powerful techniques in text mining for data mining, latent data discovery, and finding relationships among data, text documents. Researchers have published many articles in the field of topic modeling and applied in various fields such as software engineering, political science, medical and linguistic science, etc. There are various methods for topic modeling, which Latent Dirichlet allocation (LDA) is one of the most popular methods in this field. Researchers have proposed various models based on the LDA in topic modeling. According to previous work, this paper can be very useful and valuable for introducing LDA approaches in topic modeling. In this paper, we investigated scholarly articles highly (between 2003 to 2016) related to Topic Modeling based on LDA to discover the research development, current trends and intellectual structure of topic modeling. Also, we summarize challenges and introduce famous tools and datasets in topic modeling based on LDA.

研究の動機と目的

  • 研究の発展を理解するために、LDAに基づくトピックモデリングに関連する学術論文を調査する。
  • 現在のトレンドと分野の知的構造を特定する。
  • LDAベースのトピックモデリングで直面する主要な課題を要約する。
  • LDAを用いたトピックモデリングで広く用いられているツールとデータセットを紹介する。

提案手法

  • 2003–2016年のLDAベースのトピックモデリングに関する文献のレビューと統合。
  • 分野の発展、トレンド、知的構造の分析。
  • LDAトピックモデリングで使用される著名なツールとデータセットの整理と議論。

実験結果

リサーチクエスチョン

  • RQ12003年から2016年にかけて、LDAベースのトピックモデリング研究の発展経緯はどのようであるか?
  • RQ2支配的な研究テーマと分野の知的構造は何か?
  • RQ3LDAベースのトピックモデリングで顕著な課題と制限は何か?
  • RQ4この分野で広く用いられている有名なツールとデータセットは何か?

主な発見

  • 本論文はLDAベースのトピックモデリング文献の発展とトレンドを特定している。
  • 分野内の知的構造と主要な研究テーマを概説している。
  • 研究者がLDAをトピックモデリングに適用する際に直面する主要な課題を要約している。
  • LDAトピックモデリングで用いられる有名なツールとデータセットをカタログ化している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。