[논문 리뷰] Latent Dirichlet Allocation (LDA) and Topic modeling: models, applications, a survey
본 고찰은 2003년부터 2016년까지 LDA 기반 주제 모델링 문헌을 분석하여 모델, 응용 분야, 도전과제, 그리고 일반적으로 사용되는 도구와 데이터셋을 개략적으로 설명한다.
Topic modeling is one of the most powerful techniques in text mining for data mining, latent data discovery, and finding relationships among data, text documents. Researchers have published many articles in the field of topic modeling and applied in various fields such as software engineering, political science, medical and linguistic science, etc. There are various methods for topic modeling, which Latent Dirichlet allocation (LDA) is one of the most popular methods in this field. Researchers have proposed various models based on the LDA in topic modeling. According to previous work, this paper can be very useful and valuable for introducing LDA approaches in topic modeling. In this paper, we investigated scholarly articles highly (between 2003 to 2016) related to Topic Modeling based on LDA to discover the research development, current trends and intellectual structure of topic modeling. Also, we summarize challenges and introduce famous tools and datasets in topic modeling based on LDA.
연구 동기 및 목표
- 연구 개발 동향을 이해하기 위해 LDA를 기반으로 한 토픽 모델링과 관련된 학술 문헌을 고찰한다.
- 현재 트렌드와 해당 분야의 지적 구조를 식별한다.
- LDA 기반 주제 모델링에서 직면하는 주요 도전과제를 요약한다.
- LDA를 사용한 주제 모델링에서 잘 알려진 도구와 데이터셋을 소개한다.
제안 방법
- 2003–2016년 LDA 기반 주제 모델링에 관한 문헌의 검토와 종합.
- 해당 분야의 발전, 트렌드 및 지적 구조 분석.
- LDA 주제 모델링에 사용되는 주목할 만한 도구와 데이터셋의 수집 및 논의.
실험 결과
연구 질문
- RQ12003년부터 2016년까지 LDA 기반 주제 모델링 연구의 발전 궤적은 무엇인가?
- RQ2지배적인 연구 주제와 해당 분야의 지적 구조는 무엇인가?
- RQ3LDA 기반 주제 모델링에서 두드러진 도전과제와 한계는 무엇인가?
- RQ4이 영역에서 일반적으로 사용되는 유명한 도구와 데이터셋은 무엇인가?
주요 결과
- 본 논문은 LDA 기반 주제 모델링 문헌에서의 발전과 트렌드를 식별한다.
- 해당 분야의 지적 구조와 주요 연구 주제를 개략적으로 제시한다.
- LDA를 주제 모델링에 적용하는 연구자들이 직면한 주요 도전과제를 요약한다.
- LDA 주제 모델링에 사용되는 잘 알려진 도구와 데이터셋을 목록화한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.