Skip to main content
QUICK REVIEW

[논문 리뷰] A Comparative Agglomerative Hierarchical Clustering Method to Cluster Implemented Course

Rahmat Widia Sembiring, Jasni Mohamad Zain|arXiv (Cornell University)|2011. 01. 22.
Recommender Systems and Techniques참고 문헌 23인용 수 24
한 줄 요약

이 논문은 산업 교육에서 구현된 과정을 군집화하기 위해 단일 연결법과 완전 연결법을 사용한 응집형 계층적 군집화의 비교 연구를 제안한다. MATLAB 및 HCE 3.5를 사용하여, 다양한 연결 기준이 군집 수에 영향을 미치며, 과정 군집화 응용에서 군집 형성의 연결 선택에 민감함을 입증한다.

ABSTRACT

There are many clustering methods, such as hierarchical clustering method. Most of the approaches to the clustering of variables encountered in the literature are of hierarchical type. The great majority of hierarchical approaches to the clustering of variables are of agglomerative nature. The agglomerative hierarchical approach to clustering starts with each observation as its own cluster and then continually groups the observations into increasingly larger groups. Higher Learning Institution (HLI) provides training to introduce final-year students to the real working environment. In this research will use Euclidean single linkage and complete linkage. MATLAB and HCE 3.5 software will used to train data and cluster course implemented during industrial training. This study indicates that different method will create a different number of clusters.

연구 동기 및 목표

  • 산업 교육에서 구현된 과정을 군집화하는 응집형 계층적 군집화의 효과성을 평가하기 위해.
  • 단일 연결법과 완전 연결법의 성능을 구현된 과정의 군집 형성에 대해 비교하기 위해.
  • 연결 기준이 결과 군집의 수와 구조에 미치는 영향을 규명하기 위해.
  • 실제 산업 교육 과정 데이터를 사용하여 군집 기법을 적용하기 위해.
  • 학술 및 산업 교육 평가에서 과정 군집화를 위한 방법론적 기반을 제공하기 위해.

제안 방법

  • 각 과정을 개별 군집으로 시작하는 응집형 계층적 군집화를 적용한다.
  • 두 가지 연결 기준을 적용: 단일 연결법(군집 간 최소 거리)과 완전 연결법(군집 간 최대 거리).
  • 과정 데이터 포인트 간 유사도 측정으로 유클리드 거리를 사용한다.
  • 데이터 처리 및 시각화를 위해 MATLAB 및 HCE 3.5 소프트웨어를 사용하여 군집화 과정을 구현한다.
  • 두 방법 간의 비교를 위해 결과 군집 수 및 계층도를 분석한다.
  • 시각적 검토 및 연결 유형 간 군집 수 비교를 통해 결과를 검증한다.

실험 결과

연구 질문

  • RQ1단일 연결법과 완전 연결법은 동일한 구현된 과정에 대해 얼마나 다른 수의 군집을 생성하는가?
  • RQ2산업 교육 과정 데이터 맥락에서 어느 연결 방법이 더 일관성 있거나 의미 있는 군집을 도출하는가?
  • RQ3연결 기준의 선택이 과정 군집의 계층적 구조에 어떤 영향을 미치는가?
  • RQ4동일한 데이터셋에 대해 다양한 응집형 계층적 군집화 전략을 사용할 경우 군집 결과가 얼마나 다를 수 있는가?
  • RQ5특성에 기반해 구현된 과정을 효과적으로 군집화하여 교육 평가에 활용할 수 있는가?

주요 결과

  • 동일한 과정 데이터셋에 적용했을 때 단일 연결법과 완전 연결법은 서로 다른 수의 군집을 생성한다.
  • 연구는 연결 기준이 응집형 계층적 군집화에서 군집 형성과 구조에 상당한 영향을 미친다는 것을 확인한다.
  • 단일 연결법은 보통 더 길고 사슬 모양의 군집을 형성하는 반면, 완전 연결법은 더 단단하고 잘 분리된 군집을 생성한다.
  • 결과는 군집화 방법 선택이 교육적 맥락에서 군집 결과의 해석 가능성과 활용도에 직접적인 영향을 미친다는 것을 보여준다.
  • 두 방법 모두 구현된 과정을 성공적으로 군집화했지만, 연결 방법의 선택은 결과 군집의 세분성과 일관성에 영향을 미친다.
  • MATLAB 및 HCE 3.5의 사용은 비교 분석을 위한 군집 계층의 효과적인 데이터 처리 및 시각화를 가능하게 했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.