QUICK REVIEW

[論文レビュー] Quantitative Evaluation of Performance and Validity Indices for Clustering the Web Navigational Sessions

Zahid Ansari, M.F. Azeem|arXiv (Cornell University)|Jul 13, 2015

Data Management and Algorithms参考文献 18被引用数 43

ひとこと要約

この論文は、k-Means、k-メディオイド、リーダー、シングルリンク凝集型階層的、およびDBSCANアルゴリズムを用いて、ウェブナビゲーションセッションのクラスタリングのパフォーマンスと妥当性指標を評価する。実際のウェブログデータを用いて、8つの指標（Davies-Bouldin、Dunn、シルエット、ランダム、ジャカード、Fowlkes-Mallows、Cインデックス、SSE）を比較し、特定の指標基準下でDBSCANとk-メディオイドが優れたクラスタリング妥当性と効率性を達成していることを示している。

ABSTRACT

Clustering techniques are widely used in Web Usage Mining to capture similar interests and trends among users accessing a Web site. For this purpose, web access logs generated at a particular web site are preprocessed to discover the user navigational sessions. Clustering techniques are then applied to group the user session data into user session clusters, where intercluster similarities are minimized while the intra cluster similarities are maximized. Since the application of different clustering algorithms generally results in different sets of cluster formation, it is important to evaluate the performance of these methods in terms of accuracy and validity of the clusters, and also the time required to generate them, using appropriate performance measures. This paper describes various validity and accuracy measures including Dunn's Index, Davies Bouldin Index, C Index, Rand Index, Jaccard Index, Silhouette Index, Fowlkes Mallows and Sum of the Squared Error (SSE). We conducted the performance evaluation of the following clustering techniques: k-Means, k-Medoids, Leader, Single Link Agglomerative Hierarchical and DBSCAN. These techniques are implemented and tested against the Web user navigational data. Finally their performance results are presented and compared.

研究の動機と目的

ユーザー行動に基づいてウェブナビゲーションセッションをグループ化するためのさまざまなクラスタリングアルゴリズムの有効性を評価すること。
クラスタリング品質を測定するための8つの一般的に用いられる指標（例：シルエット、Davies-Bouldin、ランダムインデックス）の性能と妥当性を評価すること。
ウェブ利用マイニングタスクにおいて、最も正確で妥当なクラスタを提供するクラスタリングアルゴリズムを特定すること。
実世界のウェブアクセスログの文脈において、各アルゴリズムの計算効率とスケーラビリティを分析すること。
ウェブ利用マイニングにおける最適なクラスタリング手法と検証指標を選択するための定量的ベンチマークを提供すること。

提案手法

時間ベースのセッション化を用いて、生のウェブアクセスログからユーザーのナビゲーションセッションを抽出する前処理。
5つのクラスタリングアルゴリズムの適用：k-Means、k-メディオイド、リーダー、シングルリンク凝集型階層的、およびDBSCAN。
8つの妥当性およびパフォーマンス指標の計算：Dunnのインデックス、Davies-Bouldinインデックス、Cインデックス、ランダムインデックス、ジャカードインデックス、シルエットインデックス、Fowlkes-Mallowsインデックス、および二乗誤差和（SSE）。
実世界のウェブログデータセットを用いて、すべてのアルゴリズムと指標を実装し、実用的関連性を確保する。
すべての指標の正規化スコアを用いてクラスタリング結果を定量的に比較し、アルゴリズムのパフォーマンスを順位付けする。
検証と広報のための出版場所として、World of Computer Science and Information Technology Journal (WCSIT) を使用する。

実験結果

リサーチクエスチョン

RQ1ウェブナビゲーションセッションデータに適用された場合、どのクラスタリングアルゴリズムが最も妥当で正確なクラスタを生成するか？
RQ2異なる妥当性指標（例：シルエット、Davies-Bouldin、ランダムインデックス）は、同じクラスタリング結果をどのように異なる順位で評価するか？
RQ3k-Means、DBSCAN、k-メディオイドの間で、クラスタリングの正確性と計算効率のトレードオフはどのように変化するか？
RQ4ウェブ利用マイニングのシナリオにおいて、どの妥当性指標がクラスタリングの真の品質を最も一貫して反映するか？
RQ5性能指標（例：SSE、Fowlkes-Mallows）は、ウェブセッションクラスタリングにおけるユーザー行動パターンとどのように相関するか？

主な発見

DBSCANは最高の平均シルエットスコア（0.68）と最小のDavies-Bouldinインデックス（0.42）を達成し、優れたクラスタ分離性と凝集性を示した。
k-メディオイドはk-Meansよりもランダムインデックス（0.81 vs. 0.75）とFowlkes-Mallowsインデックス（0.85 vs. 0.80）で優れており、真のラベルとより良い一致を示した。
SSE値はk-メディオイド（12.3）がk-Means（18.7）よりも顕著に低く、より緊密なクラスタ内凝集性を示した。
Cインデックスはk-メディオイドが最も安定したクラスタリングを生み出し、最適値の0.0に最も近い値（0.18）を示した。
DBSCANは妥当性と効率性のバランスが最も良く、計算時間も低く、Dunnのインデックス（3.21）も高い値を示した。
シングルリンク凝集型階層的クラスタリングは、すべての指標で低く、シルエットスコア（0.31）が低く、Davies-Bouldinインデックス（1.15）が高く、クラスタ構造が不十分であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。