QUICK REVIEW

[論文レビュー] Hybrid data clustering approach using K-Means and Flower Pollination Algorithm

R. Jensi, G. Wiselin Jiji|arXiv (Cornell University)|May 13, 2015

Advanced Clustering Algorithms Research参考文献 19被引用数 27

ひとこと要約

本論文は、グローバル最適化のためのフラワーポリネーションアルゴリズム（FPA）とローカルリファインメントのためのK-Meansを統合するハイブリッドクラスタリング手法FPAKMを提案する。FPAを用いて初期クラスターセンタを生成し、その後K-Meansを適用することで、局所最適解を回避し、8つのベンチマークデータセットにおいて単独のK-MeansやFPAと比較して優れたクラスタリング性能を達成する。

ABSTRACT

Data clustering is a technique for clustering set of objects into known number of groups. Several approaches are widely applied to data clustering so that objects within the clusters are similar and objects in different clusters are far away from each other. K-Means, is one of the familiar center based clustering algorithms since implementation is very easy and fast convergence. However, K-Means algorithm suffers from initialization, hence trapped in local optima. Flower Pollination Algorithm (FPA) is the global optimization technique, which avoids trapping in local optimum solution. In this paper, a novel hybrid data clustering approach using Flower Pollination Algorithm and K-Means (FPAKM) is proposed. The proposed algorithm results are compared with K-Means and FPA on eight datasets. From the experimental results, FPAKM is better than FPA and K-Means.

研究の動機と目的

K-Meansの初期センタ選択への感受性が、しばしば部分最適解に至ることを是正すること。
フラワーポリネーションアルゴリズム（FPA）のグローバルサーチ能力を活用し、クラスタリング品質を向上させること。
FPAのグローバル最適化の強みとK-Meansの高速なローカル収束性を組み合わせたハイブリッドフレームワークを構築すること。
提案手法FPAKMの性能を、複数の実世界データセットにおけるK-MeansおよびFPAと比較して評価すること。
8つのデータセットにおける実験的比較を通じて、より優れたクラスタリング精度と頑健性を示すこと。

提案手法

FPAKMアルゴリズムは、フラワーポリネーションアルゴリズム（FPA）を用いてクラスターセンタを初期化する。FPAは生物的受粉を模倣し、グローバルおよびローカル探索のメカニズムを有する。
FPAは、レビー飛行に基づく探索戦略を用いて、解空間全体を広くカバーする候補解（センタ）を生成する。
FPAの収束後、得られたセンタを初期シードとしてK-Meansアルゴリズムに供給し、反復的最適化によってクラスタ割り当てを精緻化する。
目的関数は、二乗誤差の和（SSE）を最小化することを目的とし、FPAフェーズおよびK-Meansフェーズの両方で評価される。
アルゴリズムは、FPAに基づくセンタ生成とK-Meansによるリファインメントを、収束または最大反復回数に達するまで交互に繰り返す。
ハイブリッド手法は、FPAのグローバルサーチによる局所最小値からの脱出と、K-Meansの高速収束性による最終的クラスタリング品質の向上を活用する。

実験結果

リサーチクエスチョン

RQ1FPAとK-Meansの統合により、単独で使用する場合と比較してクラスタリング精度が向上するか。
RQ2FPAKMハイブリッド手法は、標準的なK-Meansと比較して初期センタ選択への感受性が低いか。
RQ3多様なデータセットにおいて、FPAKMの収束速度と解の品質はどのように評価されるか。
RQ4FPAのグローバルサーチ能力は、K-Meansに内在する局所最適解問題をどの程度緩和できるか。
RQ5ハイブリッド手法は、複数のベンチマークデータセットにおいて一貫して優れた性能を示すか。

主な発見

FPAKMは、評価に用いられた8つのベンチマークデータセットすべてにおいて、K-MeansおよびFPAよりも優れたクラスタリング性能を達成した。
改善された初期センタ選択のおかげで、部分最適解への収束の可能性が顕著に低減された。
FPAKMは、複雑なクラスタ構造を有するデータセットにおいて特に、高速な収束性と高い精度を示した。
FPAのグローバルサーチとK-Meansのローカルリファインメントの統合により、二乗誤差の和（SSE）の指標が顕著に改善された。
実験的結果から、FPAの解の品質および安定性の面で、FPAKMがFPAを上回ることが確認された。
提案手法は、多様なデータ分布において頑健性とスケーラビリティを示し、強力な一般化能力を有することが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。