QUICK REVIEW

[論文レビュー] Determination of weight coefficients for additive fitness function of genetic algorithm

V. K. Ivanov, V. K. Ivanov|arXiv (Cornell University)|Mar 27, 2021

Data Mining Algorithms and Applications参考文献 8被引用数 5

ひとこと要約

本論文は、情報検索におけるクエリ最適化に用いられる遺伝的アルゴリズム（GA）における加法的フィットネス関数の最適な重み係数を決定する解析的手法を提案する。すべてのクエリの集計結果を活用することで、一貫した集団の改善と局所的・全域的フィットネス関数最大値の信頼性のある検出を可能にし、他の重み係数計算手法を上回る性能を発揮する。

ABSTRACT

The paper presents a solution for the problem of choosing a method for analytical determining of weight factors for a genetic algorithm additive fitness function. This algorithm is the basis for an evolutionary process, which forms a stable and effective query population in a search engine to obtain highly relevant results. The paper gives a formal description of an algorithm fitness function, which is a weighted sum of three heterogeneous criteria. The selected methods for analytical determining of weight factors are described in detail. It is noted that expert assessment methods are impossible to use. The authors present a research methodology using the experimental results from earlier in the discussed project "Data Warehouse Support on the Base Intellectual Web Crawler and Evolutionary Model for Target Information Selection". There is a description of an initial dataset with data ranges for calculating weights. The calculation order is illustrated by examples. The research results in graphical form demonstrate the fitness function behavior during the genetic algorithm operation using various weighting options.

研究の動機と目的

遺伝的アルゴリズムを用いたクエリ最適化における加法的フィットネス関数の適切な重み係数の選択という課題に対処すること。
専門家による評価に依存せずに、重み係数を解析的に決定する手法を開発すること。
高関連性の検索クエリを生成する遺伝的アルゴリズムの効率性と収束性を向上させること。
重み係数の計算方法がフィットネス関数の挙動に与える影響に基づき、異なる手法を評価・比較すること。

提案手法

フィットネス関数は、順位順位（g）、結果の普遍性（p）、意味的類似度（s）という3つの異種基準の重み付き和として定式化され、重みはそれぞれ wg、wp、ws である。
重みは、集団に含まれるすべてのクエリのデータを用いて解析的に計算され、全データセットにおける g、p、s の値の正規化範囲に基づく。
正規化には最小-最大スケーリングが用いられ、g = (g - g_min)/(g_max - g_min)、p = (p - p_min)/(p_max - p_min) であり、s は文書とクエリのベクトル間のコサイン類似度で計算される。
本手法は専門家評価を避けるものであり、代わりにクエリ実行結果からの実証的データを用いて係数を導出する。
実験的走行によりアプローチの妥当性が検証され、複数の集団と世代にわたりフィットネス関数の挙動がモニタリングされた。
異なる重み設定戦略におけるフィットネス関数値のグラフィカルな可視化を用いた比較分析が実施された。

実験結果

リサーチクエスチョン

RQ1遺伝的アルゴリズムにおける多基準フィットネス関数の重み係数を解析的に決定する最も効果的な手法は何か？
RQ2重み係数の計算に集団全体の集計データを用いることで、遺伝的アルゴリズムの収束性と安定性にどのような影響を与えるか？
RQ3提案手法は、効果的な最適化を示すために、フィットネス関数の局所的・全域的最大値を信頼性を持って検出できるか？
RQ4重み係数の計算手法の違いが、集団の改善度とフィットネス関数の挙動に与える影響を比較した場合、本手法は他の手法に比べてどのように優れているか？

主な発見

集団に含まれるすべてのクエリの結果を用いて重み係数を計算する手法が、クエリ集団のフィットネスにおける最も一貫性があり、進行的な改善をもたらした。
このアプローチにより、フィットネス関数の局所的・全域的最大値の検出が可能となり、効果的な収束と安定した最適化が示された。
それに対して、他の重み係数計算手法は一貫した集団の改善を生じさせず、明確な極値を検出できなかった。
集計データを用いた係数導出は、局所的極値の迅速な検出確率を高め、最適解を表す可能性がある。
本手法により、高関連性の検索クエリを特定する可能性が高まり、遺伝的アルゴリズム全体の品質が向上した。
グラフィカルな結果から、本手法を用いた場合、フィットネス関数値がより高い水準に安定することが確認され、優れた性能を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。