QUICK REVIEW

[논문 리뷰] Determination of weight coefficients for additive fitness function of genetic algorithm

V. K. Ivanov, V. K. Ivanov|arXiv (Cornell University)|2021. 03. 27.

Data Mining Algorithms and Applications참고 문헌 8인용 수 5

한 줄 요약

이 논문은 정보 검색에서 쿼리 최적화를 위한 유전 알고리즘(GA)에 사용되는 가중치 계수를 결정하기 위한 분석적 방법을 제안한다. 인구집단 내 모든 쿼리의 집계 결과를 활용하여, 일관된 인구집단 향상과 국소 및 국소 최대값의 신뢰성 있는 탐지가 가능해지며, 이는 다른 계수 계산 접근 방식보다 우수한 성능을 발휘한다.

ABSTRACT

The paper presents a solution for the problem of choosing a method for analytical determining of weight factors for a genetic algorithm additive fitness function. This algorithm is the basis for an evolutionary process, which forms a stable and effective query population in a search engine to obtain highly relevant results. The paper gives a formal description of an algorithm fitness function, which is a weighted sum of three heterogeneous criteria. The selected methods for analytical determining of weight factors are described in detail. It is noted that expert assessment methods are impossible to use. The authors present a research methodology using the experimental results from earlier in the discussed project "Data Warehouse Support on the Base Intellectual Web Crawler and Evolutionary Model for Target Information Selection". There is a description of an initial dataset with data ranges for calculating weights. The calculation order is illustrated by examples. The research results in graphical form demonstrate the fitness function behavior during the genetic algorithm operation using various weighting options.

연구 동기 및 목표

유전 알고리즘을 통한 쿼리 최적화에 적합한 가중치 계수를 선택하는 데 도전하는 것.
전문가 평가에 의존하지 않고 분석적으로 계수를 결정하는 방법을 개발하는 것.
높은 관련성의 검색 쿼리를 생성하는 데 있어 유전 알고리즘의 효율성과 수렴성을 향상시키는 것.
적합도 함수 행동에 미치는 영향을 기반으로 다양한 계수 계산 방법을 평가하고 비교하는 것.

제안 방법

적합도 함수는 순위 위치(g), 결과 보편성(p), 의미 유사도(s)의 세 가지 이질적인 기준의 가중합으로 구성되며, 각각 wg, wp, ws의 가중치를 갖는다.
모든 인구집단 내 쿼리의 데이터를 기반으로, g, p, s 값의 정규화된 범위를 사용하여 계수를 분석적으로 계산한다.
정규화는 최소-최대 스케일링을 사용한다: g = (g - g_min)/(g_max - g_min), p = (p - p_min)/(p_max - p_min), s는 문서 및 쿼리 벡터 간 코사인 유사도를 사용한다.
전문가 평가를 피하고, 쿼리 실행 결과에서 얻은 실증 데이터를 사용하여 계수를 유도한다.
실험적 실행을 통해 유전 알고리즘의 성능을 검증하며, 다양한 인구집단과 세대에 걸쳐 적합도 함수 행동을 모니터링한다.
다양한 가중치 설정 전략 하에서 적합도 함수 값의 그래픽 시각화를 통한 비교 분석을 실시한다.

실험 결과

연구 질문

RQ1다중 기준 적합도 함수에 대해 분석적으로 가중치 계수를 결정하는 데 가장 효과적인 방법은 무엇인가?
RQ2가중치 계산에 인구집단의 집계 데이터를 사용할 경우, 유전 알고리즘의 수렴성과 안정성에 어떤 영향을 미치는가?
RQ3제안된 방법은 적합도 함수의 국소 최대값과 국소 최대값을 신뢰성 있게 탐지할 수 있는가? 이는 효과적인 최적화를 의미하는가?
RQ4다른 가중치 계산 기법과 비교할 때, 제안된 방법은 인구집단 향상과 적합도 함수 행동 측면에서 어떻게 다른가?

주요 결과

모든 쿼리 결과를 활용해 가중치 계수를 계산하는 방법이 쿼리 인구집단의 적합도에서 가장 일관되고 점진적인 향상을 이룬다.
이 접근법은 적합도 함수의 국소 최대값과 국소 최대값을 탐지할 수 있으며, 효과적인 수렴과 안정적인 최적화를 의미한다.
반면, 다른 가중치 계산 방법은 일관된 인구집단 향상이나 명확한 극값 탐지를 이루지 못했다.
집계 데이터를 사용해 계수를 유도함으로써 국소 극값을 신속하게 탐지할 확률이 높아지며, 이는 최적 해일 수 있다.
제안된 방법은 높은 관련성의 검색 쿼리를 식별할 가능성을 높여 유전 알고리즘의 전반적인 품질을 향상시킨다.
그래픽 결과는 제안된 방법을 사용할 경우 적합도 함수 값이 더 높은 수준에서 안정화됨을 확인하며, 뛰어난 성능을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.