Skip to main content
QUICK REVIEW

[논문 리뷰] Constructing Strata to solve Sample Allocation Problems by Grouping Genetic Algorithm

Mervyn O’Luing, Steven Prestwich|arXiv (Cornell University)|2017. 09. 10.
Optimal Experimental Design Methods참고 문헌 19인용 수 1
한 줄 요약

이 논문은 정확도 제약 조건을 충족하면서 표본 크기를 최소화하는 것을 목표로 하여, 초기 집단을 반복적으로 분할하여 표본 할당을 최적화하는 새로운 군집화 유전 알고리즘(GA)을 제안한다. 이 방법은 표준 GA 연산자 대신 전용 군집화 연산자를 사용하여 유사한 계산 비용으로도 훨씬 뛰어난 해의 품질을 달성하며, 이로 인해 상당한 비용 절감 효과를 얻을 수 있다.

ABSTRACT

Predicting the total cost for the minimised sample size from the optimal partition of constructed strata in multivariate survey design is a problem in cases where the population frame is large. A solution exists that satisfies accuracy constraints, while minimising the sample size and partitioning the starting number of strata iteratively into a smaller number of groups. The optimal stratification for the minimal sample size can be found by testing all possible partitions. However the number of possible partitions grows exponentially with the number of initial strata. There are alternative ways of modelling this problem, one of the most natural is using Genetic Algorithms (GA). These evolutionary algorithms use recombination, mutation and selection to search for optimal solutions. They often converge on optimal or near-optimal solution more quickly than exact methods. We propose a new GA approach to this problem using grouping genetic operators instead of traditional operators. The results show a significant improvement in solution quality for similar computational effort, corresponding to large monetary savings.

연구 동기 및 목표

  • 정확도 제약 조건을 유지하면서 다변량 표본 조사 설계에서 표본 크기를 최소화하는 데 도전하는 것.
  • 모든 가능한 집단 분할을 테스트할 경우 계산 복잡도가 기하급수적으로 증가하는 문제를 해결하는 것.
  • 기존 정확한 방법이나 표준 GA 방법보다 더 효율적인 최적화 방법을 개발하는 것.
  • 특수 설계된 군집화 유전 연산자를 통해 표본 할당 문제의 해 품질을 향상시키는 것.

제안 방법

  • 표본 할당 문제를 정확도 및 비용 제약 조건이 있는 다변량 집단화 작업으로 모델링한다.
  • 표준 이진 또는 실수 코딩 연산자가 아닌 전용 군집화 유전 연산자를 사용하는 유전 알고리즘 프레임워크를 적용한다.
  • 군집화 연산자는 초기 집단을 더 적은 수의 더 최적화된 군집으로 분할하는 데 전용으로 설계되어 있다.
  • 재조합, 변이, 선택 연산을 적용하여 총 표본 크기를 최소화하는 해를 진화시킨다.
  • 적합도 평가 기준은 다중 변수에 걸쳐 정확도 제약 조건을 충족하면서 표본 크기를 최소화하는 데 있다.
  • 정밀도를 유지하면서 비용을 줄이기 위해 정밀도를 유지하면서 집단 수를 점진적으로 감소시키는 방식으로 반복적으로 집단을 융합한다.

실험 결과

연구 질문

  • RQ1표준 유전 알고리즘과 비교해 볼 때 군집화 유전 연산자는 표본 할당 문제의 해 품질을 향상시킬 수 있는가?
  • RQ2다중 변수에 걸쳐 표본 크기를 최소화할 때 제안된 방법의 계산 비용은 어떻게 증가하는가?
  • RQ3군집화 연산자를 사용할 경우 요구되는 정확도를 유지하면서 총 표본 크기를 얼마나 줄일 수 있는가?
  • RQ4제안된 방법은 정확한 방법이나 기존의 GA 기반 방법보다 더 뛰어난 비용 효율성을 달성하는가?

주요 결과

  • 유사한 계산 비용으로도 제안된 군집화 유전 알고리즘이 표준 GA 방법보다 훨씬 뛰어난 해 품질을 달성한다.
  • 정확도 제약 조건을 충족하면서도 다변량 조사에 필요한 총 표본 크기를 줄이는 데 성공한다.
  • 군집화 연산자의 사용은 초기 집단을 최적의 군집으로 효과적으로 분할하는 데 기여한다.
  • 정밀도를 손상시키지 않으면서도 표본 크기가 감소함에 따라 상당한 금전적 절감 효과를 얻을 수 있다.
  • 정확한 순열 방법에 비해 근사 최적 해에 더 빠르게 수렴하는 경향을 보인다.
  • 기존 방법이 비가능해지는 대규모 모집단에서 특히 해 품질 향상 효과가 두드러진다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.