[논문 리뷰] Sampling-guided exploration of active feature selection policies
The paper extends a reinforcement learning framework for instance-specific active feature selection to larger datasets using a heuristic-based policy exploration and a post-fit regularisation to produce compact, interpretable acquisition policies while improving accuracy and reducing policy complexity.
Determining the most appropriate features for machine learning predictive models is challenging regarding performance and feature acquisition costs. In particular, global feature choice is limited given that some features will only benefit a subset of instances. In previous work, we proposed a reinforcement learning approach to sequentially recommend which modality to acquire next to reach the best information/cost ratio, based on the instance-specific information already acquired. We formulated the problem as a Markov Decision Process where the state's dimensionality changes during the episode, avoiding data imputation, contrary to existing works. However, this only allowed processing a small number of features, as all possible combinations of features were considered. Here, we address these limitations with two contributions: 1) we expand our framework to larger datasets with a heuristic-based strategy that focuses on the most promising feature combinations, and 2) we introduce a post-fit regularisation strategy that reduces the number of different feature combinations, leading to compact sequences of decisions. We tested our method on four binary classification datasets (one involving high-dimensional variables), the largest of which had 56 features and 4500 samples. We obtained better performance than state-of-the-art methods, both in terms of accuracy and policy complexity.
연구 동기 및 목표
- 개별 인스턴스 단위로 획득 비용 하에서 정보성이 높은 특징을 선택하는 문제의 동기를 제시하고 해결한다.
- 초상태(분리된 특징 부분집합)와 DAG 구조를 사용하여 보정(imputation)을 피하는 확장 가능한 RL 기반 프레임워크를 제안한다.
- 큰 특징 집합에서 유망한 특징 조합에 정책 학습을 집중시키는 샘플링 기반 휴리스틱을 도입한다.
- 고유한 획득 시퀀스의 수를 줄이고 해석 가능성을 높이는 정규화 전략을 제시한다.
제안 방법
- 누락 데이터를 임퓨팅하지 않고 per-instance 특징 취득 결정을 가능하게 하는 superstates 위의 마코프 결정 프로세스로 능동 특징 선택을 모델링한다.
- 각 superstate마다 독립적으로 Q(s,a)를 추정하기 위해 별도의 회귀기를 학습시켜 벨만 기반 Q값 계산을 확장한다.
- 제시된 유망한 superstate 부분집합에 대한 제한된 정책을 구축하기 위해 그래프 탐색 휴리스틱을 사용하여 추정기의 지수적 증가를 줄인다.
- 해석 가능성을 높이고 과적합을 줄이기 위해 너무 많은 superstate 방문을 벌주하는 가상 보상 항을 추가하는 희소 정책 정규화(REPS에서 영감을 받음)를 도입한다.
실험 결과
연구 질문
- RQ1활성 특징 선택을 모든 특징 조합을 나열하지 않고 중간에서 대규모 특징 집합으로 확장하려면 어떻게 할 수 있는가?
- RQ2샘플링 기반 탐색 전략이 per-instance 의사 결정에 가장 가치 있는 특징 조합을 식별하는가?
- RQ3정규화가 활성 특징 선택에서 정확도를 희생하지 않으면서 정책 복잡성을 줄일 수 있는가?
- RQ4제안된 방법이 정확도와 비용 효율성 면에서 다양한 데이터셋에서 최첨단 활성 특징 선택 접근법과 어떻게 비교되는가?
주요 결과
- 제안된 샘플링 가이드 탐색은 EDDI 및 Wang의 클러스터링과 비교하여 여러 데이터셋에서 경쟁력 있거나 우수한 정확도를 보여주며, 고차원 사례를 포함한다.
- 이 방법은 최대 56개 특징과 4500개의 샘플을 가진 데이터셋을 다룰 수 있게 하며, 정책 복잡도(고유한 획득 시퀀스 감소)와 해석 가능성이 향상된다.
- Heart 데이터셋에서의 실제 비용 평가에서는 비용이 가변적일 때 더 저렴하고 정보가 풍부한 특징을 선택하는 반면, 동질 비용 설정은 비용이 높은 특징을 장려한다.
- 휴리스틱 기반의 정책 확장은 대규모 특징 집합(예: Spam)에서 탐색을 가속화하여 무작위 탐색보다 정확도와 비용 간의 균형에서 더 나은 타협을 달성한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.