QUICK REVIEW

[논문 리뷰] A Hierarchy of Limitations in Machine Learning

Momin M. Malik|arXiv (Cornell University)|2020. 02. 12.

Explainable Artificial Intelligence (XAI)참고 문헌 232인용 수 49

한 줄 요약

사회에 적용된 기계 학습의 근본적 개념적, 절차적, 통계적 한계에 대한 구조적 다층 비판으로, 하위 결과가 정량화에서 교차 검증까지 계층을 통해 어떻게 전파되는지에 초점을 둔다.

ABSTRACT

"All models are wrong, but some are useful", wrote George E. P. Box (1979). Machine learning has focused on the usefulness of probability models for prediction in social systems, but is only now coming to grips with the ways in which these models are wrong---and the consequences of those shortcomings. This paper attempts a comprehensive, structured overview of the specific conceptual, procedural, and statistical limitations of models in machine learning when applied to society. Machine learning modelers themselves can use the described hierarchy to identify possible failure points and think through how to address them, and consumers of machine learning models can know what to question when confronted with the decision about if, where, and how to apply machine learning. The limitations go from commitments inherent in quantification itself, through to showing how unmodeled dependencies can lead to cross-validation being overly optimistic as a way of assessing model performance.

연구 동기 및 목표

사회 시스템에 적용될 때 기계 학습의 근본적 가정과 한계를 식별하고 정리한다.
의존성과 측정 선택이 모델 평가에 어떤 편향을 주는지, 특히 교차 검증을 통해 어떻게 영향을 받는지 설명한다.
혼합 방법과 대안적 접근 방식이 기계 학습만으로의 워크플로우의 한계를 어떻게 해결할 수 있는지 제안한다.
모델러와 사용자가 실제로 ML 사용에 대해 어디를 의심해야 하는지에 대한 지침을 제공한다.

제안 방법

ML 사용에 관한 네 가지 결정 계층 구조를 제시한다: (1) 질적 분석보다 양적 분석, (2) 다른 모델링보다 확률적 모델링, (3) 설명적 모델링보다 예측 모델링, (4) 평가 도구로서의 교차 검증.
정량화에서 교차 검증까지 한계가 어떻게 전파되는지 보여주는 합리적 소유의 사슬(logical chain of custody) 개념을 개발한다.
의존성이 교차 검증에 편향을 주는지에 대한 이론으로 Optimizer/Optimism 아이디어(Efron, 2004)의 확장을 도입한다.
ML의 추상화를 사회 맥락과 연결하기 위해 철학적, 사회학적, 통계적, ML 비판을 활용한다.
측정에서 구성개념, 잠재변수, 그리고 Ground Truth와 구성의 역할을 인용하고 논의한다.

실험 결과

연구 질문

RQ1사회 분석에 기계 학습을 사용할 때의 근본적 가정과 한계는 무엇인가?
RQ2의존성과 측정 선택이 교차 검증과 모델 평가에 어떤 편향을 주는가?
RQ3양적, 확률적, 예측적 접근의 우선순위가 사회 현상 이해에 어떤 영향을 미치는가?
RQ4혼합 방법은 사회에 적용될 때 ML의 한계를 어떻게 해결할 수 있는가?
RQ5모델러와 소비자가 ML 주장을 더 효과적으로 interrogate 하는 데 도움이 되는 프레임워크는 무엇인가?

주요 결과

한계의 계층적 체인이 정량화, 구성개념 및 교차 검증을 통해 전파된다.
의존성이 존재하고 충분히 고려되지 않으면 교차 검증이 일반화 가능성에 대해 지나치게 낙관적일 수 있다.
정량화는 중앙 경향성 시각을 부과하며 의미 구성과 살아있는 경험의 왜곡을 초래할 수 있다.
구성개념과 측정 문제는 기저에 있는 잠재 요인을 잘못 나타내는 ground-truth 대리변수를 초래할 수 있다.
혼합 방법과 대체 검증 접근 방식은 일부 ML 한계를 완화할 수 있지만, 신중한 협업과 방법론 작업이 필요하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.