Skip to main content
QUICK REVIEW

[논문 리뷰] Theoretical Models of Learning to Learn

Jonathan Baxter|2020. 02. 27.
Machine Learning and Algorithms참고 문헌 8인용 수 42
한 줄 요약

두 가지 이 theoretical 편향 학습(학습-학습) 모델을 소개합니다: 경험적 프로세스(EP) 모델과 계층적 베이즈 모델로, 관련 작업들의 환경에서 에이전트가 편향을 학습하여 새로운 작업에 일반화하는 방법을 자세히 설명합니다.

ABSTRACT

A Machine can only learn if it is biased in some way. Typically the bias is supplied by hand, for example through the choice of an appropriate set of features. However, if the learning machine is embedded within an {\em environment} of related tasks, then it can {\em learn} its own bias by learning sufficiently many tasks from the environment. In this paper two models of bias learning (or equivalently, learning to learn) are introduced and the main theoretical results presented. The first model is a PAC-type model based on empirical process theory, while the second is a hierarchical Bayes model.

연구 동기 및 목표

  • 편향 학습이 손으로 설계된 편향을 넘어 일반화에 필수적임을 동기화합니다.
  • 관련 작업 환경에서 학습-학습의 두 형식 모델(EP와 Bayes)을 제시합니다.
  • 학습자가 일반화 가능한 편향(또는 가설 공간 가족)을 선택하는 방법을 보여줍니다.
  • 효과적 학습-학습을 위한 작업 수와 작업당 예시 수에 대한 확률적 경계를 제공합니다.

제안 방법

  • EP 모델: 가설 공간의 가족을 통해 편향 학습을 형식화하고 모든 작업에서 좋은 해결책을 보장하기 위한 작업/샘플 요구사항의 경계를 도출합니다.
  • Bayes 모델: 편향 학습을 하이퍼 프라이어를 가진 작업 분포에 대한 계층적 추론으로 해석하여 KL-발산 기반 성능 분석으로 이끕니다.
  • 환경을 (P, Q)로 정의합니다. 여기서 P는 작업 분포이고 Q는 작업에 대한 분포이며, 가설 공간의 집합에서 최적화를 수행합니다.
  • 작업 간의 균일한 수렴성(uniform convergence)을 연구하기 위해 경험적 손실 er과 그 경험적 대응을 도입합니다.
  • 주요 결과는 샘플 복잡도(n 작업, 작업당 m 예시)와 손실 함수 클래스의 커버링 수와의 관계를 밝힙니다.
  • EP와 Bayes 접근 방식의 관계를 최대 가능도 추정 vs 베이지안 업데이트 관점으로 논의합니다.

실험 결과

연구 질문

  • RQ1동일한 환경에서 뽑힌 새로운 작업에 대해 좋은 해답을 보장하기 위해 필요한 작업 수와 작업당 예시 수는 얼마입니까?
  • RQ2관련 작업들에서 효과적으로 학습-학습을 가능하게 하려면 가설 공간 가족(하이퍼 바이어스)을 어떻게 선택해야 합니까?
  • RQ3학습-학습 맥락에서 경험적 과정 이론과 베이지안 편향 학습 사이의 연관성은 무엇입니까?
  • RQ4작업 분포(P)와 환경(Q)을 고려할 때 일반화 경계는 어떻게 달라집니까?

주요 결과

  • 두 가지 형식의 학습-학습 모델이 개발되었습니다: EP 기반 편향 학습 모델과 계층적 베이즈 모델.
  • EP 모델의 경우, 하나의 환경 전체에 걸쳐 좋은 가설 공간을 높은 확률로 보장하기 위해 필요한 작업 수와 작업당 예시 수를 보여주는 경계가 확립됩니다.
  • Bayes 모델의 경우, 실제 분포와 사후 분포 간의 KL 発산은 realizability 하에서 d/m으로 감소하며 EP 결과를 반영합니다.
  • EP 프레임워크에서 학습-학습은 편향을 인코딩하는 가설 공간 가족의 선택에 달려 있습니다.
  • 주요 정리는 er_Q(H)와 er_z(H)가 높은 확률로 서로 가깝다는 조건을 제공하고, 커버링 수를 통해 가설 공간 가족의 복잡성과 샘플 복잡도를 연결합니다.
  • 결과는 다수의 관련 작업을 활용하면 작업 수가 증가할수록 작업당 샘플 요구가 감소할 수 있음을 시사합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.