QUICK REVIEW

[논문 리뷰] Measuring Intelligence through Games

Tom Schaul, Julian Togelius|arXiv (Cornell University)|2011. 09. 06.

Artificial Intelligence in Games참고 문헌 25인용 수 41

한 줄 요약

이 논문은 게임 기반 언어(GDL)를 사용하여 다양한 샘플링된 게임 세트에서 에이전트를 평가하여 인공통합지능(AGI)을 측정하는 실용적인 벤치마크를 제안한다. 이는 끝이 없는 계산 자원을 고려한 레깅과 허터의 보편적 지능 측도를 확장하여, GDL 문자열의 길이와 자원 가중 샘플링을 통해 확장 가능하고 언제나 계산 가능한 일반 게임 지능 측도를 만든다.

ABSTRACT

Artificial general intelligence (AGI) refers to research aimed at tackling the full problem of artificial intelligence, that is, create truly intelligent agents. This sets it apart from most AI research which aims at solving relatively narrow domains, such as character recognition, motion planning, or increasing player satisfaction in games. But how do we know when an agent is truly intelligent? A common point of reference in the AGI community is Legg and Hutter's formal definition of universal intelligence, which has the appeal of simplicity and generality but is unfortunately incomputable. Games of various kinds are commonly used as benchmarks for "narrow" AI research, as they are considered to have many important properties. We argue that many of these properties carry over to the testing of general intelligence as well. We then sketch how such testing could practically be carried out. The central part of this sketch is an extension of universal intelligence to deal with finite time, and the use of sampling of the space of games expressed in a suitably biased game description language.

연구 동기 및 목표

다양한 접근 방식 간 비교가 가능한 방식으로, 인공통합지능(AGI)을 측정하기 위한 일반적이고 실용적인 벤치마크의 부족을 해결하기 위해.
계산이 불가능한 레깅과 허터의 보편적 지능 측도를 유한하고 자원 인지적이며 근사 가능한 프레임워크로 변환하여 실제 세계 테스트에 적합하게 하기 위해.
게임은 기능적 다양성과 계획, 학습, 적응과 같은 핵심 인지 능력을 테스트할 수 있는 능력 덕분에 일반 지능을 위한 이상적인 시험무대라고 주장하기 위해.
편향된 게임 기반 언어(GDL)를 통해 게임 공간을 샘플링하는 방법을 제안하여 광범위한 커버리지와 함께 계산 가능성을 유지하기 위해.
에이전트가 알려진 게임 뿐 아니라, 상호작용과 탐색을 통해 미리 정의되지 않은 랜덤 샘플링된 게임에서 테스트할 수 있도록 일반 AI 경쟁의 개발을 가능하게 하기 위해.

제안 방법

유한한 시간과 계산 자원 제약 조건을 통합하여 보편적 지능 측도를 확장함으로써, 계산이 불가능한 정의를 실용적이고 언제나 계산 가능한 측도로 전환한다.
모든 가능한 게임의 공간을 표현하고 샘플링하기 위해 게임 기반 언어(GDL)의 문자열에 길이 가중 샘플링을 적용하여 간단하고 압축 가능성이 높은 게임 기술을 선호한다.
계산 가능하고 지능 테스트에 관련된 게임을 우선순위로 정하기 위해 자원 기반 가중치를 적용함으로써 다양성과 실현 가능성의 균형을 이룬다.
샘플링된 GDL 기술을 실행하여 에이전트 평가를 위한 플레이어블한 게임 환경을 생성하는 게임 엔진 인터프리터를 활용한다.
에이전트가 사전에 정의된 게임 규칙에 의존하기보다는, 알려지지 않은 게임과의 상호작용을 통해 학습하고 적응하도록 벤치마크를 설계한다.
시간 예산 기반 메커니즘을 도입하여, 에이전트가 훈련 단계와 평가 단계를 균형 있게 관리하도록 하여 AGI 시스템의 실제 자원 제약 조건을 반영한다.

실험 결과

연구 질문

RQ1계산이 불가능한 보편적 지능 측도는 어떻게 실용적이고 유한하며 근사 가능한 AGI 평가용 벤치마크로 변환될 수 있는가?
RQ2게임은 왜 일반 지능 테스트의 벤치마크 도메인으로 특히 적합한가? 어떤 특성이 넓은 인지 능력을 탐색하는 데 이상적인가?
RQ3게임 기반 언어에서 시스템적으로 게임의 대표성 있고 다양한 세트를 어떻게 샘플링할 수 있는가? 이는 필수적인 지능 폭 드러내는 시나리오를 커버하는가?
RQ4제안된 벤치마크는 직관, 창의성, 전략적 계획과 같은 핵심 인간 유사 인지 능력을 어느 정도 테스트하는가?
RQ5시간과 계산 자원과 같은 자원 제약 조건은 어떻게 보편적 지능 측도에 의미 있게 통합될 수 있는가? 이는 실제 세계 제약 조건을 반영하기 위함인가?

주요 결과

제안된 프레임워크는 유한한 시간과 자원 제약 조건을 통합함으로써, 이론적으로 이상적이지만 계산이 불가능한 보편적 지능 측도를 실용적이고 언제나 계산 가능한 벤치마크로 성공적으로 전환한다.
길이와 자원 가중 샘플링을 통한 게임 기반 언어(GDL) 문자열의 샘플링은 확장 가능하고 대표적인 가능한 게임 공간의 샘플링을 가능하게 하여 다양성을 유지하면서도 계산 가능성을 확보한다.
에이전트가 상호작용을 통해 알려지지 않은 게임에서 평가받을 수 있도록 벤치마크가 지원되어, 규칙 기반 파싱이나 하드코딩된 전략에 의존하는 것이 아니라 진정한 일반화와 학습을 장려한다.
가상 몸체 통합을 통해 3D 게임 엔진을 GDL 인터프리터에 통합함으로써, 에이전트가 고차원적 감각 입력을 처리하고 복잡한 환경에서 신체 제어를 수행할 수 있도록 한다.
기존의 스탠포드 일반 게임 플레이 경쟁과 같은 대회에 체계적인 이론적 기반을 제공하면서도, 이론적 정당성 부족과 진정한 탐색 기반 평가의 결여라는 문제점을 해결한다.
이 프레임워크는 에이전트가 사전 지식이 아닌 경험을 통해 효과적인 전략을 발견하도록 하므로, 직관과 창의성과 같은 인간 유사 인지 기능을 암묵적으로 테스트한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.