QUICK REVIEW

[논문 리뷰] CoCoMo: Computational Consciousness Modeling for Generative and Ethical AI

Edward Yi Chang|arXiv (Cornell University)|2023. 03. 17.

Ethics and Social Impacts of AI인용 수 9

한 줄 요약

본 논문은 MFQ 스케줄링, 강화 학습, 그리고 적응적 프롬프트를 사용하여 생성형 AI에 컴퓨테이셔널 컨셔스니스, 윤리적 가드레일, 감정 지능을 내재화하는 CoCoMo 모델을 제시한다. 이는 AI 시스템의 공정성, 비해악성, 공감 능력, 신뢰성을 향상시킨다고 주장한다.

ABSTRACT

The CoCoMo model proposes a computational solution to the challenge of incorporating ethical and emotional intelligence considerations into AI systems, with the aim of creating AI agents that combine knowledge with compassion. To achieve this goal, CoCoMo prioritizes fairness, beneficence, non-maleficence, empathy, adaptability, transparency, and critical and exploratory thinking abilities. The model employs consciousness modeling, reinforcement learning, and prompt template formulation to support these desired traits. By incorporating ethical and emotional intelligence considerations, a generative AI model can potentially lead to improved fairness, reduced toxicity, and increased reliability.

연구 동기 및 목표

시스템-2 AI 특성으로서 지식, 공정성, 선의, 비해악성, 공감, 적응성, 투명성, 그리고 비판적/탐구적 사고를 포함하는 바람직한 특성을 정의한다.
컨셔스니스 이론을 실용적 아키텍처와 결합한 Computational Consciousness Model(CoCoMo)를 제안하여 AI 안전성과 윤리를 위한 구조를 제시한다.
생성형 AI에서 감정 모델링, 윤리적 가드레일, 작업 일정 관리를 가능하게 하는 모듈, 알고리즘, 프롬프트를 설명한다.
CoCoMo가 기초 모델에서의 공정성 개선, 독성 감소, 신뢰성 증가에 기여할 수 있는지 보여준다.

제안 방법

의사실주의적 관점에서 의식을 정의하고 이론들을 조사하여 계산적 접근을 정당화한다.
CoCoMo를 수용체(receptor), 무의식(unconsciousness), 의식(consciousness), 작용자(effector)의 네 모듈로 정의한다.
의식-무의식 작업 전환을 관리하기 위한 인터럽트가 포함된 다층 피드백 큐(MFQ) 스케줄러를 사용한다.
행동 가이드를 위해 감정 모델링, 보상 기반 강화 학습, 프롬프트 템플릿 생성을 도입한다.
평가 및 윤리적 추론을 위한 프롬프팅 앙상블과 CRIT(Critical Thinking Template)을 제시한다.
안전과 창의성을 촉진하기 위한 공감 템플릿과 반사실/가정적 추론 프롬프트의 예시를 제공한다.

실험 결과

연구 질문

RQ1계산적 의식을 어떻게 모델링하여 생성형 AI의 윤리 및 감정 지능을 지원할 수 있는가?
RQ2무의식과 의식 AI 상태 사이의 전환을 안전하게 유지하면서 어떤 스케줄링 및 보상 메커니즘이 가장 잘 작동하는가?
RQ3프롬프트와 템플릿이 기초 모델에서 공감, 윤리적 가드레일, 비판적 사고를 어떻게 강제할 수 있는가?
RQ4반사실적 및 가정적 추론이 창의성을 해치지 않으면서 독성 및 환각을 줄일 수 있는가?

주요 결과

CoCoMo는 MFQ 스케줄링을 의식 유사 루프와 통합하여 주의 집중과 새로운 사건에 대한 인터럽트를 관리한다.
감정 모델링과 보상 형성(reward shaping)을 통해 AI 행동을 윤리적이고 공감적 목표와 맞춘다.
CRIT는 문서의 신뢰성을 평가하고 주장에 대해 추론하는 구조적 방법을 제공한다.
프롬프트와 템플릿은 LLM 기반 구성요소에서 비판적 사고와 공감적 반응을 가능하게 한다.
이 프레임워크는 AI 시스템 자체에 윤리적 고려를 내재화함으로써 공정성 향상, 독성 감소, 신뢰성 향상을 목표로 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.