Skip to main content
QUICK REVIEW

[논문 리뷰] AI Transparency in the Age of LLMs: A Human-Centered Research Roadmap

Q. Vera Liao, Jennifer Wortman Vaughan|arXiv (Cornell University)|2023. 06. 02.
Topic Modeling인용 수 25
한 줄 요약

본 논문은 LLM에 대한 투명성에 인간 중심의 로드맵을 제시하며, 도전 과제, 이해관계자의 요구, 그리고 네 가지 일반적인 투명성 접근법(모델 리포팅, 결과 평가, 설명, 그리고 불확실성 소통)을 요약하고 이를 LLM에 적용하기 위한 지침을 제시한다.

ABSTRACT

The rise of powerful large language models (LLMs) brings about tremendous opportunities for innovation but also looming risks for individuals and society at large. We have reached a pivotal moment for ensuring that LLMs and LLM-infused applications are developed and deployed responsibly. However, a central pillar of responsible AI -- transparency -- is largely missing from the current discourse around LLMs. It is paramount to pursue new approaches to provide transparency for LLMs, and years of research at the intersection of AI and human-computer interaction (HCI) highlight that we must do so with a human-centered perspective: Transparency is fundamentally about supporting appropriate human understanding, and this understanding is sought by different stakeholders with different goals in different contexts. In this new era of LLMs, we must develop and design approaches to transparency by considering the needs of stakeholders in the emerging LLM ecosystem, the novel types of LLM-infused applications being built, and the new usage patterns and challenges around LLMs, all while building on lessons learned about how people process, interact with, and make use of information. We reflect on the unique challenges that arise in providing transparency for LLMs, along with lessons learned from HCI and responsible AI research that has taken a human-centered perspective on AI transparency. We then lay out four common approaches that the community has taken to achieve transparency -- model reporting, publishing evaluation results, providing explanations, and communicating uncertainty -- and call out open questions around how these approaches may or may not be applied to LLMs. We hope this provides a starting point for discussion and a useful roadmap for future research.

연구 동기 및 목표

  • 대형 언어 모델(LLMs)과 그 생태계가 제시하는 고유한 투명성 도전과제를 식별한다.
  • 다양한 이해관계자와 맥락을 반영하는 인간 중심 관점을 제안한다.
  • 네 가지 일반적인 투명성 접근법을 검토하고 이들이 LLM에 얼마나 적용될 수 있는지 논의한다.
  • LLM 투명성 분야의 향후 연구를 이끄는 방향성과 미해결 질문을 제시한다.

제안 방법

  • HCI와 책임 있는 AI의 기존 AI 투명성 연구를 종합하여 이해관계자의 목표와 필요를 매핑한다.
  • 능력 예측 불가성과 불투명한 아키텍처와 같은 LLM 특유의 투명성 도전과제를 특징화한다.
  • 네 가지 널리 사용되는 투명성 접근법을 요약하고 이것들이 LLM에 어떻게 적용될 수 있는지 분석한다(모델 리포팅, 평가 결과 공개, 설명, 불확실성 소통).
  • 인터페이스 설계, 사고 모델, 신뢰, 사용자 실행 가능성에 대한 시사점을 논의한다.

실험 결과

연구 질문

  • RQ1LLMs에 대한 투명성이 더 작은 모델에 대한 투명성과 구별되는 요소는 무엇인가?
  • RQ2모델 리포팅, 평가, 설명, 불확실성 소통을 LLM 생태계의 이해관계자를 지원하도록 어떻게 적응시킬 수 있는가?
  • RQ3투명성을 사용자의 목표와 사고 모델에 맞추기 위해 필요한 디자인 및 평가 고려사항은 무엇인가?
  • RQ4LLM 투명성과 관련된 책임 있는 AI 거버넌스 및 정책에 남아 있는 미해결 질문은 무엇인가?

주요 결과

  • 투명성은 정보를 제공하는 것뿐 아니라 다양한 이해관계자와 맥락에 대해 적절한 이해를 지원해야 한다.
  • LLMs는 능력 예측 불가성, 크고 불투명한 아키텍처, 넓고 진화하는 이해관계자 기반 등과 같은 도전과제를 제시한다.
  • 인간 중심적 관점은 목표와 작업에 초점을 두고 투명성을 디버깅, 의사결정, 거버넌스와 같은 하류 활동의 달성과 연결한다.
  • 커뮤니케이션 방식과 디자인(시각 자료, 자연어, 프레이밍)은 투명성 정보가 처리되고 사용되는 방식에 현저히 영향을 미친다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.