Skip to main content
QUICK REVIEW

[논문 리뷰] Standard Language Ideology in AI-Generated Language

Genevieve Smith, Eve Fleisig|arXiv (Cornell University)|2024. 06. 13.
Natural Language Processing Techniques인용 수 9
한 줄 요약

본 논문은 AI생성 언어가 표준 언어 이데올로기를 강화하는 방식, 특히 Standard American English를 강화하는지 분석하고, 소수적 언어 공동체에 시사하는 개방된 문제들의 분류를 제시한다.

ABSTRACT

Standard language ideology is reflected and reinforced in language generated by large language models (LLMs). We present a faceted taxonomy of open problems that illustrate how standard language ideology manifests in AI-generated language, alongside implications for minoritized language communities and society more broadly. We introduce the concept of standard AI-generated language ideology, a process through which LLMs position "standard" languages--particularly Standard American English (SAE)--as the linguistic default, reinforcing the perception that SAE is the most "appropriate" language. We then discuss ongoing tensions around what constitutes desirable system behavior, as well as advantages and drawbacks of generative AI tools attempting, or refusing, to imitate different English language varieties. Rather than prescribing narrow technical fixes, we offer three recommendations for researchers, practitioners, and funders that focus on shifting structural conditions and supporting more emancipatory outcomes for diverse language communities.

연구 동기 및 목표

  • 표준 언어 이데올로기 및 AI생성 언어에서의 그것의 존재를 정의한다.
  • 대형 언어 모델이 언어 변종에 대한 계층적 관점을 어떻게 강화하는지 설명한다.
  • 소수화된 언어 공동체를 위한 개방 문제와 사회적 해에 대한 분류체계를 제시한다.
  • 바람직한 모델 동작과 잠재적 해방적 디지털 미래 사이의 긴장을 논의한다.

제안 방법

  • 표준 언어 이데올로기와 AI생성 언어에 관한 문헌을 검토한다.
  • 학습 데이터와 모델 인구 통계가 SAE 기본 출력에 어떻게 기여하는지 분석한다.
  • 영어 변종 간 성능 차이와 편향 차이를 보여주는 연구들을 종합한다.
  • 소수화된 언어 공동체를 위한 해와 윤리적 고려사항의 분류체계를 제안한다.
  • AI 개발의 설계 프로세스 및 참여적 접근 방식에 대한 시사점을 논의한다.

실험 결과

연구 질문

  • RQ1AI생성 언어에서 어떤 메커니즘이 Standard American English를 기본 변형으로 강화하는가?
  • RQ2AI 언어 도구와 상호작용할 때 소수화된 영어 변종 화자에게 어떤 해가 발생하는가?
  • RQ3다국어 맥락에서 바람직하거나 해방적 모델 동작을 어떻게 정의해야 하는가?
  • RQ4표준 언어 이데올로기를 완화하고 포용적 AI 미래를 촉진할 개발 관행은 무엇인가?

주요 결과

  • AI생성 언어는 표준 변종으로 기본화되는 경향이 있으며, 특히 SAE.
  • 출력은 소수화된 변종이 표준 변종에 비해 품질이 낮거나 오해를 보이는 경향이 있다.
  • 소수화된 변종의 생산은 AI 출력에서 고정관념, 전유, 혹은 조작으로 이어질 수 있다.
  • 비표준 변종이 억압될 경우 소수화된 언어의 제거 가능성이 있다.
  • 참여적이며 커뮤니티 중심의 모델 설계 접근 방식은 해방적 디지털 미래를 촉진할 수 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.