Skip to main content
QUICK REVIEW

[논문 리뷰] A Computational Approach to Politeness with Application to Social Factors

Cristian Danescu-Niculescu-Mizil, Moritz Sudhof|arXiv (Cornell University)|2013. 06. 25.
Language, Discourse, Communication Strategies참고 문헌 4인용 수 149
한 줄 요약

이 논문은 위키백과와 스택 오버플로우에서 올라온 10,000건 이상의 요청에 대한 대규모 인간 레이블링 코퍼스를 사용하여 온라인 요청에서 예의를 식별하기 위한 계산 프레임워크를 제시한다. 이 프레임워크는 어휘적, 문법적, 정서적 특징을 활용한 도메인 독립형 분류기를 도입하여 브라운과 레빈슨의 예의 이론 요소를 실용화하며, 인간 수준에 가까운 성능을 달성하고, 예의 있는 사용자는 초반에 지위를 얻을 가능성이 더 크지만, 높은 지위에 오르면 점점 더 예의 없어지는 것으로 드러났다.

ABSTRACT

We propose a computational framework for identifying linguistic aspects of politeness. Our starting point is a new corpus of requests annotated for politeness, which we use to evaluate aspects of politeness theory and to uncover new interactions between politeness markers and context. These findings guide our construction of a classifier with domain-independent lexical and syntactic features operationalizing key components of politeness theory, such as indirection, deference, impersonalization and modality. Our classifier achieves close to human performance and is effective across domains. We use our framework to study the relationship between politeness and social power, showing that polite Wikipedia editors are more likely to achieve high status through elections, but, once elevated, they become less polite. We see a similar negative correlation between politeness and power on Stack Exchange, where users at the top of the reputation scale are less polite than those at the bottom. Finally, we apply our classifier to a preliminary analysis of politeness variation by gender and community.

연구 동기 및 목표

  • 온라인 커뮤니티 내 사용자 요청에서 예의의 언어적 징후를 식별하기 위한 계산 프레임워크를 개발하는 것.
  • 위키백과와 스택 오버플로우에서 옻은 대규모 인간 레이블링 요청 코퍼스를 사용하여 예의 이론의 핵심 원칙을 평가하는 것.
  • 온라인 논의에서 예의와 사회적 권력, 지위, 성별, 커뮤니티 소속 간의 관계를 조사하는 것.
  • 다양한 온라인 커뮤니티와 언어적 맥락에 일반화 가능한 도메인 독립형 예의 분류기를 구축하는 것.
  • 스케일이 가능한 자동 분류 기법을 활용해 커뮤니티 및 인구 통계적 그룹 간 예의 규범의 차이를 탐구하는 것

제안 방법

  • 아마존 메카니컬 터크를 활용해 위키백과와 스택 오버플로우에서 10,000건 이상의 온라인 요청을 인간 레이블링하여 대규모 인간 레이블링 예의 코퍼스를 구축하는 것.
  • 어휘적 요소(예: 'please', 'sorry'), 문법적 구조(예: 간접적 요청, 조건성), 정서적 특성(긍정적, 낙관적), 의존 관계 등을 포함한 도메인 독립형 특징을 사용한 지도 학습 분류기 설계.
  • 브라운과 레빈슨의 예의 이론의 핵심 요소인 간접성, 예의 어린 태도, 무인격화, 조건성 등을 계산 특징을 통해 실용화하는 것.
  • 레이블링된 코퍼스에서 분류기를 훈련하고 평가하여 다양한 도메인에서 인간 수준의 정확도에 가까운 성능을 달성하는 것.
  • 훈련된 분류기를 대규모 실세계 데이터셋에 적용하여, 신뢰도 수준, 성별, 프로그래밍 언어 커뮤니티 등 사회적 요인에 따른 예의의 변화를 연구하는 것.
  • 인간 레이블링이 불가능한 경우 예측 기반 추론을 활용해 예의 추세를 탐색하고, 인간 레이블링 서브셋을 통해 결과를 검증하는 것

실험 결과

연구 질문

  • RQ1간접성, 조건성, 예의 어린 태도 등의 언어적 예의 징후가 실제 요청에서 문법적 및 맥락적 특징과 어떻게 상호작용하는가?
  • RQ2위키백과와 스택 오버플로우와 같은 온라인 커뮤니티에서 예의가 사회적 지위 획득을 얼마나 잘 예측할 수 있는가?
  • RQ3사용자가 커뮤니티 내에서 사회적 권력이나 신뢰도를 높여감에 따라 요청의 예의 수준이 변화하는가?
  • RQ4특히 스택 오버플로우의 프로그래밍 언어 하위 커뮤니티 간에 예의 규범은 어떻게 다를까?
  • RQ5성별과 온라인 논의에서의 예의 간 관계는 무엇이며, 이는 이전 연구 결과와 어떻게 비교되는가?

주요 결과

  • 위키백과의 예의 있는 편집자들은 커뮤니티 선거를 통해 높은 지위 역할을 획득할 가능성이 유의미하게 더 높으며, 이는 예의가 지위 획득의 전략적 자산임을 시사한다.
  • 높은 지위 역할에 선출된 후 위키백과 편집자들은 명백히 더 예의 없어지며, 권력으로 인해 예의가 더 이상 필요하지 않다는 예측을 뒷받침한다.
  • 스택 오버플로우에서 상위 25퍼센트의 신뢰도를 가진 사용자는 하위 25퍼센트의 사용자보다 상당히 더 예의 없어지며, 예의와 권력 간의 음의 상관관계를 확인한다.
  • 스택 오버플로우의 프로그래밍 언어 커뮤니티 간 예의 수준은 유의미하게 다름을 보이며, 루비와 자바스크립트 커뮤니티는 각각 0.59와 0.53의 높은 예의 점수를 보였고, 파이썬은 0.47의 점수를 기록함.
  • 여성 위키백과 사용자는 남성 사용자들보다 일관되게 더 예의 있는 경향이 있으며, 이는 이전의 온라인 커뮤니케이션에서 성별과 예의 간의 관계를 뒷받침하는 연구 결과와 일치한다.
  • 미국의 셰서 정의 지역 중 미국 중서부 지역에 속한 사용자가 미국 내 다른 지역에 비해 가장 높은 수준의 예의를 보이며, 예의 규범의 지역적 다양성을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.