QUICK REVIEW

[論文レビュー] A Computational Approach to Politeness with Application to Social Factors

Cristian Danescu-Niculescu-Mizil, Moritz Sudhof|arXiv (Cornell University)|Jun 25, 2013

Language, Discourse, Communication Strategies参考文献 4被引用数 149

ひとこと要約

本論文は、ウィキペディアおよびスタックオーバーフローからの10,000件を超えるリクエストを含む、大規模で人間がアノテートしたコーパスを用いて、オンラインのリクエストにおける丁寧さを同定する計算フレームワークを提示する。このフレームワークは、語彙的・構文的・感情的特徴を活用したドメインに依存しない分類器を導入し、ポリテンス理論の要素を操作可能に定式化しており、人間に近い性能を達成するとともに、丁寧さが高いユーザーは初期段階でステータスを獲得しやすいが、高ステータスの役職に就いた後は丁寧さが低下する傾向があることが明らかになった。

ABSTRACT

We propose a computational framework for identifying linguistic aspects of politeness. Our starting point is a new corpus of requests annotated for politeness, which we use to evaluate aspects of politeness theory and to uncover new interactions between politeness markers and context. These findings guide our construction of a classifier with domain-independent lexical and syntactic features operationalizing key components of politeness theory, such as indirection, deference, impersonalization and modality. Our classifier achieves close to human performance and is effective across domains. We use our framework to study the relationship between politeness and social power, showing that polite Wikipedia editors are more likely to achieve high status through elections, but, once elevated, they become less polite. We see a similar negative correlation between politeness and power on Stack Exchange, where users at the top of the reputation scale are less polite than those at the bottom. Finally, we apply our classifier to a preliminary analysis of politeness variation by gender and community.

研究の動機と目的

オンラインコミュニティ内のユーザーのリクエストにおける言語的マーカーとしての丁寧さを同定する計算フレームワークの開発。
ウィキペディアおよびスタックオーバーフローのリクエストから作成された大規模で人間がラベル付けしたコーパスを用いて、ポリテンス理論の根幹的原則を評価すること。
オンラインディス course における丁寧さと社会的パワー、ステータス、性別、コミュニティ参加状況との関係を調査すること。
多様なオンラインコミュニティおよび言語的文脈に一般化可能なドメインに依存しない丁寧さ分類器を構築すること。
スケーラブルで自動化された分類手法を用いて、コミュニティやデモグラフィックグループごとの丁寧さの規範の違いを調査すること。

提案手法

アマゾン・メカニカル・ターキューを用いて、ウィキペディアおよびスタックオーバーフローのオンラインリクエスト10,000件以上を人間がアノテートし、大規模でラベル付け済みの丁寧さコーパスを構築。
語彙的要素（例：「お願いします」、「ごめんね」）、構文的構造（例：間接的リクエスト、モダリティ）、感情（肯定的、楽観的）、依存関係などのドメインに依存しない特徴を用いた教師あり分類器を設計。
ブラウンとレヴィンソンのポリテンス理論の主要な要素（例：曖昧さ、敬意、無人称化、モダリティ）を計算的特徴として操作可能に定式化。
アノテート済みコーパス上で分類器を学習・評価し、ドメインを問わず人間に近い性能（人間レベルの正確性に近い）を達成。
訓練済み分類器を大規模で現実世界のデータセットに適用し、レピュテーションレベル、性別、プログラミング言語コミュニティなど、社会的要因に起因する丁寧さの変動を調査。
人間によるアノテーションが非現実的となる文脈においても予測に基づく推論を用いて丁寧さの傾向を探索し、人間ラベル付きサブセットを用いて結果を検証。

実験結果

リサーチクエスチョン

RQ1間接性、モダリティ、敬意といった言語的マーカーが、実世界のリクエストにおいて構文的・文脈的特徴とどのように相互作用するか？
RQ2ウィキペディアやスタックオーバーフローのようなオンラインコミュニティにおいて、丁寧さは社会的ステータスの獲得をどれほど予測できるか？
RQ3ユーザーがコミュニティ内で社会的パワーまたはレピュテーションを高めるに従い、リクエストの丁寧さのレベルは変化するか？
RQ4特にスタックオーバーフローのプログラミング言語サブコミュニティにおいて、丁寧さの規範はどのように異なるか？
RQ5性別とオンラインディスコースにおける丁寧さの関係は何か？また、先行研究と比較してどう異なるか？

主な発見

ウィキペディアの丁寧な編集者は、コミュニティ選挙を通じて高ステータスの役職に就く可能性が著しく高いことから、丁寧さがステータス獲得の戦略的資産であることが示された。
高ステータスの役職に選出された後、ウィキペディアの編集者は顕著に丁寧さが低下することが確認され、権力が高まると丁寧さの必要性が減少するという予測が裏付けられた。
スタックオーバーフローにおいて、レピュテーションの上位四分位に属するユーザーは、下位四分位に属するユーザーよりも著しく丁寧さが低いことが判明し、丁寧さと権力の間には負の相関があることが確認された。
スタックオーバーフローにおけるプログラミング言語コミュニティ間で丁寧さの水準に顕著な差が見られ、Ruby（0.59）およびJavaScript（0.53）コミュニティは、Python（0.47）よりも高い丁寧さスコアを示した。
女性のウィキペディア編集者は、男性の編集者よりも一貫して丁寧さが高いことが確認され、オンラインコミュニケーションにおける性別と丁寧さの関係についての先行研究と整合的であった。
米国の国勢調査で定義された地域において、米国中西部のユーザーが最も高い丁寧さを示し、丁寧さの規範に地域差があることが示唆された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。