Skip to main content
QUICK REVIEW

[論文レビュー] Using word embeddings to analyse audience effects and individual differences in parenting Subreddits

Melody Sepahpour‐Fard, Michael Quayle|arXiv (Cornell University)|Jan 1, 2023
Social Media and Politics被引用数 1
ひとこと要約

本研究では、Redditの育児コミュニティにおけるユーザー補強語埋め込みを用いて、性別および聴衆の文脈(単一性別対象 vs. 混合性別対象のSubreddit)が言語使用に与える影響を検討した。その結果、r/Parentingでは母親と父親がトピックの多様性において一致するが、単一性別空間では乖離が生じる——母親は健康、睡眠、授乳に注力する一方、父親は外見および教育に焦点を当てる。また、自己監視度の高い人々は、混在性別環境においてコミュニティの規範により適応する傾向を示した。

ABSTRACT

Human beings adapt their language to the audience they interact with. To study the impact of audience and gender in a natural setting, we choose a domain where gender plays a particularly salient role: parenting. We collect posts from the three popular parenting Subreddits (i.e., topical communities on Reddit) r/Daddit, r/Mommit, and r/Parenting. These three Subreddits gather different audiences, respectively, self-identifying as fathers and mothers (ostensibly single-gender), and parents (explicitly mixed-gender). By selecting a sample of users who have published on both a single-gender and a mixed-gender Subreddit, we are able to explore both audience and gender effects. We analyse posts with word embeddings by adding the username as a token in the corpus. This way, we are able to compare user-tokens to word-tokens and measure their similarity. We also investigate individual differences in this context by comparing users who exhibit significant changes in their behaviour (high self-monitors) with those who show less variation (low self-monitors). Results show that r/Parenting users generally discuss a great diversity of topics while fathers focus more on advising others on educational and family matters. Mothers in r/Mommit distinguish themselves from other groups by primarily discussing topics such as medical care, sleep and potty training, and food. Both mothers and fathers celebrate parenting events and describe or comment on the physical appearance of their children with a single-gender audience. In terms of individual differences, we find that, especially on r/Parenting, high self-monitors tend to conform more to the norms of the Subreddit by discussing more of the topics associated with the Subreddit. In conclusion, this study shows how mothers and fathers express different concerns and change their behaviour for different group-based audiences.

研究の動機と目的

  • 聴衆構成(単一性別対象 vs. 混在性別対象)が、オンライン育児コミュニティにおける言語使用に与える影響を調査すること。
  • 性別アイデンティティ(母親、父親、親)がトピック選択および言語的表現に与える影響を検討すること。
  • 自己監視行動の個人差と、それが異なる文脈における言語適応に与える影響を分析すること。
  • アイデンティティの実践と聴衆効果を大規模に研究するための、新規のユーザー補強語埋め込み法の妥当性を検証すること。

提案手法

  • r/Mommit(自己申告による母親)、r/Daddit(自己申告による父親)、r/Parenting(混在性別)の3つの育児SubredditからReddit投稿を収集した。
  • 単一性別および混在性別Subredditの両方で投稿を行ったユーザーを選定し、個々のユーザーにおける聴衆文脈間の比較を可能にした。
  • ユーザー名を固有のトークンとして扱い、ネガティブサンプリングを用いたスキップグラムモデルで語埋め込みを訓練することで、テキストコーパスを補強した。
  • ユーザー埋め込みを用いて、ユーザー間の言語的行動を比較し、ユーザー・トークンと語トークンの類似度を測定した。
  • LDAを用いて埋め込み空間からのトピックをクラスタリングし、キーワード分析および先行文献と照合することで妥当性を検証した。
  • 文脈間での言語的一致性に基づいて、ユーザーを高自己監視者・低自己監視者に分類し、トピック分布の差を分析した。

実験結果

リサーチクエスチョン

  • RQ1母親と父親は、単一性別対象と混在性別対象のオンライン育児コミュニティで、どのように言語使用に差を示すか?
  • RQ2人々は、聴衆構成の変化に応じて、どの程度トピック選択および言語的スタイルを適応させるか?
  • RQ3自己監視度(高・低)の個人差は、異なる聴衆文脈における言語適応にどのように影響を与えるか?
  • RQ4性別対象Subredditにおいて母親と父親が最も注目するトピックは何か、そしてこれらは混在性別環境に移行した際にどのように変化するか?

主な発見

  • r/Mommitに所属する母親は、医療ケア、睡眠、トイレトレーニング、食事について主に議論しており、子供の健康と日常的なケア習慣に注力していることが示唆される。
  • r/Dadditに所属する父親は、子供の外見に関するトピックに注力し、特に単一性別環境において母親よりも写真の共有頻度が高い。
  • r/Parentingでは、母親と父親がトピックの多様性において一致し、より広範な育児関連問題を議論している。これは、聴衆に応じた言語使用の一致を示唆している。
  • r/Parentingにおける高自己監視者は、Subredditの支配的トピックと強く一致しており、コミュニティの規範への適合度がより高いことが示された。
  • 語埋め込みにユーザー名をトークンとして追加する手法は、ユーザーレベルの言語的パターンを的確に捉え、ユーザーと語の間で意味のある比較を可能にした。
  • 方法論的制限は存在するが、埋め込みの空間は一貫性のあるトピッククラスタリングを示しており、これらのSubredditに関する先行研究と整合的であるため、本手法の妥当性が裏付けられた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。