Skip to main content
QUICK REVIEW

[논문 리뷰] Using word embeddings to analyse audience effects and individual differences in parenting Subreddits

Melody Sepahpour‐Fard, Michael Quayle|arXiv (Cornell University)|2023. 01. 01.
Social Media and Politics인용 수 1
한 줄 요약

이 연구는 레딧 육아 커뮤니티에서 사용자 증강 워드 임베딩을 사용하여 성별과 청중 맥락(단일 성별 대비 혼성 성별 서브레딧)이 언어 사용 방식에 어떻게 영향을 미치는지 분석한다. 연구 결과, r/Parenting에서는 어머니와 아버지가 주제 다양성에서 유사해지지만, 단일 성별 공간에서는 갈라진다. 어머니들은 건강, 수면, 식사에 초점을 맞추는 반면, 아버지들은 외모와 교육에 더 주목한다. 높은 자기 모니터링 성향을 가진 사용자들은 혼성 성별 환경에서 커뮤니티 규범에 더 잘 적응한다.

ABSTRACT

Human beings adapt their language to the audience they interact with. To study the impact of audience and gender in a natural setting, we choose a domain where gender plays a particularly salient role: parenting. We collect posts from the three popular parenting Subreddits (i.e., topical communities on Reddit) r/Daddit, r/Mommit, and r/Parenting. These three Subreddits gather different audiences, respectively, self-identifying as fathers and mothers (ostensibly single-gender), and parents (explicitly mixed-gender). By selecting a sample of users who have published on both a single-gender and a mixed-gender Subreddit, we are able to explore both audience and gender effects. We analyse posts with word embeddings by adding the username as a token in the corpus. This way, we are able to compare user-tokens to word-tokens and measure their similarity. We also investigate individual differences in this context by comparing users who exhibit significant changes in their behaviour (high self-monitors) with those who show less variation (low self-monitors). Results show that r/Parenting users generally discuss a great diversity of topics while fathers focus more on advising others on educational and family matters. Mothers in r/Mommit distinguish themselves from other groups by primarily discussing topics such as medical care, sleep and potty training, and food. Both mothers and fathers celebrate parenting events and describe or comment on the physical appearance of their children with a single-gender audience. In terms of individual differences, we find that, especially on r/Parenting, high self-monitors tend to conform more to the norms of the Subreddit by discussing more of the topics associated with the Subreddit. In conclusion, this study shows how mothers and fathers express different concerns and change their behaviour for different group-based audiences.

연구 동기 및 목표

  • 청중 구성(단일 성별 대비 혼성 성별)이 온라인 육아 커뮤니티에서 언어 사용에 어떻게 영향을 미치는지 조사하는 것.
  • 성별 정체성(어머니, 아버지, 부모)이 주제 선택과 언어적 표현에 어떻게 영향을 미치는지 분석하는 것.
  • 자기 모니터링 행동의 개인적 차이와 그가 다양한 맥락에서 언어 적응에 미치는 영향을 분석하는 것.
  • 정체성 표현과 청중 효과를 대규모로 연구하기 위해 사용자 증강 워드 임베딩의 새로운 방법을 검증하는 것.

제안 방법

  • r/Mommit(자기 정체성을 어머니로 밝힌 이들), r/Daddit(자기 정체성을 아버지로 밝힌 이들), r/Parenting(혼성 성별)의 레딧 게시글을 수집.
  • 단일 성별과 혼성 성별 둘 다에 게시한 사용자를 선별하여 청중 맥락 간 개인 내 비교를 가능하게 함.
  • 사용자명을 고유 토큰으로 간주하고, 음성 샘플링을 사용한 스킵그램 모델로 워드 임베딩을 훈련하여 텍스트 코퍼스를 증강.
  • 사용자 임베딩을 활용해 사용자 간 언어적 행동을 비교하고, 사용자 토큰과 단어 토큰 간 유사도를 측정.
  • LDA를 사용해 임베딩 공간에서 주제를 군집화하고, 关련 关련 키워드 분석 및 기존 문헌을 통해 검증.
  • 다양한 맥락에서 언어적 일관성에 기반해 사용자를 높은 자기 모니터링자 또는 낮은 자기 모니터링자로 분류하고 주제 분포의 차이를 분석.

실험 결과

연구 질문

  • RQ1어머니와 아버지는 단일 성별 대비 혼성 성별 온라인 육아 커뮤니티에서 어떻게 언어 사용 방식을 달리하는가?
  • RQ2사용자들이 청중 구성에 따라 얼마나 주제 선택과 언어 스타일을 적응하는가?
  • RQ3자기 모니터링 수준(높음 대비 낮음)의 개인적 차이가 다양한 청중 맥락에서 언어 적응에 어떻게 영향을 미치는가?
  • RQ4성별 서브레딧에서 어머니와 아버지가 가장 주목하는 주제는 무엇이며, 혼성 성별 환경에서는 이러한 주제가 어떻게 변화하는가?

주요 결과

  • r/Mommit의 어머니들은 주로 의료 관리, 수면, 오줌 훈련, 식사에 대해 논의하여 자녀의 건강과 일상 케어 루틴에 초점을 맞추고 있음을 보여준다.
  • r/Daddit의 아버지들은 자녀의 신체적 외모와 관련된 주제를 강조하고, 특히 단일 성별 맥락에서 어머니들보다 사진 공유 빈도가 더 높다.
  • r/Parenting에서는 어머니와 아버지가 주제 다양성에서 유사해지며 더 넓은 범위의 육아 문제를 논의함으로써 청중 기반의 언어 사용 유사화가 일어나는 것으로 나타났다.
  • r/Parenting에서 높은 자기 모니터링 성향을 가진 사용자들은 서브레딧의 주요 주제와 더 강하게 일치함을 보여주며, 커뮤니티 규범에 더 잘 따르는 경향을 보였다.
  • 워드 임베딩에 사용자명을 토큰으로 추가하는 방법은 사용자 수준의 언어 패턴을 효과적으로 포착하고 사용자와 단어 간 의미 있는 비교를 가능하게 하였다.
  • 메소드적 한계가 존재하지만, 임베딩 공간의 주제 군집은 기존 연구와 일치하는 일관된 주제 군집을 보이며, 이 방법론의 타당성을 검증하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.