QUICK REVIEW

[논문 리뷰] Peer to Peer Hate: Hate Speech Instigators and Their Targets

Mai ElSherief, Shirin Nilizadeh|arXiv (Cornell University)|2018. 04. 12.

Hate Speech and Cyberbullying Detection인용 수 26

한 줄 요약

이 연구는 27,330개의 혐오 트윗으로 구성된 정제된 데이터셋을 사용하여 트위터에서 혐오 발언을 유도하는 사람과 그 대상 간의 첫 번째 비교 분석을 제시한다. 이는 프로필 특성, 온라인 가시성, 성격 특성 등을 분석한다. 연구 결과, 유도자들은 더 가시성이 높은 사용자를 대상으로 삼으며, 일반 사용자와 비교해 분노, 의심심, 과도함 수준이 높은 것으로 나타나, 온라인 혐오 동역학을 자극할 수 있는 공통된 심리적 프로필이 있음을 시사한다.

ABSTRACT

While social media has become an empowering agent to individual voices and freedom of expression, it also facilitates anti-social behaviors including online harassment, cyberbullying, and hate speech. In this paper, we present the first comparative study of hate speech instigators and target users on Twitter. Through a multi-step classification process, we curate a comprehensive hate speech dataset capturing various types of hate. We study the distinctive characteristics of hate instigators and targets in terms of their profile self-presentation, activities, and online visibility. We find that hate instigators target more popular and high profile Twitter users, and that participating in hate speech can result in greater online visibility. We conduct a personality analysis of hate instigators and targets and show that both groups have eccentric personality facets that differ from the general Twitter population. Our results advance the state of the art of understanding online hate speech engagement.

연구 동기 및 목표

혐오 발언 유도자, 대상, 일반 트위터 사용자 간의 프로필 자가 표현, 온라인 가시성, 성격 특성의 차이를 조사하기 위해.
역할 레이블이 부여된 공개 가능한 혐오 발언 데이터셋의 부족을 해결하기 위해, 상호 간 혐오 발언을 포함한 종합적인 데이터셋을 정제하기 위해.
혐오 발언 유도자와 대상의 성격 특성이 일반 트위터 사용자와 다름을 밝히고, 이러한 특성들이 온라인 가시성과 참여도와 관련이 있는지 탐색하기 위해.
Hatebase에서 유래한 8개 혐오 유형을 포함하는 51개의 어휘로 구성된 압축된 어휘를 활용해, 방향성 있는 명시적 혐오 발언 데이터를 정제하기 위한 반자동 분류 방법을 개발하기 위해.
성격 기반 모델링을 통해 혐오 발언 탐지, 완화, 대응 발언 봇 설계 향상을 위한 실질적인 통찰을 제공하기 위해.

제안 방법

27,330개의 혐오 트윗 데이터셋을 정제하기 위해 다단계 분류 파이프라인을 사용하였으며, Hatebase에서 유래한 8개 혐오 유형을 포함하는 51개의 어휘로 구성된 압축된 어휘를 기반으로 하였다.
데이터셋은 혐오 발언 유도자(HIs)와 대상(HTs)을 식별할 수 있도록 레이블링되어, 비교 분석이 가능하도록 하였다.
프로필 자가 표현은 계정 연령, 인증 상태, 팔로워 수, 콘텐츠 완전성 등의 메타데이터를 통해 분석되었다.
온라인 가시성은 팔로워 수, 재트윗 빈도, 리스트 포함 여부를 측정하였으며, 활동 수준을 보정하기 위해 다변량 회귀 모델이 사용되었다.
성격 특성은 심리적 프로파일링 프레임워크를 활용해 분석되었으며, 분노, 정서 인식 능력, 변화 수용성 등의 요소에서 HIs, HTs, 일반 사용자 간의 비교 분석이 이루어졌다.
반자동 정제 방법이 제안되었으며, 关련 키워드 필터링과 수동 검증을 결합하여 고정밀도의 혐오 발언 레이블링을 확보하였다.

실험 결과

연구 질문

RQ1RQ1: 혐오 유도자 및 대상의 계정 특성과 온라인 가시성은 일반 트위터 사용자와 어떻게 다름?
RQ2RQ2: 혐오 발언 유도자, 대상, 일반 트위터 사용자 간의 핵심 성격 차이가 있는가?
RQ3RQ3: 사용자 활동 수준을 보정한 후에도 혐오 발언 참여와 온라인 가시성 간 상관관계가 존재하는가?
RQ4RQ4: 혐오 유도자와 대상은 일반 트위터 사용자와는 다른 고유한 성격 특성을 공유하는가?
RQ5RQ5: 성격 기반 특징은 혐오 발언의 조기 탐지 또는 완화에 기여할 수 있는가?

주요 결과

혐오 유도자는 더 가시성이 높은 사용자를 대상으로 삼으며, 대상은 유도자보다 60% 더 많은 확인된 계정을 보유하고 일반 사용자보다 40% 더 많다.
활동 수준을 보정한 후에도, 팔로워 수, 재트윗 빈도, 리스트 포함 여부로 측정한 높은 가시성은 혐오 발언 대상일 가능성이 높다는 것으로 유의미하게 관련되어 있다.
혐오 유도자와 대상은 일반 트위터 사용자와 비교해 분노, 의심심, 정서 인식 능력 저하, 과도함 수준이 높게 나타났다.
유도자와 대상의 약 50%가 변화 수용성 성격 특성에서 0.53 이상의 점수를 기록하여, 대응 발언 개입에 대한 수용 가능성이 있음을 시사한다.
유도자는 일반적으로 더 어린 계정을 가지고 있는 반면, 대상은 종종 오랜 기간 동안 협박을 겪어온 것으로 보여 장기적인 괴롭힘 노출 가능성을 시사한다.
연구는 유도자와 대상 간 공통된 성격 특성, 예를 들어 정서 조절 장애와 사회적 회피 성향을 밝혀내었으며, 이는 오프라인 괴롭힘 연구 결과와 일치한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.