Skip to main content
QUICK REVIEW

[논문 리뷰] Characterizing Pedophile Conversations on the Internet using Online Grooming

Aditi Gupta, Ponnurangam Kumaraguru|arXiv (Cornell University)|2012. 08. 17.
Authorship Attribution and Profiling참고 문헌 5인용 수 36
한 줄 요약

이 논문은 온라인 괴롭힘 이론 프레임워크를 활용하여 75개의 대화 트랜스크립트를 수작업으로 주석 처리함으로써 온라인 괴롭힘 대화의 언어학적 및 심리학적 분석을 제안한다. 연구 결과, 예상과는 달리 성적 내용이 지배적인 것으로 예상되었지만, 관계 형성이 지배적인 단계임을 규명하였다. 이를 통해 LIWC와 로지스틱 회귀를 활용한 심리언어적 프로파일을 수립하여 실시간 채팅 모니터링 시스템에서 악성 행동의 자동 탐지 능력을 향상시킬 수 있다.

ABSTRACT

Cyber-crime targeting children such as online pedophile activity are a major and a growing concern to society. A deep understanding of predatory chat conversations on the Internet has implications in designing effective solutions to automatically identify malicious conversations from regular conversations. We believe that a deeper understanding of the pedophile conversation can result in more sophisticated and robust surveillance systems than majority of the current systems relying only on shallow processing such as simple word-counting or key-word spotting. In this paper, we study pedophile conversations from the perspective of online grooming theory and perform a series of linguistic-based empirical analysis on several pedophile chat conversations to gain useful insights and patterns. We manually annotated 75 pedophile chat conversations with six stages of online grooming and test several hypothesis on it. The results of our experiments reveal that relationship forming is the most dominant online grooming stage in contrast to the sexual stage. We use a widely used word-counting program (LIWC) to create psycho-linguistic profiles for each of the six online grooming stages to discover interesting textual patterns useful to improve our understanding of the online pedophile phenomenon. Furthermore, we present empirical results that throw light on various aspects of a pedophile conversation such as probability of state transitions from one stage to another, distribution of a pedophile chat conversation across various online grooming stages and correlations between pre-defined word categories and online grooming stages.

연구 동기 및 목표

  • 온라인에서 미성년자를 대상으로 하는 성범죄자 대화의 언어학적 및 행동 패턴을 이해하기 위해.
  • 심리학 이론에 기반하여 온라인 괴롭힘의 여섯 단계(모집, 관계 형성, 성적화, 성적 접촉, 고립, 결론)를 실증적 분석을 통해 특성화하기 위해.
  • 텍스트 분석을 통해 각 괴롭힘 단계에 대한 심리언어적 프로파일을 수립하여 악성 행동 탐지 능력을 향상시키기 위해.
  • 성적 접촉이 발생하기 전에 괴롭힘 대화를 조기에 탐지할 수 있는 자동화된 실시간 감시 시스템 설계에 정보를 제공하기 위해.
  • 키워드 기반 탐지의 한계를 보완하기 위해 괴롭힘 진행 과정의 심리학적 및 언어학적 지표를 통합하기 위해.

제안 방법

  • 심리학 이론에 기반하여 75건의 성범죄자 대화를 온라인 괴롭힘의 여섯 단계로 수작업 주석 처리함.
  • 각 괴롭힘 단계에 대한 심리언어적 프로파일을 생성하기 위해 LIWC(Linguistic Inquiry and Word Count) 도구를 적용함.
  • 각 괴롭힘 단계와 관련된 유의미한 단어 범주 및 언어적 특징을 규명하기 위해 로지스틱 회귀 분석을 사용함.
  • 괴롭힘 단계 간 상태 전이 확률을 통계적으로 분석하여 대화 진행 과정을 모델링함.
  • 괴롭힘 단계 간 대화 분포 패턴을 실증적으로 모델링하고, 단어 범주와 단계 간 상관관계를 분석함.
  • 향후 실시간 자동 탐지 시스템을 위한 파ip라인 아키텍처를 설계하여 괴롭힘 단계 분류 기능을 보다 넓은 성범죄 대화 식별 시스템에 통합함.

실험 결과

연구 질문

  • RQ1성범죄자 대화에서 온라인 괴롭힘의 어느 단계가 가장 빈번하게 나타나며, 이는 성적 내용이 지배적인 것으로 예상되는 것과 어떻게 다를까?
  • RQ2온라인 괴롭힘의 여섯 단계를 구분하는 데 사용되는 언어학적 및 심리언어적 패턴은 무엇인가?
  • RQ3대화는 괴롭힘 단계 간 어떻게 전이되는가? 한 단계에서 다른 단계로 전이될 확률은 얼마인가?
  • RQ4단어 범주에서 유도된 심리언어적 프로파일이 주어진 대화의 괴롭힘 단계를 얼마나 정확하게 예측할 수 있는가?
  • RQ5결론 단계가 이전 심리학적 모델이 마지막 단계로 보는 것과는 달리 반복적이고 기초적인 단계로 기능하는가, 즉 종점이 아닌 기초 단계로 간주될 수 있는가?

주요 결과

  • 성범죄자 대화에서 관계 형성이 가장 지배적인 단계이며, 이는 성적 내용이 지배적인 것으로 예상되는 일반적인 가정과 정면으로 배치된다.
  • 결론 단계는 한 번의 종료점이 아니라 반복적이고 기초적인 단계로 기능하며, 이는 이전 심리학적 모델이 이를 최종 단계로 보는 데 도전하는 것이다.
  • 성범죄자들은 종종 괴롭힘 과정을 완료하기 전에 접촉을 시도하거나 실제로 만남을 시도함으로써 조기 탐지의 중요성을 시사한다.
  • LIWC와 로지스틱 회귀를 통해 유도된 심리언어적 프로파일은 각 괴롭힘 단계와 관련된 고유한 언어 패턴을 성공적으로 식별하였다.
  • 괴롭힘 단계 간 대화 분포를 분석한 결과, 관계 형성과 결론 단계가 특히 대화의 후반 단계에서 가장 자주 관찰됨을 확인하였다.
  • 특정 단어 범주(예: 정서적, 사회적, 인지적 단어)와 특정 괴롭힘 단계 간에 유의미한 상관관계가 존재함을 확인하였으며, 이는 언어적 특징을 자동 분류에 활용할 수 있음을 뒷받침한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.