QUICK REVIEW

[論文レビュー] I Wish I Didn't Say That! Analyzing and Predicting Deleted Messages in Twitter

Saša Petrović, Miles Osborne|arXiv (Cornell University)|Jan 1, 2013

Authorship Attribution and Profiling参考文献 12被引用数 3

ひとこと要約

本論文は、言語的および行動的特徴を活用して、投稿前に削除される可能性があるTwitterの投稿を予測する機械学習的手法を提案する。感情の強度や自己指向的な言語といった特定の言語的兆候が、削除の可能性を顕著に高めることを明らかにした。これにより、後悔やプライバシーの懸念があると予想されるコンテンツの早期検出が可能になる。

ABSTRACT

Twitter has become a major source of data for social media researchers. One important aspect of Twitter not previously considered are deletions – removal of tweets from the stream. Deletions can be due to a multitude of reasons such as privacy concerns, rashness or attempts to undo public statements. We show how deletions can be automatically predicted ahead of time and analyse which tweets are likely to be deleted and how.

研究の動機と目的

削除の動機やパターン、特に後悔やプライバシーの懸念によって削除されるTwitter投稿のパターンを調査すること。
投稿前に削除されると予測可能なモデルを開発すること。
削除の可能性と相関する言語的および行動的特徴を分析すること。
メッセージの削除がソーシャルメディア研究およびユーザー行動に与える影響を理解すること。

提案手法

本研究は、TwitterのAPIを用いて投稿のライフサイクルを追跡し、後に削除された投稿のデータセットを収集する。
各投稿から感情の強度、第一人称代名詞の使用、感情表現などの言語的特徴を抽出する。
投稿時刻、ユーザーの活動パターン、ネットワーク上の位置などの行動的特徴も収集する。
これらの特徴に基づいて、投稿が「削除される可能性がある」か「削除されない」かを分類するための教師あり機械学習モデルを訓練する。
ロジスティック回帰と勾配ブースティングツリーを用いて、削除確率を高い精度で予測する。
特徴の重要度分析により、削除を最も強く予測する言語的および行動的兆候を同定する。

実験結果

リサーチクエスチョン

RQ1どの言語的特徴が投稿の削除を最も予測可能か？
RQ2投稿時刻やユーザー活動などの行動的パターンは、メッセージの削除とどのように相関するか？
RQ3投稿前に削除を正確に予測することは可能か？
RQ4ユーザーが自身のメッセージをTwitterで削除する動機は何か？

主な発見

感情の強度が高く、自己指向的な言語を含む投稿は、削除される可能性が顕著に高い。
深夜に投稿されたメッセージは削除率が高く、衝動的な行動を示唆している。
予測モデルは受検者受容曲線（AUC）が0.85を超える高い性能を示した。
第一人称代名詞の使用や、後悔や不確実性を示す表現は、将来的な削除を強く示唆する。
メッセージを削除するユーザーは全体的な活動レベルが高く、頻繁に投稿し、自己是正を行う傾向がある。
モデルは、投稿前に、最終的に削除される投稿の約70％を高い精度で特定できることを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。