Skip to main content
QUICK REVIEW

[論文レビュー] Homogeneous temporal activity patterns in a large online communication space

Andreas Kaltenbrunner, Vicenç Gómez|ArXiv.org|Aug 12, 2007
Complex Network Analysis Techniques参考文献 23被引用数 35
ひとこと要約

本研究は、Slashdotのユーザー生成コメントシステムにおける時間的活動パターンを分析し、多様な投稿においてもコメント間隔が対数正規分布に従うことを明らかにした。これは、背後にあるコミュニティの多様性にもかかわらず、均質的な行動が存在することを示している。二重対数正規モデルにより、日次および週次的な変動もさらに捉えることができ、大規模なオンラインフォーラムにおける社会的相互作用のダイナミクスを予測するのに、少数の主要パラメータで十分であることが示された。

ABSTRACT

The many-to-many social communication activity on the popular technology-news website Slashdot has been studied. We have concentrated on the dynamics of message production without considering semantic relations and have found regular temporal patterns in the reaction time of the community to a news-post as well as in single user behavior. The statistics of these activities follow log-normal distributions. Daily and weekly oscillatory cycles, which cause slight variations of this simple behavior, are identified. A superposition of two log-normal distributions can account for these variations. The findings are remarkable since the distribution of the number of comments per users, which is also analyzed, indicates a great amount of heterogeneity in the community. The reader may find surprising that only a few parameters allow a detailed description, or even prediction, of social many-to-many information exchange in this kind of popular public spaces.

研究の動機と目的

  • 大規模なオンラインディスカッションフォーラムにおいて、ユーザーとトピックの多様性があるにもかかわらず、均質的な時間的パターンが隠れていないかを調査すること。
  • 意味的およびユーザーの多様性があるにもかかわらず、ユーザーのコメント間隔の分布が特定の統計的分布に従うかどうかを特定すること。
  • 多数対多数のオンラインコミュニケーションにおける情報拡散ダイナミクスを記述または予測するのに、少数のパラメータで十分であるかどうかを評価すること。
  • 日次および週次サイクルが、技術系ニュースプラットフォームにおけるコメント活動パターンに果たす役割を調査すること。

提案手法

  • 本研究は、Slashdotのサーバーログを1年分分析し、意味的コンテンツを無視したコメント間隔に注目している。
  • 最大尤度推定法を用いて、間隔時間の分布を対数正規分布(LN)および二重対数正規分布(DLN)の確率密度関数にフィットさせている。
  • 実測データとモデル予測との誤差は、実際にコメントが投稿された時間帯の時間帯ごとのバインで、正規化されたℓ¹ノルム誤差測度を用いて定量化されている。
  • コメント活動の累積分布関数(CDF)は、対数正規分布の誤差関数表現を用いてモデル化されている。
  • 二重対数正規モデルは、周期的変動を捉えるために、混合パラメータを伴う2つの独立した対数正規分布を組み合わせたものである。
  • 分析は、投稿後最初の10日間を対象としており、この期間に中央値のコメント活動がピークに達するため、議論の持続期間を早期に予測可能である。

実験結果

リサーチクエスチョン

  • RQ1Slashdotのような大規模な公開プラットフォームにおける多数対多数のオンラインディスカッションは、ユーザーとトピックの多様性があるにもかかわらず、均質的な時間的パターンを示すか?
  • RQ2コメント間隔の分布は、対数正規分布であるか、それとも2つの対数正規分布の重ね合わせであるか、どちらがより適切か?
  • RQ3日次および週次サイクルは、オンラインディスカッションにおける対数正規活動パターンにどの程度影響を及ぼすか?
  • RQ4投稿後数時間以内の初期コメント活動は、議論全体の持続期間および強度を予測するために利用できるか?
  • RQ5ユーザー行動およびトピックの多様性の複雑さに比べて、少数パラメータのモデルの単純さは、情報拡散予測においてどの程度優位か?

主な発見

  • 多様なSlashdotの投稿において、コメント間隔は対数正規分布に従うことが判明し、均質的な時間的パターンが背後に存在することが示された。
  • 二重対数正規モデル(混合パラメータを伴う2つの対数正規分布の組み合わせ)は、単一の対数正規分布よりも、日次および週次的な変動を捉えるのに著しく優れた適合性を示した。
  • 中央値のコメント活動は、投稿後数時間以内にピークに達し、全コメントの90%以上が最初の10日間以内に投稿された。
  • 実測データと二重対数正規モデルとの間の誤差測度εは、常に低く抑えられており、初期段階のコメントダイナミクスに対する高い予測精度が裏付けられた。
  • ユーザー1人あたりのコメント数の多様性が極めて高いにもかかわらず、コメント生成の時間的ダイナミクスは、投稿間で顕著に一貫していた。
  • モデルの高い精度は、初期のコメントパターンを用いて、オンラインディスカッションの長期的推移を高い信頼性で予測可能であることを示唆している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。