Skip to main content
QUICK REVIEW

[論文レビュー] Log-normal statistics in e-mail communication patterns

Daniel B. Stouffer, R. Dean Malmgren|ArXiv.org|May 3, 2006
Scientific Research and Discoveries参考文献 7被引用数 34
ひとこと要約

本研究は、3,188人のユーザーからなる大学内における電子メールの通信パターンを再分析し、間隔時間の分布が単一の対数正規分布に従い、待ち時間の分布が2つの対数正規分布の重ね合わせによって最もよく記述されることを示した。ベイズ的モデル選択を用いて、指数が約1の切断型パワーロー則の適合は拒否され、Barabásiの優先度キューイングモデルは理論的に妥当でないと批判された。結論として、人間の電子メール行動の包括的理論的記述は未解決の問題のまま残っている。

ABSTRACT

Following up on Barabasi's recent letter to Nature [435, 207--211 (2005)], we systematically investigate the time series of e-mail usage for 3,188 users at a university. We focus on two quantities for each user: the time interval between consecutively sent e-mails (interevent time), and the time interval between when a user sends an e-mail and when a recipient sends an e-mail back to the original sender (waiting time). We perform a standard Bayesian model selection analysis that demonstrates that the interevent times are well-described by a single log-normal while the waiting times are better described by the superposition of two log-normals. Our analysis rejects the possibility that either measure could be described by truncated power-law distributions with exponent $α\simeq 1$. We also critically evaluate the priority queuing model proposed by Barabási to describe the distribution of the waiting times. We show that neither the assumptions nor the predictions of the model are plausible, and conclude that a theoretical description of human e-mail communication patterns remains an open problem.

研究の動機と目的

  • 厳密な統計的手法を用いて、電子メール通信パターンを再表現・再分析すること。
  • Barabásiが主張するように、間隔時間と待ち時間が指数が約1の切断型パワーロー則に従うかどうかを検証すること。
  • Barabásiの優先度キューイングモデルが待ち時間分布を説明する上で理論的に妥当かどうかを評価すること。
  • パワーロー則モデルと比較して、対数正規分布が実世界の電子メールデータにどれほどよく適合するかを特定すること。
  • 人間の通信行動ダイナミクスの現在の理論的モデルにおける根本的限界を特定すること。

提案手法

  • ベイズ的モデル選択を用いて、間隔時間および待ち時間データに対する対数正規分布と切断型パワーロー則の適合度を比較した。
  • クライアントおよびサーバー側のアーティファクトを排除するため、5秒以内に送信され、同じサイズの電子メールを統合して前処理を行った。
  • 最大尤度推定法を用いて、待ち時間データに単一および二重の対数正規分布を適合させた。
  • シミュレーションにより優先度キューイングモデルの遷移的および定常状態の挙動を評価し、実測データと照合した。
  • ベイズ的モデル比較に基づき、指数が約1のパワーロー則モデルを、二重対数正規モデルの適合に優るとして統計的仮説検定で棄却した。
  • 特に、キューの優先度が均一分布に収束するという仮定と予測を分析し、理論的妥当性を評価した。

実験結果

リサーチクエスチョン

  • RQ1電子メール通信における間隔時間は、Barabásiらが主張するように、指数が約1の切断型パワーロー則に従うのか?
  • RQ2電子メール返信の待ち時間分布は、単一の対数正規分布か、二つの対数正規分布の重ね合わせのどちらによりよく記述できるか?
  • RQ3Barabásiが提唱した優先度キューイングモデルは、電子メール通信における実測待ち時間分布を再現できるか?
  • RQ4優先度キューイングモデルの仮定および長期的挙動は、観察された人間の電子メール行動と整合性があるか?
  • RQ5どの統計的モデルが実世界の電子メール通信パターンに最もよく適合するか。そして、これは人間動力学の理論的モデリングにどのような意味を持つのか?

主な発見

  • 電子メールユーザーの間隔時間は、指数が約1の切断型パワーロー則ではなく、単一の対数正規分布によって最もよく記述される。
  • 待ち時間分布は、いかなるパワーロー則モデルよりも、二つの対数正規分布の重ね合わせによって顕著に良く適合する。
  • ベイズ的モデル比較に基づき、指数が約1のパワーロー則的尾部の仮説は、実測データによってあらゆる妥当な疑念をはるかに超えて否定された。
  • Barabásiが提唱した優先度キューイングモデルは、実測データを再現できない。特に、定常状態の挙動がτw = 1にピークを形成すると予測するが、これは実際の電子メール行動と矛盾する。
  • モデルの仮定は、キューが均一な優先度分布に収束し、高い確率で即座にタスクが処理されるといった、現実の人間の通信行動とは整合しない不自然なダイナミクスを生じる。
  • これらの発見は、人間の電子メール通信ダイナミクスの理論的記述が、現在のモデルが実測データを正確に捉えていないため、未解決の問題のまま残っていることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。