Skip to main content
QUICK REVIEW

[論文レビュー] Planetary-Scale Views on an Instant-Messaging Network

Jure Leskovec, Eric Horvitz|ArXiv.org|Mar 6, 2008
Complex Network Analysis Techniques参考文献 18被引用数 72
ひとこと要約

この論文は、2006年6月にMicrosoft Messengerを利用した2億4000万人の匿名化された通信データを分析し、1億3000万件の通信エッジを持つ1億8000万人のアクティブユーザーを含む惑星規模のソーシャルネットワークを構築した。平均最短経路長は6.6であり、わずかな変動を伴って「六度の分離」を確認した。また、言語、場所、年齢において強いハモフィリー(同質性)が見られたが、性別を越えた会話はより頻繁で長時間にわたることが判明した。

ABSTRACT

We present a study of anonymized data capturing a month of high-level communication activities within the whole of the Microsoft Messenger instant-messaging system. We examine characteristics and patterns that emerge from the collective dynamics of large numbers of people, rather than the actions and characteristics of individuals. The dataset contains summary properties of 30 billion conversations among 240 million people. From the data, we construct a communication graph with 180 million nodes and 1.3 billion undirected edges, creating the largest social network constructed and analyzed to date. We report on multiple aspects of the dataset and synthesized graph. We find that the graph is well-connected and robust to node removal. We investigate on a planetary-scale the oft-cited report that people are separated by ``six degrees of separation'' and find that the average path length among Messenger users is 6.6. We also find that people tend to communicate more with each other when they have similar age, language, and location, and that cross-gender conversations are both more frequent and of longer duration than conversations with the same gender.

研究の動機と目的

  • 匿名化されたインスタントメッセージングデータを用いて、惑星規模の現実世界の通信行動パターンを大規模に分析すること。
  • 現実の通信活動に基づく、これまでで最大のソーシャルネットワークを構築し、その分析を行うこと。
  • グローバルかつ現実世界の通信ネットワークにおいて、「六度の分離」仮説を検証すること。
  • 性別、年齢、言語、場所といった人口統計的要因が、通信頻度および継続時間に与える影響を調査すること。
  • ノードの削除を想定したシミュレーションを用いて、ネットワークの耐性および構造的特性(接続性、クラスタリング、経路長)を評価すること。

提案手法

  • 2006年6月のMicrosoft Messengerから、メッセージ本文を除く匿名化された上位レベルの通信メタデータを収集した。
  • 1億8000万人のノード(アクティブユーザー)と1億3000万本のエッジ(少なくとも1回以上通信したペア)からなる無向通信グラフを構築した。
  • ネットワーク解析技術を用いて、最短経路長、クラスタリング係数、連結成分のサイズを計算した。
  • ノード削除のシミュレーションを、次数、会話回数、メッセージ量、1回あたりの会話時間といった複数の順序基準を用いてネットワークの耐性を評価した。
  • 性別、年齢、言語、地理的場所といったユーザー属性ごとの通信パターンを比較することで、ハモフィリーを分析した。
  • 空間相関解析を用いて、地理的距離と通信頻度・継続時間の関係を検討した。

実験結果

リサーチクエスチョン

  • RQ1惑星規模のインスタントメッセージングネットワークにおけるユーザー間の平均最短経路長はどのくらいか?
  • RQ2性別、年齢、言語、場所といった人口統計的属性が、通信頻度および継続時間にどのように影響を与えるか?
  • RQ3大規模ソーシャルネットワークにおける通信パターンに、どれほどハモフィリーが影響を与えているか?
  • RQ4標的的削除とランダム削除の両方に対して、通信ネットワークはどの程度耐性を示すか?
  • RQ5地理的距離は、グローバルネットワークにおける通信パターンとどの程度相関しているか?

主な発見

  • Messengerネットワークにおける平均最短経路長は6.6(中央値6)であり、わずかな増加を伴って「六度の分離」の原則が確認された。
  • 1億8000万人のアクティブユーザーのうち99.9%が最大連結成分に属しており、強いネットワーク接続性が示された。
  • クラスタリング係数は指数-0.37で減少し、予想よりも低い水準の局所的クラスタリングが顕著に観察された。
  • ハモフィリーは言語が最も強く、次に地理的場所と年齢が続く。ユーザーは類似した相手とより頻繁に、かつ長時間通信していた。
  • ハモフィリーの期待とは反対に、性別を越えた会話は、同性間の会話よりも頻繁で、継続時間も長かった。
  • 通信頻度は地理的距離の増加に伴い低下するが、遠距離のリンクは平均してより多くのメッセージを送信し、会話も長かった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。