QUICK REVIEW

[論文レビュー] Information Diffusion and External Influence in Networks

Seth A. Myers, Chenguang Zhu|arXiv (Cornell University)|Jun 6, 2012

Complex Network Analysis Techniques参考文献 26被引用数 29

ひとこと要約

本論文は、Twitterにおける情報拡散において、内部ネットワーク拡散と外部要因（例：マスコミ）を分離する確率的モデルを提案する。1か月間のTwitterデータを分析した結果、URLの言及の71%がネットワーク拡散によるものであり、残りの29%が外部要因によるものであることが判明し、情報拡散に「ジャンプ」を引き起こす顕著な未観測の外部影響が存在することが明らかになった。

ABSTRACT

Social networks play a fundamental role in the diffusion of information. However, there are two different ways of how information reaches a person in a network. Information reaches us through connections in our social networks, as well as through the influence of external out-of-network sources, like the mainstream media. While most present models of information adoption in networks assume information only passes from a node to node via the edges of the underlying network, the recent availability of massive online social media data allows us to study this process in more detail. We present a model in which information can reach a node via the links of the social network or through the influence of external sources. We then develop an efficient model parameter fitting technique and apply the model to the emergence of URL mentions in the Twitter network. Using a complete one month trace of Twitter we study how information reaches the nodes of the network. We quantify the external influences over time and describe how these influences affect the information adoption. We discover that the information tends to "jump" across the network, which can only be explained as an effect of an unobservable external influence on the network. We find that only about 71% of the information volume in Twitter can be attributed to network diffusion, and the remaining 29% is due to external events and factors outside the network.

研究の動機と目的

Twitterにおける情報の出現が、内部ネットワーク拡散と、マスコミなどの外部ネットワーク外の要因の両方によってどのように生じるかを理解すること。
標準的な拡散モデルでは、内部的および外部的影響が区別できないという混同要因に対処すること。
内部ネットワーク拡散と外部的影響が情報受容に与える寄与を分離・定量化するモデルを開発すること。
実世界のTwitterデータを用いて、露出反応曲線の形状と外部要因の時間的活動を推定すること。

提案手法

ノードの感染（URLの言及）が、隣接ノードによる内部的影響と、観測されない外部要因による影響の両者によって生じる生成モデルを提案する。
累積的な内部的露出と時間経過に伴う外部活動に依存するハザード関数を用いて、感染確率をモデル化する。
内部的要因からの露出回数に応じて感染確率がどのように変化するかを捉える露出曲線η(x)を導入する。
最大尤度推定と効率的な推論アルゴリズムを用いて、外部活動λ_ext(t)、露出曲線η(x)、内部拡散パラメータを同時に推定する。
30億件のツイートを含む1か月間の完全なトレースデータにモデルを適用し、数千のURLにおける外部的影響のダイナミクスを推定する。
非パラメトリックアプローチを用いて、露出曲線の形状と時間的に変化する外部影響の強度を推定する。

実験結果

リサーチクエスチョン

RQ1マスコミなどの外部要因が、ネットワーク拡散を超えて、TwitterにおけるURLの出現にどの程度寄与しているか。
RQ2社会的ネットワークの影響による情報受容と、外部マスコミの露出による情報受容をどのように区別できるか。
RQ3外部的影響の時間的パターンは何か。また、時間の経過とともに内部ネットワーク拡散とどのように相互作用するか。
RQ4ネットワークの仲間からの反復露出に伴って、URLの受容確率はどのように変化するか。
RQ5Twitterにおける情報拡散のうち、外部要因によるものと内部ネットワーク拡散によるものの割合はそれぞれどれほどか。

主な発見

TwitterにおけるURLの言及のうち、71%は内部ネットワーク拡散に起因するが、残りの29%はマスコミ露出などの外部要因に起因する。
露出曲線η(x)のピークはρ₁ ≈ 0.0005であり、ユーザーが非常に選択的であり、わずかな露出回数でURLを受容することが示唆される。
露出曲線のピーク（ρ₂）は最も頻繁に1に位置しており、ユーザーが通常1〜2回の内部的露出後にURLを受容することが示されている。
初期の感染は主に外部要因によって駆動されているが、拡散が進行するにつれて内部的影響が優勢となり、露出曲線において内部的要因による感染の急増が観察された。
低露出レベルで密集した感染が観測されており、これらはほとんどが内部拡散に起因しており、初期段階のネットワーク伝播を示している。
本モデルは情報出現のダイナミクスをうまく捉えており、『ジャンプ』（直前の感染が接続されていない感染）が、未観測の外部的影響によって最もよく説明されることを明らかにした。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。