[論文レビュー] Composite Social Network for Predicting Mobile Apps Installation
本稿では、Bluetooth近接、通話ログ、GPS位置パターン、SNSの友人関係など、複数のスマートフォンセンサーで得られるネットワークを統合した複合的ソーシャルネットワークモデルを提案する。個人の行動のばらつきとアプリの人気度などの外部要因を組み合わせることで、F₁スコア0.43を達成し、ランダムな推測よりも4倍の精度を示し、個人差が著しいにもかかわらずアプリ導入の予測可能性が強いことを示している。
We have carefully instrumented a large portion of the population living in a university graduate dormitory by giving participants Android smart phones running our sensing software. In this paper, we propose the novel problem of predicting mobile application (known as "apps") installation using social networks and explain its challenge. Modern smart phones, like the ones used in our study, are able to collect different social networks using built-in sensors. (e.g. Bluetooth proximity network, call log network, etc) While this information is accessible to app market makers such as the iPhone AppStore, it has not yet been studied how app market makers can use these information for marketing research and strategy development. We develop a simple computational model to better predict app installation by using a composite network computed from the different networks sensed by phones. Our model also captures individual variance and exogenous factors in app adoption. We show the importance of considering all these factors in predicting app installations, and we observe the surprising result that app installation is indeed predictable. We also show that our model achieves the best results compared with generic approaches: our results are four times better than random guess, and predict almost 45% of all apps users install with almost 45% precision (F1 score= 0.43).
研究の動機と目的
- 複数のスマートフォンで測定されたソーシャルネットワークを用いて、モバイルアプリのインストール行動を予測できるかどうかを調査すること。
- アプリの人気度などの外部要因と、個人の行動のばらつきが存在する中で、アプリ導入を予測する課題に取り組むこと。
- 複数のネットワーク層と個人差を統合した計算モデルを構築し、予測精度を向上させること。
- 欠落した履歴データを含む実世界の制約下でも、モデルの性能を評価すること。
提案手法
- 著者らは、Bluetooth近接、通話ログ、GPSベースの位置パターン、SNSの友人関係ネットワークといった複数の観察可能なネットワークを統合して、複合ネットワークを構築した。
- 個人差(個人の導入傾向)と外部要因(例:アプリの人気度)を組み込んだ判別モデルを提案し、予測を精緻化した。
- トレーニングデータを用いてパラメータをキャリブレーションする凸最適化フレームワークを用い、ユーザーの影響力を複数のネットワークにわたって表す合成ベクトルを学習した。
- 交差検証のために、導入者を初期(G1)と後期(G2)のグループに分割し、G1データでモデルを学習し、G2データでテストした。
- F₁スコアを用いてモデルを評価し、SVMハイブリッドやランダム推測といったベースライン手法と比較した。
- 欠損データへの感受性を検証するために、観測不能なユーザー群をシミュレートし、汎化性能を評価した。
実験結果
リサーチクエスチョン
- RQ1高い個人差がある中でも、複数のスマートフォンで測定されたソーシャルネットワークを用いて、モバイルアプリのインストールを予測できるか?
- RQ2Bluetooth、通話ログ、GPS、SNSなどの複数のネットワーク層を統合することで、単一ネットワークモデルに比べて予測精度がどの程度向上するか?
- RQ3個人の行動のばらつきとアプリの人気度(外部要因)が、予測性能にどの程度の影響を及ぼすか?
- RQ4一部のデータしか得られない状況下でも、トレーニング時に観測されなかったユーザーに一般化できるか?
主な発見
- 提案されたモデルは、モバイルアプリのインストール予測においてF₁スコア0.43を達成し、ランダムな推測よりも4倍の精度を示した。
- G2グループのデータが半分しか利用できない状況でも、k=3のときF₁スコア0.35を維持しており、データのスパarsity(疎らさ)に対しても強い耐性を示した。
- SVMハイブリッドやランダム予測といったベースライン手法よりも優れた性能を示し、後者ではF₁スコアがたった0.09にとどまった。
- トレーニング時に観測されなかったユーザーに対しても、モデルは良好に一般化でき、個人差のキャリブレーションが行われていない状況でも、ランダム推測性能の80%以上を達成した。
- 複数のデータソースと個人差を同時にモデル化することで、アプリ導入におけるネットワーク効果が観察可能で予測可能であることが確認された。
- アプリの人気度といった外部要因は、予測の正確性を著しく向上させ、現実世界の導入行動をモデル化する上で極めて重要であることが示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。