QUICK REVIEW

[論文レビュー] DeepCity: A Feature Learning Framework for Mining Location Check-Ins

Jun Pang, Yang Zhang|arXiv (Cornell University)|Oct 12, 2016

Human Mobility and Location-Based Analysis被引用数 24

ひとこと要約

DeepCity は、位置情報付きソーシャルネットワークにおけるユーザーおよび場所のパーソナライズド埋め込みを生成するために、タスク固有のランダムウォークを用いたディープラーニングベースの特徴学習フレームワークである。デモグラフィック属性およびカテゴリカル属性でランダムウォークをガイドすることで、ユーザーおよび場所のプロファイリングを向上させ、4200万件のチェックインを含むInstagramデータセットにおいて、最小限のチェックインでも性別の予測でAUCが0.9に近づくという最先端の性能を達成した。

ABSTRACT

Online social networks being extended to geographical space has resulted in large amount of user check-in data. Understanding check-ins can help to build appealing applications, such as location recommendation. In this paper, we propose DeepCity, a feature learning framework based on deep learning, to profile users and locations, with respect to user demographic and location category prediction. Both of the predictions are essential for social network companies to increase user engagement. The key contribution of DeepCity is the proposal of task-specific random walk which uses the location and user properties to guide the feature learning to be specific to each prediction task. Experiments conducted on 42M check-ins in three cities collected from Instagram have shown that DeepCity achieves a superior performance and outperforms other baseline models significantly.

研究の動機と目的

一般のネットワーク埋め込み手法が、ユーザーおよび場所の予測に特化した特徴を捉えきれていないという限界に対処すること。
チェックインデータから直接表現を学習することで、ユーザーおよび場所のプロファイリングタスクにおける手動の特徴工学的作業の必要性を排除すること。
統一的かつスケーラブルなフレームワークを用いて、ユーザーのデモグラフィック要因（例：性別、年齢、人種）および場所のカテゴリを予測する精度を向上させること。
将来の研究のベンチマークとして使用可能な、デモグラフィックおよびカテゴリカルラベルが付与された大規模かつマルチシティのチェックインデータセットを構築すること。
タスク固有のランダムウォークが、各予測タスクに適した関連する近隣構造に焦点を当てることで、表現学習を向上させることを検証すること。

提案手法

DeepCity は、word2vec におけるスキップグラムモデルを用いて、ユーザーおよび場所の相互作用パターンから低次元のベクトル表現（埋め込み）を学習する。
タスク固有のランダムウォークを導入し、歩行生成中に補助的属性（例：性別、年齢、場所カテゴリ）に基づいてノードの近隣を動的に定義する。
ユーザーまたは場所のプロパティによってランダムウォークのプロセスをガイドすることで、ターゲット予測タスクに関連する接続を優先し、タスク固有の特徴学習を強化する。
スケーラムの目的関数を最適化することで、ネットワーク内の局所的な構造的関係を保持し、類似したユーザーまたは場所がベクトル空間で近接して埋め込まれるようにする。
トレーニングのためのスケールでのデモグラフィックラベルの自動収集を可能にするために、Face++ などの外部データソースを統合する。
単一の統合フレームワーク内で、ユーザープロファイリング（デモグラフィック推論）および場所プロファイリング（カテゴリ予測）を両方の予測タスクとしてサポートする。

実験結果

リサーチクエスチョン

RQ1タスク固有のランダムウォークは、一般のネットワーク埋め込み手法と比較して、ユーザーのデモグラフィック要因（例：性別、年齢、人種）の予測性能を向上させることができるか？
RQ2チェックインパターンと最小限のメタデータのみを用いて、DeepCity は場所のカテゴリをどれほど効果的に予測できるか？
RQ3ユーザーまたは場所あたりのチェックイン数が、モデルの予測性能にどの程度影響を及えるか？
RQ4DeepCity は、大規模な実世界データにおいて、ユーザーおよび場所のプロファイリングタスクの両方で、既存の最先端モデルを上回ることができるか？
RQ5ランダムウォークにタスク固有のガイドラインを組み込むことで、標準的なネットワーク埋め込み技術と比較して、より識別的かつ汎用性の高いノード埋め込みが得られるか？

主な発見

ユーザーがたった10件のチェックインしか持たない場合でも、性別予測のAUCがほぼ0.9に達し、最小限のデータでも優れた性能を示した。
人種予測の性能は、ユーザーあたり25件のチェックインで安定化し、データが少ない状況でも頑健であることが示された。
年齢予測では、AUCがチェックイン数にほぼ線形的に上昇し、ユーザー活動の増加に伴い一貫した改善が見られた。
DeepWalk や node2vec などのベースラインモデルと比較して、DeepCity はユーザーのデモグラフィック要因および場所カテゴリの両方の予測タスクで顕著に優れた性能を示した。
タスク固有のランダムウォークを用いることで、汎用的ランダムウォークよりも優れた表現学習が達成されており、AUCおよびF1スコアの向上によって裏付けられた。
DeepCity は、ニューヨーク、ロサンゼルス、ロンドンのInstagramから収集された4200万件を超える大規模データセットにおいて、高いスケーラビリティと有効性を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。