[论文解读] A Graph Neural Network based approach for detecting Suspicious Users on Online Social Media.
本文提出一种基于图神经网络(GNN)的方法,具体采用图卷积网络(GCN),以检测在线社交媒体中可能传播谣言的可疑用户。通过将PHEME谣言推文数据集转化为可疑用户数据集,该方法在F1-Score上达到0.864,AUC-ROC达到0.720,优于SVM、随机森林和LSTM基线模型。
Online Social Media platforms (such as Twitter and Facebook) are extensively used for spreading the news to a wider public effortlessly at a rapid pace. However, now a days these platforms are also used with an aim of spreading rumors and fake news to a large audience in a short time span that can cause panic, fear, and financial loss to society. Thus, it is important to detect and control these rumors before it spreads to the masses. One way to control the spread of these rumors is by identifying possible suspicious users who are often involved in spreading the rumors. Our basic assumption is that the users who are often involved in spreading rumors are more likely to be suspicious in contrast to the users whose involvement in spreading rumors are less. This is due to the fact that sometimes, users may posts the rumor tweets by accident. In this paper, we use PHEME rumor tweet dataset which contains rumor and non-rumor tweets information on five incidents, that is, i) Charlie hebdo, ii)German wings crash, iii)Ottawa shooting, iv)Sydney siege, and v)Ferguson. We transform this rumor tweets dataset into suspicious users dataset before leveraging Graph Neural Network (GNN) based approach for identifying suspicious users. Specifically, we explore Graph Convolutional Network (GCN),which is a type of GNN, for identifying suspicious users and then we compare GCN results with the other three approaches which act as baseline approaches: SVM, RF and LSTM based deep learning architecture. Extensive experiments performed on real-world dataset, where we achieve up to 0.864 value for F1-Score and 0.720 value for AUC ROC, shows the effectiveness of GNN based approach for identifying suspicious users.
研究动机与目标
- 为应对Twitter和Facebook等在线社交媒体平台中谣言和虚假新闻快速传播的日益严重问题。
- 识别频繁传播谣言的可疑用户,将其与可能偶然分享谣言的用户区分开来。
- 通过基于图的建模,利用用户之间的结构关系,改进现有方法。
- 评估图卷积网络(GCN)在检测可疑用户方面相较于传统机器学习和深度学习基线模型的有效性。
提出的方法
- 通过聚合与谣言传播相关的用户级活动,将包含五个现实世界事件推文的PHEME谣言推文数据集转化为可疑用户数据集。
- 构建用户互动图,其中节点代表用户,边代表转发、回复或提及,以捕捉社交网络结构。
- 应用图卷积网络(GCN)通过聚合图中邻居节点的特征,学习用户的低维表示。
- 训练GCN模型,基于用户在网络中的结构和行为模式,将其分类为可疑或非可疑。
- 将GCN性能与三种基线模型进行比较:支持向量机(SVM)、随机森林(RF)和长短期记忆(LSTM)网络。
- 使用F1-Score和AUC-ROC等标准评估指标,在真实世界数据集上评估模型性能。
实验结果
研究问题
- RQ1图神经网络能否有效识别社交媒体平台上参与传播谣言的可疑用户?
- RQ2GCN在检测可疑用户方面的性能与SVM、RF和LSTM等传统机器学习和深度学习模型相比如何?
- RQ3将用户互动建模为图结构,在多大程度上提升了对谣言传播用户检测的准确性,相较于非图基方法?
- RQ4在谣言传播背景下,结构化网络特征对可疑用户分类的影响如何?
主要发现
- 基于GCN的方法在F1-Score上达到最高0.864,表明其在识别社交媒体可疑用户方面表现优异。
- 该模型在AUC-ROC上得分为0.720,表明其在区分可疑与非可疑用户方面具有良好的判别能力。
- 在PHEME数据集上,GCN模型在所有评估指标上均优于SVM、随机森林和LSTM三种基线模型。
- 结果证实,将用户互动建模为图结构可增强对可疑用户的检测能力,通过捕捉谣言传播中的结构模式。
- 本研究验证了频繁参与谣言传播的用户表现出可被GNN有效捕捉的显著网络级模式。
- 将谣言推文数据集转化为用户级别的可疑用户数据集,对GCN模型的训练与评估具有显著有效性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。