Skip to main content
QUICK REVIEW

[论文解读] Verifying the Medical Specialty from User Profile of Online Community for Health-Related Advices

Соломія Федушко, Nataliya Shakhovska|arXiv (Cornell University)|Dec 15, 2018
Information Systems and Technology Applications参考文献 10被引用 9
一句话总结

本文提出了一种计算机语言学方法,通过分析用户在在线健康社区帖子中的语言和交际指标,验证用户在用户资料中所标注的医学专业。基于超过3,000名讲乌克兰语的医学论坛用户的训练样本,该方法构建了一个加权指标矩阵,用于分类和验证用户的专业,实测在“乌克兰医生论坛”中实现了25.75%的医学专业验证率。

ABSTRACT

The paper describes the verifying methods of medical specialty from user profile of online community for health-related advices. To avoid critical situations with the proliferation of unverified and inaccurate information in medical online community, it is necessary to develop a comprehensive software solution for verifying the user medical specialty of online community for health-related advices. The algorithm for forming the information profile of a medical online community user is designed. The scheme systems of formation of indicators of user specialization in the profession based on a training sample is presented. The method of forming the user information profile of online community for healthrelated advices by computer-linguistic analysis of the information content is suggested. The system of indicators based on a training sample of users in medical online communities is formed. The matrix of medical specialties indicators and method of determining weight coefficients these indicators is investigated. The proposed method of verifying the medical specialty from user profile is tested in online medical community.

研究动机与目标

  • 解决在线健康社区中未经核实且可能有害的医学建议这一关键问题。
  • 开发一种实用的、基于软件的方法,根据用户资料和帖子内容验证其医学专业。
  • 形式化一套可靠反映用户医学专业化的语言和交际指标体系。
  • 在真实在线医学社区中测试该方法,以验证其有效性和可靠性。
  • 支持社区管理员识别具备资质的、已验证的医学贡献者,并过滤掉不合格的建议。

提出的方法

  • 从可信来源(包括长期声誉良好的管理员和版主)构建已验证用户的训练样本。
  • 通过自动分析用户信息轨迹,识别与特定医学专业相关的语言和交际标记——包括语法、词汇语义和词汇句法特征。
  • 通过分析两个乌克兰语医学论坛的主题板块内容,为每种医学专业形成指标集合。
  • 开发医学专业指标矩阵,并基于频率和相关性使用多级计算机监控系统为每个指标分配权重系数。
  • 应用计算机语言学分析,从帖子内容构建用户信息档案,根据专业数据的一致性和完整性将档案标记为“已验证”或“未验证”。
  • 采用形式化算法处理用户信息轨迹,验证个人资料,并将用户分类为已验证或未验证的专业类别。

实验结果

研究问题

  • RQ1用户帖子中的语言和交际特征是否能可靠地指示其在在线健康社区中的医学专业?
  • RQ2如何基于用户内容构建一个加权指标体系,以区分不同医学专业?
  • RQ3在活跃的在线医学社区中应用该方法时,医学专业的实际验证率是多少?
  • RQ4自动化计算机语言学分析在多大程度上可降低在线论坛中非专业医学建议的风险?
  • RQ5该方法在区分已验证医学专业人士与提供错误或缺失专业信息的用户方面有多有效?

主要发现

  • 该方法在‘乌克兰医生论坛’中,对明确在个人资料中列出专业领域的用户实现了25.75%的医学专业验证率。
  • 社区中49.16%的用户列出了医学专业,表明存在大量潜在的已验证贡献者。
  • 5.69%的用户错误声称自己为非医学专业,凸显了自动化验证在防止错误信息方面的重要性。
  • 25.96%的用户档案中完全缺乏医学专业相关信息,使其成为自动化验证的候选对象。
  • 4.65%的用户提供了错误的专业信息,表明未经验证的档案在在线医学社区中存在风险。
  • 该系统成功利用计算机语言学分析对用户信息档案进行了分类,使管理员能够标记未验证或误导性档案。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。