[论文解读] Global Health Monitor: A Web-based System for Detecting and Mapping Infectious Diseases
一个基于网络的系统,分析英文新闻报道以检测传染病暴发,分类相关性,并使用 BioCaster 本体对地理-时空扩散进行映射。它在一个集群上24/7监控1500条新闻源并每小时更新地图。
We present the Global Health Monitor, an online Web-based system for detecting and mapping infectious disease outbreaks that appear in news stories. The system analyzes English news stories from news feed providers, classifies them for topical relevance and plots them onto a Google map using geo-coding information, helping public health workers to monitor the spread of diseases in a geo-temporal context. The background knowledge for the system is contained in the BioCaster ontology (BCO) (Collier et al., 2007a) which includes both information on infectious diseases as well as geographical locations with their latitudes/longitudes. The system consists of four main stages: topic classification, named entity recognition (NER), disease/location detection and visualization. Evaluation of the system shows that it achieved high accuracy on a gold standard corpus. The system is now in practical use. Running on a clustercomputer, it monitors more than 1500 news feeds 24/7, updating the map every hour.
研究动机与目标
- 从英文新闻报道中检测传染病暴发。
- 对疾病与健康事件的主题相关性对新闻条目进行分类。
- 识别疾病和地点实体并对其进行地理编码。
- 在地理-时序地图上可视化暴发,供公共卫生监测。
提出的方法
- 将主题分类、命名实体识别(NER)以及疾病/地点检测作为核心流水线阶段。
- 将 BioCaster 本体(BCO)作为疾病和地点(包括坐标)的背景知识。
- 使用经纬度地理编码将检测到的暴发绘制到 Google Maps 上。
- 在一个24/7集群上运行,监控超过 1500 条新闻源并每小时刷新地图。
- 与金标准语料库进行性能评估以评估准确性。
实验结果
研究问题
- RQ1新闻衍生信号是否能够被准确地分类为相关的传染病报道?
- RQ2系统是否能够可靠地提取疾病和地点实体并对其进行地理编码以用于映射?
- RQ3基于本体的方法(BCO)是否支持有效的暴发检测与可视化?
- RQ4端到端系统是否能够进行实时监控并频繁更新,适用于公共卫生用途?
主要发现
- 系统在金标准语料库上实现了高准确性。
- 该平台持续监控 1500 条新闻源并每小时更新地图。
- 该方法将主题分类、NER 和疾病/地点检测与地理可视化相结合。
- 通过 BioCaster 本体的背景知识支持疾病与地理实体识别。
- 系统在 IJCNLP 2008 的实际应用与部署中得到演示。
- 在集群计算机上运行以支持实时监控。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。