Skip to main content
QUICK REVIEW

[论文解读] A Historical Analysis of the Field of OR/MS using Topic Models

Christopher J. Gatti, James D. Brooks|arXiv (Cornell University)|Oct 17, 2015
Big Data and Business Intelligence参考文献 32被引用 31
一句话总结

本研究将潜在狄利克雷分布(LDA)主题建模应用于自1950年代以来37家领先期刊的80,757篇运筹学与管理科学(OR/MS)期刊文摘,揭示了研究主题的随时间演变动态、期刊范围的演化以及主题聚类情况。研究识别出既符合预期又出人意料的期刊分组,并展示了期刊随时间在独特性上的增减变化,为OR/MS文献的发展提供了客观、数据驱动的视角。

ABSTRACT

This study investigates the content of the published scientific literature in the fields of operations research and management science (OR/MS) since the early 1950s. Our study is based on 80,757 published journal abstracts from 37 of the leading OR/MS journals. We have developed a topic model, using Latent Dirichlet Allocation (LDA), and extend this analysis to reveal the temporal dynamics of the field, journals, and topics. Our analysis shows the generality or specificity of each of the journals, and we identify groups of journals with similar content, which are both consistent and inconsistent with intuition. We also show how journals have become more or less unique in their scope. A more detailed analysis of each journals' topics over time shows significant temporal dynamics, especially for journals with niche content. This study presents an observational, yet objective, view of the published literature from OR/MS that would be of interest to authors, editors, journals, and publishers. Furthermore, this work can be used by new entrants to the fields of OR/MS to understand the content landscape, as a starting point for discussions and inquiry of the field at large, or as a model for other fields to perform similar analyses.

研究动机与目标

  • 使用已发表的文摘分析运筹学与管理科学(OR/MS)研究主题的历史演变。
  • 评估OR/MS期刊随时间在研究范围和独特性方面的演变。
  • 识别内容相似的期刊聚类,包括与直觉预期一致和不一致的聚类。
  • 为研究人员、编辑和出版商提供OR/MS文献格局的客观、数据驱动视图。
  • 为其他学术领域使用大规模出版数据进行主题建模的类似分析提供范例。

提出的方法

  • 本研究使用潜在狄利克雷分布(LDA)从37家领先OR/MS期刊的80,757篇期刊文摘中提取主题。
  • 扩展LDA模型以分析时间动态,追踪主题流行度及期刊-主题关系随时间的变化。
  • 分析期刊特定的主题分布,以评估其研究范围的广度或专精度及其独特性的变化。
  • 基于期刊间主题构成的相似性,进行主题聚类与期刊分组。
  • 分析利用了从20世纪50年代初至今的大型、精心整理的OR/MS出版物数据集。
  • 采用统计与可视化技术,追踪数十年间研究重点与期刊专业化程度的变化。

实验结果

研究问题

  • RQ1OR/MS研究主题随时间如何演变,特别是在应对技术与社会变革时?
  • RQ2哪些期刊在其主题关注上随时间变得更具或更少独特性,原因是什么?
  • RQ3内容相似的期刊聚类与基于期刊名称或声誉的直觉预期相比如何?
  • RQ4与广泛范围的期刊相比,专业性期刊在主题转变上是否表现出更高的动态性?
  • RQ5主题建模在多大程度上能提供OR/MS知识版图的客观、大规模视图?

主要发现

  • 本研究在OR/MS期刊中识别出显著的主题聚类,其中一些与传统预期一致,另一些则揭示了出人意料的相似性。
  • 期刊在范围独特性方面表现出可测量的变化,部分期刊随时间变得更加专业化,另一些则更加泛化。
  • 主题流行度的时间动态在专业内容的期刊中最为显著,表明专门领域内研究兴趣的持续演变。
  • LDA模型成功捕捉了每本期刊内容的广度或专精度,提供了研究范围的量化度量。
  • 分析表明,一些历史上被视为广泛的期刊在主题分布上实际上更为聚焦,挑战了传统认知。
  • 该方法为利用大规模出版数据对任何学术领域的知识演化进行可复现分析提供了框架。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。