Skip to main content
QUICK REVIEW

[论文解读] Software search is not a science, even among scientists

Michael Hucka, M. J. Graham|arXiv (Cornell University)|Jan 1, 2016
Software Engineering Research参考文献 91被引用 9
一句话总结

本研究调查了科学家和工程师搜索软件的方式,发现即使受过高等教育的用户,也严重依赖通用网络搜索、同事推荐和学术文献,而非专业工具。尽管可以访问GitHub和Stack Overflow等平台,开发人员更倾向于使用社区网站,而糟糕的文档仍然是代码重用的主要障碍。

ABSTRACT

When they seek software for a task, how do people go about finding it? Past research found that searching the Web, asking colleagues, and reading papers have been the predominant approaches---but is it still true today, given the popularity of Facebook, Stack Overflow, GitHub, and similar sites? In addition, when users do look for software, what criteria do they use? And finally, if resources such as improved software catalogs were to be developed, what kind of information would people want in them? These questions motivated our cross-sectional survey of scientists and engineers. We sought to understand the practices and experiences of people looking for ready-to-run software as well as people looking for source code. The results show that even in our highly educated sample of people, the relatively unsophisticated approaches of relying on general Web searches, the opinions of colleagues, and the literature remain the most popular approaches overall. However, software developers are more likely than non-developers to search in community sites such as Stack Overflow and GitHub, even when seeking ready-to-run software rather than source code. We also found that when searching for source code, poor documentation was the most common reason for being unable to reuse the code found. Our results also reveal a variety of characteristics that matter to people searching for software, and thus can inform the development of future resources to help people find software more effectively.

研究动机与目标

  • 了解科学家和工程师当前的软件发现实践。
  • 识别用户在选择软件或源代码时所依据的标准。
  • 通过揭示用户需求和偏好,为改进软件目录的设计提供依据。

提出的方法

  • 对科学家和工程师开展横断面调查,以评估其软件搜索行为。
  • 收集用户在寻找可运行软件和源代码时偏好的搜索方法的数据。
  • 分析调查结果,以识别工具使用模式、决策标准和代码重用障碍。
  • 比较软件开发人员与非开发人员的行为差异。
  • 评估文档质量在软件重用决策中的作用。
  • 识别用户在未来软件发现资源中希望拥有的关键功能。

实验结果

研究问题

  • RQ1科学家和工程师当前如何搜索软件,他们更倾向于使用哪些工具?
  • RQ2用户在选择软件或源代码时,最重视哪些标准?
  • RQ3在发现软件后,尤其是源代码,主要的重用障碍是什么?
  • RQ4软件开发人员与非开发人员的搜索行为有何不同?
  • RQ5用户在改进的软件目录中,最希望获得哪些信息?

主要发现

  • 即使在科学家和工程师群体中,通用网络搜索、同事推荐和学术文献仍是软件发现的最常见方式。
  • 与非开发人员相比,软件开发人员在寻找可运行软件时,更可能使用Stack Overflow和GitHub等社区平台。
  • 文档质量差被确定为无法重用所发现源代码的最常见原因。
  • 用户重视软件目录中清晰、易获取的信息,表明需要更结构化、以用户为中心的软件发现资源。
  • 尽管存在专业平台,用户群体对广泛搜索和社交网络的依赖依然持续。
  • 本研究揭示了当前工具与用户需求之间的差距,凸显了改进软件目录化和元数据管理的机遇。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。