[论文解读] The EcoLexicon English Corpus as an open corpus in Sketch Engine
The EcoLexicon English Corpus (23.1 million words of contemporary environmental texts) is released as an open Sketch Engine corpus with guidance on its construction and use.
The EcoLexicon English Corpus (EEC) is a 23.1-million-word corpus of contemporary environmental texts. It was compiled by the LexiCon research group for the development of EcoLexicon (Faber, Leon-Arauz & Reimerink 2016; San Martin et al. 2017), a terminological knowledge base on the environment. It is available as an open corpus in the well-known corpus query system Sketch Engine (Kilgarriff et al. 2014), which means that any user, even without a subscription, can freely access and query the corpus. In this paper, the EEC is introduced by de- scribing how it was built and compiled and how it can be queried and exploited, based both on the functionalities provided by Sketch Engine and on the parameters in which the texts in the EEC are classified.
研究动机与目标
- 描述 EcoLexicon English Corpus (EEC) 的构建与编制过程。
- 解释如何使用 Sketch Engine 对 EEC 进行查询与利用。
- 详细说明用于 EEC 文本的分类参数。
- 演示对未订阅 Sketch Engine 的用户的开放获取访问。
提出的方法
- 展示构建 EEC 并将其集成到 Sketch Engine 的工作流程。
- 描述编纂环境文本的步骤与标准。
- 解释用于查询和分析 EEC 的 Sketch Engine 功能。
- 概述应用于语料文本的参数化和分类方案。
实验结果
研究问题
- RQ1EcoLexicon English Corpus 是如何构建的,包含了哪些来源?
- RQ2用户如何在 Sketch Engine 中查询和利用 EEC,包括非订阅访问?
- RQ3用于组织和分类 EEC 文本的分类参数有哪些?
- RQ4将 EEC 作为开放语料库在 Sketch Engine 中使用的实际能力和局限性是什么?
主要发现
- The EcoLexicon English Corpus 包含 23.1 million words 的当代环境文本。
- 该语料库作为开放语料库在 Sketch Engine 中提供,向非订阅者开放。
- 本文描述了在 Sketch Engine 内的构建、编译标准以及查询/利用方法。
- 用户可以基于已定义的分类参数,使用 Sketch Engine 的功能对 EEC 进行查询。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。