[论文解读] Urdu Morphology, Orthography and Lexicon Extraction
论文详细介绍在一个可重复使用的框架内实现 Urdu 语言特征作为软件 API,解决正字法、形态学和词汇提取的问题。它通过一个小型的 Urdu 语法组件展示复用。
Urdu is a challenging language because of, first, its Perso-Arabic script and second, its morphological system having inherent grammatical forms and vocabulary of Arabic, Persian and the native languages of South Asia. This paper describes an implementation of the Urdu language as a software API, and we deal with orthography, morphology and the extraction of the lexicon. The morphology is implemented in a toolkit called Functional Morphology (Forsberg & Ranta, 2004), which is based on the idea of dealing grammars as software libraries. Therefore this implementation could be reused in applications such as intelligent search of keywords, language training and infrastructure for syntax. We also present an implementation of a small part of Urdu syntax to demonstrate this reusability.
研究动机与目标
- 激发为 Urdu 构建一个支持正字法、形态学与词汇提取的软件 API。
- 展示在模块化工具包中将文法作为软件库重用。
- 演示一个小型 Urdu 语法组件以说明可重用性。
提出的方法
- 使用 Functional Morphology toolkit 实现 Urdu 语言特征(Forsberg & Ranta, 2004)。
- 将文法视为可重复使用的软件库,以支持诸如关键词搜索和语言训练等应用。
- 将正字法处理和词汇提取与形态学模块集成。
- 提供一个小型句法组件以说明端到端的复用。
实验结果
研究问题
- RQ1Urdu 形态学如何作为可重复使用的软件库的一部分来表示和操作?
- RQ2正字法和词汇提取能否在 Urdu 的可重复使用工具包中与形态学集成?
- RQ3多大程度上一个小型 Urdu 语法组件可以展示语法库的可复用性?
主要发现
- 可以实现一个 Urdu 语言实现作为使用 Functional Morphology 框架的软件 API。
- 形态学、正字法和词汇提取可以在模块化工具包中集成,以支持诸如智能关键词搜索和语言训练等应用。
- 一个小型 Urdu 语法组件展示了 Urdu 文法作为软件库的重用。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。