[论文解读] Verb Semantics and Lexical Selection
本文提出了一种基于跨认知领域共享语义概念的多领域动词概念表征,即使在缺乏精确词典匹配的情况下,也能实现机器翻译中的准确词汇选择。通过测量概念相似性并放宽选择限制,该系统在具体动词用法上的准确率达到99.45%,在隐喻用法上达到88.8%,显著优于传统的基于转换的机器翻译系统。
This paper will focus on the semantic representation of verbs in computer systems and its impact on lexical selection problems in machine translation (MT). Two groups of English and Chinese verbs are examined to show that lexical selection must be based on interpretation of the sentence as well as selection restrictions placed on the verb arguments. A novel representation scheme is suggested, and is compared to representations with selection restrictions used in transfer-based MT. We see our approach as closely aligned with knowledge-based MT approaches (KBMT), and as a separate component that could be incorporated into existing systems. Examples and experimental results will show that, using this scheme, inexact matches can achieve correct lexical selection.
研究动机与目标
- 解决依赖详尽动词对列表和严格选择限制的基于转换的机器翻译系统所存在的局限性。
- 通过在共享概念领域上建模动词语义,而非依赖固定论元约束,提升机器翻译中的词汇选择准确率。
- 通过引入基于概念表征的相似性度量,实现对新出现或隐喻性动词用法的非精确匹配。
- 证明概念相似性在解决动词翻译歧义方面可优于严格的选择限制。
- 将所提出的表征集成到现有机器翻译系统中,作为与基于知识的机器翻译方法兼容的模块化组件。
提出的方法
- 将每个动词表示为多个概念领域(如物理变化、力量、运动)中的概念集合,形成多领域语义表征。
- 基于层次化本体中概念成分的重叠与接近程度,定义动词义项之间的相似性度量。
- 将选择限制视为概率指标而非硬性约束,当约束被违反时,利用概念相似性来解决歧义。
- 应用扩展的选择过程,放宽约束,并基于概念接近度选择最语义相似的目标动词。
- 将系统集成到UNICON机器翻译框架中,利用概念层次结构解释未知动词论元,并指导词汇选择。
- 利用领域特定知识(例如,“价格”可以“被固定”或“价值变动”)将抽象或隐喻性用法映射到合适的中文动词。
实验结果
研究问题
- RQ1基于多领域概念表征的动词是否能超越严格选择限制,在机器翻译中提升词汇选择准确率?
- RQ2在缺乏精确词典匹配的情况下,动词义项之间的概念相似性在多大程度上能实现正确的词汇选择?
- RQ3所提出的方法在处理违反标准论元选择限制的隐喻性或非具体动词用法方面有多有效?
- RQ4该系统能否在传统双语词典未涵盖的新出现或罕见动词用法上实现高准确率?
- RQ5在优先考虑概念相似性的同时放宽选择约束,对歧义动词翻译的性能有何影响?
主要发现
- 在对154个包含具体对象的句子编码未知动词论元的概念意义后,系统在词汇选择上的正确率达到99.45%。
- 在包含隐喻和非具体对象的116个句子的测试集上,应用扩展选择过程并放宽约束后,系统准确率达到88.8%。
- 与基线相比,扩展选择过程使准确率提升了13.8个百分点,证明了基于相似性的匹配具有显著价值。
- 该方法成功翻译了诸如“打破语言障碍”和“达到价格高峰”等隐喻用法,通过将抽象意义映射到合适的中文动词“da-po”和“da-dao”。
- 该系统优于商业化的基于转换的机器翻译系统TranStar,后者在相同157个“break”句子的测试集上仅达到19.1%的准确率。
- 结果表明,尤其在处理依赖上下文或新出现的动词用法时,概念相似性应优先于严格的选择限制。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。