Skip to main content
QUICK REVIEW

[論文レビュー] A discourse based approach in text-based machine translation

Sana Ullah, Mohammad Aamir Khan|arXiv (Cornell University)|Jul 1, 2007
Natural Language Processing Techniques参考文献 1被引用数 1
ひとこと要約

本稿は、複雑な対話構造を体系的な分解によって原始的対話構造に変換することにより、テキストベース機械翻訳における省略の解消にための対話に基づくアプローチを提案する。本研究では実新聞テキストに対話式の公式を適用し、Khan (1995) の枠組みを拡張して、新たな原始的対話パターンを同定した。実世界の断片を用いた実証的分析により検証された。

ABSTRACT

This paper presents a theoretical research based approach to ellipsis resolution in machine translation. Moreover, the formula of discourse is applied in order to resolve ellipses. The validity of the discourse formula is analyzed by applying it to the real world text i.e. newspaper fragments. The source text is converted into mono-sentential discourses where complex discourses require further dissection either directly into primitive discourses or first into compound discourses and later into primitive ones. The procedure of dissection needs further improvement i.e. discovering as many primitive discourse forms as possible. This work is further improvement to the concepts presented by Khan (Khan, 1995). Likewise, an attempt has been made to investigate new primitive discourses i.e. patterns from the given text.

研究の動機と目的

  • 対話分析を用いて、テキストベース機械翻訳における省略解消の課題に取り組む。
  • Khan (1995) の枠組みを拡張し、実世界のテキストから新たな原始的対話形式を同定する。
  • 新聞断片の実証的分析を用いて、対話式の公式の妥当性を検証する。
  • 複雑な対話構造を原始的または複合的対話構造に分解するプロセスを改善する。
  • 対話に配慮した機械翻訳システムの理論的基盤を強化する。

提案手法

  • 分析を簡素化するため、元のテキストを単一文の対話構造に変換する。
  • 複雑な対話構造を直接原始的対話構造に分解するか、中間の複合的対話構造経由で分解する。
  • 文脈的および構造的関係を活用して、対話式の公式を適用し、省略を解消する。
  • 実新聞断片の分析を通じて、対話式の公式の有効性と適用可能性を検証する。
  • 出発資料のテクスト解析を通じて、新たな原始的対話パターンを同定する。
  • 原始的対話形式の発見を最大化するため、分解手順を改善する。

実験結果

リサーチクエスチョン

  • RQ1どのようにすれば、省略解消のための対話構造を体系的に分解できるか?
  • RQ2実世界のテキストから得られる、最も効果的な原始的対話形式は何か?
  • RQ3対話式の公式は、新聞断片における省略解消をどの程度改善するか?
  • RQ4提案手法は、Khan (1995) の枠組みを対話的翻訳にどのように発展させたか?
  • RQ5原始的対話構造を同定するための現在の分解プロセスにはどのような制限があるか?

主な発見

  • 対話式の公式は、文脈的対話構造を活用することで、実新聞断片における省略を効果的に解消した。
  • 実証的テキスト解析から新たな原始的対話パターンが成功裏に同定され、先行研究が拡張された。
  • 複雑な対話構造を原始的形に分解することで、省略解消の正確性が向上した。
  • 本手法は実世界のテキストにおいて実現可能であることが示され、理論的枠組みの妥当性が裏付けられた。
  • 原始的対話形式の発見を最大化するため、分解手順のさらなる精錬が求められる。
  • 本アプローチは、対話に配慮した機械翻訳システムの堅実な基盤を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。