Skip to main content
QUICK REVIEW

[論文レビュー] Gender Neutralization for an Inclusive Machine Translation: from Theoretical Foundations to Open Challenges

Andrea Piergentili, Dennis Fucci|arXiv (Cornell University)|Jan 24, 2023
Gender Studies in Language被引用数 11
ひとこと要約

本論文は英語→イタリア語 MT におけるジェンダー・ニュートラル翻訳(GNT)を定義し、ジェンダー包摂言語に関するガイドラインを検討し、MT における GNT の実装に向けた望まれる条件、課題、および潜在的な解決策を概説する。

ABSTRACT

Gender inclusivity in language technologies has become a prominent research topic. In this study, we explore gender-neutral translation (GNT) as a form of gender inclusivity and a goal to be achieved by machine translation (MT) models, which have been found to perpetuate gender bias and discrimination. Specifically, we focus on translation from English into Italian, a language pair representative of salient gender-related linguistic transfer problems. To define GNT, we review a selection of relevant institutional guidelines for gender-inclusive language, discuss its scenarios of use, and examine the technical challenges of performing GNT in MT, concluding with a discussion of potential solutions to encourage advancements toward greater inclusivity in MT.

研究の動機と目的

  • GNT を、出典から推測されない場合にターゲット言語で性別を示さず翻訳することとして定義する。
  • 英語とイタリア語の機関ガイドラインを調査して、ジェンダーと中立性の概念化を理解する。
  • MT における GNT の適用に関する実用的な望まれる条件(D1–D3)を、具体的な例とともに概説する。
  • GNT を MT に実装する際の文脈検出、データ、評価の技術的課題を論じる。
  • 包括的な MT 研究を進展させるための潜在的な方法論的方向性を提案する。

提案手法

  • ジェンダーと言語理論をレビュー・総合して、性別が言語間でどのように符号化され、MT における偏りがどこで生じるかを特定する。
  • 英語とイタリア語の30件の機関ガイドラインを整理・比較して、中立化戦略と適用性を抽出する。
  • GNT の適用時期と方法を示す3つの desiderata フレームワーク(D1–D3)を、具体例とともに定義する。
  • GNT を MT に実装する際の動的な制約、データ、評価の課題を論じ、文脈、制約、デコード、評価などの技術的アプローチを検討する。
  • GNT を MT で実現するための将来の研究方向と潜在的解決策のロードマップを提供する。

実験結果

リサーチクエスチョン

  • RQ1GNT を実現するために、ジェンダー包摂的な言語とは何か、MT での運用可能性はどうなるのか?
  • RQ2MT システムはいつジェンダーニュートラルな翻訳を適用すべきか、出典テキストの性別手がかりをどのように検出するか?
  • RQ3英語とイタリア語のガイドラインからの中立化戦略のうち、MT に移植可能なものはどれか?
  • RQ4データ、デコード、評価における GNT の主な技術的課題は何か?
  • RQ5包括的な MT を GNT の堅牢な実現へと進展させるためのロードマップと方法論は何か?

主な発見

  • ジェンダー・ニュートラル翻訳は、出典から推測できない場合にターゲット言語へ性別を示さず自動的に翻訳することとして定義される。
  • 英語のガイドラインは代名詞や性別手がかりの中立化に焦点を当て、イタリア語のガイドラインは性別名詞の中立化を強調して、言語間の差異を浮き彫りにしている。
  • GNT には中立性、流暢さ、文脈とのトレードオフを慎重に考慮する必要があり、特に中立性がジャンルによって制約される正式な領域で影響を受け得る。
  • GNT は動的な制約であり、中立化を適用する決定は出典の性別手がかりと談話文脈に依存し、文書レベルの文脈のほうが文単位翻訳より利点を得られる可能性がある。
  • データ不足の課題があり、中立的なターゲット形を持つ平行データが不足しているため、GNT を訓練する MT モデルの作成が難しい。
  • 制約付きデコードや再ランク付けアプローチは GNT を強制する可能性がある一方で、翻訳品質に影響を与え、慎重な評価が必要となる。
  • ジェンダー中立性を全体の翻訳品質とは別に評価する専用の評価プロトコルとベンチマークが必要で、平行元タイプと中立化ターゲットを含むデータセットが含まれる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。