Skip to main content
QUICK REVIEW

[論文レビュー] A Duality Based 2-Approximation Algorithm for Maximum Agreement Forest

Frans Schalekamp, Anke van Zuylen|arXiv (Cornell University)|Jan 1, 2016
Data Mining Algorithms and Applications被引用数 2
ひとこと要約

本稿では、2本の根付き二分木における最大一致森(MAF)問題に対して、線形計画法の双対性を用いて近似比を分析する、新規の2近似アルゴリズムを提示する。従来の局所的部分木解析に依存する手法とは異なり、最小不一致部分木を特定し、双対妥当解に従うグローバルな操作を適用することで、以前の最良近似比2.5を改善する。

ABSTRACT

We give a 2-approximation algorithm for the Maximum Agreement Forest problem on two rooted binary trees. This NP-hard problem has been studied extensively in the past two decades, since it can be used to compute the Subtree Prune-and-Regraft (SPR) distance between two phylogenetic trees. Our result improves on the very recent 2.5-approximation algorithm due to Shi, Feng, You and Wang (2015). Our algorithm is the first approximation algorithm for this problem that uses LP duality in its analysis.

研究の動機と目的

  • 2本の根付き二分木における最大一致森(MAF)問題に対する2近似アルゴリズムの開発。
  • MAFの以前の最良近似比2.5を改善すること。
  • 線形計画法の双対性に基づく解析を導入し、MAF近似のための新しい理論的枠組みを提供すること。
  • 局所的4葉構造に依存するのではなく、最小不一致部分木を特定するグローバルなアルゴリズム的アプローチの設計。
  • 実験的に、本アルゴリズムが実際の応用において優れた性能を示すことを示すこと。平均近似比は1.92であり、グリーディな後処理ステップを適用することで1.28未満にまで低下する。

提案手法

  • 本アルゴリズムは、MAF問題の線形計画緩和に対する妥当な双対解を構築し、双対目的関数を最適解の下界として用いる。
  • 入力木の一方において、剪定後に同型部分木を形成しない葉集合を有する最小不一致部分木を特定する。
  • この不一致部分木内のアクティブな兄弟ペアに対して局所的操作を実行し、森林を変更するとともに双対変数を更新する。この操作には、ResolvePairと呼ばれる手続きを用いる。
  • lcaの構造的性質とトリプレット整合性を活用し、負荷が一致する集合上でのみ増加するように保証することで、双対妥当性を維持する。
  • 潜在関数の議論を用いて、プライマルコストの増加が双対利得に対して有界であることを示し、双対目的関数がプライマルコストの半分以上であることを証明する。
  • 後向きにマージするステップを導入することで、最終的な森林が妥当であり続け、アルゴリズム実行中における双対解の妥当性が保たれるようにする。

実験結果

リサーチクエスチョン

  • RQ1線形計画法の双対性を用いて、局所的構造的議論に代わるMAFの2近似アルゴリズムを開発することは可能か?
  • RQ2局所的4葉構成に焦点を当てるのでなく、最小不一致部分木を特定し操作するグローバルなアルゴリズムを設計することは可能か?
  • RQ3後処理を組み合わせた双対性に基づくアルゴリズムの性能は、従来の近似アルゴリズムと比べて実際の応用でどのように差がつくか?
  • RQ4双対解は近似比の証明にとどまらず、近似的に最適な一致森の構築を指針とするのにも利用可能か?
  • RQ5特に最適解が既知のインスタンスに対して、本アルゴリズムの経験的性能(近似比と実行時間)はいかがなものか?

主な発見

  • 提案されたアルゴリズムは、最大一致森問題に対して2近似比を達成し、以前の最良の2.5を改善した。
  • 本アルゴリズムの解析は線形計画法の双対性に基づくものであり、理論的根拠としてこの手法を用いた最初のMAF近似アルゴリズムである。
  • 2000個の葉をもつランダムに生成されたインスタンスを1000回のテストで用いた際、44%の実行で双対解が最適双対値に正確に一致した。
  • 37%の実行で双対解が最適双対値から1単位以内にあり、強力な双対下界であることが示された。
  • 観測された平均近似比は約1.92であり、単純なグリーディな後処理ステップにより、1.28未満にまで低下した。
  • 本アルゴリズムは多項式時間で実装可能であるが、最小不一致部分木を特定するコストが高いため、正確な時間計算量はまだ不明である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。