[論文レビュー] Cross-Species Antimicrobial Resistance Prediction from Genomic Foundation Models
論文はゲノム基盤モデルを用いた種間AMR予測を研究し、Layer 10の埋め込みを抽出しMiniRocketを用いた局所パターンの集約が、カセット媒介性耐性で主に転移を可能にすること、耐性機構に依存して性能が変化することを示す。
Cross-species antimicrobial resistance (AMR) prediction is fundamentally an out-of-distribution (OOD) generalization problem: models trained on one set of bacterial taxa must transfer to phylogenetically distinct genomes that may rely on different resistance mechanisms. Across species, resistance arises from a heterogeneous mixture of localized, horizontally transferred gene cassettes and diffuse species-specific genomic backgrounds, making successful transfer inherently mechanism-dependent. Using a strict species holdout protocol, we first establish an interpretable k-mer baseline with Kover and show that strong within-species performance collapses under true cross-species evaluation. This motivates representation-level approaches that preserve transferable biological signals rather than amplify phylogenetic shortcuts. We investigate genomic foundation model embeddings derived from Evo-1-8k-base and introduce diagnostics for layer selection based on activation scale, isotropy, effective rank, and cross-seed stability under native bfloat16 inference. These analyses identify a stability boundary in deeper layers and reveal that embeddings extracted near this boundary provide more robust representations for downstream prediction. To preserve localized resistance signals, we treat per-window embeddings as an ordered multivariate signal and apply MiniRocket to summarize multi-scale local activation patterns instead of relying on global pooling. Our results show that aggregation strategy plays a central role in cross-species AMR prediction and that preserving local activation patterns substantially improves generalization when resistance mechanisms are localized.
研究の動機と目的
- 分布シフト下でゲノム基盤モデルを用いた種間AMR予測をどのように達成するかを検討する。
- 転移可能な耐性信号を保持するレイヤーと集約戦略を特定する。
- 耐性機構タイプが種間一般化に与える影響を理解する。
- AMRモデルの再現性があり漏洩を防ぐ評価フレームワークを提供する。
提案手法
- 診断に基づいてLayer 10から抽出する Evoゲノム基盤モデル埋め込みを使用し、安定性と等方性の観点から層を選定する。
- 窓ごとの埋め込みを多変量信号として扱い、局所パターンの集約にMiniRocketを適用する。
- 厳密な種保持分割を用いてKoverベースラインと比較し、真の種間一般化を評価する。
- 頑健な評価を可能にするため、5 partition・3回複の多種データセットをフィルタリング・整理する。
- カセット媒介性 vs 染色体性耐性機構を横断して、集約戦略(MiniRocket vs Global Pooling)を比較する。

実験結果
リサーチクエスチョン
- RQ1厳密な種保持で未見種へゲノム基盤モデル埋め込みは転移可能か。
- RQ2どの層と集約戦略が種間で転移可能な耐性信号を最もよく保持するか。
- RQ3優勢な耐性機構(カセット mediated vs 染色体性)が種間一般化にどのように影響するか。
- RQ4種間AMR予測におけるモデル解釈性と近傍監査の役割は何か。
主な発見
- Koverは種内性能は強力だが、種保持を跨いだ6つの抗生物質で種間の大幅な劣化を示す。
- Layer 10の埋め込みは最も深く同時に安定した抽出点であり、Layer 11は不安定性を示す。レイヤー診断はこの安定境界を特定する。
- MiniRocketとk-NNは、van_outside分割でアンピシリンに対して最も高い種間MCC(0.753)を一般的に達成し、k-NN with Global Poolingを上回る。
- アンピシリンではカセット媒介性耐性で種間利益が大きくなる一方、染色体/拡散性耐性は移行が難しい。
- 独立したtest_outsideセットでは、Global Poolingを線形または木ベースの分類器と組み合わせると、MiniRocketと同等かそれを上回ることが多い。耐性機構次第。
- 耐性信号が局在化して集約時にも保持されると、種間予測が改善され、同種性能は手法間でほぼ同等のまま推移する。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。