Skip to main content
QUICK REVIEW

[論文レビュー] Orthogonal Hierarchical Decomposition for Structure-Aware Table Understanding with Large Language Models

Bin Cao, Huixian Lu|arXiv (Cornell University)|Feb 2, 2026
Data Quality and Management被引用数 0
ひとこと要約

本論文は、Orthogonal Hierarchical Decomposition(OHD)フレームワークとOrthogonal Tree Induction(OTI)、デュアルパスウェイ連合プロトコルを提案し、LLMによる構造認識型テーブル理解を実現。AITQAおよびHiTabで最先端の結果を達成。

ABSTRACT

Complex tables with multi-level headers, merged cells and heterogeneous layouts pose persistent challenges for LLMs in both understanding and reasoning. Existing approaches typically rely on table linearization or normalized grid modeling. However, these representations struggle to explicitly capture hierarchical structures and cross-dimensional dependencies, which can lead to misalignment between structural semantics and textual representations for non-standard tables. To address this issue, we propose an Orthogonal Hierarchical Decomposition (OHD) framework that constructs structure-preserving input representations of complex tables for LLMs. OHD introduces an Orthogonal Tree Induction (OTI) method based on spatial--semantic co-constraints, which decomposes irregular tables into a column tree and a row tree to capture vertical and horizontal hierarchical dependencies, respectively. Building on this representation, we design a dual-pathway association protocol to symmetrically reconstruct semantic lineage of each cell, and incorporate an LLM as a semantic arbitrator to align multi-level semantic information. We evaluate OHD framework on two complex table question answering benchmarks, AITQA and HiTab. Experimental results show that OHD consistently outperforms existing representation paradigms across multiple evaluation metrics.

研究の動機と目的

  • 複数レベルのヘッダ、結合セル、非規則なレイアウトを持つ複雑なテーブルの理解という課題に対処する。
  • テーブル構造を独立した列階層と行階層にデカップリングして階層的意味論を保持する。
  • デュアルパスウェイ連合とLLMベースの仲裁を通じてテーブルセルの意味系譜を再構築する。
  • ベンチマークデータセット(AITQA、HiTab)における非標準的なレイアウトへの堅牢性を示す。
  • 意味述語、デュアルパスウェイ、仲裁の寄与を検証するアブレーションを示す。

提案手法

  • 意味空間的協調性に guided された列ツリーと行ツリーへテーブルを因子分解するOrthogonal Hierarchical Decomposition(OHD)を導入する。
  • 二段階のOrthogonal Tree Induction(OTI)を開発:ヘッダ骨格推定と適応データアンカーリングを用い、意味述語と空間的制約を活用してツリーを構築する。
  • デュアルパスウェイ連合再構築を適用して、データセルごとに一次軸と直交軸から構造化コンテキストを構築し、境界認識を行う。
  • デュアル入力から最終の構造認識表現をLLMが洗練・統合するマルチパスウェイ意味仲裁を使用する。
  • LLMへゼロショット prompting で最終の構造認識テキスト代替表現を提供し、論理的一貫性、完全性、可読性を最適化する。
Figure 1 : Illustration of table complexity and structural diversity. The examples encompass several challenging non-standard layouts. (a) : Tables featuring multi-level nested column headers and merged data cells; (b) : Tables characterized by deep hierarchical row header structures; (c) : Complex
Figure 1 : Illustration of table complexity and structural diversity. The examples encompass several challenging non-standard layouts. (a) : Tables featuring multi-level nested column headers and merged data cells; (b) : Tables characterized by deep hierarchical row header structures; (c) : Complex

実験結果

リサーチクエスチョン

  • RQ1階層ヘッダと非規則レイアウトを持つ複雑なテーブルを、意味を保持した正交的構造表現に分解できるか。
  • RQ2正交的な(行/列)階層とデュアルパスウェイ連合が、非標準テーブルに対するLLM推論を改善できるか。
  • RQ3意味述語とLLMベース仲裁がテーブルQAの性能に与える影響は何か。
  • RQ4OHDはAITQAおよびHiTabのような難易度の高いベンチマークで、線形化やスキーマベースのベースラインと比較してどう性能を示すか。

主な発見

手法AITQA EMAITQA LLM Eval Avg.HiTab EMHiTab LLM Eval Avg.HiTab Subset EMHiTab Subset LLM Eval Avg.
Chain-of-Table (Qwen2-72b)49.3262.0244.2662.9250.2567.06
E5 (Qwen2-72b)56.4058.9743.5647.9350.1358.78
St-Raptor (Qwen2-72b)60.5571.0353.8360.7155.7361.93
Ours (Qwen2-72b)69.3489.1260.0767.1564.7470.66
TableLLaMA-7B68.3585.6164.7166.9966.7571.56
Ours (TableLLaMA-7B)73.8387.9563.6266.2468.3774.23
  • OHDはAITQAおよびHiTabでEMおよびLLMベースの評価のいずれにおいても、ベースラインを上回る優れた性能を示す。
  • デュアル正交ツリー(列と行)を用いることで、柔軟なヘッダや非標準レイアウトへのロバスト性が大幅に向上する。
  • 意味述語とLLMベース仲裁は重要で、これらを除くと性能が著しく低下する。
  • マークダウン/HTMLによる系譜表現は、複雑なテーブルに対してOHDのデュアルパスウェイ トポロジーよりも効果が劣る。
  • アブレーションにより、全体のOHDがバックボーン(Qwen2-72BおよびTableLLaMA-7B)を問わず最良の結果を示すことがわかった。
Figure 2 : Workflow of the OHD framework. The process begins with a Categorized Table Input where each cell is pre-identified as a Row Header, Column Header, or Data unit. The pipeline then proceeds in three stages: (1) Orthogonal Tree Induction (OTI) to decompose the table into independent row and
Figure 2 : Workflow of the OHD framework. The process begins with a Categorized Table Input where each cell is pre-identified as a Row Header, Column Header, or Data unit. The pipeline then proceeds in three stages: (1) Orthogonal Tree Induction (OTI) to decompose the table into independent row and

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。