Skip to main content
QUICK REVIEW

[論文レビュー] Space-Efficient Approximate Spherical Range Counting in High Dimensions

Andreas Kalavas, Ioannis Psarros|arXiv (Cornell University)|Mar 12, 2026
Computational Geometry and Mesh Generation被引用数 0
ひとこと要約

論文は高次元空間における近線形空間の近似球面レンジカウントのデータ構造を提案し,ambiguity-zone 点数 t_q がサブ線形のときクエリ時間がサブ線形になる。分割木,ε- stabbing の概念,および学習に触発された前処理の変種を組み合わせている。

ABSTRACT

We study the following range searching problem in high-dimensional Euclidean spaces: given a finite set $P\subset \mathbb{R}^d$, where each $p\in P$ is assigned a weight $w_p$, and radius $r>0$, we need to preprocess $P$ into a data structure such that when a new query point $q\in \mathbb{R}^d$ arrives, the data structure reports the cumulative weight of points of $P$ within Euclidean distance $r$ from $q$. Solving the problem exactly seems to require space usage that is exponential to the dimension, a phenomenon known as the curse of dimensionality. Thus, we focus on approximate solutions where points up to $(1+\varepsilon)r$ away from $q$ may be taken into account, where $\varepsilon>0$ is an input parameter known during preprocessing. We build a data structure with near-linear space usage, and query time in $n^{1-Θ(\varepsilon^4/\log(1/\varepsilon))}+t_q^{\varrho}\cdot n^{1-\varrho}$, for some $\varrho=Θ(\varepsilon^2)$, where $t_q$ is the number of points of $P$ in the ambiguity zone, i.e., at distance between $r$ and $(1+\varepsilon)r$ from the query $q$. To the best of our knowledge, this is the first data structure with efficient space usage (subquadratic or near-linear for any $\varepsilon>0$) and query time that remains sublinear for any sublinear $t_q$. We supplement our worst-case bounds with a query-driven preprocessing algorithm to build data structures that are well-adapted to the query distribution.

研究の動機と目的

  • 高次元での呪いの次元性の下で近似球面レンジカウント問題を動機づけ,定義する。
  • (1+ε)r 半径内で近似的に回答できる近線形空間のデータ構造を開発する。
  • t_q の数に依存してサブ線形のクエリ時間を実現する。
  • 最悪ケース保証とクエリ分布に適応したデータ駆動型前処理の変種を提供する。

提案手法

  • 高次元の近似レンジカウントのために partition tree を適用する。
  • より強力な ε-stabbing の概念を導入する:クエリ ε-stabs する集合は、クエリからの距離が ≤ r の点と ≥ (1+ε)r の点が存在する場合である。
  • 軽量エッジと MWU(Multiplicative Weight Update)を用いて ε-stabbing数が低いスパニングツリーを構築し、効率的な partition tree を実現する。
  • L SH を介したヘミング距離へのランダム埋め込みを適用して近似刺さりクエリを実装し、partition tree の効率的な走査を支援する。
  • クエリ駆動型の前処理変種を学習理論に触発して導入し、構造をクエリ分布に合わせる。
  • Johnson-Lindenstrauss 埋め込みと末端埋め込みを活用して次元数を管理しつつ、距離を必要に応じて保持する。

実験結果

リサーチクエスチョン

  • RQ1高次元で近線形空間の近似球面レンジカウントは解けるのか。
  • RQ2ambiguity zone の点数 t_q がサブ線形なら、n に対してクエリ時間をサブ線形に保てるのか。
  • RQ3効率的な partition tree を可能にする構造的性質(低 ε-stabbing 数など)は何か。
  • RQ4データ駆動前処理は実務的なクエリ分布に対して平均ケース性能を改善するのか。

主な発見

  • ランダム化データ構造は near-linear space を達成する(上付き文字を含む表記: O(n) )で前処理時間は O(dn) + n^{poly(1/ε)}、t_q がサブ線形の場合にサブ線形のクエリ時間を実現。
  • 簡略化された版ではクエリ時間は n^{1 - Θ(ε^{4}/log(1/ε))} + t_q^{Θ(ε^{2})} · n^{1 - Θ(ε^{2})} となり、t_q が小さい場合に以前の空間効率を改善しつつサブ線形の性能を維持。
  • サブ線形 ε-stabbing 数を持つスパニングツリーが存在し、多項式時間で計算可能で、効率的な partition tree を支える。
  • データ駆動型(クエリ分布認識)前処理アルゴリズムはクエリ分布に対してほぼ最適な期待訪問数をもたらし、実務的には前処理の複雑さを n^{O(1)} に削減。
  • 本アプローチは partition tree,ε-stabbing,MWU に基づくスパニングツリー,ランダム埋め込みを統合し、t_q がサブ線形である場合のサブ線形クエリ時間を達成する初めての試み(サブ二次/ near-linear 空間とサブ線形クエリ時間)である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。