[論文レビュー] Fast Preprocessing for Optimal Orthogonal Range Reporting and Range Successor with Applications to Text Indexing
本稿では、2次元直交範囲報告、範囲後続、およびソート済み範囲報告のための最初のデータ構造を提示する。これらは、ワードRAMモデル下でO(n√lg n)の時間で構築可能であり、クエリ時間は最適なO(lg lg n + k)またはO(lg lg n)を達成する。この手法は、ワイルドレスタイプの木と階層的分解、および三辺および直交報告のための特別な構造を組み合わせることで、幾何的およびテキストインデックス応用における高速な事前処理を可能にする。
Under the word RAM model, we design three data structures that can be constructed in $O(n\sqrt{\lg n})$ time over $n$ points in an $n imes n$ grid. The first data structure is an $O(n\lg^ε n)$-word structure supporting orthogonal range reporting in $O(\lg\lg n+k)$ time, where $k$ denotes output size and $ε$ is an arbitrarily small constant. The second is an $O(n\lg\lg n)$-word structure supporting orthogonal range successor in $O(\lg\lg n)$ time, while the third is an $O(n\lg^ε n)$-word structure supporting sorted range reporting in $O(\lg\lg n+k)$ time. The query times of these data structures are optimal when the space costs must be within $O(n\ polylog\ n)$ words. Their exact space bounds match those of the best known results achieving the same query times, and the $O(n\sqrt{\lg n})$ construction time beats the previous bounds on preprocessing. Previously, among 2d range search structures, only the orthogonal range counting structure of Chan and Pǎtraşcu (SODA 2010) and the linear space, $O(\lg^ε n)$ query time structure for orthogonal range successor by Belazzougui and Puglisi (SODA 2016) can be built in the same $O(n\sqrt{\lg n})$ time. Hence our work is the first that achieve the same preprocessing time for optimal orthogonal range reporting and range successor. We also apply our results to improve the construction time of text indexes.
研究の動機と目的
- 2次元直交範囲報告、範囲後続、およびソート済み範囲報告のためのデータ構造を設計し、最適なクエリ時間を達成すること。
- これらの構造の構築時間をO(n√lg n)にすること。これは、類似問題における既知の最速の事前処理時間と一致する。
- 幾何データ構造における最適なクエリ性能と高速な事前処理の間のギャップを埋めること。
- 結果を応用して、特に圧縮データ構造におけるテキストインデックスの構築時間を改善すること。
提案手法
- ボール継承を用いた2√lg n-aryワイルドレスタイプの木を構築し、点列における効率的なランクおよびセレクト操作をサポートする。
- ワイルドレスタイプの木の各内部ノードにおいて、三辺ソート済み報告のためのTSds(u)と直交ソート済み報告のためのRSds(u)の2つの補助構造を維持する。
- ワイルドレスタイプの木を用いて、クエリ範囲を左、中央、右の3つの部分に分割し、分割統治によるクエリ処理を可能にする。
- 左および右の部分木に対してはTSds(u)を用いて、サブレーンジ内でのy-順序での点の報告を行い、中央部分にはRSds(u)を用いて全範囲を処理する。
- 3つのソート済み出力をO(occ)時間で3路マージし、報告された点の数をoccとする。
- ワイルドレスタイプの木の構造と階層的分解を活用して、すべてのノードにおける合計事前処理時間をO(n√lg n)に保証する。
実験結果
リサーチクエスチョン
- RQ12次元直交範囲報告において、O(lg lg n + k)のクエリ時間で最適な性能を達成しつつ、O(n√lg n)の事前処理時間を実現できるか?
- RQ2O(lg lg n)のクエリ時間で直交範囲後続をサポートし、O(n√lg n)の事前処理時間を達成することは可能か?
- RQ3O(lg lg n + k)のクエリ時間とO(n√lg n)の事前処理時間を備えたソート済み範囲報告のためのデータ構造を設計できるか?
- RQ4これらの高速な事前処理構造をテキストインデックスの構築改善に応用できるか?
主な発見
- 本稿では、O(n lgϵ n)-wordのデータ構造を提示し、直交範囲報告をO(lg lg n + k)時間で行い、O(n√lg n)時間で構築可能である。
- 直交範囲後続のためのO(n lg lg n)-word構造を設計し、O(lg lg n)のクエリ時間とO(n√lg n)の事前処理時間を達成した。
- ソート済み範囲報告のためのO(n lg1+ϵ n)-word構造を提示し、O(lg lg n + occ)のクエリ時間とO(n√lg n)の事前処理時間を達成した。
- O(n√lg n)の構築時間は、これらの問題における最適なクエリ時間の境界に一致する最初のものである。
- 空間の上限は、同じクエリ時間に対して既知の最良の結果と一致しており、この解決策は空間的に最適である。
- 結果は、特にワイルドレスタイプに基づく圧縮インデックスにおけるテキストインデックスの構築を改善するために応用された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。