[論文レビュー] Fast Approximate Counting of Cycles
本稿では、Exact-k-Clique仮説の下でk ≥ 3の場合に条件付き最適な実行時間を達成する、出力に依存する新しいアルゴリズムを提示する。k未満のℓ-クリーク数(∆ℓ)をパラメータとして用いることで、ω = 2のとき、O~(min{m^{1/(k−2)} t^{1−2/(k(k−2))}, n^{2/(k−1)} t^{1−2/(k(k−1))}})の実行時間を達成し、三角形リスト作成の先行研究を一般化するとともに、19年前の4-および5-クリーク検出の境界を改善する。
We consider the problem of approximate counting of triangles and longer fixed length cycles in directed graphs. For triangles, Tětek [ICALP'22] gave an algorithm that returns a (1±ε)-approximation in Õ(n^ω/t^{ω-2}) time, where t is the unknown number of triangles in the given n node graph and ω < 2.372 is the matrix multiplication exponent. We obtain an improved algorithm whose running time is, within polylogarithmic factors the same as that for multiplying an n× n/t matrix by an n/t × n matrix. We then extend our framework to obtain the first nontrivial (1± ε)-approximation algorithms for the number of h-cycles in a graph, for any constant h ≥ 3. Our running time is Õ(MM(n,n/t^{1/(h-2)},n)), the time to multiply n × n/(t^{1/(h-2)}) by n/(t^{1/(h-2)) × n matrices. Finally, we show that under popular fine-grained hypotheses, this running time is optimal.
研究の動機と目的
- 出力に依存するk-クリークリスト作成アルゴリズムを設計し、出力内のk-クリーク数に応じて効率的にスケーリングすること。
- nとmに依存する既存のクリークリスト作成フレームワークを、k未満のℓ-クリーク数(∆ℓ)をパラメータとして組み込むことで、それらを一般化すること。
- すべての定数k ≥ 3に対して、Exact-k-Clique仮説の下でk-クリークリスト作成の条件付き最適な実行時間を達成すること。
- 現代の行列乗算の境界を活用することで、19年前の4-および5-クリーク検出の実行時間境界を改善すること。
提案手法
- 1 ≤ ℓ < kのℓ-クリーク数(∆ℓ)をパラメータとして用いる一般化されたk-クリークリスト作成フレームワークを導入し、より細かい粒度の実行時間解析を可能にする。
- 密度の高い部分グラフにおける次数に基づいて頂点を分割する再帰的分解戦略を採用し、軽量エッジおよび高密度エッジとクリークに焦点を当てる。
- 特に(4,2)-および(5,1)-Clique-Listingサブルーチンで、高速な行列乗算(MM)をサブルーチンとして用いる。
- H"olderの不等式と組合せ論的境界を用いて、再帰的レベル間での次数の合計とクリーク数を制御する。
- t(出力クリーク数)の異なる範囲に最適化された2つの代替アルゴリズム(アルゴリズムIおよびII)を6-クリークリスト作成のために設計する。
- 行列乗算の効率を活用するため、(2,1)-Clique-Listingではなく(4,2)-Clique-Listingなどのより小さなクリークリスト作成サブ問題に問題を還元する。
実験結果
リサーチクエスチョン
- RQ1k ≥ 3のすべてのkに対して、三角形の既知の最適結果を拡張し、条件付き最適な実行時間を達成する出力に依存するk-クリークリスト作成アルゴリズムを設計できるか?
- RQ2nとmだけでなく、k未満のℓ-クリーク数∆ℓ(ℓ < k)をパラメータとして用いることで、k-クリークリスト作成の実行時間をどのようにパラメータ化できるか?
- RQ3現代の行列乗算技術を活用することで、19年前の4-および5-クリーク検出の実行時間境界を改善することは可能か?
- RQ4Exact-k-Clique仮説のような標準的な細粒度複雑性仮定の下で、k-クリークリスト作成の最もタイトな実行時間は何か?
- RQ5クリーク密度および次数の閾値に基づく再帰的分解は、出力サイズtの異なる状況において最適で適応的なアルゴリズムを導くことができるか?
主な発見
- ω = 2でtが十分に大きいとき、提案されたアルゴリズムはExact-k-Clique仮説の下で条件付き最適なO~(min{m^{1/(k−2)} t^{1−2/(k(k−2))}, n^{2/(k−1)} t^{1−2/(k(k−1))}})の実行時間を達成する。
- 4-クリークおよび5-クリーク検出において、現在の行列乗算境界の下で、それぞれO(m^{1.66})およびO(m^{2.06})の実行時間を達成し、EisenbrandとGrandoni(2004年)の以前のO(m^{2})およびO(m^{2.2})の境界を改善する。
- 任意のℓ < kに対して、実行時間はO~(∆^{2ℓ(k−ℓ)/ℓ}_ℓ · ∆^{1−2/(k(k−ℓ))}_k)と表され、Exact-k-Clique仮説の下ですべてのℓ ∈ [1, k−1]に対して最適である。
- 2つの異なるアルゴリズムが(6,1)-Clique-Listingのために提示されている:1つはO~(n^4 + n^{5/2}t^{1/2} + n^{2/5}t^{14/15})、もう1つはO~(n^4 + n^{15/7}t^{4/7} + n^{37/21}t^{2/3} + n^{29/25}t^{4/5} + n^{9/10}t^{17/20})であり、それぞれtの異なる範囲で最適である。
- Bj"orklundたちは2014年に三角形リスト作成についてO~(n^2 + nt^{2/3})の結果を得たが、本フレームワークはその結果をk ≥ 3に一般化している。
- 再帰的ステップで(2,1)-Clique-Listingの代わりに(4,2)-Clique-Listingを用いることで、行列乗算の利点を活かし、より優れた性能を達成している。これは、より高いレベルのクリーク分解の利点を示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。