Skip to main content
QUICK REVIEW

[論文レビュー] Optimal Stopping Rules for Sequential Hypothesis Testing

Akshay Balsubramani|arXiv (Cornell University)|May 12, 2014
Markov Chains and Monte Carlo Methods参考文献 14被引用数 21
ひとこと要約

本稿は、平均化された上 martingale と停止時刻を用いた新規の指数モーメント法により、時間一様な制御への自己反復対数法則(LIL)の一般化を実現する、鋭い有限時刻集中不等式を確立する。主な貢献は、最適定数を有する非漸近的で時間一様なLIL不等式であり、一致する反集中不等式によって裏付けられ、Hoeffding や Bernstein の古典的集中不等式の有限時刻版として、逐次仮説検定や逐次解析におけるより優れた有限標本保証を提供する。

ABSTRACT

Suppose that we are given sample access to an unknown distribution p over n elements and an explicit distribution q over the same n elements. We would like to reject the null hypothesis "p=q" after seeing as few samples as possible, when p =/= q, while we never want to reject the null, when p=q. Well-known results show that Theta(sqrt{n}/epsilon^2) samples are necessary and sufficient for distinguishing whether p equals q versus p is epsilon-far from q in total variation distance. However, this requires the distinguishing radius epsilon to be fixed prior to deciding how many samples to request. Our goal is instead to design sequential hypothesis testers, i.e. online algorithms that request i.i.d. samples from p and stop as soon as they can confidently reject the hypothesis p=q, without being given a lower bound on the distance between p and q, when p =/= q. In particular, we want to minimize the number of samples requested by our tests as a function of the distance between p and q, and if p=q we want the algorithm, with high probability, to never reject the null. Our work is motivated by and addresses the practical challenge of sequential A/B testing in Statistics. We show that, when n=2, any sequential hypothesis test must see Omega(1/{d_{tv}(p,q)^2} log log 1/{d_{tv}(p,q)}) samples, with high (constant) probability, before it rejects p=q, where d_{tv}(p,q) is the - unknown to the tester - total variation distance between p and q. We match the dependence of this lower bound on d_{tv}(p,q) by proposing a sequential tester that rejects p=q from at most O({\sqrt{n}}/{d_{tv}(p,q)^2}log log 1/{d_{tv}(p,q)}) samples with high (constant) probability. The Omega(sqrt{n}) dependence on the support size n is also known to be necessary. We similarly provide two-sample sequential hypothesis testers, when sample access is given to both p and q, and discuss applications to sequential A/B testing.

研究の動機と目的

  • 漸近的自己反復対数法則(LIL)と逐次確率過程における有限時刻集中の間のギャップを埋めること。
  • 逐次仮説検定や逐次解析に適用可能な、小さな定数の範囲内で最適な時間一様 martingale 集中不等式を開発すること。
  • Hoeffding や Bernstein の古典的不等式を、時間 t と信頼水準 δ の間の明確なトレードオフを伴う、有限時刻で時間一様に成り立つ形に統一・一般化すること。
  • 中心極限定理の領域(O(√t log(1/δ))) と LIL の領域(O(√t log log t)) を同時に捉える、1 つの鋭い不等式として非漸近的 LIL を確立すること。
  • 一致する反集中不等式による境界の最適性の証明により、時間 t と誤り確率 δ の間のトレードオフがタイトであることを示すこと。

提案手法

  • 連続的なパrameter λ の族にわたる適切に構築された平均化された上 martingale を用いた指数モーメント法により、martingale のモーメント生成関数を制御する。
  • 停止時刻を用いて解析を局所化し、すべての有限時刻 t における一様な境界を導出する。初期閾値 τ₀ は δ に依存する時刻依存的関数である。
  • λ ∈ (−1/exp_v(2), 1/exp_v(2)) ⋯ {0} の確率分布族 P^v_λ を導入し、平均化プロセスを精緻化することで、√t log log t 項の主要定数を低減する。
  • Gaussian に似た関数の P^v_λ における積分の下界を精密化し、粗い境界をより正確な漸近展開に置き換えることで、最適定数を達成する。
  • 集中の逆転を用いて反集中不等式を証明し、境界が定数因子より大きくは改善できないことを示す。
  • 有界差分 martingale(Hoeffding 型)および部分指数型 martingale(Bernstein 型)の両方について、時間一様な誤り確率 δ を有する一様な境界を導出する。

実験結果

リサーチクエスチョン

  • RQ1自己反復対数法則(LIL)を、martingale の有限時刻で時間一様な集中不等式へ拡張できるか?
  • RQ2時間一様 martingale 集中における時間 t と信頼水準 δ の最適なトレードオフは何か? そして、それを明確に特徴づけられるか?
  • RQ3提案された有限時刻の境界が、反集中挙動と一致する意味で最適であるか?
  • RQ4精密な平均化技術を用いて、√t log log t 項の主要定数を √6 から漸近的に最適な √2 に改善できるか?
  • RQ5Hoeffding や Bernstein の古典的集中不等式を、鋭い定数を伴い、すべての有限時刻で一様に成り立つ形に一般化できるか?

主な発見

  • 本稿は、Rademacher ランダムウォークに対して鋭い時間一様集中不等式を確立する:確率 1−δ 以上で、すべての t ≥ C log(4/δ) に対して、|Mt| ≤ √(3t (2 log log(5t/(2|Mt|)) + log(2/δ))) が成り立つ。ただし C=173 である。
  • 境界は有限時刻のトレードオフを示す:t ≲ exp(1/δ) の範囲では、主な項が O(√(t log(1/δ))) となり、中心極限定理型の境界に類似する。
  • 十分に大きな t と固定された δ > 0 に対して、境界は O(√(t log log t)) に収束し、漸近的 LIL 速度と一致する。この速度は改善不可能である。
  • 一致する反集中不等式が証明され、境界が定数因子より大きくは改善できないことが示され、最適性が裏付けられる。
  • v ≥ 2 に対して、P^v_λ の精密な族を用いることで、√t log log t 項の主要定数は √6 から √2 に低減され、漸近的に最適性が達成される。
  • 本手法は、有界差分型および部分指数型 martingale を含む広範な martingale のクラスに一般化可能であり、最適定数を有する時間一様 Hoeffding 型および Bernstein 型の境界を導出する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。