Skip to main content
QUICK REVIEW

[論文レビュー] Wilcoxon Rank-Based Tests for Clustered Data with R Package clusrank

Yujing Jiang, Xin He|arXiv (Cornell University)|Jun 11, 2017
Data-Driven Disease Surveillance参考文献 5被引用数 35
ひとこと要約

この論文は、クラスタリングされたデータに対する現代的なランクベースのノンパラメトリック検定を実装するRパッケージclustRankを紹介している。主に、2つのアプローチ、すなわちRGL法(Rosner et al., 2003)とDS法(Datta & Satten, 2008)を用いて、ウィルコクソンの順位和検定および符号順位検定を実行する。このパッケージは、正確なパーミュテーション検定を備えた統合的で使いやすいインターフェースを提供し、情報的クラスタサイズや交換不能な相関構造を含むさまざまなクラスタ構造をサポートする。

ABSTRACT

Wilcoxon Rank-based tests are distribution-free alternatives to the popular two-sample and paired t-tests. For independent data, they are available in several R packages such as stats and coin. For clustered data, in spite of the recent methodological developments, there did not exist an R package that makes them available at one place. We present a package clusrank where the latest developments are implemented and wrapped under a unified user-friendly interface. With different methods dispatched based on the inputs, this package offers great flexibility in rank-based tests for various clustered data. Exact tests based on permutations are also provided for some methods. Details of the major schools of different methods are briefly reviewed. Usages of the package clusrank are illustrated with simulated data as well as a real dataset from an ophthalmological study. The package also enables convenient comparison between selected methods under settings that have not been studied before and the results are discussed.

研究の動機と目的

  • クラスタリングされたデータに対する現代的なランクベースの検定を統合的に実装する、中央集権的で使いやすいRパッケージの不足を解消すること。
  • クラスタリングされたデータにおけるウィルコクソン型検定に関する最近の手法的進展を、統合的かつアクセス可能なインターフェースで統合すること。
  • さまざまな相関構造およびクラスタサイズの仮定下で、2標本順位和検定および対応のある符号順位検定をサポートすること。
  • 小標本における第1種過誤の制御を改善するために、正確なパーミュテーションに基づく推論を提供すること。
  • 従来の研究では検討されていなかった新しいデータ設定下で、異なる手法の比較的評価を可能にすること。

提案手法

  • 交換可能性と共通するクラスタ内相関の下で、ウィルコクソン順位和統計量の分散を調整するRGL法(Rosner et al., 2003)を実装する。
  • クラスタ内リサンプリングを用いて情報的クラスタサイズと非交換可能な依存構造を扱うDS法(Datta & Satten, 2008)を統合する。
  • 漸近的およびパーミュテーションに基づく推論をサポートし、モンテカルロリサンプリングを用いて正確なp値を計算する。
  • 入力データ構造とユーザーの指定に基づいて、順位和検定と符号順位検定の間でディスpatchする統一関数インターフェースを採用する。
  • シミュレーションおよび実データ評価において、不均等なクラスタサイズ、層別化、AR1相関構造を処理する。
  • ランダムなクラスタサイズと非交換可能な相関を含む設定下で、複数の手法を同一のシミュレーション条件下で比較可能にする。

実験結果

リサーチクエスチョン

  • RQ1AR1相関構造を含むさまざまなクラスタ内相関構造下で、RGL法とDS法の経験的第1種過誤率はどのように振る舞うか?
  • RQ2情報的クラスタサイズが、クラスタリングされたデータに対するランクベース検定の性能に及ぼす影響は何か?
  • RQ3クラスタサイズの増加およびクラスタ内相関の低下に伴い、RGL法とDS法のパワー特性はどのように変化するか?
  • RQ4cluskrank内での正確なパーミュテーション検定は、小標本および複雑な相関構造下でも名目水準を維持できるか?
  • RQ5標準的な仮定が適用されない、ランダムなクラスタサイズと非交換可能な依存構造を含む設定下で、2つの手法はどのように比較されるか?

主な発見

  • AR1相関構造下では交換可能性の仮定が破られるが、RGL法およびDS法の両方の経験的第1種過誤率は、すべてのシミュレーション設定で名目水準0.05に近く保たれた。
  • クラスタサイズが大きくなるほどクラスタ内相関が低下するにつれて、パワーが向上し、両手法は同等の条件下で類似した性能を示した。
  • DS法は、クラスタサイズが対応する差の分布に影響を与える情報的クラスタサイズ下でも、妥当な第1種過誤制御を維持した。
  • RGL法は、固定された平均クラスタサイズと比較して、完全にランダムなクラスタサイズ下ではわずかにパワーが低下したが、サイズ制御に関しては依然として頑健であった。
  • パーミュテーションに基づく推論は、特に小標本設定下で正確なp値を提供し、経験的サイズが名目水準に非常に近づいた。
  • 実際の眼科的データでは、cluskrankパッケージは治療群間の視力評価に有意差を検出でき、実用的有用性を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。