Back to Search Start Over

Post hoc confidence bounds on false positives using reference families

Authors :
Pierre Neuvial
Gilles Blanchard
Etienne Roquain
Institut für Mathematik [Potsdam]
Universität Potsdam
Laboratoire de Mathématiques d'Orsay (LMO)
Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
Understanding the Shape of Data (DATASHAPE)
Inria Sophia Antipolis - Méditerranée (CRISAM)
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Inria Saclay - Ile de France
Institut National de Recherche en Informatique et en Automatique (Inria)
Institut de Mathématiques de Toulouse UMR5219 (IMT)
Institut National des Sciences Appliquées - Toulouse (INSA Toulouse)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Toulouse 1 Capitole (UT1)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)
Laboratoire de Mathématiques et Modélisation d'Evry (LaMME)
Université d'Évry-Val-d'Essonne (UEVE)-ENSIIE-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)
Laboratoire de Probabilités, Statistiques et Modélisations (LPSM (UMR_8001))
Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)-Université de Paris (UP)
ANR-16-CE40-0019,SansSouci,Approches post hoc pour les tests multiples à grande échelle(2016)
ANR-17-CE40-0001,BASICS,Bayésien non-paramétrique, quantification de l'incertitude et structures aléatoires(2017)
Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Toulouse 1 Capitole (UT1)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3)
Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)
Institut National de la Recherche Agronomique (INRA)-Université d'Évry-Val-d'Essonne (UEVE)-ENSIIE-Centre National de la Recherche Scientifique (CNRS)
Laboratoire de Probabilités et Modèles Aléatoires (LPMA)
Université Pierre et Marie Curie - Paris 6 (UPMC)-Université Paris Diderot - Paris 7 (UPD7)-Centre National de la Recherche Scientifique (CNRS)
ANR-16-CE40-0019,SansSouci,Post hoc approaches for large-scale multiple testing
University of Potsdam = Universität Potsdam
Université Toulouse Capitole (UT Capitole)
Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse)
Institut National des Sciences Appliquées (INSA)-Université de Toulouse (UT)-Institut National des Sciences Appliquées (INSA)-Université Toulouse - Jean Jaurès (UT2J)
Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3)
Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)
Laboratoire de Probabilités, Statistique et Modélisation (LPSM (UMR_8001))
Sorbonne Université (SU)-Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité)
Source :
Annals of Statistics, Annals of Statistics, Institute of Mathematical Statistics, 2020, 48 (3), pp.1281-1303. ⟨10.1214/19-AOS1847⟩, Annals of Statistics, Institute of Mathematical Statistics, In press, Annals of Statistics, 2020, 48 (3), pp.1281-1303. ⟨10.1214/19-AOS1847⟩, Ann. Statist. 48, no. 3 (2020), 1281-1303
Publication Year :
2020
Publisher :
HAL CCSD, 2020.

Abstract

We follow a post hoc, “user-agnostic” approach to false discovery control in a large-scale multiple testing framework, as introduced by Genovese and Wasserman [J. Amer. Statist. Assoc. 101 (2006) 1408–1417], Goeman and Solari [Statist. Sci. 26 (2011) 584–597]: the statistical guarantee on the number of correct rejections must hold for any set of candidate items, possibly selected by the user after having seen the data. To this end, we introduce a novel point of view based on a family of reference rejection sets and a suitable criterion, namely the joint familywise error rate over that family (JER for short). First, we establish how to derive post hoc bounds from a given JER control and analyze some general properties of this approach. We then develop procedures for controlling the JER in the case where reference regions are $p$-value level sets. These procedures adapt to dependencies and to the unknown quantity of signal (via a step-down principle). We also show interesting connections to confidence envelopes of Meinshausen [Scand. J. Stat. 33 (2006) 227–237]; Genovese and Wasserman [J. Amer. Statist. Assoc. 101 (2006) 1408–1417], the closed testing based approach of Goeman and Solari [Statist. Sci. 26 (2011) 584–597] and to the higher criticism of Donoho and Jin [Ann. Statist. 32 (2004) 962–994]. Our theoretical statements are supported by numerical experiments.

Details

Language :
English
ISSN :
00905364 and 21688966
Database :
OpenAIRE
Journal :
Annals of Statistics, Annals of Statistics, Institute of Mathematical Statistics, 2020, 48 (3), pp.1281-1303. ⟨10.1214/19-AOS1847⟩, Annals of Statistics, Institute of Mathematical Statistics, In press, Annals of Statistics, 2020, 48 (3), pp.1281-1303. ⟨10.1214/19-AOS1847⟩, Ann. Statist. 48, no. 3 (2020), 1281-1303
Accession number :
edsair.doi.dedup.....da48ad57f4962e2d13dc75523eb262bf