1. Inference and validation of prognostic marker for correlated survival data with application to cancer
- Author
-
Meddis, Alessandra, Cancer et génome: Bioinformatique, biostatistiques et épidémiologie d'un système complexe, MINES ParisTech - École nationale supérieure des mines de Paris, Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Institut Curie [Paris]-Institut National de la Santé et de la Recherche Médicale (INSERM), Université Paris-Saclay, Aurélien Latouche, STAR, ABES, and Mines Paris - PSL (École nationale supérieure des mines de Paris)
- Subjects
Clustered data ,Time-To-Event ,Courbe ROC ,[SDV.CAN] Life Sciences [q-bio]/Cancer ,Survie ,Informative cluster size ,Effet centre ,[SDV.CAN]Life Sciences [q-bio]/Cancer ,Taille informative de grappes ,Meta-Analyses ,Donnèes en grappes ,ROC curve ,Meta-Analysis - Abstract
Clustered data often arises in medical research. These are characterized by correlations between observations belonging to the same cluster. Here, we discuss some extension to clustered data in different contexts: evaluating the performance of a candidate biomarker, and assessing the treatment effect in an individual patient data (IPD) meta-analysis with competing risks. The former was motivated by the IMENEO study, an IPD meta-analysis where the prognostic validity of the Circulating Tumor Cells (CTCs) was of interest. Our objective was to determine how well CTCs discriminates patients that died from the one that did not within the t-years, comparing individuals with same tumor stage. Although the covariate-specific time dependent ROC curve has been widely used for biomarker's discrimination, there is no methodology that can handle clusteres censored data. We proposed an estimator for the covariate-specific time dependent ROC curves and area under the ROC curve when clustered failure times are detected. We considered a shared frailty model for modeling the effect of the covariates and the biomarker on the outcome in order to account for the cluster effect. A simulation study was conducted and it showed negligible bias for the proposed estimator and a nonparametric one based on inverse probability censoring weighting, while a semiparametric estimator, ignoring the clustering, is markedly biased.We further considered an IPD meta-analysis with competing risks to assess the benefit of the addition of chemotherapy to radiotherapy on each competing endpoint for patients with nasopharyngeal carcinoma. Recommendations for the analysis of competing risks in the context of randomized clinical trials are well established. Surprisingly, no formal guidelines have been yet proposed to conduct an IPD meta-analysis with competing risk endpoints. To fill this gap, this work detailed: how to handle the heterogeneity between trials via a stratified regression model for competing risks and it highlights that the usual metrics of inconsistency to assess heterogeneity can readily be employed. The typical issues that arise with meta-analyses and the advantages due to the availability of patient-level characteristics were underlined. We proposed a landmark approach for the cumulative incidence function to investigate the impact of follow up on the treatment effect.The assumption of non informative cluster size was made in both the analyses. The cluster size is said to be informative when the outcome depends on the size of the cluster conditional on a set of covariates. Intuitively, a meta-analysis would meet this assumption. However, non informative cluster size is commonly assumed even though it may be not true in some situations and it leads to incorrect results. Informative cluster size (ICS) is a challenging problem and its presence has an impact on the choice of the correct methodology. We discussed more in details interpretation of results and which quantities can be estimated under which conditions. We proposed a test for ICS with censored clustered data. To our knowledge, this is the first test on the context of survival analysis. A simulation study was conducted to assess the power of the test and some illustrative examples were provided.The implementation of each of these developments are available at https://github.com/AMeddis., Les données de survie en grappes sont souvent recueillies dans le cadre de la recherche médicale. Elles sont caractérisées par des corrélations entre des observations appartenant à un même groupe. Ici, nous discutons des extensions a des données en grappes dans différents contextes : évaluation de la performance d'un biomarqueur candidat, et l’estimation de l'effet du traitement dans une méta-analyse sur données individuels (IPD) avec risques concurrents. La première a été motivée par l'étude IMENEO, une méta-analyse où l'intérêt portait sur la validité pronostique des cellules tumorales circulantes (CTCs). Notre objectif était de déterminer dans quelle mesure les CTCs discriminent les patients qui sont morts de ceux qui ne l'ont pas fait dans les t-années, en comparant des individus ayant le même stade de tumeur. Bien que la courbe ROC dépendante du temps ait été largement utilisée pour la discrimination des biomarqueurs, il n'existe pas de méthodologie permettant de traiter des données en grappes censurées. Nous proposons un estimateur pour les courbes ROC dépendantes du temps et pour l'AUC lorsque les temps d'évènements sont correlés. Nous avons employé un modèle de fragilité partagée pour modéliser l'effet des covariables et du biomarqueur sur la réponse afin de tenir compte de l'effet de la grappe. Une étude de simulation a été réalisée et a montré un biais négligeable pour l'estimateur proposé et pour un estimateur non paramétrique fondé sur la pondération par la probabilité inverse d’être censuré (IPCW), tandis qu'un estimateur semi-paramétrique, ignorant la structure en grappe est nettement biaisé.Nous avons également considéré une méta-analyse IPD pour quantifier le bénéfice de l'ajout de la chimiothérapie à la radiothérapie sur chaque risque concurrent pour les patients avec un carcinome nasopharyngien . Les recommandations pour l'analyse des risques concurrents dans le cadre d'essais cliniques randomisés sont bien établies. Étonnamment, aucune recommendation n'a encore été proposée pour l’anlayse d'une méta-analyse IPD avec les risque concurrents. Pour combler cette lacune, ce travail a détaillé la manière de traiter l'hétérogénéité entre les essais par un modèle de régression stratifié pour les risques concurrents et il souligne que les mesures standardes d'hétérogénéité pour évaluer l'incohérence peuvent facilement être utilisées. Les problèmes typiques qui se posent avec les méta-analyses et les avantages dus à la disponibilité des caractéristiques au niveau du patient ont été soulignées. Nous avons proposé une approche landmark pour la fonction d'incidence cumulée afin d'étudier l'impact du temps de suivi sur l'effet du traitement.L'hypothèse d'une taille de grappe non informative était faite dans les deux analyses. On dit que la taille de grappe est informative lorsque la variable réponse dépend de la taille de grappe conditionnellement à un ensemble de variables explicatives. Intuitivement, une méta-analyse répondrait à cette hypothèse. Cependant, la taille de grappe non informative est généralement supposée, même si elle peut être fausse dans certaines situations, ce qui conduit à des résultats incorrects. La taille des grappes informatives (ICS) est un problème difficile et sa présence a un impact sur le choix de la méthodologie. Nous avons discuté plus en détail de l'interprétation des résultats et des quantités qui peuvent être estimées et dans quelles conditions. Nous avons proposé un test pour l'ICS avec des données en grappes censurées. À notre connaissance, il s'agit du premier test sur le contexte de l'analyse de survie. Une étude de simulation a été réalisée pour évaluer la puissance du test et quelques exemples sont fournis à titre d'illustration.L'implémentation de chacun de ces développements est disponible sur https://github.com/AMeddis.
- Published
- 2020