Back to Search Start Over

Variable selection and accurate predictions in habitat modelling: a shrinkage approach

Authors :
Matthieu Authier
Claire Saraux
Clara Péron
Observatoire PELAGIS UMS 3462 (PELAGIS)
LIttoral ENvironnement et Sociétés - UMRi 7266 (LIENSs)
Université de La Rochelle (ULR)-Centre National de la Recherche Scientifique (CNRS)-Université de La Rochelle (ULR)-Centre National de la Recherche Scientifique (CNRS)
Centre d’Ecologie Fonctionnelle et Evolutive (CEFE)
Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-École pratique des hautes études (EPHE)
Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Institut National de la Recherche Agronomique (INRA)-Université Paul-Valéry - Montpellier 3 (UPVM)-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)
Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut de Recherche pour le Développement (IRD [France-Sud])
MARine Biodiversity Exploitation and Conservation (UMR MARBEC)
Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Institut Français de Recherche pour l'Exploitation de la Mer (IFREMER)-Institut de Recherche pour le Développement (IRD)
Institute for Marine and Antarctic Studies [Horbat] (IMAS)
University of Tasmania [Hobart, Australia] (UTAS)
LIttoral ENvironnement et Sociétés - UMR 7266 (LIENSs)
Université de La Rochelle (ULR)-Centre National de la Recherche Scientifique (CNRS)-Université de La Rochelle (ULR)-Centre National de la Recherche Scientifique (CNRS)-Centre National de la Recherche Scientifique (CNRS)
Institut de Recherche pour le Développement (IRD [France-Sud])-Centre National de la Recherche Scientifique (CNRS)-École pratique des hautes études (EPHE)-Université de Montpellier (UM)-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)-Institut National de la Recherche Agronomique (INRA)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-Université Paul-Valéry - Montpellier 3 (UM3)
Institut de Recherche pour le Développement (IRD)-Institut Français de Recherche pour l'Exploitation de la Mer (IFREMER)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)
University of Tasmania (UTAS)
Université Paul-Valéry - Montpellier 3 (UM3)-Institut National de la Recherche Agronomique (INRA)-Centre international d'études supérieures en sciences agronomiques (Montpellier SupAgro)-École pratique des hautes études (EPHE)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD [France-Sud])-Institut national d’études supérieures agronomiques de Montpellier (Montpellier SupAgro)
Source :
Ecography, Ecography, Wiley, 2017, 40 (4), pp.549-560. ⟨10.1111/ecog.01633⟩
Publication Year :
2017
Publisher :
HAL CCSD, 2017.

Abstract

International audience; Habitat modelling is increasingly relevant in biodiversity and conservation studies. A typical application is to predict potential zones of specific conservation interest. With many environmental covariates, a large number of models can he investigated but multi-model inference may become impractical. Shrinkage regression overcomes this issue by dealing with the identification and accurate estimation of effect size for prediction. In a Bayesian framework we investigated the use of a shrinkage prior, the Horseshoe, for variable selection in spatial generalized linear models (GLM). As study cases, we considered 5 datasets on small pelagic fish abundance in the Gulf of Lion (Mediterranean Sea, France) and 9 environmental inputs. We compared the predictive performances of a simple kriging model, a full spatial GLM model with independent normal priors for regression coefficients, a full spatial GLM model with a Horseshoe prior for regression coefficients and 2 zero-inflated models (spatial and non-spatial) with a Horseshoe prior. Predictive performances were evaluated by cross validation on a hold-out subset of the data: models with a Horseshoe prior performed best, and the full model with independent normal priors worst. With an increasing number of inputs, extrapolation quickly became pervasive as we tried to predict from novel combinations of covariate values. By shrinking regression coefficients with a Horseshoe prior, only one model needed to be fitted to the data in order to obtain reasonable and accurate predictions, including extrapolations.

Details

Language :
English
ISSN :
09067590 and 16000587
Database :
OpenAIRE
Journal :
Ecography, Ecography, Wiley, 2017, 40 (4), pp.549-560. ⟨10.1111/ecog.01633⟩
Accession number :
edsair.doi.dedup.....da322b662f08eae00228c18680893afb
Full Text :
https://doi.org/10.1111/ecog.01633⟩