Delphine Blanke, Guilhem Boulay, Laure Casanova Enault, Mathieu Coulon, Didier Josselin, Pierre Le Brun, Antoine Peris, EA2151 Laboratoire de Mathématiques d'Avignon (LMA), Avignon Université (AU), Études des Structures, des Processus d’Adaptation et des Changements de l’Espace (ESPACE), Université Côte d'Azur (UCA)-Avignon Université (AU)-Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU), ESPACE - CNRS - Université d'Avignon, Université Nice Sophia Antipolis (1965 - 2019) (UNS), and COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Avignon Université (AU)-Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
International audience; De prime abord, on pourrait penser que la valeur moyenne des biens, au moment des transactions qui lesfont passer d'un propriétaire à un autre, est a priori insensible à l'échantillon considéré (i.e. du quartier) danslequel cette opération se réalise. En effet, cette moyenne est celle qui est utilisée par les opérateursd'évaluation et de diffusion des prix fonciers, comme meilleurs-taux.com. A ce titre, elle devrait être fiable etindépendante de l'échelle ou de la taille de l'échantillon considéré. Concrètement, cette estimation numérique et aujourd'hui cartographique a un impact non négligeable sur l'offre et la demande et sur leur relation, fixénotamment par le prix de transaction. Cela est d'autant plus vrai qu'aujourd'hui les évaluations de biens enligne ont un poids très important dans l'aide ç la décision, comparées aux évaluations des agents immobiliersou des experts fonciers, qui pourtant, connaissent souvent parfaitement les caractéristiques locales desbiens en vente.Pourtant, la moyenne estimée des valeurs foncières est sensible à plusieurs éléments.D'une part, à cause du problème écologique d'agrégation des données, les petits échantillons, donc lesquartiers contenant peu d'habitations, c'est-à-dire soit les grands quartiers composés de peu de grandespropriétés foncières, ou bien des petits quartiers relativement peu denses, sont structurellement plussensibles à un calcul basé sur la moyenne. Cela est dû au fait que la moyenne n'est pas robuste, qu'elle esttrès sensible aux valeurs extrêmes et qu'elle possède un point d'effondrement nul, c'est-à-dire qu'il suffit demodifier légèrement une valeur qui n'est pas localisée sur la moyenne elle-même, pour obtenir unemodification de celle-ci. Une autre façon de décrire cette propriété de non robustesse est de construire unefonction d'influence, que l'on notera linéaire, en simulant l'arrivée progressive dans le paquet de donnéesobservées d'une valeur esseulée et de mesurer son impact sur la moyenne. D'autre part, notons quel'homogénéité des quartiers influence fortement la robustesse de cette valeur centrale qu'est la moyenne. Etqui dit homogénéité, dit, de façon duale, variabilité.La variabilité est souvent décrite par la variance. Cette variance, basée sur un écart à la moyenne, qui plusest, élevée au carré, est en conséquence très peu robuste, et ce même si on la divise par la moyenne pourobtenir un coefficient de variation. De plus, il existe deux types de variance : l'une sans biais et l'autre avecbiais. Les deux sont utilisées dans la littérature sans qu'aucune précision ne soit fournie lors de leur usage.Or, elles ont des propriétés bien différentes et, notamment, sur les petits échantillons dont nous venons deparler ci-dessus, elles peuvent produire des écarts d'estimation très sensibles. On peut se demander alorsquel est l'impact de ces écarts d'estimation sur l'évaluation des prix des biens immobiliers et, par ricochet, surles niveaux financiers des transactions observées.Enfin, si des différences de taille d'échantillon peuvent logiquement apparaître à un niveau d'échelle donné,les découpages administratifs induisent d'autres niveaux d'agrégation qui impactent de manière encore plusforte la taille des échantillons et, en conséquence, la robustesse des indicateurs statistiques produits. Ainsi,selon que l'on considère les quartiers, les communes, les cantons où les arrondissements, les résultatsstatistiques des moyennes et des variances subissent un effet mécanique écrasant, lié à la loi des grandsnombres. À l'inverse, il règne une certaine incertitude dans les grandes échelles (c'est-à-dire les petitséchantillons), d'autant plus forte que l'échantillon est petit et peu homogène, comme nous l'avons mentionnéci-avant. C'est toute la problématique de l'agrégation des données spatiales ou du "Modifiable Areal UnitProblem", problème bien connu lié à l'agrégation des données spatiales. Il se traduit par un lien dedépendance entre l'échelle (à savoir la quantité d'information géographique embrassée dans un échantillon)et la statistique spatiale qui y est associée.Ces différents calculs numériques (essentiellement moyenne et variance) sont appliqués à des donnéesobservées en Provence Alpes Côte d'Azur. Nous les mettons à l'épreuve, en termes de sensibilité et derobustesse, à l'aide d'une approche exploratoire interactive. Nous analysons leur comportement respectifselon les différentes l'échelles, en intégrant le biais statistiques, mais également des connaissances plusthématiques sur les effets de quartier (homogénéité, taille, composition et organisation spatiales). Lesrésultats sont analysés et discutés, afin de déterminer l'impact de la métrique utilisée sur les variations desestimations et de proposer des pistes pour des solutions plus robustes.