L’indicateur d’occupation foncière permet un suivi fiable et rapide de l’évolution de l’occupation foncière dans une périodicité plus élevée que les données de références fournies par l’Etat. Il permet de comprendre les mutations fonctionnelles et sémantiques du tissu urbain et contribue à l’analyse des mécanismes de consommation foncière.
Il éclaire les mutations fonctionnelles et morphologiques du tissu urbain et contribue à l’analyse des mécanismes de consommation foncière. Il constitue un appui à la planification territoriale (loi ZAN, sobriété foncière, densification) grâce à des mesures reproductibles, historisées et automatisées.
Que mesure cet indicateur ?
Le taux d’artificialisation (en biannuel) : mesure la proportion de surfaces artificialisées dans le territoire observé, c’est-à-dire les sols transformés par l’activité humaine (bâtis, infrastructures, surfaces imperméabilisées, etc.). L’indicateur est calculé à partir de la segmentation sémantique des surfaces, entraînée sur des données open data FLAIR, permettant de distinguer les zones naturelles ou artificielles avec un degré de confiance associé.
Le taux d’occupation foncière (en biannuel) : mesure la proportion de surfaces artificialisées effectivement occupées par des bâtiments, en qualifiant leur usage principal (résidentiel, commercial, industriel ou entrepôt). Cet indicateur repose sur la détection automatique des bâtis (IA de détection d’objets) et leur classification sémantique et panoptique. Les bâtiments sont représentés par leur empreinte ou leur centroïde selon la granularité.
Sources des données
Images satellite haute résolution complétée par des données métiers : OCS GE (Occupation du sol à grande échelle), BD TOPO®, BD Ortho®, DVF (Demandes de Valeurs Foncières), Sitadel (Système d’Information et de Traitement Automatisé des Données Élémentaires sur les Logements et les locaux).
Méthodologie
La production repose sur une chaîne automatisée de traitement d’images par machine Learning ou Deep Learning et documentée, conçue pour être répétable sur de nouvelles zones à observer.
Les données sont agrégées par période et par territoire afin de garantir la lisibilité des résultats. Des traitements statistiques sont appliqués pour fiabiliser les indicateurs et limiter les effets des valeurs atypiques.
Comment interpréter les résultats ?
Les deux indicateurs principaux à interpréter sont le taux d’artificialisation des sols, qui mesure la proportion des surfaces imperméabilisées ou transformées par l’activité humaine, et le taux d’occupation foncière, calculé à partir d’au moins quatre classes d’usage du sol distinctes. Ces indicateurs reposent sur la classification automatique des images satellitaires en usages du sol, dont la précision dépend directement de la qualité des modèles de Deep Learning utilisés et des données d’entraînement associées.
Les indicateurs doivent être considérés comme des approximations reflétant des tendances globales. Leur précision dépend de plusieurs paramètres, notamment la résolution spatiale des images satellitaires, la fréquence temporelle d’acquisition, ainsi que la conception des modèles d’apprentissage profond (Deep Learning) et la calibration fine de leurs hyperparamètres. Des phénomènes tels que le surapprentissage (overfitting), le biais d’échantillonnage des données d’entraînement, ou encore la variance du modèle peuvent introduire des incertitudes significatives. Les erreurs de classification automatique, résultant notamment de la complexité des scènes ou de la similarité visuelle entre classes, doivent également être prises en compte.
Par ailleurs, la complexité territoriale affecte la qualité des résultats : la diversité des usages du sol, la variabilité morphologique urbaine, les discontinuités spatiales, ainsi que le contexte local — incluant les dynamiques d’aménagement, les contraintes réglementaires, les pratiques socio-économiques et autres facteurs contextuels — peuvent générer des biais ou des limitations dans l’interprétation des indicateurs.
Limites d’utilisation
Les données utilisées peuvent comporter des délais de mise à jour liés aux calendriers d’acquisition des images satellites et aux étapes de traitement nécessaires à leur exploitation. Les indicateurs reposent sur des traitements automatisés, notamment des méthodes de calcul et de classification, qui peuvent comporter des marges d’incertitude. Certaines situations locales, en particulier dans les territoires hétérogènes ou en forte évolution, peuvent être partiellement ou imparfaitement représentées. Les résultats sont produits à partir de données agrégées et visent à mettre en évidence des tendances générales. Ils ne reflètent pas nécessairement la diversité des situations locales ni les spécificités réglementaires, économiques ou sociales propres à chaque territoire. Les indicateurs constituent des outils d’aide à l’analyse et doivent être interprétés avec précaution, en complément d’une expertise locale et d’autres sources d’information.
Mise à jour
La fréquence de mise à jour est semestrielle. Toutefois des mises à jour plus fréquente et conditionné par la disponibilité de données d’entrée peuvent avoir lieu sur le site. Pour toute question, vous pouvez contacter l’équipe en charge du site.
Mini glossaire
Apprentissage profond (Deep Learning)
Technique d’intelligence artificielle qui utilise des réseaux de neurones complexes pour analyser et interpréter des données, comme les images satellites.
Calibration des hyperparamètres
Processus d’ajustement des paramètres internes d’un modèle d’apprentissage pour améliorer ses performances.
Classification automatique
Méthode qui permet d’assigner automatiquement des catégories (ex. : types d’usage du sol) à chaque zone d’une image.
Erreur de classification
Cas où le modèle attribue une mauvaise catégorie à une zone, par exemple confondre un espace vert avec un espace bâti.
Overfitting (surapprentissage)
Phénomène où un modèle apprend trop précisément les données d’entraînement, ce qui réduit sa capacité à généraliser sur de nouvelles données.
Biais d’échantillonnage
Distorsion qui survient lorsque les données utilisées pour entraîner un modèle ne sont pas représentatives de la réalité globale.
Variance du modèle
Mesure de la sensibilité d’un modèle aux variations dans les données d’entraînement, pouvant entraîner des résultats instables.
Résolution spatiale
Niveau de détail d’une image satellite, souvent exprimé en mètres par pixel.
Taux d’artificialisation des sols
Proportion des surfaces terrestres transformées par l’homme, notamment imperméabilisées (bâtiments, routes).
Taux d’occupation foncière
Répartition des usages du sol dans un territoire, calculée à partir d’au moins quatre classes distinctes (ex. : résidentiel, commercial, agricole, naturel).