Blog
/

Cinq étapes pour construire un meilleur détecteur de tourbières

Table of contents
Introduction

Il s'agit de la deuxième partie d'une série en deux parties

Dans la première partie de cette série, nous avons défini GeoAI et résumé l'état actuel des applications GeoAI dans l'industrie de l'exploration minérale. Cette section décrit comment nous avons exécuté un modèle de vision par ordinateur de bout en bout pour détecter les affleurements tachés de fer à l'aide de la segmentation sémantique et de cartes auto-organisées sur des données de télédétection multiplateformes.

La présence d'oxydes de fer est l'une des rares caractéristiques diagnostiques qui peuvent aider les efforts d'exploration minérale dans le spectre visuel. Bien que l'imagerie multispectrale et hyperspectrale puisse révéler la présence de nombreux altérations et minéraux de référence, les données open source pour une analyse spectrale approfondie des minéraux d'altération sont limitées à une résolution de 30 m pixels.

Bien qu'une résolution de 30 m soit appropriée pour les analyses régionales, l'analyse locale présente certaines limites importantes en raison de la perte d'un nombre inconnu d'affleurements potentiels au niveau des sous-pixels. Nous avons eu accès à des images RVB d'une résolution de 0,5 m pour notre projet, ce qui nous a permis de distinguer les plus petites expositions aux affleurements.

L'utilisation de la coloration au fer comme mesure pour former un classificateur de vision par ordinateur pose un problème majeur. La « teinte rouge » indiquant l'oxydation du fer sur les affleurements peut facilement être confondue avec la végétation non verte, comme le lichen et certaines sphaignes et les bryophytes, ces derniers étant répandus dans les tourbières et les tourbières.

En nous inspirant d'un article de Descartes Labs, nous avons décidé de tester une approche similaire en utilisant des données radar chronologiques pour détecter les milieux humides en fonction de la variabilité saisonnière.

Les tourbières sont un type de milieu humide caractérisé par des fluctuations variables de l'acidité, de la salinité et du niveau d'eau. Notre objectif était d'utiliser une année de données SAR à source libre provenant de notre zone d'étude et de filtrer les milieux humides potentiels en fonction de la variation tout au long de l'année, ainsi que les visualisations RVB et un modèle numérique régional d'altitude. Par la suite, nous pourrions évaluer la qualité de nos données de formation originales et apporter des ajustements au modèle au besoin.

Le SAR est très sensible à l'eau, et une analyse des données SAR de séries chronologiques peut aider à distinguer cette variabilité saisonnière. À l'instar des méthodes d'apprentissage en ensemble, une approche multiplateforme de classification de la couverture terrestre surpasse les solutions à plateforme unique en télédétection.

notion image

Figure 1. Baie de sources de données provenant de la zone du projet. Modèle numérique d'altitude, image RVB, image RVB avec données d'entraînement et image de variation SAR de série chronologique, de gauche à droite.

Résumons l'approche :

Objectif : Utiliser la vision par ordinateur pour détecter les oxydes de fer sur les affleurements

Question : La « teinte rouge » confond le modèle entre les oxydes de fer et la végétation particulière des milieux humides

Solution : Intégrer des images radar de séries chronologiques pour filtrer les pixels des milieux humides de la classification

Sources de données : imagerie RVB aérienne de 0,5 m, imagerie SAR Sentinel-1 de 10 m

1.Créer des données sur la formation

L'ensemble d'entraînement initial a été numérisé manuellement à partir de l'image RVB avec des étiquettes de classe pour les tourbières, les affleurements oxydés (coloration au fer), les forêts, l'eau et les sédiments fluviaux/lacustres (sédiments fluviaux et lacustres). Cet ensemble de données a ensuite servi de base à notre modèle de segmentation sémantique et a servi de base pour évaluer les variations saisonnières du SAR.

N'oubliez pas que puisque nous avons commencé avec une seule image RVB, ces polygones peuvent ne pas être entièrement exacts ou complets. Néanmoins, nous pouvons toujours les utiliser pour savoir si la méthode fonctionnera ou non.

2. Former et exécuter le modèle de vision par ordinateur

Il y a deux entrées pour le CNN :

Image raster contenant trois bandes, Une image d'étiquette qui contient l'étiquette de chaque pixel correspondant à la coloration au fer

  • Une image raster qui contient trois bandes,
  • Image d'étiquette qui contient l'étiquette de chaque pixel correspondant à la coloration au fer

Nous avons utilisé l'architecture Unet pour former notre modèle de segmentation sémantique.

U-net a été inventé à l'origine et utilisé pour la première fois pour la segmentation d'images biomédicales. Son architecture peut être généralement considérée comme un réseau de codeur suivi d'un réseau de décodeurs. Contrairement à la classification où le résultat final du réseau profond est la seule chose importante, la segmentation sémantique nécessite non seulement une discrimination au niveau des pixels, mais aussi un mécanisme pour projeter les caractéristiques discriminatives apprises aux différentes étapes du codeur sur l'espace des pixels.

notion image

Les cases bleues représentent les cartes d'entités multicanaux, tandis que les cases représentent les cartes d'entités copiées.

Grâce à la numérisation de nos fonctions de formation, nous avons formé notre modèle et prédit les emplacements des taches d'oxyde de fer sur l'image.

Comme prévu, il y a plusieurs faux positifs dans les milieux humides probables.

3. Acquérir des données SAR de séries chronologiques

Google Earth Engine est une ressource fantastique pour la collecte de données de télédétection, en particulier des données de séries chronologiques. Si vous n'êtes pas familier avec Google Earth Engine, vous trouverez ici une excellente introduction aux agrégateurs et aux réducteurs avec des exemples de code.

Nous avons filtré toutes les données Sentinel-1 de 2019 en douze images, une pour chaque mois, agrégées par un réducteur médian. Chaque image contenait trois bandes :

Rouge = polarisation verticale-verticale (VV)

Vert = Polarisation verticale-horizontale (VH)

Bleu = rapport VV:VH

Les polarisations de bandes pour les SAR dépassent le cadre de ce poste et font toujours l'objet de recherches en cours. En résumé, les longueurs d'onde SAR sont beaucoup plus longues que les longueurs d'onde optiques. Pour cette raison, les ondes radar sont sensibles aux différentes habitudes texturales des objets au sol, comme la canopée des arbres et la rugosité de surface des affleurements, par exemple. Les ondes radar sont également sensibles à la constante diélectrique des matériaux de surface, c'est pourquoi le radar est excellent pour détecter la présence d'eau.

Les satellites capables d'envoyer des radars polarisés peuvent profiter du fait qu'en plus de la diffusion (les intensités de pixels SAR sont une mesure de la diffusion de surface), certains matériaux modifient la polarisation de l'énergie émise lorsqu'ils réagissent avec elle. En utilisant différentes polarisations et le rapport entre les deux, nous pouvons créer un composite RVB, ce qui est très pratique pour les visualisations et ajoute une dimension supplémentaire aux données.

Pour obtenir une image représentant la variation annuelle, nous avons superposé toutes les images ensemble, calculé l'écart type pour chaque pixel à travers les 12 images, puis créé une nouvelle image à partir de ces valeurs.

En prélevant un échantillon de chaque valeur de pixel dans chaque classe et en traçant par écart-type, nous obtenons un aperçu de la distribution des valeurs radar tout au long de l'année. Supposons que nous nous concentrions spécifiquement sur la bande de polarisation VV (c.-à-d. la bande rouge lorsqu'elle est mappée à l'espace colorimétrique RVB). Dans ce cas, il semble y avoir suffisamment de distinction entre les classes de milieux humides et les affleurements tachés de fer.

notion image

4. Classifier le SAR

Kohonen Self-Organizing Maps (SOM) a récemment reçu de plus en plus d'attention en tant que réseau de neurones artificiels sous-utilisé. Les SOM sont extrêmement utiles lorsque vous n'avez pas de données de formation disponibles et que vous n'avez aucune indication claire du nombre de grappes qu'il y a dans vos données. Ils diffèrent également des autres réseaux de neurones artificiels en utilisant l'apprentissage compétitif au lieu de l'apprentissage par correction d'erreurs.

Les SOMS sont essentiellement l'équivalent en réseau neuronal du clustering KMoyens, sauf que les grappes de nombres de votre ensemble de données n'ont pas besoin d'être spécifiées. De plus, les SOMS peuvent être très rapides à former, ce qui vous permet d'observer comment l'ajustement des différents paramètres du modèle affecte rapidement le réseau.

Cette dernière partie est bénéfique puisque le réseau formé est une carte 2D, avec les coordonnées x et y correspondant à des neurones spécifiques. Les neurones du réseau sont parfois appelés unités, et le neurone gagnant pour n'importe quel pixel de l'image est la meilleure unité de correspondance ou BMU pour ce pixel. Les fonctions sigma et voisinage déterminent le degré d'influence des neurones gagnants sur les neurones environnants, ce qui donne lieu à de nombreux groupes distincts ou à moins de grappes moins définies.

notion image

Figure 3. Deux réseaux SOM formés sur des données SAR de séries chronologiques avec une valeur sigma élevée (à gauche) et une valeur sigma faible (à droite).

Dans les deux cas, un élément de supervision est nécessaire pour reconvertir la sortie SOM en classes étiquetées. Nous avons utilisé KMoyens pour attribuer des étiquettes à chaque cluster SOM, puis échantillonné le réseau neuronal pour attribuer l'étiquette de classe gagnante à chaque pixel.

5. Superposer et filtrer les résultats

Avec notre image SAR classifiée de séries chronologiques et les résultats de notre modèle de vision par ordinateur, nous avons combiné les résultats en exécutant une opération de différence. Cette opération a effacé toutes les prévisions d'affleurement et d'oxyde de fer à l'intérieur des limites de nos classes probables de milieux humides. Depuis que nous avons coupé des images de résolution de 0,5 m avec une résolution de 10 m, il y a eu une certaine perte de résolution. Mais les classes de terres humides dérivées du radar ont fait un travail formidable pour éliminer les faux positifs.

notion image

Figure 4. La sortie du modèle combiné avant et après le fonctionnement de la différence. A) image RVB) image avec prédictions d'affleurement à partir du modèle de vision par ordinateur en rouge C) affleurement filtré en vert superposé aux prévisions originales de l'affleurement D) affleurement filtré avec des milieux humides visibles.

notion image

Le résultat est un ensemble de prédictions beaucoup plus propre. En réduisant considérablement le nombre de faux positifs, nous nous retrouvons avec des cibles de meilleure qualité pour cibler les efforts d'exploration. De plus, l'identification des zones où les fluctuations de l'eau sont élevées associées aux milieux humides peut aider à planifier le projet et à atténuer les risques environnementaux.

Share this post
Copied!
Written By
No items found.
Written By
Team KorrAI

Nous envoyons à l'occasion des courriels contenant des mises à jour, nos derniers blogues et nos lectures préférées sur InSAR et le paysage lent de l'affaissement du sol.

Abonnez-vous à notre infolettre

Lu par les meilleurs professionnels sur
Je vous remercie ! Votre soumission a bien été reçue !
Oups ! Quelque chose s'est mal passé lors de la soumission du formulaire.