Définition
La segmentation sémantique est la tâche de vision par ordinateur consistant à classer chaque pixel d'une image dans une catégorie, telle qu'une route, un bâtiment ou un piéton.
Interet
L’objectif est de fournir une compréhension détaillée de la scène pour les applications d’IA dans la conduite autonome, l’imagerie médicale et la robotique.
Importance
- Essentiel pour la perception au niveau des pixels dans les systèmes critiques pour la sécurité.
- Permet des limites d'objet précises par rapport aux cadres de délimitation.
- Nécessite de grands ensembles de données annotées.
- Calcul intensif à haute résolution.
Aide
- Collectez et étiquetez des images annotées au niveau des pixels.
- Entraînez des modèles d’apprentissage profond comme des réseaux entièrement convolutifs.
- L'image d'entrée est traitée en prédictions au niveau des pixels.
- Le masque de sortie attribue chaque pixel à une classe.
- Évaluez avec des mesures telles que l'intersection sur l'union (IoU).
Exemples (monde réel)
- Ensemble de données sur les paysages urbains : segmentation sémantique des scènes urbaines.
- Tesla Autopilot : segmentation au niveau des pixels pour la navigation routière.
- Imagerie médicale : segmentation des tumeurs dans les examens IRM.
Références / Lectures complémentaires
- Long et al. « Réseaux entièrement convolutifs pour la segmentation sémantique. » CVPR 2015.
- Ensemble de données sur les paysages urbains.
- Transactions IEEE sur l'imagerie médicale.