Définition
La collecte de données d'image consiste à rassembler des ensembles de données visuelles pour l'entraînement des systèmes de vision par ordinateur. Les sources utilisées sont notamment des caméras, des drones, des satellites et des ensembles de données publics.
Interet
L’objectif est de garantir que les modèles disposent d’exemples diversifiés pour l’apprentissage de modèles visuels dans différents environnements et cas d’utilisation.
Importance
- Essentiel pour la précision du modèle de vision par ordinateur.
- Doit inclure un éclairage, des angles et des données démographiques variés pour éviter les biais.
- Soulevez des questions de confidentialité et de consentement lors de la collecte d’images humaines.
- Exigences élevées en matière de stockage et de gestion.
Aide
- Définir les objectifs du projet et les besoins en données.
- Collectez des images via des capteurs, des API ou des référentiels.
- Organiser et étiqueter les métadonnées pour la traçabilité.
- Stockez-le en toute sécurité pour l'annotation et la formation.
- Mettre à jour en permanence les ensembles de données pour en assurer la pertinence.
Exemples (monde réel)
- ImageNet : ensemble de données visuelles à grande échelle pour l'IA.
- Ensemble de données COCO : images collectées et annotées pour la recherche.
- Google Street View : images collectées par caméra pour les tâches de cartographie et de vision.
Références / Lectures complémentaires
- Projet ImageNet — Princeton et Stanford.
- Ensemble de données COCO — cocodataset.org.
- ISO/IEC TR 20547-5 : Architecture de référence du Big Data.
- Pourquoi un ensemble de données de formation d’images est-il nécessaire pour la vision par ordinateur ?