Définition
La reconnaissance de texte désigne l'identification des caractères dans des images ou des documents numérisés. Elle comprend la reconnaissance des caractères imprimés et manuscrits.
Interet
L’objectif est de rendre le texte dans des formats visuels accessible et consultable.
Importance
- Permet la numérisation des archives.
- Essentiel pour l’accessibilité et l’automatisation.
- La précision dépend de la qualité de l'image.
- Lié aux technologies OCR.
Aide
- Capturez des documents numérisés ou photographiés.
- Prétraitez les images pour améliorer la clarté.
- Détecter les zones de texte.
- Appliquer des modèles de reconnaissance.
- Générer un texte lisible par machine.
Exemples (monde réel)
- Google Lens : reconnaît le texte dans les photos.
- ABBYY FineReader : numérise les documents numérisés.
- Tesseract OCR : moteur de reconnaissance de texte open source.
Références / Lectures complémentaires
- Smith, R. « Un aperçu du moteur OCR Tesseract. » ICDAR.
- Norme ISO/CEI 15938-4.
- Transactions IEEE sur l'analyse des modèles et l'intelligence artificielle.