Ensemble de données linguistiques en arabe, thaï, vietnamien, hindi, anglais et chinois
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 150K
Annotation: Oui
Description: Ensemble de données linguistiques en arabe, thaï, vietnamien, hindi, anglais et chinois
Ensemble de données textuelles en arabe
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 1k
Annotation: Oui
Description: L'ensemble de données de texte arabe contient une collection d'échantillons de textes écrits en arabe. Il comprend diverses formes de contenu, telles que des articles de presse, des publications sur les réseaux sociaux, de la littérature et des dialogues, couvrant différents sujets et styles d'écriture. Cet ensemble de données est utilisé pour des tâches telles que le traitement du langage naturel (NLP), la classification de texte, l'analyse des sentiments et la traduction automatique dans les applications en langue arabe.
Ensemble de données sur les langues chinoise, anglaise, tibétaine et ouïghoure
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 38K
Annotation: Oui
Description: Ensemble de données sur les langues chinoise, anglaise, tibétaine et ouïghoure
Ensemble de données de menu chinois et anglais
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 60K
Annotation: Oui
Description: L'ensemble de données de menus chinois et anglais contient des images ou des exemples de texte de menus de restaurants en chinois et en anglais. Il comprend diverses polices, mises en page et structures de menu, présentant les noms, descriptions et prix des plats bilingues. Cet ensemble de données est utile pour des tâches telles que la reconnaissance optique de caractères (OCR), la traduction automatique et la numérisation de menus dans des environnements multilingues.
Ensemble de données sur la composition manuscrite chinoise
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 3k
Annotation: Oui
Description: L'ensemble de données de composition manuscrite chinoise contient des échantillons de textes chinois manuscrits, notamment des compositions, des essais et d'autres textes longs. Il présente différents styles d'écriture manuscrite et niveaux de complexité, et est utilisé pour des tâches telles que la reconnaissance de l'écriture manuscrite, l'analyse de texte et la formation de modèles d'apprentissage automatique.
Ensemble de données d'invite WIFI chinoise
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 1k
Annotation: Oui
Description: L'ensemble de données d'invites WIFI chinoises se compose d'échantillons de texte trouvés dans les invites WIFI et les écrans de connexion écrits en chinois. Il comprend généralement diverses invites, instructions et messages d'erreur liés à la connexion ou à la gestion des réseaux WIFI. Cet ensemble de données est utilisé pour des tâches telles que la reconnaissance de texte, le traitement du langage naturel et l'amélioration des interfaces utilisateur pour la connectivité réseau.
Ensemble de données sur l'écriture manuscrite en anglais et en chinois
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 12K
Annotation: Oui
Description: L'ensemble de données d'écriture manuscrite en anglais et en chinois contient des échantillons manuscrits en anglais et en chinois, présentant divers styles d'écriture et complexités de caractères. Il est généralement utilisé pour la formation et l'évaluation de modèles de reconnaissance de l'écriture manuscrite, pour soutenir l'analyse de textes multilingues et d'autres recherches connexes. L'ensemble de données comprend une gamme variée de caractères, de chiffres, de mots et de phrases dans les deux langues.
Ensemble de données sur les enseignes de magasins en anglais et en chinois
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 30K
Annotation: Oui
Description: L'ensemble de données sur les enseignes de magasins en anglais et en chinois comprend des images d'enseignes de magasins comportant du texte en anglais et en chinois. Il capture divers éléments de signalisation tels que les noms de magasins, les publicités, les promotions et les directions, affichés dans diverses polices, styles et formats. Cet ensemble de données est utilisé pour des tâches telles que la détection et la reconnaissance de texte, la compréhension de scènes multilingues et l'amélioration des modèles de vision par ordinateur pour l'interprétation de la signalisation bilingue.
Ensemble de données textuelles d'angle spécial en anglais et en chinois
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 50K
Annotation: Oui
Description: L'ensemble de données textuelles spéciales en anglais et en chinois contient des images de texte affichées sous différents angles et orientations en anglais et en chinois. Il comprend du texte provenant de sources telles que des panneaux, des publicités et des documents qui ne sont pas présentés dans des formats horizontaux standard. Cet ensemble de données est utilisé pour la formation et l'évaluation de modèles de détection et de reconnaissance de texte, en particulier ceux capables de gérer du texte dans des orientations et des perspectives non traditionnelles.
Ensemble de données du menu anglais
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 20K
Annotation: Oui
Description: L'ensemble de données de menus en anglais comprend des images ou des exemples de texte de menus de restaurants rédigés en anglais. Il propose une variété de polices, de mises en page et de styles de formatage, avec un contenu allant des noms de plats aux descriptions et aux prix. Cet ensemble de données est souvent utilisé pour des tâches telles que la reconnaissance optique de caractères (OCR), l'extraction de texte et la numérisation de menus dans les applications liées à l'alimentation.
Ensemble de données textuelles sur les scènes en anglais
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 33K
Annotation: Oui
Description: L'ensemble de données textuelles de scènes anglaises se compose d'images contenant des scènes naturelles avec du texte anglais intégré. Le texte apparaît sous diverses formes, telles que des panneaux, des panneaux d'affichage et des affiches, souvent dans des polices, des tailles et des orientations diverses. Cet ensemble de données est couramment utilisé pour la formation et le test de modèles dans les tâches de détection, de reconnaissance et de compréhension de scènes de texte.
Ensemble de données de texte manuscrit
Cas d'utilisation: IA documentaire
Format: HEIC (images) & .mov (vidéos)
Count: 94053
Annotation: Non
Description: Photos en direct avec texte manuscrit pour le japonais, le coréen et le russe
Enregistreur: Appareil photo iPhone et iPad
Condition d'enregistrement : - Éclairage agressif/éblouissement - Flash de l'appareil photo activé - Lumière colorée - Faible luminosité, pas de flash de l'appareil photo - Normal
Ensemble de données sur les langues japonaise et coréenne
Cadre de délimitation + texte
Cas d'utilisation: OCR
Format: Image(s)
Count: 40K
Annotation: Oui
Description: L'ensemble de données sur les langues japonaise et coréenne comprend des échantillons de texte en japonais et en coréen. Il propose une gamme de contenus tels que des phrases, des expressions et des mots, englobant divers contextes et styles. Cet ensemble de données est utilisé pour des tâches telles que le traitement du langage naturel (NLP), la traduction automatique et l'analyse de texte dans des applications multilingues.