Ensemble de données linguistiques en arabe, thaï, vietnamien, hindi, anglais et chinois

Cadre de délimitation + texte

Ensemble de données linguistiques en arabe, thaï, vietnamien, hindi, anglais et chinois

Cas d'utilisation: OCR

Format: Image(s)

Count: 150K

Annotation: Oui

X

Description: Ensemble de données linguistiques en arabe, thaï, vietnamien, hindi, anglais et chinois

Ensemble de données textuelles en arabe

Cadre de délimitation + texte

Ensemble de données textuelles en arabe

Cas d'utilisation: OCR

Format: Image(s)

Count: 1k

Annotation: Oui

X

Description: L'ensemble de données de texte arabe contient une collection d'échantillons de textes écrits en arabe. Il comprend diverses formes de contenu, telles que des articles de presse, des publications sur les réseaux sociaux, de la littérature et des dialogues, couvrant différents sujets et styles d'écriture. Cet ensemble de données est utilisé pour des tâches telles que le traitement du langage naturel (NLP), la classification de texte, l'analyse des sentiments et la traduction automatique dans les applications en langue arabe.

Ensemble de données sur les langues chinoise, anglaise, tibétaine et ouïghoure

Cadre de délimitation + texte

Ensemble de données sur les langues chinoise, anglaise, tibétaine et ouïghoure

Cas d'utilisation: OCR

Format: Image(s)

Count: 38K

Annotation: Oui

X

Description: Ensemble de données sur les langues chinoise, anglaise, tibétaine et ouïghoure

Ensemble de données de menu chinois et anglais

Cadre de délimitation + texte

Ensemble de données de menu chinois et anglais

Cas d'utilisation: OCR

Format: Image(s)

Count: 60K

Annotation: Oui

X

Description: L'ensemble de données de menus chinois et anglais contient des images ou des exemples de texte de menus de restaurants en chinois et en anglais. Il comprend diverses polices, mises en page et structures de menu, présentant les noms, descriptions et prix des plats bilingues. Cet ensemble de données est utile pour des tâches telles que la reconnaissance optique de caractères (OCR), la traduction automatique et la numérisation de menus dans des environnements multilingues.

Ensemble de données sur la composition manuscrite chinoise

Cadre de délimitation + texte

Ensemble de données sur la composition manuscrite chinoise

Cas d'utilisation: OCR

Format: Image(s)

Count: 3k

Annotation: Oui

X

Description: L'ensemble de données de composition manuscrite chinoise contient des échantillons de textes chinois manuscrits, notamment des compositions, des essais et d'autres textes longs. Il présente différents styles d'écriture manuscrite et niveaux de complexité, et est utilisé pour des tâches telles que la reconnaissance de l'écriture manuscrite, l'analyse de texte et la formation de modèles d'apprentissage automatique.

Ensemble de données d'invite WIFI chinoise

Cadre de délimitation + texte

Ensemble de données d'invite WIFI chinoise

Cas d'utilisation: OCR

Format: Image(s)

Count: 1k

Annotation: Oui

X

Description: L'ensemble de données d'invites WIFI chinoises se compose d'échantillons de texte trouvés dans les invites WIFI et les écrans de connexion écrits en chinois. Il comprend généralement diverses invites, instructions et messages d'erreur liés à la connexion ou à la gestion des réseaux WIFI. Cet ensemble de données est utilisé pour des tâches telles que la reconnaissance de texte, le traitement du langage naturel et l'amélioration des interfaces utilisateur pour la connectivité réseau.

Ensemble de données sur l'écriture manuscrite en anglais et en chinois

Cadre de délimitation + texte

Ensemble de données sur l'écriture manuscrite en anglais et en chinois

Cas d'utilisation: OCR

Format: Image(s)

Count: 12K

Annotation: Oui

X

Description: L'ensemble de données d'écriture manuscrite en anglais et en chinois contient des échantillons manuscrits en anglais et en chinois, présentant divers styles d'écriture et complexités de caractères. Il est généralement utilisé pour la formation et l'évaluation de modèles de reconnaissance de l'écriture manuscrite, pour soutenir l'analyse de textes multilingues et d'autres recherches connexes. L'ensemble de données comprend une gamme variée de caractères, de chiffres, de mots et de phrases dans les deux langues.

Ensemble de données sur les enseignes de magasins en anglais et en chinois

Cadre de délimitation + texte

Ensemble de données sur les enseignes de magasins en anglais et en chinois

Cas d'utilisation: OCR

Format: Image(s)

Count: 30K

Annotation: Oui

X

Description: L'ensemble de données sur les enseignes de magasins en anglais et en chinois comprend des images d'enseignes de magasins comportant du texte en anglais et en chinois. Il capture divers éléments de signalisation tels que les noms de magasins, les publicités, les promotions et les directions, affichés dans diverses polices, styles et formats. Cet ensemble de données est utilisé pour des tâches telles que la détection et la reconnaissance de texte, la compréhension de scènes multilingues et l'amélioration des modèles de vision par ordinateur pour l'interprétation de la signalisation bilingue.

Ensemble de données textuelles d'angle spécial en anglais et en chinois

Cadre de délimitation + texte

Ensemble de données textuelles d'angle spécial en anglais et en chinois

Cas d'utilisation: OCR

Format: Image(s)

Count: 50K

Annotation: Oui

X

Description: L'ensemble de données textuelles spéciales en anglais et en chinois contient des images de texte affichées sous différents angles et orientations en anglais et en chinois. Il comprend du texte provenant de sources telles que des panneaux, des publicités et des documents qui ne sont pas présentés dans des formats horizontaux standard. Cet ensemble de données est utilisé pour la formation et l'évaluation de modèles de détection et de reconnaissance de texte, en particulier ceux capables de gérer du texte dans des orientations et des perspectives non traditionnelles.

Ensemble de données du menu anglais

Cadre de délimitation + texte

Ensemble de données du menu anglais

Cas d'utilisation: OCR

Format: Image(s)

Count: 20K

Annotation: Oui

X

Description: L'ensemble de données de menus en anglais comprend des images ou des exemples de texte de menus de restaurants rédigés en anglais. Il propose une variété de polices, de mises en page et de styles de formatage, avec un contenu allant des noms de plats aux descriptions et aux prix. Cet ensemble de données est souvent utilisé pour des tâches telles que la reconnaissance optique de caractères (OCR), l'extraction de texte et la numérisation de menus dans les applications liées à l'alimentation.

Ensemble de données textuelles sur les scènes en anglais

Cadre de délimitation + texte

Ensemble de données textuelles sur les scènes en anglais

Cas d'utilisation: OCR

Format: Image(s)

Count: 33K

Annotation: Oui

X

Description: L'ensemble de données textuelles de scènes anglaises se compose d'images contenant des scènes naturelles avec du texte anglais intégré. Le texte apparaît sous diverses formes, telles que des panneaux, des panneaux d'affichage et des affiches, souvent dans des polices, des tailles et des orientations diverses. Cet ensemble de données est couramment utilisé pour la formation et le test de modèles dans les tâches de détection, de reconnaissance et de compréhension de scènes de texte.

Ensemble de données de texte manuscrit

Ensemble de données de texte manuscrit

Cas d'utilisation: IA documentaire

Format: HEIC (images) & .mov (vidéos)

Count: 94053

Annotation: Non

X

Description: Photos en direct avec texte manuscrit pour le japonais, le coréen et le russe

Enregistreur: Appareil photo iPhone et iPad

Condition d'enregistrement : - Éclairage agressif/éblouissement - Flash de l'appareil photo activé - Lumière colorée - Faible luminosité, pas de flash de l'appareil photo - Normal

Ensemble de données sur les langues japonaise et coréenne

Cadre de délimitation + texte

Ensemble de données sur les langues japonaise et coréenne

Cas d'utilisation: OCR

Format: Image(s)

Count: 40K

Annotation: Oui

X

Description: L'ensemble de données sur les langues japonaise et coréenne comprend des échantillons de texte en japonais et en coréen. Il propose une gamme de contenus tels que des phrases, des expressions et des mots, englobant divers contextes et styles. Cet ensemble de données est utilisé pour des tâches telles que le traitement du langage naturel (NLP), la traduction automatique et l'analyse de texte dans des applications multilingues.