Ensemble de données chinois
简体中文数据集
Ensemble de données chinoises de haute qualité pour les modèles d'IA et de parole
Aperçu
Titre (langue)
Ensemble de données sur la langue chinoise
Types de jeux de données
Centre d'appels, musique, monologue scénarisé, données multimédias (données de podcast)
Pays
La Chine
Description
Cet ensemble de données comprend des conversations téléphoniques synthétiques non scénarisées entre agents et clients (5 à 15 minutes), des conversations téléphoniques naturelles entre humains (15 à 60 minutes) et des enregistrements audio chantés avec transcriptions, fournissant diverses données vocales pour la formation et l'évaluation des technologies de la parole et du langage.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Langue | Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|---|
| Chant chinois | Musique | 48 kHz | Haut-parleur unique | Mono | 06:11:32 | 10 |
| Chinois (traditionnel) | Monologue scénarisé | 48 kHz | Haut-parleur unique | Mono | 1,499:00:00 | 1,805 |
| Anglais avec accent chinois | Données médias | 16 kHz | Enceintes multiples | Mono | 306:04:58 | 2,130 |
| Chinois simplifié | Monologue scénarisé | 48 kHz | Haut-parleur unique | Mono | 2,761:00:00 | 3,725 |
| Anglais avec accent américain chinois | Centre d'appel | 8 kHz | Conférenciers 2 | Double | 152:18:33 | 2,058 |
| Anglais avec accent américain chinois | Données médias | 16 kHz | Enceintes multiples | Mono | 245:55:15 | 468 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal