Ensemble de données coréen
한국어 데이터셋
Ensemble de données de centre d'appels coréen de haute qualité, de monologues scénarisés et de médias (podcasts) pour modèles d'IA et de parole
Marché
Titre (langue)
Ensemble de données en langue coréenne
Types de jeux de données
Centre d'appels, données multimédias, monologue scénarisé
Pays
Corée
Description
Cet ensemble de données comprend des conversations téléphoniques synthétiques non scénarisées entre un agent et un client (5 à 15 minutes), des fichiers audio/vidéo du domaine public sous licence tels que des entretiens et des podcasts avec 1 à 5 participants (15 à 60 minutes) et des monologues scénarisés mettant en vedette un seul locuteur délivrant un contenu prédéfini pour la formation du modèle de parole et de langage.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Centre d'appel | 8 kHz | Conférenciers 2 | Double | 102:27:55 | 1,244 |
| Données médias | 16 kHz | Enceintes multiples | Mono | 203:46:54 | 397 |
| Monologue scénarisé | 24 kHz | Haut-parleur unique | Mono | 500:00:00 | Sur demande |
| Monologue scénarisé | 48 kHz | Haut-parleur unique | Mono | 1,955:00:00 | Sur demande |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal