Ensemble de données anglais Deep South
Ensemble de données de centre d'appels, de conversations générales et de podcasts en anglais de haute qualité pour les modèles d'IA et de parole du Deep South
Marché
Titre (langue)
Ensemble de données sur la langue anglaise du Sud profond
Types de jeux de données
Centre d'appels, Conversation générale, Données multimédias (Podcast)
Pays
Sud des États-Unis
Description
Les conversations téléphoniques synthétiques non scénarisées entre un agent et un client durent généralement de 5 à 15 minutes, tandis que les conversations téléphoniques non scénarisées entre deux personnes durent généralement de 15 à 60 minutes. De plus, des fichiers audio ou vidéo sous licence, appartenant au domaine public, tels que des interviews ou des podcasts réunissant de 1 à 5 participants, sont également disponibles pour une durée de 15 à 60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Centre d'appel | 8 kHz | Conférenciers 2 | Double | 266:44:22 | 634 |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 197:25:07 | 1,490 |
| Données médias | 16 kHz | Enceintes multiples | Mono | 261:20:58 | 565 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal
Marché
Objet
Anglais Grand Sud Ensemble de données linguistiques
Type de jeu de données
Centre d'appel
Description
Conversation téléphonique synthétique non scénarisée entre « agent » et « client », env. Durée audio (plage) 5-15 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
151
Taux d'échantillonnage
8 kHz
Audio Channel
Double
Plate-forme d'enregistrement
Bureau
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Anglais Grand Sud
Langue
Anglais Grand Sud
Genre
Femme 221, Homme 1004, Inconnu 7
Nombre de haut-parleurs
1,232
Âge
18-50
Marché
Objet
Anglais Grand Sud Ensemble de données linguistiques
Type de jeu de données
Conversation générale
Description
Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
56
Taux d'échantillonnage
8 kHz
Audio Channel
Double
Plate-forme d'enregistrement
Bureau
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Anglais Grand Sud
Langue
Anglais Grand Sud
Genre
Femme 99, Homme 31, Inconnu 0
Nombre de haut-parleurs
130
Âge
18-50
Marché
Objet
Anglais Grand Sud Ensemble de données linguistiques
Type de jeu de données
Podcast
Description
Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
266
Taux d'échantillonnage
16 kHz
Audio Channel
Mono
Plate-forme d'enregistrement
Sourcing Web
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Anglais Grand Sud
Langue
Anglais Grand Sud
Genre
Femme 204, Homme 356, Inconnu 21
Nombre de haut-parleurs
581
Âge
18-50