Ensemble de données en anglais américain
Ensemble de données en anglais américain de haute qualité pour les modèles d'IA et de parole
Marché
Titre (langue)
Ensemble de données en anglais aux États-Unis
Types de jeux de données
Centre d'appels, Médias (podcast), Médical
Pays
États-Unis
Description
Cet ensemble de données comprend des conversations synthétiques non scénarisées entre agents et clients (5 à 15 minutes), des fichiers audio ou vidéo du domaine public sous licence tels que des entretiens et des podcasts avec 1 à 5 participants (15 à 60 minutes), ainsi que des types d'ensembles de données médiatiques et médicales pour une recherche complète sur la parole et le langage.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Centre d'appel | 8 kHz | Conférenciers 2 | Mono | 10,196:00:00 | 1,052 |
| Centre d'appel | 8 kHz | Conférenciers 2 | Double | 597:26:43 | Sur demande |
| Données médias | 16 kHz | Enceintes multiples | Mono | 620:23:43 | 5,466 |
| Médical | 8 kHz | Conférenciers 2 | Mono | 1,480:30:33 | 697 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal