Ensemble de données anglais Deep South

Ensemble de données de centre d'appels, de conversations générales et de podcasts en anglais de haute qualité pour les modèles d'IA et de parole du Deep South

Marché

Titre (langue)

Ensemble de données sur la langue anglaise du Sud profond

Types de jeux de données

Centre d'appels, Conversation générale, Données multimédias (Podcast)

Pays

Sud des États-Unis

Description

Les conversations téléphoniques synthétiques non scénarisées entre un agent et un client durent généralement de 5 à 15 minutes, tandis que les conversations téléphoniques non scénarisées entre deux personnes durent généralement de 15 à 60 minutes. De plus, des fichiers audio ou vidéo sous licence, appartenant au domaine public, tels que des interviews ou des podcasts réunissant de 1 à 5 participants, sont également disponibles pour une durée de 15 à 60 minutes.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Type de jeu de données Taux d'échantillonnage Conférenciers Développement Heures totales Nombre total de haut-parleurs
Centre d'appel 8 kHz Conférenciers 2 Double 266:44:22 634
Conversation générale 8 kHz Conférenciers 2 Double 197:25:07 1,490
Données médias 16 kHz Enceintes multiples Mono 261:20:58 565

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Amazon
Google
Microsoft
Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • Ce champ est à des fins de validation et devrait être laissé inchangé.
  • En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.