Ensemble de données en anglais américain

Ensemble de données en anglais américain de haute qualité pour les modèles d'IA et de parole

Marché

Titre (langue)

Ensemble de données en anglais aux États-Unis

Types de jeux de données

Centre d'appels, Médias (podcast), Médical

Pays

États-Unis

Description

Cet ensemble de données comprend des conversations synthétiques non scénarisées entre agents et clients (5 à 15 minutes), des fichiers audio ou vidéo du domaine public sous licence tels que des entretiens et des podcasts avec 1 à 5 participants (15 à 60 minutes), ainsi que des types d'ensembles de données médiatiques et médicales pour une recherche complète sur la parole et le langage.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Type de jeu de données Taux d'échantillonnage Conférenciers Développement Heures totales Nombre total de haut-parleurs
Centre d'appel 8 kHz Conférenciers 2 Mono 10,196:00:00 1,052
Centre d'appel 8 kHz Conférenciers 2 Double 597:26:43 Sur demande
Données médias 16 kHz Enceintes multiples Mono 620:23:43 5,466
Médical 8 kHz Conférenciers 2 Mono 1,480:30:33 697

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • Ce champ est à des fins de validation et devrait être laissé inchangé.
  • En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.