Ensemble de données anglais de New York

Ensemble de données de centre d'appels, de conversation générale et de podcast de haute qualité pour les modèles d'IA et de parole à New York

Vue d'ensemble

Titre (langue)

Ensemble de données sur la langue anglaise de New York

Types de jeux de données

Centre d'appels, Conversation générale, Médias (Podcast)

Pays

États-Unis

Description

Cet ensemble de données offre un contenu vocal et multimédia diversifié, notamment des conversations synthétiques non scénarisées entre agents et clients (5 à 15 minutes), des conversations téléphoniques interhumaines (15 à 60 minutes), des enregistrements audio chantés avec transcriptions, des interviews, des podcasts et des monologues scénarisés, soutenant la formation et l'évaluation des technologies de la parole et du langage.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Type de jeu de données Taux d'échantillonnage Conférenciers Développement Heures totales Nombre total de haut-parleurs
Un centre d'appel 8 kHz Conférenciers 2 Double 117:40:09 1,388
Conversation générale 8 kHz Conférenciers 2 Double 156:42:48 510
Musique 16 kHz Haut-parleur unique Mono 135:14:18 288

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Amazon
Google
Microsoft
Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • Ce champ est à des fins de validation et devrait être laissé inchangé.
  • En m'inscrivant, je suis d'accord avec Shaip Politique de Confidentialité ou Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.