Ensemble de données anglais de New York

Ensemble de données de centre d'appels, de conversation générale et de podcast de haute qualité pour les modèles d'IA et de parole à New York

Aperçu

Titre

Ensemble de données sur la langue anglaise de New York

Type de jeu de données

Centre d'appel

Description

Conversation téléphonique synthétique non scénarisée entre « agent » et « client », env. Durée audio (plage) 5-15 minutes.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Heures totales

103

Taux d'échantillonnage

8 kHz

Audio Channel

Mono

Plate-forme d'enregistrement

Desktop

Format audio

. Wav

Format de transcription

.json

RET (%)

5

Démographie des ensembles de données

Pays

USA

Langue

Anglais new-yorkais

Égalité entre les

Femme 610, Homme 532, Inconnu 0

Nombre de haut-parleurs

1,142

Âge

18-50

Aperçu

Titre

Ensemble de données sur la langue anglaise de New York

Type de jeu de données

Conversation générale

Description

Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Heures totales

107

Taux d'échantillonnage

8 kHz

Audio Channel

Double

Plate-forme d'enregistrement

Desktop

Format audio

. Wav

Format de transcription

.json

RET (%)

5

Démographie des ensembles de données

Pays

USA

Langue

Anglais new-yorkais

Égalité entre les

Femme 118 Homme 114 Inconnu 0

Nombre de haut-parleurs

232

Âge

18-50

Aperçu

Titre

Ensemble de données sur la langue anglaise de New York

Type de jeu de données

TTS

Description

Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Heures totales

140

Taux d'échantillonnage

16 kHz

Audio Channel

Mono

Plate-forme d'enregistrement

Sourcing Web

Format audio

. Wav

Format de transcription

.json

RET (%)

5

Démographie des ensembles de données

Pays

USA

Langue

Anglais new-yorkais

Égalité entre les

Femme 66, Homme 230, Inconnu 11

Nombre de haut-parleurs

307

Âge

18-50

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Amazon
Google
Microsoft
Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • En m'inscrivant, je suis d'accord avec Shaip Privacy Policy et Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.
  • Ce champ est à des fins de validation et devrait être laissé inchangé.