Ensemble de données coréen

한국어 데이터셋

Ensemble de données de centre d'appels coréen de haute qualité, de monologues scénarisés et de médias (podcasts) pour modèles d'IA et de parole

Marché

Titre (langue)

Ensemble de données en langue coréenne

Types de jeux de données

Centre d'appels, données multimédias, monologue scénarisé

Pays

Corée

Description

Cet ensemble de données comprend des conversations téléphoniques synthétiques non scénarisées entre un agent et un client (5 à 15 minutes), des fichiers audio/vidéo du domaine public sous licence tels que des entretiens et des podcasts avec 1 à 5 participants (15 à 60 minutes) et des monologues scénarisés mettant en vedette un seul locuteur délivrant un contenu prédéfini pour la formation du modèle de parole et de langage.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Type de jeu de données Taux d'échantillonnage Conférenciers Développement Heures totales Nombre total de haut-parleurs
Centre d'appel 8 kHz Conférenciers 2 Double 102:27:55 1,244
Données médias 16 kHz Enceintes multiples Mono 203:46:54 397
Monologue scénarisé 24 kHz Haut-parleur unique Mono 500:00:00 Sur demande
Monologue scénarisé 48 kHz Haut-parleur unique Mono 1,955:00:00 Sur demande

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Amazon
Google
Microsoft
Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • Ce champ est à des fins de validation et devrait être laissé inchangé.
  • En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.