Ensemble de données danois
Dansk Dataset
Ensemble de données de conversation générale, de synthèse vocale et de podcast danois de haute qualité pour les modèles d'IA et de parole
Vue d'ensemble
Titre (langue)
Ensemble de données sur la langue danoise
Types de jeux de données
Centre d'appels, Conversation générale, Données multimédias (Données de podcast), Monologue scénarisé
Pays
Danemark
Description
Des conversations téléphoniques improvisées entre deux personnes sont disponibles et durent environ 15 à 60 minutes. Les fichiers audio ou vidéo du domaine public, tels que les interviews ou les podcasts réunissant de 1 à 5 participants, sont également disponibles pendant 15 à 60 minutes. De plus, les enregistrements d'une seule phrase en danois, provenant du Danemark, durent généralement entre 5 et 30 secondes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Un centre d'appel | 8 kHz | Conférenciers 2 | Mono | 2,000:00:00 | Sur demande |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 356:29:47 | 700 |
| Données médias | 16 kHz | Enceintes multiples | Mono | 665:16:30 | 1,261 |
| Monologue scénarisé | 48 kHz | Haut-parleur unique | Mono | 2,496:00:00 | 2,825 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal