Ensemble de données polonais
Ensemble de données polonais
Données médiatiques polonaises de haute qualité et monologues scénarisés pour l'IA et les modèles de parole
Aperçu
Titre (langue)
Ensemble de données en langue polonaise
Types de jeux de données
Médias (podcast), monologue scénarisé
Pays
Pologne
Description
Cet ensemble de données comprend des fichiers audio ou vidéo du domaine public sous licence tels que des interviews et des podcasts avec 1 à 5 participants (15 à 60 minutes), ainsi que des monologues scénarisés où un seul locuteur fournit un contenu prédéfini pour la formation et l'évaluation des modèles de parole et de langage.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Données médias | 16 kHz | Haut-parleurs multipal | Mono | 268:56:51 | 532 |
| Monologue scénarisé | 48 kHz | Haut-parleur unique | Mono | 2,348:00:00 | 2,699 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal