Jeu de données malayalam
മലയാളം ഡാറ്റാസെറ്റ്
Ensemble de données de conversation générale et de podcasts en malayalam de haute qualité pour les modèles d'IA et de parole
Marché
Titre (langue)
Ensemble de données sur la langue malayalam
Types de jeux de données
Conversation générale, données sur les médias (podcast)
Pays
Inde
Description
Cet ensemble de données comprend des conversations téléphoniques synthétiques non scénarisées entre un agent et un client (5 à 15 minutes) et des fichiers audio ou vidéo du domaine public sous licence, tels que des interviews et des podcasts avec 1 à 5 participants (15 à 60 minutes).
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 70:46:30 | 576 |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 149:39:33 | 296 |
| Données médias | 16 kHz | Enceintes multiples | Mono | 12:39:24 | 81 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal