Jeu de données marathi
मराठी डेटासेट
Ensemble de données marathi de haute qualité pour centres d'appels, conversations générales, monologues scénarisés et médias (podcasts) pour modèles d'IA et de parole
Vue d'ensemble
Titre (langue)
Ensemble de données sur la langue marathi
Types de jeux de données
Centre d'appels, Conversation générale, Médias (podcast), Monologue scénarisé
Pays
Inde
Description
Cet ensemble de données comprend des conversations téléphoniques synthétiques non scénarisées entre agents et clients (5 à 15 minutes), des conversations téléphoniques naturelles entre humains (15 à 60 minutes) et des enregistrements audio chantés avec transcriptions, fournissant diverses données vocales pour la formation et l'évaluation des technologies de la parole et du langage.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Un centre d'appel | 8 kHz | Conférenciers 2 | Double | 70:28:58 | 634 |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 159:21:13 | 298 |
| Données médias | 16 kHz | Haut-parleurs multipal | Mono | 24:09:24 | 94 |
| Monologue scénarisé | 24 kHz | Haut-parleur unique | Mono | 3,900:00:00 | Sur demande |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal