Ensemble de données hindi
हिंदी डेटासेट
Ensemble de données de haute qualité en hindi pour centres d'appels, conversations générales et podcasts pour modèles d'IA et de reconnaissance automatique de la parole
Vue d'ensemble
Titre (langue)
Ensemble de données sur la langue hindi
Types de jeux de données
Centre d'appels, Conversation générale, Médias (podcast), Monologue scénarisé
Pays
Inde
Description
Des conversations téléphoniques non scénarisées entre deux personnes sont disponibles, d'une durée de 15 à 60 minutes, ainsi que des fichiers audio ou vidéo sous licence, relevant du domaine public, tels que des interviews et des podcasts, avec un à cinq participants du même groupe. Des enregistrements d'énoncés uniques durent généralement de 5 à 30 secondes, et des données de monologues scénarisés sont également disponibles.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Un centre d'appel | 8 kHz | Conférenciers 2 | Double | 70:45:51 | Sur demande |
| Un centre d'appel | 8 kHz | Conférenciers 2 | Mono | 20,000:00:00 | Sur demande |
| Un centre d'appel | 16 kHz | Conférenciers 2 | Mono | 29:17:20 | 261 |
| Un centre d'appel | 16 kHz | Conférenciers 2 | Double | 400:27:10 | 1200 |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 47:48:40 | 224 |
| Données médias | 16 kHz | Enceintes multiples | Mono | 227:57:43 | 438 |
| Monologue scénarisé | 48 kHz | Haut-parleur unique | Mono | 2,866:00:00 | 3,988 |
| Monologue scénarisé | 24 kHz | Haut-parleur unique | Mono | 29,000:00:00 | Sur demande |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal