Jeu de données Hinglish
हिंगलिश डाटासेट
Ensemble de données de centre d'appels et de podcasts Hinglish de haute qualité pour les modèles d'IA et de parole
Marché
Titre (langue)
Ensemble de données sur la langue hinglish
Types de jeux de données
Centre d'appels, données multimédias
Pays
Inde
Description
Des conversations téléphoniques synthétiques et non scénarisées entre un agent et un client sont disponibles avec des durées de 5 à 15 minutes, tandis que les fichiers audio ou vidéo du domaine public sous licence tels que les interviews et les podcasts avec 1 à 5 participants durent généralement de 15 à 60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Centre d'appel | 8 kHz | Conférenciers 2 | Double | 240:54:06 | 2404 |
| Données médias | 16 kHz | Haut-parleurs multipal | Mono | 144:15:36 | 317 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal