Jeu de données télougou
తెలుగు డేటాసెట్లు
Ensemble de données de conversation générale et de podcast en télougou de haute qualité pour les modèles d'IA et de parole
Aperçu
Titre
telugu Ensemble de données linguistiques
Type de jeu de données
Conversation générale
Description
Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
553
Taux d'échantillonnage
8 kHz
Audio Channel
Double
Plate-forme d'enregistrement
Desktop
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Inde
Langue
telugu
Égalité entre les
Femme 574, Homme 564, Inconnu 0
Nombre de haut-parleurs
1,138
Âge
18-50
Aperçu
Titre
telugu Ensemble de données linguistiques
Type de jeu de données
Podcast
Description
Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
648
Taux d'échantillonnage
16 kHz
Audio Channel
Mono
Plate-forme d'enregistrement
Sourcing Web
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Inde
Langue
telugu
Égalité entre les
Femme 207, Homme 963, Inconnu 2
Nombre de haut-parleurs
1,172
Âge
18-50
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.

Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal