Jeu de données tamoul
தமிழ் தரவுத்தொகுப்பு
Exploitez la puissance des ensembles de données vocales tamoules pour la reconnaissance automatique de la parole (ASR), la synthèse vocale (TTS) et l'IA conversationnelle. Shaip propose des ensembles de données audio tamoules premium pour former des modèles linguistiques plus intelligents.
Vue d'ensemble
Titre (langue)
Ensemble de données sur la langue tamoule
Types de jeux de données
Centre d'appels, Conversation générale, Données multimédias, Monologue scénarisé
Pays
Inde
Description
Cet ensemble de données comprend des conversations synthétiques non scénarisées entre agents et clients (5 à 15 minutes), des conversations téléphoniques naturelles entre humains (15 à 60 minutes) et des données multimédias avec transcriptions, offrant diverses données vocales pour la formation et l'évaluation des technologies de la parole et du langage.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Un centre d'appel | 8 kHz | Conférenciers 2 | Double | 124:23:52 | 484 |
| Un centre d'appel | 16 kHz | Conférenciers 2 | Mono | 199:44:21 | 1,986 |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 101:42:05 | 440 |
| Conversation générale | 48 kHz | Conférenciers 2 | Mono | 80:21:16 | 141 |
| Données médias | 16 kHz | Enceintes multiples | Mono | 43:07:01 | 32 |
| Monologue scénarisé | 24 kHz | Haut-parleur unique | Mono | 500:00:00 | Sur demande |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal