Ensemble de données bengali
বাংলা ডেটাসেট
Ensemble de données bengali de haute qualité pour les centres d'appels, les conversations générales et les podcasts pour les modèles d'IA et de parole
Informations clés
Titre
Ensemble de données sur la langue bengali
Type de jeu de données
Centre d'appel
Description
Conversation téléphonique synthétique non scénarisée entre « agent » et « client », env. Durée audio (plage) 5-15 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
60
Taux d'échantillonnage
8 Khz
Audio Channel
Double
Plate-forme d'enregistrement
Bureau
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Inde
Langue :
Bengali
Genre:
Homme : 332, Femme : 192 et Inconnu : 0
Nombre de haut-parleurs
524
Âge :
18-50
Informations clés
Titre
Ensemble de données sur la langue bengali
Type de jeu de données
Conversation générale
Description
Conversation téléphonique synthétique non scénarisée entre « agent » et « client », env. Durée audio (plage) 5-15 minutes
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
100
Taux d'échantillonnage
8 Khz
Audio Channel
Double
Plate-forme d'enregistrement
Bureau
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Inde
Langue :
Bengali
Genre:
Homme : 304, Femme : 270 et Inconnu : 0
Nombre de haut-parleurs
574
Âge :
18-50
Informations clés
Titre
Ensemble de données sur la langue bengali
Type de jeu de données
Podcast
Description
Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
40
Taux d'échantillonnage
16 Khz
Audio Channel
Mono
Plate-forme d'enregistrement
Sourcing Web
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Inde
Langue :
Bengali
Genre:
Homme : 86, Femme : 10 et Inconnu : 0
Nombre de haut-parleurs
96
Âge :
18-50
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.

Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal