Ensemble de données bengali
বাংলা ডেটাসেট
Ensemble de données bengali de haute qualité pour les centres d'appels, les conversations générales et les podcasts pour les modèles d'IA et de parole
Vue d'ensemble
Titre (langue)
Ensemble de données sur la langue bengali
Types de jeux de données
Centre d'appels, Conversation générale, Données multimédias (Données de podcast), Monologue scénarisé
Pays
Inde
Description
Des conversations téléphoniques synthétiques et improvisées entre un agent et un client sont disponibles, d'une durée approximative de 5 à 15 minutes. Des fichiers audio ou vidéo sous licence, appartenant au domaine public, tels que des interviews, des podcasts et autres contenus similaires impliquant de 1 à 5 participants, sont également disponibles, d'une durée approximative de 15 à 60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Un centre d'appel | 8 kHz | Conférenciers 2 | Double | 117:03:45 | 498 |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 168:13:39 | 458 |
| Données médias | 16 kHz | Plusieurs locuteurs | Mono | 24:58:58 | 90 |
| Monologue scénarisé | 24 kHz | Haut-parleur unique | Mono | 2,300:00:00 | Sur demande |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal