Ensemble de données bengali

বাংলা ডেটাসেট

Ensemble de données bengali de haute qualité pour les centres d'appels, les conversations générales et les podcasts pour les modèles d'IA et de parole

Vue d'ensemble

Titre (langue)

Ensemble de données sur la langue bengali

Types de jeux de données

Centre d'appels, Conversation générale, Données multimédias (Données de podcast), Monologue scénarisé

Pays

Inde

Description

Des conversations téléphoniques synthétiques et improvisées entre un agent et un client sont disponibles, d'une durée approximative de 5 à 15 minutes. Des fichiers audio ou vidéo sous licence, appartenant au domaine public, tels que des interviews, des podcasts et autres contenus similaires impliquant de 1 à 5 participants, sont également disponibles, d'une durée approximative de 15 à 60 minutes.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Type de jeu de données Taux d'échantillonnage Conférenciers Développement Heures totales Nombre total de haut-parleurs
Un centre d'appel 8 kHz Conférenciers 2 Double 117:03:45 498
Conversation générale 8 kHz Conférenciers 2 Double 168:13:39 458
Données médias 16 kHz Plusieurs locuteurs Mono 24:58:58 90
Monologue scénarisé 24 kHz Haut-parleur unique Mono 2,300:00:00 Sur demande

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Amazon
Google
Microsoft
Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • Ce champ est à des fins de validation et devrait être laissé inchangé.
  • En m'inscrivant, je suis d'accord avec Shaip Politique de Confidentialité ou Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.