Jeu de données marathi

मराठी डेटासेट

Ensemble de données marathi de haute qualité pour centres d'appels, conversations générales, monologues scénarisés et médias (podcasts) pour modèles d'IA et de parole

Vue d'ensemble

Titre (langue)

Ensemble de données sur la langue marathi

Types de jeux de données

Centre d'appels, Conversation générale, Médias (podcast), Monologue scénarisé

Pays

Inde

Description

Cet ensemble de données comprend des conversations téléphoniques synthétiques non scénarisées entre agents et clients (5 à 15 minutes), des conversations téléphoniques naturelles entre humains (15 à 60 minutes) et des enregistrements audio chantés avec transcriptions, fournissant diverses données vocales pour la formation et l'évaluation des technologies de la parole et du langage.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Type de jeu de données Taux d'échantillonnage Conférenciers Développement Heures totales Nombre total de haut-parleurs
Un centre d'appel 8 kHz Conférenciers 2 Double 70:28:58 634
Conversation générale 8 kHz Conférenciers 2 Double 159:21:13 298
Données médias 16 kHz Haut-parleurs multipal Mono 24:09:24 94
Monologue scénarisé 24 kHz Haut-parleur unique Mono 3,900:00:00 Sur demande

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Amazon
Google
Microsoft
Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • Ce champ est à des fins de validation et devrait être laissé inchangé.
  • En m'inscrivant, je suis d'accord avec Shaip Politique de Confidentialité ou Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.