Jeu de données malais

Définir les données Melayu

Ensemble de données malaisiennes de haute qualité pour centres d'appels, conversations générales et podcasts destinés aux modèles d'IA et de parole

Vue d'ensemble

Titre (langue)

Ensemble de données sur la langue malaise

Types de jeux de données

Centre d'appels, Conversation générale, Données multimédias (Données de podcast)

Pays

Malaisie, Indonésie, Brunei et Singapour

Description

Des conversations téléphoniques non scénarisées entre deux personnes en malais de Malaisie sont disponibles avec des durées de 15 à 60 minutes, ainsi que des fichiers audio ou vidéo du domaine public sous licence tels que des interviews et des podcasts avec 1 à 5 participants, allant également de 15 à 60 minutes.

Case Study

ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Détails de l'ensemble de données

Type de jeu de données Taux d'échantillonnage Conférenciers Développement Heures totales Nombre total de haut-parleurs
Conversation générale 8 kHz Conférenciers 2 Double 239:49:43 432
Conversation générale 48 kHz Conférenciers 2 Mono 90:19:23 140
Données médias 16 kHz Haut-parleurs multipal Mono 343:57:16 907
Un centre d'appel 8 kHz Conférenciers 2 Mono 2,000:00:00 Sur demande

Clients en vedette

Donner aux équipes les moyens de créer des produits d'IA de pointe.

Amazon
Google
Microsoft
Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • Ce champ est à des fins de validation et devrait être laissé inchangé.
  • En m'inscrivant, je suis d'accord avec Shaip Politique de Confidentialité ou Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.