Jeu de données malais
Définir les données Melayu
Ensemble de données malaisiennes de haute qualité pour centres d'appels, conversations générales et podcasts destinés aux modèles d'IA et de parole
Vue d'ensemble
Titre (langue)
Ensemble de données sur la langue malaise
Types de jeux de données
Centre d'appels, Conversation générale, Données multimédias (Données de podcast)
Pays
Malaisie, Indonésie, Brunei et Singapour
Description
Des conversations téléphoniques non scénarisées entre deux personnes en malais de Malaisie sont disponibles avec des durées de 15 à 60 minutes, ainsi que des fichiers audio ou vidéo du domaine public sous licence tels que des interviews et des podcasts avec 1 à 5 participants, allant également de 15 à 60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 239:49:43 | 432 |
| Conversation générale | 48 kHz | Conférenciers 2 | Mono | 90:19:23 | 140 |
| Données médias | 16 kHz | Haut-parleurs multipal | Mono | 343:57:16 | 907 |
| Un centre d'appel | 8 kHz | Conférenciers 2 | Mono | 2,000:00:00 | Sur demande |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal