Ensemble de données indonésien
Kumpulan Data Indonésie
Ensemble de données de conversation générale et de podcast indonésien de haute qualité pour les modèles d'IA et de parole
Vue d'ensemble
Titre (langue)
Ensemble de données sur la langue indonésienne
Types de jeux de données
Centre d'appels, Conversation générale, Musique, Monologue scénarisé
Pays
Indonésie
Description
Des conversations téléphoniques non scénarisées entre deux personnes en indonésien sont disponibles avec des durées de 15 à 60 minutes, ainsi que des fichiers audio ou vidéo du domaine public sous licence tels que des interviews et des podcasts avec 1 à 5 participants, allant également de 15 à 60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Un centre d'appel | 8 kHz | Conférenciers 2 | Mono | 100,000:00:00 | Sur demande |
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 453:09:53 | 890 |
| Données médias | 16 kHz | Haut-parleurs multipal | Mono | 640:04:34 | 2,367 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal