Jeu de données en hébreu
ערכת נתונים עברית
Ensemble de données de conversation générale et de podcast en hébreu de haute qualité pour les modèles d'IA et de parole
Marché
Titre (langue)
Ensemble de données sur la langue hébraïque
Types de jeux de données
Conversation générale, données médiatiques
Pays
Israël
Description
Des conversations téléphoniques non scénarisées entre deux personnes en hébreu depuis Israël sont disponibles avec des durées de 15 à 60 minutes, ainsi que des fichiers audio ou vidéo du domaine public sous licence tels que des interviews et des podcasts avec 1 à 5 participants, allant également de 15 à 60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
| Type de jeu de données | Taux d'échantillonnage | Conférenciers | Développement | Heures totales | Nombre total de haut-parleurs |
|---|---|---|---|---|---|
| Conversation générale | 8 kHz | Conférenciers 2 | Double | 398:47:10 | 814 |
| Données médias | 16 kHz | Enceintes multiples | Mono | 426:14:16 | 885 |
Clients en vedette
Donner aux équipes les moyens de créer des produits d'IA de pointe.
Vous n'arrivez pas à trouver ce que vous cherchez?
De nouveaux ensembles de données prêts à l'emploi sont collectés dans tous les types de données
Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal
Marché
Objet
Hébreu Ensemble de données linguistiques
Type de jeu de données
Conversation générale
Description
Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, hébreu en Israël.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
399
Taux d'échantillonnage
8 kHz
Audio Channel
Double
Plate-forme d'enregistrement
Bureau
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Israël
Langue
Hébreu
Genre
Femme 414, Homme 399, Inconnu 1
Nombre de haut-parleurs
814
Âge
18-50
Marché
Objet
Hébreu Ensemble de données linguistiques
Type de jeu de données
Podcast
Description
Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes.
Case Study
ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Détails de l'ensemble de données
Heures totales
427
Taux d'échantillonnage
16 kHz
Audio Channel
Mono
Plate-forme d'enregistrement
Sourcing Web
Format audio
. Wav
Format de transcription
.json
RET (%)
5
Démographie des ensembles de données
Pays
Israël
Langue
Hébreu
Genre
Femme 361, Homme 513, Inconnu 13
Nombre de haut-parleurs
887
Âge
18-50