Ensembles de données audio / parole / voix de haute qualité pour former votre modèle d'IA conversationnelle 

Ensembles de données voix/parole/audio prêts à l'emploi dans plusieurs langues pour démarrer vos modèles de reconnaissance automatique de la parole (ASR)

Ensembles de données vocales

Branchez le catalogue de données audio qui vous manquait aujourd'hui

InformationsEnsemble de données linguistiquesTaux d'échantillonnageType de jeu de donnéesNombre total d'heures audioTotal des heures de discoursDescription de l'ensemble de donnéesAudio ChannelPlate-forme d'enregistrementRET (%)Format audioFormat de transcriptionCase StudyCTA
ParoleAfro-américaineVernaculaire afro-américain8 kHzCentre d'appel214211Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAfro-américaineVernaculaire afro-américain16 kHzAudio multimédia159149Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroleafrikaansafrikaans8 kHzConversation générale368404Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, afrikaans parlé en AfriqueDoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroleafrikaansafrikaans16 kHzAudio multimédia658615Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleArabeArabe8 kHzConversation générale293297Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, arabe des pays du GolfeDoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolebostonboston8 kHzCentre d'appel177175Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolebostonboston8 kHzConversation générale3232Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolebostonboston16 kHzAudio multimédia9393Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais chinoisAnglais chinois8 kHzCentre d'appel169130Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais chinoisAnglais chinois16 kHzAudio multimédia249236Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleDanoisDanois8 kHzConversation générale372395Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleDanoisDanois16 kHzAudio multimédia664603Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglaisAnglais16 kHzAudio multimédia109Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais Grand SudAnglais Grand Sud8 kHzCentre d'appel151149Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais Grand SudAnglais Grand Sud8 kHzConversation générale5656Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais Grand SudAnglais Grand Sud16 kHzAudio multimédia266248Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHébreuHébreu8 kHzConversation générale399397Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, hébreu en IsraëlDoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHébreuHébreu16 kHzAudio multimédia427400Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHinglishHinglish8 kHzCentre d'appel208185Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHinglishHinglish16 kHzAudio multimédia216219Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais hispaniqueAnglais hispanique8 kHzCentre d'appel212209Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais hispaniqueAnglais hispanique16 kHzAudio multimédia155150Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais indienAnglais indien16 kHzAudio multimédia13787Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleIndonesianIndonesian8 kHzConversation générale496598Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, bahasa indonésienDoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleIndonesianIndonesian16 kHzAudio multimédia643610Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroleirlandaisirlandais8 kHzConversation générale192180Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleCoréenCoréen8 kHzCentre d'appel107103Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleCoréenCoréen16 kHzAudio multimédia204197Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMalaiMalai8 kHzConversation générale266302Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, malais en MalaisieDoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMalaiMalai16 kHzAudio multimédia344305Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais néo-zélandais Anglais néo-zélandais 8 kHzConversation générale148142Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais néo-zélandais Anglais néo-zélandais 16 kHzAudio multimédia400400Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais new-yorkaisAnglais new-yorkais8 kHzCentre d'appel103103Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais new-yorkaisAnglais new-yorkais8 kHzConversation générale107106Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais new-yorkaisAnglais new-yorkais16 kHzAudio multimédia140140Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePolonaisPolonais16 kHzAudio multimédia269255Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleÉcossaisÉcossais8 kHzConversation générale292267Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais de SingapourAnglais de Singapour8 kHzCentre d'appel218194Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais de SingapourAnglais de Singapour16 kHzAudio multimédia247240Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais sud-africainAnglais sud-africain8 kHzCentre d'appel261204Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais sud-africainAnglais sud-africain16 kHzAudio multimédia251245Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleEspagnolEspagnol16 kHzAudio multimédia32Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleSwahiliSwahili8 kHzCentre d'appel184165Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleSwahiliSwahili8 kHzCentre d'appel4644Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleSwahiliSwahili16 kHzAudio multimédia203191Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleSwahiliSwahili16 kHzAudio multimédia6258Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleSwedishStockingsSwedishStockings8 kHzCentre d'appel250224Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleSwedishStockingsSwedishStockings16 kHzAudio multimédia278255Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroletelugutelugu8 kHzConversation générale553582Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroletelugutelugu16 kHzAudio multimédia648599Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleThaiThai8 kHzConversation générale183201Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, Un registre informel utilisé entre amisDoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleThaiThai16 kHzAudio multimédia173167Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleVietnamienVietnamien8 kHzConversation générale295293Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, nord (par exemple, Hanoi), centre et sud (par exemple, Ho Chi Minh-Ville).DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleVietnamienVietnamien16 kHzAudio multimédia257248Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleGalloisGallois8 kHzConversation générale278299Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais indienAnglais indien8 kHzCentre d'appel200200Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,MonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroletelugu telugu NACentre d'appel3030Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTamil Tamil NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleKannada Kannada NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolemalayalam malayalam NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleBengali Bengali NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolegujarati gujarati NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMarathi Marathi NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAssamais Assamais NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleOriya Oriya NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePunjabi Punjabi NACentre d'appel6060Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroletelugu telugu NAConversation générale5050Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTamil Tamil NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleKannada Kannada NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolemalayalam malayalam NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleBengali Bengali NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolegujarati gujarati NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMarathi Marathi NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAssamais Assamais NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleOriya Oriya NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePunjabi Punjabi NAConversation générale100100Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,NADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Paroletelugu telugu NAAudio multimédia2020Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTamil Tamil NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleKannada Kannada NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolemalayalam malayalam NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleBengali Bengali NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolegujarati gujarati NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMarathi Marathi NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAssamais Assamais NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleOriya Oriya NAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePunjabiPunjabiNAAudio multimédia4040Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesNADesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAnglais USAnglais US48 kHzMonologue scénarisé54Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleEspagnol EspagneEspagnol Espagne48 kHzMonologue scénarisé108Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMexicainMexicain48 kHzMonologue scénarisé1,4921,228Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
Parolecanadiennecanadienne48 kHzMonologue scénarisé1,2221,049Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleNederlandNederland48 kHzMonologue scénarisé1,2051,021Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePologne polonaisePologne polonaise48 kHzMonologue scénarisé1,4821,266Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTurc TurquieTurc Turquie48 kHzMonologue scénarisé2,0271,735Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleChinoisChinois48 kHzMonologue scénarisé1,028891Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleArabeArabe48 kHzMonologue scénarisé1,9471,594Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleDanoisDanois48 kHzMonologue scénarisé2,5792,041Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes, danois du DanemarkMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHindiHindi8 kHzCentre d'appel122131Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHindiHindi16 kHzAudio multimédia219202Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoDesktop5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHindiHindi48 kHzMonologue scénarisé2,8672,105Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleJaponaisJaponais48 kHzMonologue scénarisé2,3352,029Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleCoréenCoréen48 kHzMonologue scénarisé1,9551,548Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleRusseRusse48 kHzMonologue scénarisé2,3982,046Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleChinois simplifiéChinois simplifié48 kHzMonologue scénarisé2,7622,181Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAllemandAllemand8 kHzCentre d'appel640Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage

Description

Conversations du centre d'appels 8khz : Conversation téléphonique synthétique non scénarisée : « agent » & « client »

Conversations génériques 8khz : Conversation téléphonique non scénarisée entre 2 personnes

Médias et podcasts 16 khz : Entrevues audio/vidéo du domaine public, podcasts, etc. 1 à 5 personnes

Énoncé/monologue scénarisé 16 khz : Enregistrement basé sur Prompt 

Contactez-nous

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données audio et vocales prêts à l'emploi sont collectés pour tous les types de données 

Contactez-nous maintenant pour vous débarrasser de vos soucis de collecte de données d'entraînement audio / vocal

  • En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions de service et donner mon consentement pour recevoir des communications marketing B2B de Shaip.