Services de collecte de données vocales les plus fiables pour vos IA

Entraînez vos modèles NLP, VA, prototypes TTS et plus encore avec des données conversationnelles de qualité, avec nos services de collecte de données audio et vocales

Collecte de données audio

Découvrez les pipelines de données audio sans goulots d'étranglement.

Clients en vedette

Pourquoi l'ensemble de données d'entraînement vocal est-il nécessaire pour le traitement du langage naturel ?

Avez-vous déjà remarqué que votre smartphone VA, c'est-à-dire Siri, Bixby ou autre, interagissait ? La façon dont ils répondent à chaque question et analysent et présentent les résultats selon vos besoins !

Eh bien, bien que ces AV nous intriguent, ces ressources et programmes intelligents doivent être formés progressivement pour pouvoir répondre avec autant de précision. C'est la raison pour laquelle vous devriez envisager de sous-traiter la collecte de données vocales/audio et vocales à des sociétés spécialisées dans la collecte de données, avec une expertise professionnelle validante.

Investir dans la collecte de données audio prépare votre prétendu PNL à répondre à un public multilingue. De plus, la collecte de données vocales pour la PNL, au fur et à mesure qu'elle est gérée par un expert, prend même en compte la collecte sur le terrain, l'analyse sémantique et la transcription audio. Avec des solutions professionnelles de collecte de données vocales, vous pouvez :

  • Obtenir des ensembles de données audio de haute qualité pour améliorer la précision
  • Cibler diverses configurations de scénarios
  • Collecter des données d'entraînement multilingues pour l'IA
  • Faites évoluer votre modèle ML pour l'adapter à diverses données démographiques et verticales

Services professionnels de collecte de données audio/vocales pour la PNL

N'importe quel sujet. N'importe quel scénario.

Les systèmes de PNL intelligents sont tout sauf génériques. Selon la fonctionnalité du programme, vous devrez peut-être vous concentrer sur les services de données audio spatiaux et multilingues, qui ne peuvent être proposés que par des sociétés de collecte de données vocales/audio réputées. C'est là que Shaip entre en scène en tant que fournisseur de services de connexion de données très fiable qui est fier de faire le gros du travail pour vos IA prétendument intelligentes.

Chez Shaip, notre objectif principal est d'alimenter les modèles avec le plus grand volume possible d'échantillons de parole personnalisés, dans le moins de temps possible. Avec nous à bord, vous pouvez vous attendre à :

Collection de discours
  • Collecte de données audio/voix organisée pour la PNL
  • Des programmes sur mesure qui répondent à des cas d'utilisation spécifiques
  • Préparation de l'exploration d'ensembles de données audio
  • Traitement de données automatisé et spécifique au modèle
  • Niveau de spécificité de domaine le plus élevé possible
  • Mise sur le marché plus rapide avec des modèles d'IA accélérés

Notre expertise

Aligner les données audio pour préparer des modèles NLP intelligents

Shaip propose des services de collecte de données vocales/audio de bout en bout dans plus de 100 langues pour permettre aux technologies vocales de répondre à un ensemble diversifié de publics à travers le monde. Nous pouvons travailler sur des projets de toute envergure et de toute taille; de la licence d'ensembles de données audio disponibles dans le commerce à la gestion de la collecte de données audio personnalisée, en passant par la transcription et l'annotation audio. Quelle que soit la taille de votre projet de collecte de données vocales, nous pouvons personnaliser les services de collecte audio en fonction de vos besoins pour créer des ensembles de données PNL de haute qualité qui ciblent les dialectes, les tons et les langues. Choisissez parmi notre large gamme d'ensembles de données vocales et de ressources de collecte de données audio, pour des configurations intelligentes permettant la voix.

Discours monologue

Collection de discours monologues

Gérez les exigences vocales relatives à un haut-parleur autonome pour vos prototypes Text-to-Speed ​​et les exigences spécifiques aux transcriptions avec une alimentation d'invite scriptée, via des fichiers à canal unique.

Discours de dialogue

Discours de dialogue
Collection

Configurez des assistants virtuels intelligents, des chatbots spécifiques à la vitesse et des modèles de reconnaissance vocale automatique avec une exposition multilingue via des fichiers à double canal et des ressources transcrites.

Discours acoustique

Données acoustiques
Collection

Nous pouvons enregistrer de manière professionnelle des données audio de qualité studio, qu'il s'agisse de restaurants, de bureaux ou de maisons ou à partir de divers environnements et langues, grâce à notre réseau mondial de collaborateurs, tout en couvrant une gamme acoustique plus large

Énoncé en langage naturel

Collection d'énoncés en langage naturel

Former des configurations commerciales intelligentes pour identifier des phrases de clients prononcées différemment avec une signification similaire, pour rendre les IA plus autonomes dans le temps

Assistants virtuels numériques

Numérique / Virtuel
Assistants

Concentrez-vous sur la création de votre futur assistant virtuel en formant des modèles avec des mises en garde sur la parole humaine, l'exposition multilingue, l'analyse contextuelle et la NLU.

Reconnaissance vocale automatique

Reconnaissance vocale automatique (ASR)

Améliorez la précision de vos systèmes de reconnaissance automatique de la parole (ASR) en ayant accès à des ensembles de données vocales/audio diversifiés à la pointe de la technologie, à partir d'un large éventail de données démographiques.

Énoncé en langage naturel

Données multilingues d'entraînement vocal/audio

Nos professionnels de la langue hautement qualifiés à travers le monde offrent des données de formation audio/vocale multilingues dans plusieurs langues et dialectes, y compris l'arabe, le danois, le chinois, l'afrikaans, Singapour, la Nouvelle-Zélande, l'hébreu, l'indonésien, l'irlandais, le coréen, le malais, le polonais, l'écossais, le suédois. , français, allemand, vietnamien, thaï, italien, espagnol et plus.

Assistants virtuels numériques

Text-to-Speech
(TTS)

Pour offrir une meilleure expérience utilisateur avec TTS, développer un système au son naturel est essentiel. Créez un modèle multilingue de synthèse vocale (TTS) avec l'aide de notre main-d'œuvre mondiale, qui vous aide à collecter des données vocales dans plus de 150 langues et dialectes pour améliorer vos modèles d'IA, des commandes embarquées aux chatbots et aux solutions d'apprentissage avec un haut niveau de données audio de qualité.

Raisons de choisir Shaip comme partenaire de confiance pour la collecte de données vocales

Personnes

Personnes

Des équipes dédiées et formées:

  • Plus de 30,000 collaborateurs pour la création de données, l'étiquetage et le contrôle qualité
  • Équipe de gestion de projet accréditée
  • Équipe de développement de produits expérimentée
  • Équipe d'approvisionnement et d'intégration du pool de talents
Processus

Processus

Une efficacité de processus maximale est assurée avec:

  • Processus robuste 6 Sigma Stage-Gate
  • Une équipe dédiée de ceintures noires 6 Sigma – Responsables des processus clés & Conformité qualité
  • Amélioration continue et boucle de rétroaction
Plateforme

Plateforme

La plateforme brevetée offre des avantages :

  • Plateforme Web de bout en bout
  • Une qualité irréprochable
  • TAT plus rapide
  • Livraison transparente

Langue : Ensembles de données audio collectés

Ensembles de données vocales/audio prêts à l'emploi

DétailsEnsemble de données linguistiquesTaux d'échantillonnageType de jeu de donnéesNombre total d'heures audioDescription courteDescription de l'ensemble de donnéesAudio ChannelPlate-forme d'enregistrementRET (%)Format audioFormat de transcriptionCase StudyNombre de haut-parleursCTA
Parolefr_US_CC_8Vernaculaire afro-américainVernaculaire afro-américainen_US8 kHzCentre d'appel211Données du centre d'appel vernaculaire afro-américainConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 612, Homme : 1242 et Inconnu : 12
Parolefr_US_MA_16Vernaculaire afro-américainVernaculaire afro-américainen_US16 kHzAudio multimédia154Données sur les médias vernaculaires afro-américainsFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 151, Homme : 150 et Inconnu : 10
ParoleAfrikaans_GC_8afrikaansafrikaansaf_ZA8 kHzConversation générale368Données de conversation générale en afrikaansConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, afrikaans parlé en AfriqueDoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 502, Homme : 390 et Inconnu : 2
ParoleAfrikaans_MA_16afrikaansafrikaansaf_ZA16 kHzAudio multimédia658Fichiers multimédias en afrikaansFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 750, Homme : 1278 et Inconnu : 52
ParoleArabe_GC_8ArabeArabear_AE8 kHzConversation générale292Données de conversation générale en arabeConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, arabe des pays du GolfeDoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 171, Homme : 534 et Inconnu : 1
ParoleArabe_SM_48ArabeArabear-SA48 kHzMonologue scénarisé1,947Monologue scénarisé en arabeEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 838 Homme 1209 Inconnu 78
ParoleAssamais_CC_8AssamaisAssamais (en cours de développement) un péchéCentre d'appel60Données du centre d'appels assamais (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAssamais_GCAssamaisAssamais (en cours de développement) un péchéConversation générale100Assamais (en pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleAssamais_MAAssamaisAssamais (en cours de développement) un péchéAudio multimédia40Données audio des médias assamais (en cours de développement)Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleBengali_CC_8BengaliBengali (en cours) bn_INCentre d'appel60Données du centre d'appels en bengali (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleBengali_GCBengaliBengali (en cours) bn_INConversation générale100Bengali (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleBengali_MABengaliBengali (en cours) bn_INAudio multimédia40Bengali (In Pipeline) Données audio multimédiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleBoston_CC_8Boston anglaisBoston anglaisen_US8 kHzCentre d'appel177Données du centre d'appels de BostonConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 605, Homme : 711 et Inconnu : 0
ParoleBoston_GC_8Boston anglaisBoston anglaisen_US8 kHzConversation générale32Données de conversation générale de BostonConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 53, Homme : 83 et Inconnu : 0
ParoleBoston_MA_16Boston anglaisBoston anglaisen_US16 kHzAudio multimédia93Données audio de Boston MediaFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 43, Homme : 181 et Inconnu : 2
ParoleCanadian_SM_48Français canadienFrançais canadienfr-CA48 kHzMonologue scénarisé1,222Français canadienEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 974 Homme 631 Inconnu 1
ParoleChinois_CC_8Anglais chinoisAnglais chinoisen_US8 kHzCentre d'appel169Données du centre d'appels chinoisConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 1790, Homme : 523 et Inconnu : 13
ParoleChinois_MA_16Anglais chinoisAnglais chinoisen_US16 kHzAudio multimédia249Données audio des médias chinoisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 126, Homme : 346 et Inconnu : 6
ParoleChinois simplifié_SM_48Chinois simplifiéChinois simplifiézh-CN48 kHzMonologue scénarisé2,762Chinois simplifiéEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1920 Homme 1535 Inconnu 270
ParoleChinois traditionnel_SM_48ChinoisChinoiszh-TW48 kHzMonologue scénarisé1,028ChinoisEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1069 Homme 262 Inconnu 3
ParoleDanois_GC_8DanoisDanoisda_DK8 kHzConversation générale372Données de conversation générale en danoisConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 311, Homme : 417, Inconnu : 0
ParoleDanois_MA_16DanoisDanoisda_DK16 kHzAudio multimédia664Données audio des médias danoisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme : 369, Homme : 864, Inconnu : 27
ParoleDanois_SM_48DanoisDanoisda-DK48 kHzMonologue scénarisé2,579Monologue scénarisé danoisEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes, danois du DanemarkMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1551 Homme 1233 Inconnu 42
ParoleSud profond anglais_CC_8Anglais Grand SudAnglais Grand Suden_US8 kHzCentre d'appel151Données du centre d'appels du Sud profond anglaisConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 221 , Homme 1004 , Inconnu 7
ParoleSud profond anglais_GC_8Anglais Grand SudAnglais Grand Suden_US8 kHzConversation générale56Données de conversation générale en anglais Deep SouthConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 99, Homme 31, Inconnu 0
ParoleSud profond anglais_MA_16Anglais Grand SudAnglais Grand Suden_US16 kHzAudio multimédia266Données audio de Deep South Media en anglaisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 204, Homme 356, Inconnu 21
ParoleAllemand_CC_8AllemandAllemandde-De8 kHzCentre d'appel64Données des centres d'appels allemands Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,MonoDesktop. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 478 Homme 1440 Inconnu 0
ParoleAllemand_IVR_8AllemandAllemandde-De8 kHz IVR200Données IVR allemandesDe l'humain à la machine. Un type de flux IVR où il y a une invite TTS (par exemple "Comment puis-je vous aider") suivie d'une réponse humaine spontanéeMonoDesktop. Wav .jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage Femme 10115 Homme 8750 Inconnu 0
ParoleGujarati_CC_8gujaratiGujarati (en cours de développement) gu_INCentre d'appel60Données du centre d'appels en gujarati (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleGujarati_GCgujaratiGujarati (en cours de développement) gu_INConversation générale100Gujarati (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleGujarati_MAgujaratiGujarati (en cours de développement) gu_INAudio multimédia40Gujarati (In Pipeline) Données audio des médiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleHébreu_Conversation générale_8HébreuHébreuil_IL8 kHzConversation générale399Données de conversation générale en hébreuConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, hébreu en IsraëlDoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 414 , Homme 399 , Inconnu 1
ParoleHébreu_MA_16HébreuHébreuil_IL16 kHzAudio multimédia427Données audio des médias hébreuxFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 361, Homme 513, Inconnu 13
ParoleHindi_MA_16HindiHindiSalut dans16 kHzAudio multimédia219Données audio des médias hindiFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 83, Homme 309, Inconnu 0
ParoleHindi_SM_48HindiHindiSalut dans48 kHzMonologue scénarisé2,867Monologue écrit en hindiEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1977 Homme 1864 Inconnu 147
ParoleHINGLISH_CC_8HinglishHinglishhg_IN8 kHzCentre d'appel208HINGLISH Données du centre d'appelsConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 822, Homme 1262, Inconnu 0
ParoleHINGLISH_MA_16HinglishHinglishhg_IN16 kHzAudio multimédia216HINGLAIS Données audio multimédiaFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 75, Homme 380, Inconnu 0
ParoleHispanique_CC_8Anglais hispaniqueAnglais hispaniqueen_US8 kHzCentre d'appel212Données du centre d'appel hispaniqueConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 822, Homme 1262, Inconnu 0
ParoleHispanique_MA_16Anglais hispaniqueAnglais hispaniqueen_US16 kHzAudio multimédia155Audio des médias d'appel hispaniqueFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 140, Homme 219, Inconnu 5
ParoleIndonésien_GC_8IndonésienIndonésienJ'ai fait8 kHzConversation générale496Données de conversation générale en indonésienConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, bahasa indonésienDoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 524, Homme 454, Inconnu 2
ParoleIndonésien_MA_16IndonésienIndonésienJ'ai fait16 kHzAudio multimédia643Données audio des médias indonésiensFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 746, Homme 1507, Inconnu 129
ParoleIrlandais_GC_8irlandaisirlandaisfr_FR8 kHzConversation générale192Données de conversation générale irlandaiseConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 213 , Homme 153 , Inconnu 0
ParoleJaponais_SM_48JaponaisJaponaisja-JP48 kHzMonologue scénarisé2,335Monologue scénarisé japonaisEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1460 Homme 1221 Inconnu 194
ParoleKannada_CC_8KannadaKannada (en cours de développement) kn_INCentre d'appel60Données du centre d'appels Kannada (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleKannada_GCKannadaKannada (en cours de développement) kn_INConversation générale100Kannada (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleKannada_MAKannadaKannada (en cours de développement) kn_INAudio multimédia40Kannada (In Pipeline) Données audio multimédiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleCoréen_CC_8CoréenCoréenko_KR8 kHzCentre d'appel107Données du centre d'appels coréenConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1086, Homme 210, Inconnu 4
ParoleCoréen_MA_16CoréenCoréenko_KR16 kHzAudio multimédia204Données audio des médias coréensFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 70 Homme 303, Inconnu 25
ParoleCoréen_SM_48CoréenCoréenko-KR48 kHzMonologue scénarisé1,955Monologue scénarisé coréenEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1195 Homme 1134 Inconnu 122
ParoleMalais_GC_8MalaisienMalaisienms_MY8 kHzConversation générale266Données de conversation générale en malaisConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, malais en MalaisieDoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 316, Homme 176, Inconnu 0
ParoleMalais_MA_16MalaisienMalaisienms_MY16 kHzAudio multimédia344Données audio des médias malaisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 236, Homme 626, Inconnu 47
ParoleMalayalam_CC_8malayalamMalayalam (en cours) ml_INCentre d'appel60Données du centre d'appels en malayalam (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMalayalam_GCmalayalamMalayalam (en cours) ml_INConversation générale100Malayalam (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMalayalam_MAmalayalamMalayalam (en cours) ml_INAudio multimédia40Malayalam (In Pipeline) Données audio des médiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMarathie_CC_8MarathiMarathi (en cours) monsieur_INCentre d'appel60Données du centre d'appels Marathi (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMarathi_GCMarathiMarathi (en cours) monsieur_INConversation générale100Marathi (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMarathie_MAMarathiMarathi (en cours) monsieur_INAudio multimédia40Marathi (In Pipeline) Données audio des médiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleMexicain_SM_48Espagnol (Mexique)Espagnol (Mexique)es-MX48 kHzMonologue scénarisé1,492Monologue scénarisé espagnol mexicainEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1016 Homme 1069 Inconnu 95
ParolePays-Bas_SM_48HollandaisHollandaisfr-FR48 kHzMonologue scénarisé1,205Monologue scénarisé néerlandaisEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1285 Homme 531 Inconnu 3
ParoleNew York English_CC_8Anglais new-yorkaisAnglais new-yorkaisen_US8 kHzCentre d'appel103Données du centre d'appels anglais de New YorkConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 610, Homme 532, Inconnu 0
ParoleNew York English_GC_8Anglais new-yorkaisAnglais new-yorkaisen_US8 kHzConversation générale107Données de conversation générale en anglais à New YorkConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 118, Homme 114, Inconnu 0
ParoleNew York English_MA_16Anglais new-yorkaisAnglais new-yorkaisen_US16 kHzAudio multimédia140Données audio de New York English MediaFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 66, Homme 230, Inconnu 11
ParoleNouvelle-Zélande_GC_8Anglais néo-zélandais Anglais néo-zélandais fr_NZ8 kHzConversation générale148Données de conversation générale en anglais néo-zélandaisConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 167, homme 121, Inconnu 4
ParoleNouvelle-Zélande_MA_16Anglais néo-zélandais Anglais néo-zélandais fr_NZ16 kHzAudio multimédia400Audio des médias anglais néo-zélandaisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 367, homme 678, Inconnu 26
ParoleOriya_CC_8OriyaOriya (en cours) ou_INCentre d'appel60Données du centre d'appels Oriya (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleOriya_GCOriyaOriya (en cours) ou_INConversation générale100Oriya (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleOriya_MAOriyaOriya (en cours) ou_INAudio multimédia40Oriya (In Pipeline) Données audio multimédiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePolonais_MA_16PolonaisPolonaispl_PL16 kHzAudio multimédia269Audio des médias polonaisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 173 Homme 354 Inconnu 6
ParolePolonais Pologne_SM_48Polonais (Pologne)Polonais (Pologne)pl-PL48 kHzMonologue scénarisé1,482Pologne polonaise - Monologue scénariséEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1324 Homme 701 Inconnu 24
ParolePendjabi_CC_8PunjabiPunjabi (en préparation) PunjabiCentre d'appel60Punjabi (In Pipeline) Données du centre d'appelsConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePunjabi_GCPunjabiPunjabi (en préparation) PunjabiConversation générale100Punjabi (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParolePendjabi_MAPunjabiPunjabi (en préparation) Punjabi Audio multimédia40Punjabi (In Pipeline) Données audio des médiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleRusse_SM_48RussianRussianru-RU48 kHzMonologue scénarisé2,398Monologue scénarisé russeEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1689 Homme 1937 Inconnu 214
ParoleÉcossais_GC_8Écossais (accent anglais)Écossais (accent anglais)fr_AB8 kHzConversation générale292Données de conversation générale écossaiseConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 285, Homme 260, Inconnu 3
ParoleSingapour_CC_8Anglais de SingapourAnglais de Singapourfr_SG8 kHzCentre d'appel218Données du centre d'appels de SingapourConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 2139, Homme 884, Inconnu 21
ParoleSingapour_MA_16Anglais de SingapourAnglais de Singapourfr_SG16 kHzAudio multimédia247Données audio de Singapour MediaFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 160, Homme 455, Inconnu 37
ParoleAnglais sud-africain_CC_8Anglais sud-africainAnglais sud-africainfr_ZA8 kHzCentre d'appel261Données du centre d'appels anglais sud-africainConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1274 , Homme 935 , Inconnu 1
ParoleAnglais sud-africain_MA_16Anglais sud-africainAnglais sud-africainfr_ZA16 kHzAudio multimédia251Données audio des médias anglais sud-africainsFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 235, Homme 432, Inconnu 36
ParoleSwahili_CC_8SwahiliSwahilisw_KE8 kHzCentre d'appel230Données du centre d'appels en swahiliConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 611, Homme 833, Inconnu 0
ParoleSwahili_MA_16SwahiliSwahilisw_KE16 kHzAudio multimédia265Données audio du média swahiliFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 118, Homme 493, Inconnu 25
ParoleSuédois_CC_8SwedishSwedishsv_SE8 kHzCentre d'appel250Données du centre d'appel suédoisConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1581, homme 727, Inconnu 2
ParoleSuédois_MA_16SwedishSwedishsv_SE16 kHzAudio multimédia278Données audio des médias suédoisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 195, homme 500, Inconnu 21
ParoleTamoul_CC_8TamoulTamoul (en cours de développement) ta_INCentre d'appel60Données du centre d'appel tamoul (en cours de développement)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTamil_GCTamoulTamoul (en cours de développement) ta_INConversation générale100Tamil (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTamoul_MATamoul Tamoul (en cours de développement) ta_INAudio multimédia40Tamil (In Pipeline) Données audio des médiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTelugu_GC_8telugutelugute_IN8 kHzConversation générale553Données de conversation générale en télougouConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 574, Homme 564, Inconnu 0
ParoleTelugu_MA_16telugutelugute_IN16 kHzAudio multimédia648Données audio Telugu MediaFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 207, Homme 963, Inconnu 2
ParoleTelugu_CC_8teluguTelugu (en cours) te_INCentre d'appel30Données du centre d'appels Telugu (In Pipeline)Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTelugu_GCteluguTelugu (en cours) te_INConversation générale50Telugu (In Pipeline) Données de conversation généralesConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,Desktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleTelugu_MAteluguTelugu (en cours) te_INAudio multimédia20Telugu (In Pipeline) Données audio multimédiasFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage
ParoleThaï_GC_8ThaïThaïth_TH8 kHzConversation générale183Conversation générale thaïlandaiseConversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, Un registre informel utilisé entre amisDoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 338, Homme 96, Inconnu 8
ParoleThaï_MA_8ThaïThaïth_TH16 kHzAudio multimédia173Audio des médias thaïlandaisFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 143, Homme 502, Inconnu 26
ParoleTurc Turquie_SM_48Turc TurquieTurc Turquietr-TR48 kHzMonologue scénarisé2,027Turc TurquieEnregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondesMonoApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 1561 Homme 1241 Inconnu 31
ParoleVietnamien_GC_8VietnamienVietnamienvi_VN8 kHzConversation générale295Données de conversation générale en vietnamienConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, nord (par exemple, Hanoi), centre et sud (par exemple, Ho Chi Minh-Ville).DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 400, homme 380, inconnus 2
ParoleVietnamien_MA_16VietnamienVietnamienvi_VN16 kHzAudio multimédia257Données audio des médias vietnamiensFichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutesMonoSourcing Web5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 249, homme 200, inconnus 45
ParoleGallois_GC_8Gallois (accent anglais)Gallois (accent anglais)fr_WL8 kHzConversation générale278Données de conversation générale en galloisConversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,DoubleDesktop5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageFemme 270, Homme 324, Inconnu 0
ParoleAnglais britannique_WW_16Anglais britanniqueAnglais britanniquefr_fr16 kHzWake Word200Wake Word anglais britanniquephrases clés collecte de données
  • Haut-parleurs 200
  • 4 phrases clés uniques par intervenant
  • 25-30 enregistrements répétés de phrases clés par phrase clé unique
  • 25 à 30 fichiers audio par phrase clé unique
  • 120 paroles enregistrées au total par locuteur
1 canauxApplication mobile5.0. Wav.jsonASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langageSexe : 50 % masculin, 50 % féminin, +/- 10 %.

Services offerts

La collecte de données audio par des experts n'est pas un jeu d'enfant pour les configurations complètes de l'IA. Chez Shaip, vous pouvez même envisager les services suivants pour rendre les modèles beaucoup plus répandus que d'habitude :

Collecte de données textuelles

Collecte de données textuelles
Nos services

La vraie valeur des services de collecte de données cognitives de Shaip est qu'ils donnent aux organisations la clé pour déverrouiller les informations critiques trouvées dans les données non structurées

Collecte de données d'images

Services de collecte de données d'images

Assurez-vous que votre modèle de vision par ordinateur identifie chaque image avec précision, pour former de manière transparente les modèles d'IA de nouvelle génération du futur

Collecte de données vidéo

Services de collecte de données vidéo

Concentrez-vous maintenant sur la vision par ordinateur avec la PNL pour entraîner vos modèles à identifier les objets, les individus, les dissuasifs et autres éléments visuels à la perfection

Contactez-nous

Vous souhaitez créer votre propre ensemble de données audio ?

Connectez-vous avec notre expert interne en collecte de données vocales pour mettre en place un référentiel audio qui correspond le mieux à vos besoins

  • En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et des tours Conditions d'utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.