Services de collecte de données vocales les plus fiables pour votre IA
Entraînez vos modèles NLP, VA, prototypes TTS et plus encore avec des données conversationnelles de qualité, avec nos services de collecte de données audio et vocales
Découvrez les pipelines de données audio sans goulots d'étranglement.
Clients en vedette
Pourquoi l'ensemble de données d'entraînement vocal est-il nécessaire pour le traitement du langage naturel ?
Avez-vous déjà remarqué que votre smartphone VA, c'est-à-dire Siri, Bixby ou autre, interagissait ? La façon dont ils répondent à chaque question et analysent et présentent les résultats selon vos besoins !
Eh bien, bien que ces AV nous intriguent, ces ressources et programmes intelligents doivent être formés progressivement pour pouvoir répondre avec autant de précision. C'est la raison pour laquelle vous devriez envisager de sous-traiter la collecte de données vocales/audio et vocales à des sociétés spécialisées dans la collecte de données, avec une expertise professionnelle validante.
Investir dans la collecte de données audio prépare votre prétendu PNL à répondre à un public multilingue. De plus, la collecte de données vocales pour la PNL, au fur et à mesure qu'elle est gérée par un expert, prend même en compte la collecte sur le terrain, l'analyse sémantique et la transcription audio. Avec des solutions professionnelles de collecte de données vocales, vous pouvez :
- Obtenir des ensembles de données audio de haute qualité pour améliorer la précision
- Cibler diverses configurations de scénarios
- Collecter des données d'entraînement multilingues pour l'IA
- Faites évoluer votre modèle ML pour l'adapter à diverses données démographiques et verticales
Services professionnels de collecte de données audio/vocales pour la PNL
N'importe quel sujet. N'importe quel scénario.
Les systèmes de PNL intelligents sont tout sauf génériques. Selon la fonctionnalité du programme, vous devrez peut-être vous concentrer sur les services de données audio spatiaux et multilingues, qui ne peuvent être proposés que par des sociétés de collecte de données vocales/audio réputées. C'est là que Shaip entre en scène en tant que fournisseur de services de connexion de données très fiable qui est fier de faire le gros du travail pour vos IA prétendument intelligentes.
Chez Shaip, notre objectif principal est d'alimenter les modèles avec le plus grand volume possible d'échantillons de parole personnalisés, dans le moins de temps possible. Avec nous à bord, vous pouvez vous attendre à :
- Collecte de données audio/voix organisée pour la PNL
- Des programmes sur mesure qui répondent à des cas d'utilisation spécifiques
- Préparation de l'exploration d'ensembles de données audio
- Traitement de données automatisé et spécifique au modèle
- Niveau de spécificité de domaine le plus élevé possible
- Mise sur le marché plus rapide avec des modèles d'IA accélérés
Notre expertise
Aligner les données audio pour préparer des modèles NLP intelligents
Shaip propose des services de collecte de données vocales/audio de bout en bout dans plus de 100 langues pour permettre aux technologies vocales de répondre à un ensemble diversifié de publics à travers le monde. Nous pouvons travailler sur des projets de toute envergure et de toute taille; de la licence d'ensembles de données audio disponibles dans le commerce à la gestion de la collecte de données audio personnalisée, en passant par la transcription et l'annotation audio. Quelle que soit la taille de votre projet de collecte de données vocales, nous pouvons personnaliser les services de collecte audio en fonction de vos besoins pour créer des ensembles de données PNL de haute qualité qui ciblent les dialectes, les tons et les langues. Choisissez parmi notre large gamme d'ensembles de données vocales et de ressources de collecte de données audio, pour des configurations intelligentes permettant la voix.
Collection de discours monologues
Gérez les exigences vocales relatives à un haut-parleur autonome pour vos prototypes Text-to-Speed et les exigences spécifiques aux transcriptions avec une alimentation d'invite scriptée, via des fichiers à canal unique.
Discours de dialogue
Collection
Configurez des assistants virtuels intelligents, des chatbots spécifiques à la vitesse et des modèles de reconnaissance vocale automatique avec une exposition multilingue via des fichiers à double canal et des ressources transcrites.
Données acoustiques
Collection
Nous pouvons enregistrer de manière professionnelle des données audio de qualité studio, qu'il s'agisse de restaurants, de bureaux ou de maisons ou à partir de divers environnements et langues, grâce à notre réseau mondial de collaborateurs, tout en couvrant une gamme acoustique plus large
Collection d'énoncés en langage naturel
Former des configurations commerciales intelligentes pour identifier des phrases de clients prononcées différemment avec une signification similaire, pour rendre les IA plus autonomes dans le temps
Numérique / Virtuel
Assistants
Concentrez-vous sur la création de votre futur assistant virtuel en formant des modèles avec des mises en garde sur la parole humaine, l'exposition multilingue, l'analyse contextuelle et la NLU.
Reconnaissance vocale automatique (ASR)
Améliorez la précision de vos systèmes de reconnaissance automatique de la parole (ASR) en ayant accès à des ensembles de données vocales/audio diversifiés à la pointe de la technologie, à partir d'un large éventail de données démographiques.
Données multilingues d'entraînement vocal/audio
Nos professionnels de la langue hautement qualifiés à travers le monde offrent des données de formation audio/vocale multilingues dans plusieurs langues et dialectes, y compris l'arabe, le danois, le chinois, l'afrikaans, Singapour, la Nouvelle-Zélande, l'hébreu, l'indonésien, l'irlandais, le coréen, le malais, le polonais, l'écossais, le suédois. , français, allemand, vietnamien, thaï, italien, espagnol et plus.
Text-to-Speech
(TTS)
Pour offrir une meilleure expérience utilisateur avec TTS, développer un système au son naturel est essentiel. Créez un modèle multilingue de synthèse vocale (TTS) avec l'aide de notre main-d'œuvre mondiale, qui vous aide à collecter des données vocales dans plus de 150 langues et dialectes pour améliorer vos modèles d'IA, des commandes embarquées aux chatbots et aux solutions d'apprentissage avec un haut niveau de données audio de qualité.
Raisons de choisir Shaip comme partenaire de confiance pour la collecte de données vocales
Personnes
Des équipes dédiées et formées:
- Plus de 30,000 collaborateurs pour la création de données, l'étiquetage et le contrôle qualité
- Équipe de gestion de projet accréditée
- Équipe de développement de produits expérimentée
- Équipe d'approvisionnement et d'intégration du pool de talents
Processus
Une efficacité de processus maximale est assurée avec:
- Processus robuste 6 Sigma Stage-Gate
- Une équipe dédiée de ceintures noires 6 Sigma – Responsables des processus clés & Conformité qualité
- Amélioration continue et boucle de rétroaction
Plateforme
La plateforme brevetée offre des avantages :
- Plateforme Web de bout en bout
- Une qualité irréprochable
- TAT plus rapide
- Livraison transparente
Personnes
Des équipes dédiées et formées:
- Plus de 30,000 collaborateurs pour la création de données, l'étiquetage et le contrôle qualité
- Équipe de gestion de projet accréditée
- Équipe de développement de produits expérimentée
- Équipe d'approvisionnement et d'intégration du pool de talents
Processus
Une efficacité de processus maximale est assurée avec:
- Processus robuste 6 Sigma Stage-Gate
- Une équipe dédiée de ceintures noires 6 Sigma – Responsables des processus clés & Conformité qualité
- Amélioration continue et boucle de rétroaction
Plateforme
La plateforme brevetée offre des avantages :
- Plateforme Web de bout en bout
- Une qualité irréprochable
- TAT plus rapide
- Livraison transparente
Langue : Ensembles de données audio collectés
Ensembles de données vocales/audio prêts à l'emploi
Détails | ID de corpus (unique) | Mots-clés | Ensemble de données linguistiques | Code de langue | Taux d'échantillonnage | Type de jeu de données | Nombre total d'heures audio | Description courte | Description de l'ensemble de données | Audio Channel | Plate-forme d'enregistrement | RET (%) | Format audio | Format de transcription | Case Study | Nombre de haut-parleurs | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
fr_US_CC_8 | Vernaculaire afro-américain | Vernaculaire afro-américain | en_US | 8 kHz | Centre d'appel | 211 | Données du centre d'appel vernaculaire afro-américain | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 612, Homme : 1242 et Inconnu : 12 | Contacter | |
fr_US_MA_16 | Vernaculaire afro-américain | Vernaculaire afro-américain | en_US | 16 kHz | Audio multimédia | 154 | Données sur les médias vernaculaires afro-américains | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 151, Homme : 150 et Inconnu : 10 | Contacter | |
Afrikaans_GC_8 | Afrikaans | Afrikaans | af_ZA | 8 kHz | Conversation générale | 368 | Données de conversation générale en afrikaans | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, afrikaans parlé en Afrique | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 502, Homme : 390 et Inconnu : 2 | Contacter | |
Afrikaans_MA_16 | Afrikaans | Afrikaans | af_ZA | 16 kHz | Audio multimédia | 658 | Fichiers multimédias en afrikaans | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 750, Homme : 1278 et Inconnu : 52 | Contacter | |
Arabe_GC_8 | Arabe | Arabe | ar_AE | 8 kHz | Conversation générale | 292 | Données de conversation générale en arabe | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, arabe des pays du Golfe | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 171, Homme : 534 et Inconnu : 1 | Contacter | |
Arabe_SM_48 | Arabe | Arabe | ar-SA | 48 kHz | Monologue scénarisé | 1,947 | Monologue scénarisé en arabe | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 838 Homme 1209 Inconnu 78 | Contacter | |
Assamais_CC_8 | Assamais | Assamais (en cours de développement) | un péché | Centre d'appel | 60 | Données du centre d'appels assamais (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Assamais_GC | Assamais | Assamais (en cours de développement) | un péché | Conversation générale | 100 | Assamais (en pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Assamais_MA | Assamais | Assamais (en cours de développement) | un péché | Audio multimédia | 40 | Données audio des médias assamais (en cours de développement) | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Bengali_CC_8 | Bengali | Bengali (en cours) | bn_IN | Centre d'appel | 60 | Données du centre d'appels en bengali (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Bengali_GC | Bengali | Bengali (en cours) | bn_IN | Conversation générale | 100 | Bengali (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Bengali_MA | Bengali | Bengali (en cours) | bn_IN | Audio multimédia | 40 | Bengali (In Pipeline) Données audio multimédias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Boston_CC_8 | Boston anglais | Boston anglais | en_US | 8 kHz | Centre d'appel | 177 | Données du centre d'appels de Boston | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 605, Homme : 711 et Inconnu : 0 | Contacter | |
Boston_GC_8 | Boston anglais | Boston anglais | en_US | 8 kHz | Conversation générale | 32 | Données de conversation générale de Boston | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 53, Homme : 83 et Inconnu : 0 | Contacter | |
Boston_MA_16 | Boston anglais | Boston anglais | en_US | 16 kHz | Audio multimédia | 93 | Données audio de Boston Media | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 43, Homme : 181 et Inconnu : 2 | Contacter | |
Canadien_SM_48 | Français canadien | Français canadien | fr-CA | 48 kHz | Monologue scénarisé | 1,222 | Français canadien | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 974 Homme 631 Inconnu 1 | Contacter | |
Chinois_CC_8 | Anglais chinois | Anglais chinois | en_US | 8 kHz | Centre d'appel | 169 | Données du centre d'appels chinois | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 1790, Homme : 523 et Inconnu : 13 | Contacter | |
Chinois_MA_16 | Anglais chinois | Anglais chinois | en_US | 16 kHz | Audio multimédia | 249 | Données audio des médias chinois | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 126, Homme : 346 et Inconnu : 6 | Contacter | |
Chinois simplifié_SM_48 | Chinois simplifié | Chinois simplifié | zh-CN | 48 kHz | Monologue scénarisé | 2,762 | Chinois simplifié | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1920 Homme 1535 Inconnu 270 | Contacter | |
Chinois traditionnel_SM_48 | Chinois | Chinois | zh-TW | 48 kHz | Monologue scénarisé | 1,028 | Chinois | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1069 Homme 262 Inconnu 3 | Contacter | |
Danois_GC_8 | Danois | Danois | da_NSP | 8 kHz | Conversation générale | 372 | Données de conversation générale en danois | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 311, Homme : 417, Inconnu : 0 | Contacter | |
Danois_MA_16 | Danois | Danois | da_NSP | 16 kHz | Audio multimédia | 664 | Données audio des médias danois | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme : 369, Homme : 864, Inconnu : 27 | Contacter | |
Danois_SM_48 | Danois | Danois | da-DK | 48 kHz | Monologue scénarisé | 2,579 | Monologue scénarisé danois | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes, danois du Danemark | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1551 Homme 1233 Inconnu 42 | Contacter | |
Sud profond anglais_CC_8 | Anglais Grand Sud | Anglais Grand Sud | en_US | 8 kHz | Centre d'appel | 151 | Données du centre d'appels du Sud profond anglais | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 221 , Homme 1004 , Inconnu 7 | Contacter | |
Sud profond anglais_GC_8 | Anglais Grand Sud | Anglais Grand Sud | en_US | 8 kHz | Conversation générale | 56 | Données de conversation générale en anglais Deep South | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 99, Homme 31, Inconnu 0 | Contacter | |
Sud profond anglais_MA_16 | Anglais Grand Sud | Anglais Grand Sud | en_US | 16 kHz | Audio multimédia | 266 | Données audio de Deep South Media en anglais | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 204, Homme 356, Inconnu 21 | Contacter | |
Allemand_CC_8 | Allemand | Allemand | de-De | 8 kHz | Centre d'appel | 64 | Données des centres d'appels allemands | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Mono | Desktop | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 478 Homme 1440 Inconnu 0 | Contacter | ||
Allemand_IVR_8 | Allemand | Allemand | de-De | 8 kHz | IVR | 200 | Données IVR allemandes | De l'humain à la machine. Un type de flux IVR où il y a une invite TTS (par exemple "Comment puis-je vous aider") suivie d'une réponse humaine spontanée | Mono | Desktop | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 10115 Homme 8750 Inconnu 0 | Contacter | ||
gujarati_CC_8 | Gujarati | Gujarati (en cours de développement) | gu_IN | Centre d'appel | 60 | Données du centre d'appels en gujarati (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
gujarati_GC | Gujarati | Gujarati (en cours de développement) | gu_IN | Conversation générale | 100 | Gujarati (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
gujarati_MA | Gujarati | Gujarati (en cours de développement) | gu_IN | Audio multimédia | 40 | Gujarati (In Pipeline) Données audio des médias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Hébreu_Conversation générale_8 | Hébreu | Hébreu | il_IL | 8 kHz | Conversation générale | 399 | Données de conversation générale en hébreu | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, hébreu en Israël | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 414 , Homme 399 , Inconnu 1 | Contacter | |
Hébreu_MA_16 | Hébreu | Hébreu | il_IL | 16 kHz | Audio multimédia | 427 | Données audio des médias hébreux | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 361, Homme 513, Inconnu 13 | Contacter | |
Hindi_MA_16 | Hindi | Hindi | Salut dans | 16 kHz | Audio multimédia | 219 | Données audio des médias hindi | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 83, Homme 309, Inconnu 0 | Contacter | |
Hindi_SM_48 | Hindi | Hindi | Salut dans | 48 kHz | Monologue scénarisé | 2,867 | Monologue écrit en hindi | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1977 Homme 1864 Inconnu 147 | Contacter | |
HINGLISH_CC_8 | Hinglish | Hinglish | hg_IN | 8 kHz | Centre d'appel | 208 | HINGLISH Données du centre d'appels | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 822, Homme 1262, Inconnu 0 | Contacter | |
HINGLISH_MA_16 | Hinglish | Hinglish | hg_IN | 16 kHz | Audio multimédia | 216 | HINGLAIS Données audio multimédia | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 75, Homme 380, Inconnu 0 | Contacter | |
Hispanique_CC_8 | Anglais hispanique | Anglais hispanique | en_US | 8 kHz | Centre d'appel | 212 | Données du centre d'appel hispanique | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 822, Homme 1262, Inconnu 0 | Contacter | |
Hispanique_MA_16 | Anglais hispanique | Anglais hispanique | en_US | 16 kHz | Audio multimédia | 155 | Audio des médias d'appel hispanique | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 140, Homme 219, Inconnu 5 | Contacter | |
Indonésien_GC_8 | Indonésien | Indonésien | J'ai fait | 8 kHz | Conversation générale | 496 | Données de conversation générale en indonésien | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, bahasa indonésien | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 524, Homme 454, Inconnu 2 | Contacter | |
Indonésien_MA_16 | Indonésien | Indonésien | J'ai fait | 16 kHz | Audio multimédia | 643 | Données audio des médias indonésiens | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 746, Homme 1507, Inconnu 129 | Contacter | |
Irlandais_GC_8 | irlandais | irlandais | fr_FR | 8 kHz | Conversation générale | 192 | Données de conversation générale irlandaise | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 213 , Homme 153 , Inconnu 0 | Contacter | |
Japonais_SM_48 | Japonais | Japonais | ja-JP | 48 kHz | Monologue scénarisé | 2,335 | Monologue scénarisé japonais | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1460 Homme 1221 Inconnu 194 | Contacter | |
Kannada_CC_8 | Kannada | Kannada (en cours de développement) | kn_IN | Centre d'appel | 60 | Données du centre d'appels Kannada (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Kannada_GC | Kannada | Kannada (en cours de développement) | kn_IN | Conversation générale | 100 | Kannada (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Kannada_MA | Kannada | Kannada (en cours de développement) | kn_IN | Audio multimédia | 40 | Kannada (In Pipeline) Données audio multimédias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Coréen_CC_8 | Coréen | Coréen | ko_KR | 8 kHz | Centre d'appel | 107 | Données du centre d'appels coréen | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1086, Homme 210, Inconnu 4 | Contacter | |
Coréen_MA_16 | Coréen | Coréen | ko_KR | 16 kHz | Audio multimédia | 204 | Données audio des médias coréens | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 70 Homme 303, Inconnu 25 | Contacter | |
Coréen_SM_48 | Coréen | Coréen | ko-KR | 48 kHz | Monologue scénarisé | 1,955 | Monologue scénarisé coréen | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1195 Homme 1134 Inconnu 122 | Contacter | |
Malais_GC_8 | Malais | Malais | ms_MY | 8 kHz | Conversation générale | 266 | Données de conversation générale en malais | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, malais en Malaisie | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 316, Homme 176, Inconnu 0 | Contacter | |
Malais_MA_16 | Malais | Malais | ms_MY | 16 kHz | Audio multimédia | 344 | Données audio des médias malais | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 236, Homme 626, Inconnu 47 | Contacter | |
Malayalam_CC_8 | Malayalam | Malayalam (en cours) | ml_IN | Centre d'appel | 60 | Données du centre d'appels en malayalam (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Malayalam_GC | Malayalam | Malayalam (en cours) | ml_IN | Conversation générale | 100 | Malayalam (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Malayalam_MA | Malayalam | Malayalam (en cours) | ml_IN | Audio multimédia | 40 | Malayalam (In Pipeline) Données audio des médias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Marathie_CC_8 | Marathi | Marathi (en cours) | monsieur_IN | Centre d'appel | 60 | Données du centre d'appels Marathi (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Marathi_GC | Marathi | Marathi (en cours) | monsieur_IN | Conversation générale | 100 | Marathi (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Marathie_MA | Marathi | Marathi (en cours) | monsieur_IN | Audio multimédia | 40 | Marathi (In Pipeline) Données audio des médias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Mexicain_SM_48 | Espagnol (Mexique) | Espagnol (Mexique) | es-MX | 48 kHz | Monologue scénarisé | 1,492 | Monologue scénarisé espagnol mexicain | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1016 Homme 1069 Inconnu 95 | Contacter | |
Pays-Bas_SM_48 | Néerlandais | Néerlandais | fr-FR | 48 kHz | Monologue scénarisé | 1,205 | Monologue scénarisé néerlandais | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1285 Homme 531 Inconnu 3 | Contacter | |
New York anglais_CC_8 | Anglais new-yorkais | Anglais new-yorkais | en_US | 8 kHz | Centre d'appel | 103 | Données du centre d'appels anglais de New York | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 610, Homme 532, Inconnu 0 | Contacter | |
New York Anglais_GC_8 | Anglais new-yorkais | Anglais new-yorkais | en_US | 8 kHz | Conversation générale | 107 | Données de conversation générale en anglais à New York | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 118, Homme 114, Inconnu 0 | Contacter | |
New York Anglais_MA_16 | Anglais new-yorkais | Anglais new-yorkais | en_US | 16 kHz | Audio multimédia | 140 | Données audio de New York English Media | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 66, Homme 230, Inconnu 11 | Contacter | |
Nouvelle-Zélande_GC_8 | Anglais néo-zélandais | Anglais néo-zélandais | fr_NZ | 8 kHz | Conversation générale | 148 | Données de conversation générale en anglais néo-zélandais | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 167, homme 121, Inconnu 4 | Contacter | |
Nouvelle-Zélande_MA_16 | Anglais néo-zélandais | Anglais néo-zélandais | fr_NZ | 16 kHz | Audio multimédia | 400 | Audio des médias anglais néo-zélandais | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 367, homme 678, Inconnu 26 | Contacter | |
Oriya_CC_8 | Oriya | Oriya (en cours) | ou_IN | Centre d'appel | 60 | Données du centre d'appels Oriya (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Oriya_GC | Oriya | Oriya (en cours) | ou_IN | Conversation générale | 100 | Oriya (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Oriya_MA | Oriya | Oriya (en cours) | ou_IN | Audio multimédia | 40 | Oriya (In Pipeline) Données audio multimédias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Polonais_MA_16 | Polonais | Polonais | pl_PL | 16 kHz | Audio multimédia | 269 | Audio des médias polonais | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 173 Homme 354 Inconnu 6 | Contacter | |
Polonais Pologne_SM_48 | Polonais (Pologne) | Polonais (Pologne) | pl-PL | 48 kHz | Monologue scénarisé | 1,482 | Pologne polonaise - Monologue scénarisé | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1324 Homme 701 Inconnu 24 | Contacter | |
Pendjabi_CC_8 | Punjabi | Punjabi (en préparation) | Punjabi | Centre d'appel | 60 | Punjabi (In Pipeline) Données du centre d'appels | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Pendjabi_GC | Punjabi | Punjabi (en préparation) | Punjabi | Conversation générale | 100 | Punjabi (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Pendjabi_MA | Punjabi | Punjabi (en préparation) | Punjabi | Audio multimédia | 40 | Punjabi (In Pipeline) Données audio des médias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Russe_SM_48 | Russe | Russe | ru-RU | 48 kHz | Monologue scénarisé | 2,398 | Monologue scénarisé russe | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1689 Homme 1937 Inconnu 214 | Contacter | |
Écossais_GC_8 | Écossais (accent anglais) | Écossais (accent anglais) | fr_AB | 8 kHz | Conversation générale | 292 | Données de conversation générale écossaise | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 285, Homme 260, Inconnu 3 | Contacter | |
Singapour_CC_8 | Anglais de Singapour | Anglais de Singapour | fr_SG | 8 kHz | Centre d'appel | 218 | Données du centre d'appels de Singapour | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 2139, Homme 884, Inconnu 21 | Contacter | |
Singapour_MA_16 | Anglais de Singapour | Anglais de Singapour | fr_SG | 16 kHz | Audio multimédia | 247 | Données audio de Singapour Media | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 160, Homme 455, Inconnu 37 | Contacter | |
Anglais sud-africain_CC_8 | Anglais sud-africain | Anglais sud-africain | fr_ZA | 8 kHz | Centre d'appel | 261 | Données du centre d'appels anglais sud-africain | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1274 , Homme 935 , Inconnu 1 | Contacter | |
Anglais sud-africain_MA_16 | Anglais sud-africain | Anglais sud-africain | fr_ZA | 16 kHz | Audio multimédia | 251 | Données audio des médias anglais sud-africains | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 235, Homme 432, Inconnu 36 | Contacter | |
Swahili_CC_8 | Swahili | Swahili | sw_KE | 8 kHz | Centre d'appel | 230 | Données du centre d'appels en swahili | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 611, Homme 833, Inconnu 0 | Contacter | |
Swahili_MA_16 | Swahili | Swahili | sw_KE | 16 kHz | Audio multimédia | 265 | Données audio du média swahili | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 118, Homme 493, Inconnu 25 | Contacter | |
Suédois_CC_8 | Suédois | Suédois | sv_SE | 8 kHz | Centre d'appel | 250 | Données du centre d'appels suédois | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1581, homme 727, Inconnu 2 | Contacter | |
Suédois_MA_16 | Suédois | Suédois | sv_SE | 16 kHz | Audio multimédia | 278 | Données audio des médias suédois | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 195, homme 500, Inconnu 21 | Contacter | |
Tamoul_CC_8 | Tamoul | Tamoul (en cours de développement) | ta_IN | Centre d'appel | 60 | Données du centre d'appel tamoul (en cours de développement) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Tamoul_GC | Tamoul | Tamoul (en cours de développement) | ta_IN | Conversation générale | 100 | Tamil (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Tamoul_MA | Tamoul | Tamoul (en cours de développement) | ta_IN | Audio multimédia | 40 | Tamil (In Pipeline) Données audio des médias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Telugu_GC_8 | telugu | telugu | te_IN | 8 kHz | Conversation générale | 553 | Données de conversation générale en télougou | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 574, Homme 564, Inconnu 0 | Contacter | |
Telugu_MA_16 | telugu | telugu | te_IN | 16 kHz | Audio multimédia | 648 | Données audio Telugu Media | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 207, Homme 963, Inconnu 2 | Contacter | |
Telugu_CC_8 | telugu | Telugu (en cours) | te_IN | Centre d'appel | 30 | Données du centre d'appels Telugu (In Pipeline) | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Telugu_GC | telugu | Telugu (en cours) | te_IN | Conversation générale | 50 | Telugu (In Pipeline) Données de conversation générales | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Telugu_MA | telugu | Telugu (en cours) | te_IN | Audio multimédia | 20 | Telugu (In Pipeline) Données audio multimédias | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Contacter | ||||
Thaï_GC_8 | Thaïlandais | Thaïlandais | th_TH | 8 kHz | Conversation générale | 183 | Conversation générale thaïlandaise | Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, Un registre informel utilisé entre amis | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 338, Homme 96, Inconnu 8 | Contacter | |
Thaï_MA_8 | Thaïlandais | Thaïlandais | th_TH | 16 kHz | Audio multimédia | 173 | Audio des médias thaïlandais | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 143, Homme 502, Inconnu 26 | Contacter | |
Turc Turquie_SM_48 | Turc Turquie | Turc Turquie | tr-TR | 48 kHz | Monologue scénarisé | 2,027 | Turc Turquie | Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes | Mono | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 1561 Homme 1241 Inconnu 31 | Contacter | |
Vietnamien_GC_8 | Vietnamien | Vietnamien | fr_VN | 8 kHz | Conversation générale | 295 | Données de conversation générale en vietnamien | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, nord (par exemple, Hanoi), centre et sud (par exemple, Ho Chi Minh-Ville). | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 400, homme 380, inconnus 2 | Contacter | |
Vietnamien_MA_16 | Vietnamien | Vietnamien | fr_VN | 16 kHz | Audio multimédia | 257 | Données audio des médias vietnamiens | Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes | Mono | Sourcing Web | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 249, homme 200, inconnus 45 | Contacter | |
Gallois_GC_8 | Gallois (accent anglais) | Gallois (accent anglais) | fr_WL | 8 kHz | Conversation générale | 278 | Données de conversation générale en gallois | Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, | Double | Desktop | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Femme 270, Homme 324, Inconnu 0 | Contacter | |
Anglais britannique_WW_16 | Anglais britannique | Anglais britannique | fr_fr | 16 kHz | Wake Word | 200 Haut-parleurs | Wake Word anglais britannique | phrases clés collecte de données
| 1 canaux | Application mobile | 5.0 | . Wav | .json | ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage | Sexe : 50 % masculin, 50 % féminin, +/- 10 %. | Contacter |
Services offerts
La collecte de données audio par des experts n'est pas un jeu d'enfant pour les configurations complètes de l'IA. Chez Shaip, vous pouvez même envisager les services suivants pour rendre les modèles beaucoup plus répandus que d'habitude :
Collecte de données textuelles
Service
La vraie valeur des services de collecte de données cognitives de Shaip est qu'ils donnent aux organisations la clé pour déverrouiller les informations critiques trouvées dans les données non structurées
Services de collecte de données d'images
Assurez-vous que votre modèle de vision par ordinateur identifie chaque image avec précision, pour former de manière transparente les modèles d'IA de nouvelle génération du futur
Services de collecte de données vidéo
Concentrez-vous maintenant sur la vision par ordinateur avec la PNL pour entraîner vos modèles à identifier les objets, les individus, les dissuasifs et autres éléments visuels à la perfection
Ressources recommandées
Offre
Annotation audio pour les IA intelligentes
Les services d'annotation audio sont un point fort de Shaip depuis le début. Développez, formez et améliorez l'IA conversationnelle, les chatbots et les moteurs de reconnaissance vocale avec nos services d'annotation audio de pointe.
Guide de l'acheteur
Guide de l'acheteur : Guide complet de l'IA conversationnelle
Le chatbot avec lequel vous avez conversé fonctionne sur un système d'IA conversationnel avancé qui est formé, testé et construit à l'aide de tonnes d'ensembles de données de reconnaissance vocale.
Catalogue de données
Catalogue et licences de données vocales prêts à l'emploi
Il existe une grande variété d'applications courantes pour les données vocales dans les projets d'IA. Nous vous offrons de vastes quantités de données de haute qualité prêtes pour votre reconnaissance vocale.
Vous souhaitez créer votre propre ensemble de données audio ?
Connectez-vous avec notre expert interne en collecte de données vocales pour mettre en place un référentiel audio qui correspond le mieux à vos besoins
Foire Aux Questions (FAQ)
La collecte de données vocales pour un modèle ML fait référence au processus de collecte d'enregistrements audio de la langue parlée. Cette collection aide à former et à affiner les algorithmes d'apprentissage automatique, en particulier ceux centrés sur la compréhension et le traitement des voix humaines.
Lorsque vous souhaitez collecter des données audio pour la reconnaissance automatique de la parole (ASR), vous devez commencer par définir les besoins spécifiques de votre projet, notamment la langue, l'accent et le type de parole souhaités. Après avoir défini ces paramètres, assurez-vous d'obtenir toutes les autorisations nécessaires pour respecter la confidentialité des utilisateurs. Ensuite, utilisez des appareils ou des logiciels d'enregistrement appropriés pour capturer des échantillons audio clairs. Chaque enregistrement doit être méticuleusement annoté avec sa transcription ou d'autres métadonnées pertinentes et stocké systématiquement pour un accès sans effort.
Un ensemble de données vocales dans l'apprentissage automatique est essentiel pour former, tester et valider des modèles adaptés à la reconnaissance, à la transcription ou à l'interprétation du langage parlé. De tels ensembles de données ouvrent la voie à une myriade d’applications, depuis les assistants vocaux et les services de transcription jusqu’à la biométrie vocale.
Pour collecter des données précises sur diverses langues et accents, la collaboration avec des locuteurs natifs des milieux linguistiques souhaités est vitale. Visez un échantillon varié et représentatif pour couvrir un large spectre de nuances démographiques. Utilisez un équipement d’enregistrement standardisé dans des environnements uniformes pour garantir la cohérence audio. Et surtout, annotez chaque élément de données avec des transcriptions et des métadonnées détaillées, indiquant la langue et l'accent spécifiques.