Services de collecte de données vocales les plus fiables pour votre IA

Entraînez vos modèles NLP, VA, prototypes TTS et plus encore avec des données conversationnelles de qualité, avec nos services de collecte de données audio et vocales

Découvrez les pipelines de données audio sans goulots d'étranglement

Contactez-Nous

Clients en vedette

N'importe quel sujet. N'importe quel scénario.

Chez Shaip, notre expertise réside dans la création d'ensembles de données vocales de haute qualité conçus pour répondre à diverses exigences d'IA/ML. Nous proposons une large gamme de langues et enregistrons dans divers contextes, ce qui rend nos ensembles de données complets et adaptables. ÔNotre objectif est d'alimenter les modèles avec le plus grand volume de données vocales personnalisées, dans les plus brefs délais. Avec nous à bord, vous pouvez vous attendre à :

Données audio/vocales multilingues de haute qualité organisées pour améliorer la précision
Niveau de spécificité de domaine le plus élevé possible pour tscénario diversifié installation

Faites évoluer votre modèle ML pour l'adapter à diverses données démographiques et verticales
Environnements d'enregistrement : Qualité studio, offrant un son cristallin avec un bruit de fond minimal, et Milieux naturels, où les enregistrements intègrent des sons ambiants pour imiter des situations du monde réel.

100+

Pays

55K +

Données sur les heures de parole

250+

Projets

60+

Langues (plus de 100 dialectes)

8 / 16 / 44 / 48 kHz

Taux d'échantillonnage

Notre expertise

Alignez les données audio pour des modèles NLP plus intelligents

Shaip propose des services de collecte de données vocales/audio de bout en bout dans plus de 100 langues pour permettre aux technologies vocales de répondre à un ensemble diversifié de publics à travers le monde. Nous pouvons travailler sur des projets de toute envergure et de toute taille; de la licence d'ensembles de données audio disponibles dans le commerce à la gestion de la collecte de données audio personnalisée, en passant par la transcription et l'annotation audio. Quelle que soit la taille de votre projet de collecte de données vocales, nous pouvons personnaliser les services de collecte audio en fonction de vos besoins pour créer des ensembles de données PNL de haute qualité qui ciblent les dialectes, les tons et les langues. Choisissez parmi notre large gamme d'ensembles de données vocales et de ressources de collecte de données audio, pour des configurations intelligentes permettant la voix.

Histoires de réussite

Ensembles de données d'IA conversationnelle avec plus de 3 8 heures de données dans XNUMX langues

Cherchant à créer une plate-forme multilingue pour les langues indiennes, le client s'est associé à Shaip pour collecter, segmenter et transcrire de grands ensembles de données dans plusieurs langues indiennes. Cela aiderait à développer des modèles vocaux efficaces qui pourraient alimenter la nouvelle plateforme innovante du client.

Problème: Plus de 3,000 8 heures de données audio collectées dans XNUMX langues indiennes, segmentées et transcrites pour développer la reconnaissance automatique de la parole.

Solution: Nous avons assuré la collecte, la segmentation, la transcription des données et livré des fichiers JSON avec des métadonnées. Nous avons collecté 3000 8 heures de données audio dans XNUMX langues indiennes à grande échelle pour le projet de technologie vocale du client.

Raisons de choisir Shaip comme partenaire de confiance pour la collecte de données vocales

Personnes

Des équipes dédiées et formées:

Plus de 30,000 collaborateurs pour la création de données, l'étiquetage et le contrôle qualité
Équipe de gestion de projet accréditée
Équipe de développement de produits expérimentée
Équipe d'approvisionnement et d'intégration du pool de talents

Processus

Une efficacité de processus maximale est assurée avec:

Processus robuste 6 Sigma Stage-Gate
Une équipe dédiée de ceintures noires 6 Sigma – Responsables des processus clés & Conformité qualité
Amélioration continue et boucle de rétroaction

Plateforme

La plateforme brevetée offre des avantages :

Plateforme Web de bout en bout
Une qualité irréprochable
TAT plus rapide
Livraison transparente

Personnes

Des équipes dédiées et formées:

Plus de 30,000 collaborateurs pour la création de données, l'étiquetage et le contrôle qualité
Équipe de gestion de projet accréditée
Équipe de développement de produits expérimentée
Équipe d'approvisionnement et d'intégration du pool de talents

Processus

Une efficacité de processus maximale est assurée avec:

Processus robuste 6 Sigma Stage-Gate
Une équipe dédiée de ceintures noires 6 Sigma – Responsables des processus clés & Conformité qualité
Amélioration continue et boucle de rétroaction

Plateforme

La plateforme brevetée offre des avantages :

Plateforme Web de bout en bout
Une qualité irréprochable
TAT plus rapide
Livraison transparente

Ensembles de données vocales/audio prêts à l'emploi

ID de corpus (unique)	Mots-clés	Ensemble de données linguistiques	Code de langue	Taux d'échantillonnage	Type de jeu de données	Nombre total d'heures audio	Description courte	Description de l'ensemble de données	Audio Channel	Plate-forme d'enregistrement	RET (%)	Format audio	Format de transcription	Case Study	Nombre de haut-parleurs	CTA
fr_US_CC_8	Vernaculaire afro-américain	Vernaculaire afro-américain	en_US	8 kHz	Centre d'appel	211	Données du centre d'appel vernaculaire afro-américain	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 612, Homme : 1242 et Inconnu : 12	Contactez-Nous
fr_US_MA_16	Vernaculaire afro-américain	Vernaculaire afro-américain	en_US	16 kHz	Audio multimédia	154	Données sur les médias vernaculaires afro-américains	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 151, Homme : 150 et Inconnu : 10	Contactez-Nous
Afrikaans_GC_8	Afrikaans	Afrikaans	af_ZA	8 kHz	Conversation générale	368	Données de conversation générale en afrikaans	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, afrikaans parlé en Afrique	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 502, Homme : 390 et Inconnu : 2	Contactez-Nous
Afrikaans_MA_16	Afrikaans	Afrikaans	af_ZA	16 kHz	Audio multimédia	658	Fichiers multimédias en afrikaans	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 750, Homme : 1278 et Inconnu : 52	Contactez-Nous
Arabe_GC_8	Arabe	Arabe	ar_AE	8 kHz	Conversation générale	292	Données de conversation générale en arabe	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, arabe des pays du Golfe	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 171, Homme : 534 et Inconnu : 1	Contactez-Nous
Arabe_SM_48	Arabe	Arabe	ar-SA	48 kHz	Monologue scénarisé	1,947	Monologue scénarisé en arabe	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 838 Homme 1209 Inconnu 78	Contactez-Nous
Assamais_CC_8	Assamais	Assamais (en cours de développement)	un péché		Centre d'appel	60	Données du centre d'appels assamais (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Assamais_GC	Assamais	Assamais (en cours de développement)	un péché		Conversation générale	100	Assamais (en pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Assamais_MA	Assamais	Assamais (en cours de développement)	un péché		Audio multimédia	40	Données audio des médias assamais (en cours de développement)	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Bengali_CC_8	Bengali	Bengali (en cours)	bn_IN		Centre d'appel	60	Données du centre d'appels en bengali (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Bengali_GC	Bengali	Bengali (en cours)	bn_IN		Conversation générale	100	Bengali (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Bengali_MA	Bengali	Bengali (en cours)	bn_IN		Audio multimédia	40	Bengali (In Pipeline) Données audio multimédias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Boston_CC_8	Boston anglais	Boston anglais	en_US	8 kHz	Centre d'appel	177	Données du centre d'appels de Boston	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 605, Homme : 711 et Inconnu : 0	Contactez-Nous
Boston_GC_8	Boston anglais	Boston anglais	en_US	8 kHz	Conversation générale	32	Données de conversation générale de Boston	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 53, Homme : 83 et Inconnu : 0	Contactez-Nous
Boston_MA_16	Boston anglais	Boston anglais	en_US	16 kHz	Audio multimédia	93	Données audio de Boston Media	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 43, Homme : 181 et Inconnu : 2	Contactez-Nous
Canadien_SM_48	Français canadien	Français canadien	fr-CA	48 kHz	Monologue scénarisé	1,222	Français canadien	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 974 Homme 631 Inconnu 1	Contactez-Nous
Chinois_CC_8	Anglais chinois	Anglais chinois	en_US	8 kHz	Centre d'appel	169	Données du centre d'appels chinois	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 1790, Homme : 523 et Inconnu : 13	Contactez-Nous
Chinois_MA_16	Anglais chinois	Anglais chinois	en_US	16 kHz	Audio multimédia	249	Données audio des médias chinois	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 126, Homme : 346 et Inconnu : 6	Contactez-Nous
Chinois simplifié_SM_48	Chinois simplifié	Chinois simplifié	zh-CN	48 kHz	Monologue scénarisé	2,762	Chinois simplifié	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1920 Homme 1535 Inconnu 270	Contactez-Nous
Chinois traditionnel_SM_48	Chinois	Chinois	zh-TW	48 kHz	Monologue scénarisé	1,028	Chinois	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1069 Homme 262 Inconnu 3	Contactez-Nous
Danois_GC_8	Danois	Danois	da_NSP	8 kHz	Conversation générale	372	Données de conversation générale en danois	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 311, Homme : 417, Inconnu : 0	Contactez-Nous
Danois_MA_16	Danois	Danois	da_NSP	16 kHz	Audio multimédia	664	Données audio des médias danois	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme : 369, Homme : 864, Inconnu : 27	Contactez-Nous
Danois_SM_48	Danois	Danois	da-DK	48 kHz	Monologue scénarisé	2,579	Monologue scénarisé danois	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes, danois du Danemark	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1551 Homme 1233 Inconnu 42	Contactez-Nous
Sud profond anglais_CC_8	Anglais Grand Sud	Anglais Grand Sud	en_US	8 kHz	Centre d'appel	151	Données du centre d'appels du Sud profond anglais	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 221 , Homme 1004 , Inconnu 7	Contactez-Nous
Sud profond anglais_GC_8	Anglais Grand Sud	Anglais Grand Sud	en_US	8 kHz	Conversation générale	56	Données de conversation générale en anglais Deep South	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 99, Homme 31, Inconnu 0	Contactez-Nous
Sud profond anglais_MA_16	Anglais Grand Sud	Anglais Grand Sud	en_US	16 kHz	Audio multimédia	266	Données audio de Deep South Media en anglais	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 204, Homme 356, Inconnu 21	Contactez-Nous
Allemand_CC_8	Allemand	Allemand	de-De	8 kHz	Centre d'appel	64	Données des centres d'appels allemands	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Mono	Desktop		. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 478 Homme 1440 Inconnu 0	Contactez-Nous
Allemand_IVR_8	Allemand	Allemand	de-De	8 kHz	IVR	200	Données IVR allemandes	De l'humain à la machine. Un type de flux IVR où il y a une invite TTS (par exemple "Comment puis-je vous aider") suivie d'une réponse humaine spontanée	Mono	Desktop		. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 10115 Homme 8750 Inconnu 0	Contactez-Nous
gujarati_CC_8	Gujarati	Gujarati (en cours de développement)	gu_IN		Centre d'appel	60	Données du centre d'appels en gujarati (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
gujarati_GC	Gujarati	Gujarati (en cours de développement)	gu_IN		Conversation générale	100	Gujarati (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
gujarati_MA	Gujarati	Gujarati (en cours de développement)	gu_IN		Audio multimédia	40	Gujarati (In Pipeline) Données audio des médias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Hébreu_Conversation générale_8	Hébreu	Hébreu	il_IL	8 kHz	Conversation générale	399	Données de conversation générale en hébreu	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, hébreu en Israël	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 414 , Homme 399 , Inconnu 1	Contactez-Nous
Hébreu_MA_16	Hébreu	Hébreu	il_IL	16 kHz	Audio multimédia	427	Données audio des médias hébreux	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 361, Homme 513, Inconnu 13	Contactez-Nous
Hindi_MA_16	Hindi	Hindi	Salut dans	16 kHz	Audio multimédia	219	Données audio des médias hindi	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 83, Homme 309, Inconnu 0	Contactez-Nous
Hindi_SM_48	Hindi	Hindi	Salut dans	48 kHz	Monologue scénarisé	2,867	Monologue écrit en hindi	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1977 Homme 1864 Inconnu 147	Contactez-Nous
HINGLISH_CC_8	Hinglish	Hinglish	hg_IN	8 kHz	Centre d'appel	208	HINGLISH Données du centre d'appels	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 822, Homme 1262, Inconnu 0	Contactez-Nous
HINGLISH_MA_16	Hinglish	Hinglish	hg_IN	16 kHz	Audio multimédia	216	HINGLAIS Données audio multimédia	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 75, Homme 380, Inconnu 0	Contactez-Nous
Hispanique_CC_8	Anglais hispanique	Anglais hispanique	en_US	8 kHz	Centre d'appel	212	Données du centre d'appel hispanique	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 822, Homme 1262, Inconnu 0	Contactez-Nous
Hispanique_MA_16	Anglais hispanique	Anglais hispanique	en_US	16 kHz	Audio multimédia	155	Audio des médias d'appel hispanique	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 140, Homme 219, Inconnu 5	Contactez-Nous
Indonésien_GC_8	Indonésien	Indonésien	J'ai fait	8 kHz	Conversation générale	496	Données de conversation générale en indonésien	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, bahasa indonésien	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 524, Homme 454, Inconnu 2	Contactez-Nous
Indonésien_MA_16	Indonésien	Indonésien	J'ai fait	16 kHz	Audio multimédia	643	Données audio des médias indonésiens	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 746, Homme 1507, Inconnu 129	Contactez-Nous
Irlandais_GC_8	irlandais	irlandais	fr_FR	8 kHz	Conversation générale	192	Données de conversation générale irlandaise	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 213 , Homme 153 , Inconnu 0	Contactez-Nous
Japonais_SM_48	Japonais	Japonais	ja-JP	48 kHz	Monologue scénarisé	2,335	Monologue scénarisé japonais	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1460 Homme 1221 Inconnu 194	Contactez-Nous
Kannada_CC_8	Kannada	Kannada (en cours de développement)	kn_IN		Centre d'appel	60	Données du centre d'appels Kannada (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Kannada_GC	Kannada	Kannada (en cours de développement)	kn_IN		Conversation générale	100	Kannada (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Kannada_MA	Kannada	Kannada (en cours de développement)	kn_IN		Audio multimédia	40	Kannada (In Pipeline) Données audio multimédias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Coréen_CC_8	Coréen	Coréen	ko_KR	8 kHz	Centre d'appel	107	Données du centre d'appels coréen	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1086, Homme 210, Inconnu 4	Contactez-Nous
Coréen_MA_16	Coréen	Coréen	ko_KR	16 kHz	Audio multimédia	204	Données audio des médias coréens	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 70 Homme 303, Inconnu 25	Contactez-Nous
Coréen_SM_48	Coréen	Coréen	ko-KR	48 kHz	Monologue scénarisé	1,955	Monologue scénarisé coréen	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1195 Homme 1134 Inconnu 122	Contactez-Nous
Malais_GC_8	Malais	Malais	ms_MY	8 kHz	Conversation générale	266	Données de conversation générale en malais	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (plage) - 15 à 60 minutes, malais en Malaisie	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 316, Homme 176, Inconnu 0	Contactez-Nous
Malais_MA_16	Malais	Malais	ms_MY	16 kHz	Audio multimédia	344	Données audio des médias malais	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 236, Homme 626, Inconnu 47	Contactez-Nous
Malayalam_CC_8	Malayalam	Malayalam (en cours)	ml_IN		Centre d'appel	60	Données du centre d'appels en malayalam (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Malayalam_GC	Malayalam	Malayalam (en cours)	ml_IN		Conversation générale	100	Malayalam (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Malayalam_MA	Malayalam	Malayalam (en cours)	ml_IN		Audio multimédia	40	Malayalam (In Pipeline) Données audio des médias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Marathie_CC_8	Marathi	Marathi (en cours)	monsieur_IN		Centre d'appel	60	Données du centre d'appels Marathi (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Marathi_GC	Marathi	Marathi (en cours)	monsieur_IN		Conversation générale	100	Marathi (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Marathie_MA	Marathi	Marathi (en cours)	monsieur_IN		Audio multimédia	40	Marathi (In Pipeline) Données audio des médias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Mexicain_SM_48	Espagnol (Mexique)	Espagnol (Mexique)	es-MX	48 kHz	Monologue scénarisé	1,492	Monologue scénarisé espagnol mexicain	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1016 Homme 1069 Inconnu 95	Contactez-Nous
Pays-Bas_SM_48	Néerlandais	Néerlandais	fr-FR	48 kHz	Monologue scénarisé	1,205	Monologue scénarisé néerlandais	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1285 Homme 531 Inconnu 3	Contactez-Nous
New York anglais_CC_8	Anglais new-yorkais	Anglais new-yorkais	en_US	8 kHz	Centre d'appel	103	Données du centre d'appels anglais de New York	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 610, Homme 532, Inconnu 0	Contactez-Nous
New York Anglais_GC_8	Anglais new-yorkais	Anglais new-yorkais	en_US	8 kHz	Conversation générale	107	Données de conversation générale en anglais à New York	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 118, Homme 114, Inconnu 0	Contactez-Nous
New York Anglais_MA_16	Anglais new-yorkais	Anglais new-yorkais	en_US	16 kHz	Audio multimédia	140	Données audio de New York English Media	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 66, Homme 230, Inconnu 11	Contactez-Nous
Nouvelle-Zélande_GC_8	Anglais néo-zélandais	Anglais néo-zélandais	fr_NZ	8 kHz	Conversation générale	148	Données de conversation générale en anglais néo-zélandais	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 167, homme 121, Inconnu 4	Contactez-Nous
Nouvelle-Zélande_MA_16	Anglais néo-zélandais	Anglais néo-zélandais	fr_NZ	16 kHz	Audio multimédia	400	Audio des médias anglais néo-zélandais	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 367, homme 678, Inconnu 26	Contactez-Nous
Oriya_CC_8	Oriya	Oriya (en cours)	ou_IN		Centre d'appel	60	Données du centre d'appels Oriya (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Oriya_GC	Oriya	Oriya (en cours)	ou_IN		Conversation générale	100	Oriya (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Oriya_MA	Oriya	Oriya (en cours)	ou_IN		Audio multimédia	40	Oriya (In Pipeline) Données audio multimédias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Polonais_MA_16	Polonais	Polonais	pl_PL	16 kHz	Audio multimédia	269	Audio des médias polonais	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 173 Homme 354 Inconnu 6	Contactez-Nous
Polonais Pologne_SM_48	Polonais (Pologne)	Polonais (Pologne)	pl-PL	48 kHz	Monologue scénarisé	1,482	Pologne polonaise - Monologue scénarisé	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1324 Homme 701 Inconnu 24	Contactez-Nous
Pendjabi_CC_8	Punjabi	Punjabi (en préparation)	Punjabi		Centre d'appel	60	Punjabi (In Pipeline) Données du centre d'appels	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Pendjabi_GC	Punjabi	Punjabi (en préparation)	Punjabi		Conversation générale	100	Punjabi (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Pendjabi_MA	Punjabi	Punjabi (en préparation)	Punjabi		Audio multimédia	40	Punjabi (In Pipeline) Données audio des médias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Russe_SM_48	Russe	Russe	ru-RU	48 kHz	Monologue scénarisé	2,398	Monologue scénarisé russe	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1689 Homme 1937 Inconnu 214	Contactez-Nous
Écossais_GC_8	Écossais (accent anglais)	Écossais (accent anglais)	fr_AB	8 kHz	Conversation générale	292	Données de conversation générale écossaise	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 285, Homme 260, Inconnu 3	Contactez-Nous
Singapour_CC_8	Anglais de Singapour	Anglais de Singapour	fr_SG	8 kHz	Centre d'appel	218	Données du centre d'appels de Singapour	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 2139, Homme 884, Inconnu 21	Contactez-Nous
Singapour_MA_16	Anglais de Singapour	Anglais de Singapour	fr_SG	16 kHz	Audio multimédia	247	Données audio de Singapour Media	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 160, Homme 455, Inconnu 37	Contactez-Nous
Anglais sud-africain_CC_8	Anglais sud-africain	Anglais sud-africain	fr_ZA	8 kHz	Centre d'appel	261	Données du centre d'appels anglais sud-africain	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1274 , Homme 935 , Inconnu 1	Contactez-Nous
Anglais sud-africain_MA_16	Anglais sud-africain	Anglais sud-africain	fr_ZA	16 kHz	Audio multimédia	251	Données audio des médias anglais sud-africains	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 235, Homme 432, Inconnu 36	Contactez-Nous
Swahili_CC_8	Swahili	Swahili	sw_KE	8 kHz	Centre d'appel	230	Données du centre d'appels en swahili	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 611, Homme 833, Inconnu 0	Contactez-Nous
Swahili_MA_16	Swahili	Swahili	sw_KE	16 kHz	Audio multimédia	265	Données audio du média swahili	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 118, Homme 493, Inconnu 25	Contactez-Nous
Suédois_CC_8	Suédois	Suédois	sv_SE	8 kHz	Centre d'appel	250	Données du centre d'appels suédois	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1581, homme 727, Inconnu 2	Contactez-Nous
Suédois_MA_16	Suédois	Suédois	sv_SE	16 kHz	Audio multimédia	278	Données audio des médias suédois	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 195, homme 500, Inconnu 21	Contactez-Nous
Tamoul_CC_8	Tamoul	Tamoul (en cours de développement)	ta_IN		Centre d'appel	60	Données du centre d'appel tamoul (en cours de développement)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Tamoul_GC	Tamoul	Tamoul (en cours de développement)	ta_IN		Conversation générale	100	Tamil (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Tamoul_MA	Tamoul	Tamoul (en cours de développement)	ta_IN		Audio multimédia	40	Tamil (In Pipeline) Données audio des médias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Conversation générale	553	Données de conversation générale en télougou	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 574, Homme 564, Inconnu 0	Contactez-Nous
Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Audio multimédia	648	Données audio Telugu Media	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 207, Homme 963, Inconnu 2	Contactez-Nous
Telugu_CC_8	telugu	Telugu (en cours)	te_IN		Centre d'appel	30	Données du centre d'appels Telugu (In Pipeline)	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Telugu_GC	telugu	Telugu (en cours)	te_IN		Conversation générale	50	Telugu (In Pipeline) Données de conversation générales	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,		Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Telugu_MA	telugu	Telugu (en cours)	te_IN		Audio multimédia	20	Telugu (In Pipeline) Données audio multimédias	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes		Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage		Contactez-Nous
Thaï_GC_8	Thaïlandais	Thaïlandais	th_TH	8 kHz	Conversation générale	183	Conversation générale thaïlandaise	Conversation téléphonique non scénarisée entre deux personnes. Environ. Durée audio (gamme) - 15-60 minutes, Un registre informel utilisé entre amis	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 338, Homme 96, Inconnu 8	Contactez-Nous
Thaï_MA_8	Thaïlandais	Thaïlandais	th_TH	16 kHz	Audio multimédia	173	Audio des médias thaïlandais	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 143, Homme 502, Inconnu 26	Contactez-Nous
Turc Turquie_SM_48	Turc Turquie	Turc Turquie	tr-TR	48 kHz	Monologue scénarisé	2,027	Turc Turquie	Enregistrements à un seul énoncé, qui ont tendance à se situer entre 5 et 30 secondes	Mono	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 1561 Homme 1241 Inconnu 31	Contactez-Nous
Vietnamien_GC_8	Vietnamien	Vietnamien	fr_VN	8 kHz	Conversation générale	295	Données de conversation générale en vietnamien	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes, nord (par exemple, Hanoi), centre et sud (par exemple, Ho Chi Minh-Ville).	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 400, homme 380, inconnus 2	Contactez-Nous
Vietnamien_MA_16	Vietnamien	Vietnamien	fr_VN	16 kHz	Audio multimédia	257	Données audio des médias vietnamiens	Fichiers audio/vidéo du domaine public sous licence tels que des interviews, des podcasts, etc. - 1 à 5 personnes. Environ. Durée audio (plage) 15-60 minutes	Mono	Sourcing Web	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 249, homme 200, inconnus 45	Contactez-Nous
Gallois_GC_8	Gallois (accent anglais)	Gallois (accent anglais)	fr_WL	8 kHz	Conversation générale	278	Données de conversation générale en gallois	Conversation téléphonique synthétique non scénarisée entre "agent" et "client", env. Durée audio (plage) 5-15 minutes,	Double	Desktop	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Femme 270, Homme 324, Inconnu 0	Contactez-Nous
Anglais britannique_WW_16	Anglais britannique	Anglais britannique	fr_fr	16 kHz	Wake Word	Conférenciers 200	Wake Word anglais britannique	phrases clés collecte de données Haut-parleurs 200 4 phrases clés uniques par intervenant 25-30 enregistrements répétés de phrases clés par phrase clé unique 25 à 30 fichiers audio par phrase clé unique 120 paroles enregistrées au total par locuteur	1 canaux	Application mobile	5.0	. Wav	.json	ASR, assistant virtuel, chatbot, IA conversationnelle, analyse de la parole, TTS, modélisation du langage	Sexe : 50 % masculin, 50 % féminin, +/- 10 %.	Contactez-Nous

Services offerts

La collecte de données audio par des experts n'est pas un jeu d'enfant pour les configurations complètes de l'IA. Chez Shaip, vous pouvez même envisager les services suivants pour rendre les modèles beaucoup plus répandus que d'habitude :

Ressources recommandées

Offre

Annotation audio pour les IA intelligentes

Les services d'annotation audio sont un point fort de Shaip depuis le début. Développez, formez et améliorez l'IA conversationnelle, les chatbots et les moteurs de reconnaissance vocale avec nos services d'annotation audio de pointe.

Guide de l'acheteur

Guide de l'acheteur : Guide complet de l'IA conversationnelle

Le chatbot avec lequel vous avez conversé fonctionne sur un système d'IA conversationnel avancé qui est formé, testé et construit à l'aide de tonnes d'ensembles de données de reconnaissance vocale.

Catalogue de données

Catalogue et licences de données vocales prêts à l'emploi

Il existe une grande variété d'applications courantes pour les données vocales dans les projets d'IA. Nous vous offrons de vastes quantités de données de haute qualité prêtes pour votre reconnaissance vocale.

Vous souhaitez créer votre propre ensemble de données audio ?

Connectez-vous avec notre expert interne en collecte de données vocales pour mettre en place un référentiel audio qui correspond le mieux à vos besoins

Prénom*
Nom de famille*
Email*
Téléphone*
Entreprise*
Pays*
Pays
Commentaires*
En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions d'utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.
CAPTCHA

Foire Aux Questions (FAQ)

1. Qu'est-ce que la collecte de données vocales ?

La collecte de données vocales pour un modèle ML fait référence au processus de collecte d'enregistrements audio de la langue parlée. Cette collection aide à former et à affiner les algorithmes d'apprentissage automatique, en particulier ceux centrés sur la compréhension et le traitement des voix humaines.

2. Comment collecter des données audio pour l'ASR (reconnaissance automatique de la parole) ?

Lorsque vous souhaitez collecter des données audio pour la reconnaissance automatique de la parole (ASR), vous devez commencer par définir les besoins spécifiques de votre projet, notamment la langue, l'accent et le type de parole souhaités. Après avoir défini ces paramètres, assurez-vous d'obtenir toutes les autorisations nécessaires pour respecter la confidentialité des utilisateurs. Ensuite, utilisez des appareils ou des logiciels d'enregistrement appropriés pour capturer des échantillons audio clairs. Chaque enregistrement doit être méticuleusement annoté avec sa transcription ou d'autres métadonnées pertinentes et stocké systématiquement pour un accès sans effort.

3. Utilisation de l'ensemble de données vocales pour l'apprentissage automatique

Un ensemble de données vocales dans l'apprentissage automatique est essentiel pour former, tester et valider des modèles adaptés à la reconnaissance, à la transcription ou à l'interprétation du langage parlé. De tels ensembles de données ouvrent la voie à une myriade d’applications, depuis les assistants vocaux et les services de transcription jusqu’à la biométrie vocale.

4. Comment collecter des données précises à partir de plusieurs langues et accents

Pour collecter des données précises sur diverses langues et accents, la collaboration avec des locuteurs natifs des milieux linguistiques souhaités est vitale. Visez un échantillon varié et représentatif pour couvrir un large spectre de nuances démographiques. Utilisez un équipement d’enregistrement standardisé dans des environnements uniformes pour garantir la cohérence audio. Et surtout, annotez chaque élément de données avec des transcriptions et des métadonnées détaillées, indiquant la langue et l'accent spécifiques.

Services de collecte de données vocales les plus fiables pour votre IA

Découvrez les pipelines de données audio sans goulots d'étranglement

Clients en vedette

Services professionnels de collecte de données audio/vocales

N'importe quel sujet. N'importe quel scénario.

100+

55K +

250+

60+

8 / 16 / 44 / 48 kHz

Notre expertise

Alignez les données audio pour des modèles NLP plus intelligents

Collection de discours monologues

Discours de dialogue Collection

Groupe / Muti-party Conversations

Collection d'énoncés en langage naturel

Données acoustiques Collection

Reconnaissance vocale automatique (ASR)

Données multilingues d'entraînement vocal/audio

Text-to-Speech (TTS)

Call Center l'enregistrement

Histoires de réussite

Raisons de choisir Shaip comme partenaire de confiance pour la collecte de données vocales

Personnes

Processus

Plateforme

Personnes

Processus

Plateforme

Ensembles de données vocales/audio prêts à l'emploi

Services offerts

Collecte de données textuelles Services

Services de collecte de données d'images

Services de collecte de données vidéo

Ressources recommandées

Offre

Annotation audio pour les IA intelligentes

Guide de l'acheteur

Guide de l'acheteur : Guide complet de l'IA conversationnelle

Catalogue de données

Catalogue et licences de données vocales prêts à l'emploi

Vous souhaitez créer votre propre ensemble de données audio ?

Foire Aux Questions (FAQ)

Services de données IA

Spécialité

Industrie

Produits

Entreprise

Ressources

Contactez-Nous

Discours de dialogue
Collection

Groupe / Muti-party
Conversations

Données acoustiques
Collection

Text-to-Speech
(TTS)

Call Center
l'enregistrement

Collecte de données textuelles
Services