Données audio de dictée médicale conformes à la loi HIPAA pour l'IA médicale

Accélérez l'innovation en matière d'IA dans le domaine de la santé en utilisant des données audio de dictée médicale prêtes à l'emploi, conformes aux réglementations en matière de confidentialité et HIPAA.

Ensembles de données audio de dictée médicale

Ensembles de données audio médicales de haute qualité pour des modèles d'IA plus intelligents

Notre base de données de santé anonymisée comprend des fichiers audio provenant de 31 spécialités différentes, dictés avec soin par des médecins. Ces enregistrements décrivent en détail l'état clinique et les plans de soins des patients, issus d'interactions réelles entre médecins et patients, en milieu hospitalier et clinique. Entièrement conforme aux réglementations en matière de confidentialité, cette base de données est idéale pour l'entraînement de modèles avancés d'IA en santé.

Données audio médicales par sexe
Spécialité Fichiers audio des patients (durée de lecture en heures) Nombre total de fichiers audio
Total257,9775,172,766
Masculin58,8502,444,910
femme113,4061,290,900
Inconnu85,7211,436,956
Données audio médicales par spécialité
Spécialité Fichiers audio des patients (durée de lecture en heures) Nombre total de fichiers audio
Total257,9775,172,766
Accident et urgence9359
Allergie et immunologie115222202
Anesthésiologie67722280
Anesthésiques19
APRN1631693
Cardiologie675041566721
Cardiothoracique17122
Chirurgie cardiothoracique110
Hématologie clinique02
Chirurgie du côlon et rectale7162
Chirurgien colorectal45984
Médecine de soins intensifs2204328
Dentiste165
Dermatologie77123014
diététicien et nutritionniste44736
Médecine d'urgence4911112518
Endocrinologie2057052
ENT7010175477
Médecine familiale1767106733
Gastroentérologie145840365
Médecine générale1405757
Pratique générale411318
Chirurgie générale203871744
Gynécologie3269103370
Chirurgie de la main245
Hématologie2588125
Hospitalist5931142529
Maladie infectieuse49314001
Médecine interne15410445591
Cardiologie interventionnelle151143035
Médecine materno-fœtale511355
Néonatologie104524760
Néphrologie73520334
Neurologie226963774
Neurochirurgie46211990
Médecine nucléaire223
Gynécologie3562122303
Oncologie293882996
Ophtalmologie131641047
Optométrie331066
Orthopédie5665164483
Otolaryngology3433100811
Pathologie1664097
Pneumologie pédiatrique440
Spécialité pédiatrique35682
Chirurgie pédiatrique223
Pédiatrie8779271
Médecine physique et réadaptation134723523
Le physiothérapeute.1141713
Adjoint au médecin638
Chirurgie podiatrique424
Podologie47312296
Premiers soins65120120
Psychiatrie212060381
Pneumologie129035290
Radio-oncologie2396558
Radiologie334599641
Rhumatologie2938729
Sicu125
Orthophonie328
Oncologie chirurgicale2175758
Chirurgie thoracique1073336
Chirurgie de transplantation611535
Urologie317096934
Chirurgie digestive haute458
CHIRURGIE VASCULAIRE19156
Vasculaire/Général9268
Soins des plaies15211
Données audio médicales par appareil
Spécialité Fichiers audio des patients (durée de lecture en heures) Nombre total de fichiers audio
Total257,9775,172,766
IPHONE66632,382
Enregistreur numérique1,65922,377
Type mixte69,8181,408,679
SmartPhone51,5331,306,405
Microphone vocal10,329257,730
Dictée téléphonique120,8672,071,557
Inconnu3,10473,636

Nous traitons tous les types de licences de données, c'est-à-dire le texte, l'audio, la vidéo ou l'image. Les ensembles de données se composent d'ensembles de données médicales pour ML : ensemble de données de dictée de médecins, notes cliniques de médecins, ensemble de données de conversation médicale, ensemble de données de transcription médicale, conversation médecin-patient, données de texte médical, images médicales - tomodensitométrie, IRM, ultrasons (exigences personnalisées de base collectées) .

Shaip nous contacter

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données médicales prêts à l'emploi sont collectés dans tous les types de données

Contactez-nous dès maintenant pour vous débarrasser de vos soucis de collecte de données de formation en soins de santé

  • En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions d’utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.

Les données audio de dictée de médecin se composent de fichiers audio dans lesquels les médecins décrivent l'état clinique, le plan de traitement ou les antécédents médicaux d'un patient lors de consultations ou de visites à l'hôpital.

Ces données sont essentielles à l'entraînement des modèles d'IA en reconnaissance vocale, en traitement du langage naturel (TALN) et en automatisation de la documentation clinique. Elles permettent de créer des systèmes de transcription, d'analyse et d'amélioration des flux de documentation médicale.

L'ensemble de données comprend 257,977 31 heures de dictées de médecins de XNUMX spécialités médicales. L'enregistrement audio est réalisé à l'aide de divers appareils, notamment des téléphones, des enregistreurs numériques, des smartphones et des microphones vocaux.

Oui, tous les fichiers audio sont anonymisés pour supprimer les informations personnelles identifiables (PII), garantissant ainsi la confidentialité des patients.

Oui, les ensembles de données respectent les directives HIPAA et Safe Harbor, ainsi que d’autres normes mondiales de confidentialité.

Oui, les ensembles de données peuvent être adaptés à des spécialités, des données démographiques ou des types d’appareils d’enregistrement spécifiques en fonction des exigences du projet.

Absolument. Les ensembles de données sont vastes, avec des millions de fichiers audio, ce qui les rend adaptés aux projets d'IA/ML de petite et grande envergure.

Les données audio médicales et les transcriptions correspondantes sont fournies dans des formats standard qui peuvent être intégrés de manière transparente dans les modèles de reconnaissance vocale et de traitement du langage naturel (NLP).

Les données audio sont soumises à des contrôles de qualité rigoureux et les experts du domaine valident les annotations pour garantir l'exactitude et la fiabilité.

Le coût dépend de facteurs tels que le volume de données, la personnalisation et la portée du projet. Pour obtenir le meilleur devis, veuillez remplir le formulaire « Contactez-nous ».

Les délais de livraison varient en fonction de la taille et de la complexité du projet, mais sont structurés pour respecter les délais de manière efficace.

Ces ensembles de données améliorent les capacités de l’IA en automatisant la documentation clinique, en améliorant la précision de la transcription et en permettant une meilleure prise de décision pour les prestataires de soins de santé.