Licence de données de soins de santé/médicales de haute qualité pour les modèles d'IA et de ML

Ensembles de données médicales/médicales prêts à l'emploi pour démarrer votre projet d'IA médicale

Ensembles de données médicales et de santé

Branchez les données médicales qui vous manquaient aujourd'hui

Ensembles de données médicales et de santé pour l'apprentissage automatique

Données audio de la dictée du médecin

Notre ensemble de données anonymisées pour les soins de santé comprend 31 fichiers audio de spécialités différentes dictés par des médecins décrivant l'état clinique et le plan de soins des patients en fonction des rencontres médecin-patient en milieu hospitalier/clinique.

Fichiers audio de dictée médicale prêts à l'emploi :

  • 257,977 31 heures d'ensemble de données de parole de dictée médicale dans le monde réel de XNUMX spécialités pour former des modèles de parole de santé
  • Audio de dictée capturé à partir de divers appareils tels que la dictée téléphonique (54.3 %), l'enregistreur numérique (24.9 %), le micro vocal (5.4 %), le téléphone intelligent (2.7 %) et l'inconnu (12.7 %)
  • PII Redacted Audio & Transcripts adhérant aux directives Safe Harbor conformément à la loi HIPAA
Données audio de la dictée du médecin

Dossiers médicaux transcrits

Les dossiers médicaux transcrits font référence à la transcription des conversations entre le médecin et le patient, à la transcription des rapports médicaux et à l'évaluation médicale. Il aide à cartographier les antécédents médicaux du patient pour les visites futures et sert également de point de référence pour les médecins. Il aide le médecin à évaluer l'état actuel du patient et à proposer un traitement adapté.

Dossiers médicaux transcrits prêts à l'emploi :

  • Transcription de 257,977 31 heures de dictée médicale du monde réel de XNUMX spécialités pour former des modèles de discours de santé
  • Dossiers médicaux transcrits de divers types de travail comme le rapport opératoire, le résumé de sortie, la note de consultation, la note d'admission, la note ED, la note clinique, le rapport de radiologie, etc.
  • PII Redacted Audio & Transcripts adhérant aux directives Safe Harbor conformément à la loi HIPAA
Dossiers de santé électroniques (DSE)

Dossiers de santé électroniques (DSE)

Les dossiers de santé électroniques ou EHR sont des dossiers médicaux contenant les antécédents médicaux, les diagnostics, les ordonnances, les plans de traitement, les dates de vaccination ou d'immunisation, les allergies, les images radiologiques (CT Scan, IRM, rayons X) et les tests de laboratoire du patient, etc.

Dossiers de santé électroniques (DSE) prêts à l'emploi :

  • Plus de 5.1 millions de dossiers et de fichiers audio de médecins dans 31 spécialités
  • Dossiers médicaux de référence dans le monde réel pour former la PNL clinique et d'autres modèles d'IA de document
  • Informations sur les métadonnées telles que MRN (anonymisé), date d'admission, date de sortie, durée du séjour, sexe, catégorie de patients, payeur, catégorie financière, état, état de sortie, âge, DRG, description du DRG, remboursement en dollars, AMLOS, GMLOS, risque de mortalité, gravité de la maladie, mérou, code postal de l'hôpital, etc.
  • Dossiers médicaux de divers États et régions des États-Unis - Nord-Est (46 %), Sud (9 %), Midwest (3 %), Ouest (28 %), Autres (14 %)
  • Dossiers médicaux appartenant à toutes les catégories de patients couvertes - patients hospitalisés, patients externes (cliniques, de réadaptation, récurrents, soins de jour chirurgicaux), urgences.
  • Dossiers médicaux appartenant à tous les groupes d'âge des patients <10 ans (7.9 %), 11-20 ans (5.7 %), 21-30 ans (10.9 %), 31-40 ans (11.7 %), 41-50 ans (10.4 % ), 51-60 ans (13.8%), 61-70 ans (16.1%), 71-80 ans (13.3%), 81-90 ans (7.8%), 90+ ans (2.4%)
  • Rapport entre les sexes des patients de 46 % (homme) et 54 % (femme)
  • PII Documents expurgés adhérant aux directives de la sphère de sécurité conformément à la loi HIPAA
Dossiers de santé électroniques (DSE)
  • Dossiers médicaux appartenant à tous les groupes d'âge des patients <10 ans (7.9 %), 11-20 ans (5.7 %), 21-30 ans (10.9 %), 31-40 ans (11.7 %), 41-50 ans (10.4 % ), 51-60 ans (13.8%), 61-70 ans (16.1%), 71-80 ans (13.3%), 81-90 ans (7.8%), 90+ ans (2.4%)
  • Rapport entre les sexes des patients de 46 % (homme) et 54 % (femme)
  • PII Documents expurgés adhérant aux directives de la sphère de sécurité conformément à la loi HIPAA

Ensemble de données d'images CT Scan

Les médecins utilisent l'image du scanner pour diagnostiquer et détecter des conditions anormales ou normales dans le corps d'un patient (c'est-à-dire pour identifier une maladie ou une blessure dans diverses parties du corps). Dans le diagnostic par traitement d'image informatisé, une image CT-scan passe par des phases sophistiquées, à savoir l'acquisition, l'amélioration de l'image, l'extraction des caractéristiques importantes, l'identification de la région d'intérêt (ROI), l'interprétation des résultats, etc.

Shaip fournit des ensembles de données d'images CT de haute qualité essentielles pour la recherche et le diagnostic médical. Nos ensembles de données comprennent des milliers d'images haute résolution collectées auprès de vrais patients et traitées avec des techniques de pointe. Ces ensembles de données sont conçus pour aider les professionnels de la santé et les chercheurs à améliorer leurs connaissances et leur compréhension de diverses conditions médicales, notamment le cancer, les troubles neurologiques et les maladies cardiovasculaires. Avec Shaip, vous pouvez accéder à des données médicales fiables et précises pour améliorer vos recherches et améliorer les résultats pour les patients.

Ensemble de données d'images de tomodensitométrie

Ensemble de données d'images IRM

Les modèles de vision par ordinateur sont conçus pour dériver des informations significatives à partir d'images et de vidéos numériques, selon IBM. Il permet une utilisation intensive des données d'images de soins de santé pour fournir un meilleur diagnostic, traitement et prédiction des maladies. Il peut utiliser le contexte de la séquence d'images, la texture, la forme et les informations de contour, ainsi que les connaissances antérieures, pour produire des informations 3D et 4D qui contribuent à une meilleure compréhension humaine. Comme les tomodensitogrammes, les IRM sont également utilisées pour diagnostiquer et détecter des conditions anormales ou normales dans le corps d'un patient (c'est-à-dire pour identifier une maladie ou une blessure dans diverses parties du corps).

Shaip fournit des ensembles de données d'images IRM de haute qualité essentielles pour la recherche et le diagnostic médical. Nos ensembles de données comprennent des milliers d'images haute résolution collectées auprès de vrais patients et traitées avec des techniques de pointe.

Ensemble de données d'images IRM

Ensemble de données d'images radiographiques

Les tests aux rayons X sont utilisés pour vérifier la structure interne et l'intégrité de l'objet. Des images radiographiques d'un objet de test peuvent être générées à différentes positions et à différents niveaux d'énergie pour diagnostiquer et détecter des conditions anormales dans le corps d'un patient.

Shaip fournit des ensembles de données d'images radiographiques de haute qualité essentielles pour la recherche et le diagnostic médical. Nos ensembles de données comprennent des milliers d'images haute résolution collectées auprès de vrais patients et traitées avec des techniques de pointe. Avec Shaip, vous pouvez accéder à des données médicales fiables et précises pour améliorer vos recherches et améliorer les résultats pour les patients.

Ensemble de données d'images radiographiques
Contactez-nous

Vous n'arrivez pas à trouver ce que vous cherchez?

De nouveaux ensembles de données médicales prêts à l'emploi sont collectés dans tous les types de données 

Contactez-nous dès maintenant pour vous débarrasser de vos soucis de collecte de données de formation en soins de santé

  • En m'inscrivant, je suis d'accord avec Shaip Politique de confidentialité et Conditions d'utilisation et donner mon consentement pour recevoir des communications marketing B2B de Shaip.

Un ensemble de données de santé est une collection de données liées à la santé, souvent structurées et rassemblées à des fins d'analyse, de recherche et de prise de décision dans les domaines médicaux et de santé.

Les exemples incluent les dossiers de santé électroniques (DSE), les bases de données d’imagerie médicale, les séquences génomiques, les données démographiques des patients et les ensembles de données provenant d’appareils de santé portables.

Les ensembles de données sur les soins de santé soutiennent la recherche médicale en fournissant des informations sur les types de maladies, les résultats des traitements, le comportement des patients, l'efficacité des médicaments, etc., contribuant ainsi aux progrès médicaux et à l'élaboration de politiques.

Les formats courants incluent CSV, Excel, DICOM (pour l'imagerie médicale) et HL7 (pour les dossiers de santé).

Les problèmes de confidentialité découlent de l’utilisation abusive potentielle des données sensibles des patients, conduisant à l’usurpation d’identité, à la discrimination ou à une exposition non désirée à des informations personnelles sur la santé.

Les informations des patients sont protégées par la désidentification (suppression des informations personnelles identifiables), le cryptage, des contrôles d'accès stricts et le respect de réglementations telles que HIPAA (aux États-Unis).

Pour garantir la qualité, validez et nettoyez régulièrement l'ensemble de données, utilisez des méthodes de collecte de données standardisées, faites des références croisées avec des sources fiables et impliquez des experts du domaine pour la vérification.