Saviez-vous que les modèles d'IA qui fusionnent diverses données médicales peuvent améliorer la précision prédictive des résultats en soins intensifs de 12 % ou plus par rapport aux approches monomodales ? Cette propriété remarquable transforme la prise de décision en matière de soins de santé, permettant aux soignants d'établir des diagnostics et des programmes de traitement plus éclairés.
L'impact de l'intelligence artificielle sur le secteur de la santé continue de modifier l'orientation générale du secteur. La qualité et la diversité des données d'entraînement sont désormais des déterminants importants de l'efficacité d'un système d'IA.
Que sont les ensembles de données médicales multimodales ?
Les ensembles de données médicales multimodales rassemblent des informations provenant de plusieurs types ou modalités de données afin de fournir une image complète de la santé des patients qu'aucune source de données ne pourrait fournir à elle seule. Ces ensembles de données peuvent combiner cinq types d'informations :
Données textuelles
Les notes cliniques, les rapports de pathologie, les dossiers médicaux électroniques (DME) ou les antécédents médicaux des patients fournissent un contexte sur l'état des patients, le traitement ou l'évolution de leur état et leurs antécédents médicaux.
Données d'imagerie
Les rayons X, la tomodensitométrie, l’IRM et les ultrasons fournissent des informations visuelles sur les structures anatomiques et sur toute anomalie pertinente pour le diagnostic et le traitement.
Données audio
Les conversations entre médecins et patients, les dictées médicales et l’enregistrement audio des sons cardiaques et pulmonaires capturent des échanges verbaux et des biomarqueurs acoustiques qui pourraient fournir des informations cliniques.
Données génomiques
Le séquençage de l’ADN et le profilage génomique contiennent des informations génétiques sur les maladies héréditaires, la susceptibilité aux maladies chroniques et la réponse au traitement.
Données du capteur
Les sorties des appareils portables qui surveillent la fréquence cardiaque, la pression artérielle et les niveaux d'oxygène fournissent des sorties pour une surveillance continue des patients en dehors d'un cadre clinique.
Une fois intégrées, ces sources de données permettent aux systèmes d’IA d’examiner les corrélations entre les variables pour obtenir des informations plus approfondies et de meilleures prévisions qu’avec n’importe quel type de données.
[A également lu: 22 ensembles de données de santé gratuits et ouverts pour l'apprentissage automatique]
L'importance des ensembles de données médicales multimodales pour le développement de l'intelligence artificielle
Contexte amélioré et compréhension complète
Les données de santé étant stockées de manière hétérogène dans différents systèmes et formats, l'intégration de données provenant de sources multiples offre aux modèles d'IA la possibilité d'accéder à un tableau clinique plus complet. Par exemple, les modèles multimodaux peuvent exploiter à la fois des images radiologiques et des notes cliniques pour comprendre non seulement les manifestations visuelles d'une pathologie, mais aussi les symptômes qu'elle présente chez les patients.
Faire face aux complexités des soins de santé
Il est rare qu'un diagnostic médical ou une recommandation de traitement repose sur une seule donnée. Au quotidien, un cabinet médical synthétise les informations et les preuves issues de multiples données (symptômes, tests et images) en tenant compte de l'histoire du patient. L'utilisation d'ensembles de données multimodales permet à l'intelligence artificielle de mieux refléter le processus décisionnel utilisé en pratique réelle en synthétisant différentes modalités.
Améliorations significatives de la précision
Les recherches montrent régulièrement que les modèles multimodaux sont souvent plus performants que les modèles monomodals. Par exemple, la combinaison prospective de données de dossiers médicaux électroniques et de données d'imagerie médicale a démontré une précision de prédiction des résultats significativement supérieure, notamment pour déterminer si et quand un patient nécessiterait une intubation ou pour évaluer son risque de mortalité, en se basant uniquement sur l'une ou l'autre source de données.
Explorer la médecine personnalisée
La capacité de l'IA à explorer des sources de données multimodales lui permet de révéler des relations subtiles, parfois invisibles cliniquement, entre la génétique, le mode de vie et les manifestations de la maladie, permettant ainsi un traitement véritablement personnalisé. Ceci est particulièrement utile dans les cas de maladies complexes où l'hétérogénéité de la présentation peut être encore plus prononcée.
Applications des ensembles de données médicales multimodales dans le domaine de la santé
Voici quelques applications importantes des ensembles de données médicales dans le domaine de la santé :
Capacité de diagnostic améliorée
Les modèles d'IA entraînés sur des ensembles de données multimodaux présentent une capacité diagnostique remarquable. Par exemple, Med-Gemini-2D réalisé des résultats de pointe en matière de questions-réponses visuelles et de génération de rapports sur les radiographies thoraciques et ont dépassé les références établies de plus de 12 %.
Interprétation d'imagerie médicale 3D
Le plus impressionnant est peut-être que les modèles d'IA multimodaux sont même capables d'interpréter des scans volumétriques 3D complexes. Par exemple, Med-Gemini-3D comprend et peut rédiger des comptes rendus radiologiques pour la tomodensitométrie crânienne.
Prédictions de santé
Les approches multimodales ne se limitent pas à l'imagerie et permettent de prédire les résultats de santé à partir de données, dépassant ainsi les scores traditionnels. Cela inclut des résultats de santé tels que la dépression, les accidents vasculaires cérébraux (AVC) et le diabète.
Aide à la décision clinique
En synthétisant les informations issues de différentes modalités, les systèmes d'IA peuvent offrir aux cliniciens un outil complet d'aide à la décision. Cela permet de mettre en évidence des éléments de données importants, de suggérer des diagnostics potentiels et de proposer des options thérapeutiques personnalisées.
Surveillance et évaluation à distance
Les systèmes multimodaux peuvent analyser les données des dispositifs de surveillance à distance en les combinant avec les antécédents médicaux. Cela permet aux patients de bénéficier d'une évaluation continue de leur état de santé en dehors des structures de soins traditionnelles.
Défis liés à l'utilisation d'ensembles de données médicales multimodales
Bien que les ensembles de données médicales multimodales offrent d’énormes promesses, il reste encore des défis importants :
- Accès et intégration des données : L'accès à un ensemble de données vaste et diversifié demeure difficile, notamment pour les maladies rares. De même, l'hétérogénéité des données, leurs formats, normes et niveaux de détail différents, posent des difficultés techniques d'harmonisation et d'intégration.
- Problèmes de confidentialité et de sécurité : La combinaison de plusieurs types de données augmente le risque de réidentification des patients, ce qui nécessite une protection et le respect des réglementations et normes de confidentialité (par exemple, HIPAA, GDPR).
- Assemblage et complexité de l'interprétation du modèle : Les modèles d’IA multimodaux sont souvent très complexes, ce qui rend difficile et intimidant l’interprétation de leur raisonnement décisionnel.
- Exigences informatiques : Le traitement et l’analyse des données multimodales nécessitent une puissance de calcul importante, ce qui augmente le coût du développement et du déploiement des modèles dans les applications et réduit probablement l’accès à l’utilisation.
[A également lu: Pourquoi les ensembles de données de santé sont importants pour façonner l'avenir de l'IA médicale]
Comment Shaip relève ces défis
Pour relever les défis inhérents aux modèles et algorithmes pour les données médicales multimodales, Shaip propose les solutions suivantes :
Ensembles de données prétraités étendus
Avec plus de 80 % des données de santé existant dans des formats non structurés et inaccessibles, la vaste collection d'ensembles de données médicales prétraitées de Shaip, qui comprend plus de 5.1 millions de dossiers médicaux anonymisés et 250,000 31 heures complètes de données audio de dictée de médecins dans XNUMX spécialités, fournit la base nécessaire au développement efficace de l'IA.
Annotation et étiquetage des données par des experts
Les services d'annotation de Shaip permettent aux moteurs d'IA d'interpréter des données médicales complexes. Leurs experts maîtrisent l'annotation de dossiers médicaux textuels et imagés afin de fournir des données d'apprentissage de haute qualité pour le développement de modèles d'IA.
Capacités robustes de désidentification
Propriété de Shaip plateforme de désidentification Permettent d'anonymiser les données sensibles, qu'elles soient textuelles ou graphiques, avec une précision extrême. Validés par des experts HIPAA, ces documents extraient les informations de santé protégées (PHI) et d'identification personnelle (PII), puis masquent, suppriment ou masquent ces champs afin de fournir des données entièrement anonymisées, conformes aux directives de conformité des fournisseurs et des institutions.
En résolvant les défis décrits ci-dessus, Shaip permet aux organisations de libérer le potentiel des ensembles de données médicales multimodales et d’accélérer le développement de solutions d’IA qui transforment la prestation de soins de santé et conduisent à de meilleurs résultats pour les patients.