Étude de cas : IA conversationnelle

Précision des données en oncologie : licences, désidentification et annotations pour l'innovation des modèles de PNL

Révolutionner les soins contre le cancer grâce aux technologies PNL de pointe.

Développement du NLP en oncologie

Résumé du projet

Le client, un acteur majeur du secteur de la santé, avait besoin d’une solution avancée de PNL pour traiter un volume important de dossiers médicaux en oncologie. Dans le cadre d’une initiative cruciale visant à affiner la recherche en oncologie, la nécessité d’équilibrer l’analyse détaillée des données avec des normes strictes de confidentialité est primordiale. Cette étude de cas décrit nos contributions à l'amélioration des efforts de recherche du client grâce à l'annotation de données haute fidélité, à des pratiques rigoureuses de désidentification et à l'application de techniques de traitement du langage naturel (NLP), le tout dans le cadre réglementaire fourni par HIPAA.

Développement du NLP en oncologie

Principales statistiques

Licence de données
+ Données dé-identifiées

10,000 pages

Non oncologique
Domaine

10,000 pages

Oncologie
Domaine

10,000 pages

Oncologie
Relations

4500 pages

Négation

9000 pages

NER + Relation
Cartographie

1223 pages

Défis

Le projet nécessitait une compréhension nuancée de la documentation clinique, une identification précise des entités médicales et la capacité d'appliquer des étiquettes de négation avec précision, le tout dans un cadre sécurisé qui protège la vie privée des patients conformément aux réglementations HIPAA. L'entreprise exigeait non seulement une expertise technique dans la gestion de grands volumes de données complexes, mais également une approche stratégique pour intégrer les commentaires et maintenir la qualité à toutes les étapes du processus d'annotation.

Description détaillée des services :

  • Couverture complète des données cliniques : Couvrant différents types de notes, contextes de soins et sous-spécialités oncologiques, garantissant un ensemble de données robuste reflétant divers scénarios cliniques.
  • Désidentification rigoureuse : Veiller à ce que tous les enregistrements étiquetés soient anonymisés conformément à la méthode Safe Harbor de la HIPAA, garantissant ainsi la confiance des clients dans la confidentialité et la sécurité des données.
  • Directives d'annotation : Création et mise en œuvre de directives standard d'annotation de données pour la préparation d'enregistrements étiquetés conformément aux normes HIPAA.
  • Techniques d'annotation avancées : Application de la PNL à 10,000 XNUMX pages de dossiers liés à l’oncologie, impliquant un étiquetage complexe des statuts de négation et d’autres détails pertinents conformément aux directives préalablement établies.
  • Assurance qualité rigoureuse : Atteindre la norme de qualité spécifiée décrite dans la directive.

Solution

Notre approche impliquait les stratégies clés suivantes :

Couverture complète des données cliniques

Pour adapter l'ensemble de données aux besoins spécifiques du client, une sélection ciblée de données a été minutieusement extraite du vaste référentiel de Shaip, qui compte plus de 5 millions de dossiers médicaux électroniques. Cet ensemble de données organisé englobait une variété de types de notes et de paramètres de soins, offrant une vue riche et diversifiée
un éventail de scénarios cliniques. Cela garantit un ensemble de données qui est non seulement complet mais également hautement représentatif des données médicales du monde réel.

Désidentification rigoureuse

Le processus a strictement respecté la méthode de désidentification Safe Harbor de la HIPAA, qui garantit la confiance du client dans la confidentialité et la sécurité des données. Cela implique de supprimer toutes les informations de santé protégées (PHI) et de les remplacer par des espaces réservés étiquetés, conservant ainsi l'utilité des données tout en protégeant la confidentialité des patients.

Variables de désidentification

CatégorieSous-catégorie
NomNom du patient, nom du médecin, nom de l'infirmière praticienne, nom du membre de la famille, nom du centre médical, nom de la clinique, nom de la maison de retraite, nom de l'entreprise, nom de l'université.
Âge  
DateModèle de date, modèle Mois Année, Jour Modèle Mois, Modèle Jour Année, Jour, Mois, Année, Saison
LieuPays, État, Ville, Rue, Code postal, Numéro de chambre, Numéro de suite, Numéro d'étage
IDNuméro de sécurité sociale, numéro de dossier médical, numéro de bénéficiaire du régime d'assurance maladie, numéro de compte, numéro de certificat/licence, identifiant biométrique, identifiant de dossier, numéro d'accès, numéro d'identification du véhicule, numéro de plaque d'immatriculation Identifiants de l'appareil et numéro de série
ContactNuméro de téléphone, numéro de fax, adresse e-mail, URL Web, adresse IP

Exemple :

Le 25 septembre 2106, à 11h00, M. Harry Pace, âgé de 90 ans, a été admis à l'hôpital général de Forrest pour une opération programmée de la hanche, préalablement consulté par son médecin traitant, le Dr Jose Martin, et assisté par Kendra Reith, MARYLAND. Pendant son séjour, il a été pris en charge par Mary Hu, NP, et Suzan Ray, RN, avec R. Charles Melancon, PA, également consulté. Son opération, réalisée le jour même de son admission, s'est déroulée avec succès et aucune complication n'a été signalée. Après l'opération, M. Pace a été transféré à la salle 202, au 2e étage, pour y être rétabli. Son épouse, Emma Pace, était présente tout au long et a reçu toutes les mises à jour nécessaires. Au cours de son bref séjour, ses dossiers médicaux, notamment le MRN MR99062619 et le compte KV000014764, ont été traités conformément aux protocoles standard du Gracewood Nursing Home, son ancienne résidence. Il a été renvoyé plus tard le même jour vers les soins de la clinique ambulatoire d'Oakland pour poursuivre sa convalescence. Tout au long du processus, toutes les procédures ont été documentées et sécurisées dans le respect des normes de confidentialité.

Exemple : Dépersonnalisé

On [Modèle de date], à 11h00, M. [Nom du patient], vieilli [Âge], a été admis à [Nom du centre médical] pour une opération programmée de la hanche, préalablement consulté par son médecin traitant le Dr. [Nom du médecin], et assisté par [Nom du médecin] MARYLAND. Durant son séjour, il était sous la garde de [Infirmière praticienne], NP, et [Infirmière praticienne], RN, avec [Nom du médecin], PA, également consulté. Son opération, réalisée le jour même de son admission, s'est déroulée avec succès et aucune complication n'a été signalée. Après l'opération, M. [Nom du patient] a été transféré dans la chambre no. [Numéro de chambre], Étage n° [Numéro d'étage], pour se rétablir. Sa femme, [Nom du membre de la famille], était présent tout au long du séjour et a reçu toutes les mises à jour nécessaires. Pendant son bref séjour, ses dossiers médicaux, y compris le MRN [Numéro de dossier médical] et compte [Numéro de compte], ont été traités conformément aux protocoles standards de [Nom de la maison de retraite], sa résidence précédente. Il a été libéré plus tard le même jour et confié aux soins de [Nom de la clinique] pour une récupération ultérieure. Tout au long du processus, toutes les procédures ont été documentées et sécurisées dans le respect des normes de confidentialité.

Directives d'annotation et techniques d'annotation avancées

Shaip a joué un rôle déterminant dans l'établissement et la mise en œuvre de directives standard d'annotation des données, garantissant que tous les dossiers étiquetés étaient préparés de manière cohérente et en conformité avec les normes HIPAA. De plus, 10,000 XNUMX pages de divers dossiers médicaux ont été minutieusement annotées, avec
une attention particulière a été portée à l'étiquetage détaillé des statuts de négation et d'autres entités cliniquement pertinentes, y compris diverses sous-spécialités en oncologie. L'annotation a été réalisée par une équipe d'annotateurs experts possédant des connaissances spécialisées en oncologie et en réglementation sur la confidentialité des données.

Annotations complexes

CatégorieSous-catégorie
Date
Annotation
(Oncologie)
Date de diagnostic, Date du stade, Début, Date de la procédure, Date de début du traitement, Date de fin du traitement,
Date de début de l'irradiation, date de fin de l'irradiation
Maladie
(Oncologie)
Problème de cancer, histologie, état clinique, site corporel, comportement, grade, stade du cancer, stade TNM, test des marqueurs tumoraux, dimensions, code
Traitement
(Oncologie)
Médecine contre le cancer, dosage des médicaments, fréquence, chirurgie du cancer, résultat de la chirurgie, modalités de rayonnement, dosage des rayonnements
GénomiqueCode de variation, gène étudié, méthode, spécimen
NégationNégatif, possiblement négatif, incertain, possiblement positif
TNS clinique
Relations
Problème de cancer – Site corporel, Histologie – Site corporel, Comportement – ​​Site corporel, Chirurgie du cancer – Site corporel, Modalité de radiothérapie – Site corporel, Histologie – Grade, Problème de cancer – Dimension

Exemple :

Déclaration de note clinique en oncologie

Déclaration de note clinique en oncologie

« La patiente Jane Doe a reçu un diagnostic de cancer du poumon non à petites cellules (CPNPC) de stade IIIB, en particulier un adénocarcinome, le 03/05/2023. Le cancer est localisé dans le lobe inférieur droit du poumon. Il est classé T3N2M0 selon le système de classification TNM, avec une taille tumorale de 5 cm x 3 cm. Une délétion de l’exon 19 de l’EGFR a été identifiée par analyse PCR de l’échantillon de biopsie tumorale. La chimiothérapie par Carboplatine AUC 5 et Pémétrexed 500 mg/m² a été débutée le 03/20/2023 et doit être administrée toutes les 3 semaines. Radiothérapie externe (EBRT) à la dose de 60 Gy en 30 fractions débutée le 04/01/2023. Le traitement du patient est en cours et il n'y a aucune preuve de métastases cérébrales sur la récente IRM. La possibilité d'une invasion lymphovasculaire reste à déterminer et la tolérance du patient au régime de chimiothérapie complet reste incertaine.

Déclaration de note clinique en oncologie :

Déclaration de note clinique en oncologie

Assurance qualité rigoureuse

Mise en œuvre d'un cadre de gestion de projet flexible qui a facilité l'intégration efficace des commentaires des clients tout en respectant des normes de qualité rigoureuses. Un protocole d'assurance qualité complet a été appliqué, en s'alignant sur les directives pour atteindre les critères de qualité requis. Ce protocole comprenait des cycles successifs d'examen et de vérification, garantissant la précision et la fiabilité des données annotées. Une surveillance de qualité aussi méticuleuse est essentielle à l'élaboration d'une solution PNL fiable, essentielle à la prise de décision clinique éclairée et à l'excellence de la recherche.

Le résultat

Nous avons livré avec succès 10,000 XNUMX dossiers étiquetés anonymisés de haute qualité, fournissant un ensemble de données sécurisé et précieux pour le développement du modèle NLP du client. L'application méticuleuse du NLP et le respect des normes d'anonymisation HIPAA ont permis de créer un ensemble de données hautement raffiné qui étayera les efforts de recherche en oncologie actuels et futurs du client, visant à terme à améliorer les résultats des patients en oncologie et l'efficacité de la prestation des soins.

Le succès du projet illustre notre capacité à traiter des données médicales complexes avec précision, contribuant ainsi à l'objectif du client d'améliorer les résultats des soins aux patients et d'accélérer le rythme de l'innovation en matière de soins de santé.

Notre partenariat avec Shaip a joué un rôle déterminant dans l’avancement de nos capacités en PNL dans le domaine de l’oncologie. Le traitement professionnel de 10,000 XNUMX dossiers médicaux, annotés de négations détaillées et d'autres entités cliniques, a démontré leur engagement envers l'excellence et la conformité. De plus, leur engagement envers les normes de confidentialité telles que HIPAA nous a fourni des ressources inestimables pour faire avancer nos initiatives d'IA visant à développer des traitements et des diagnostics oncologiques de pointe.

5 étoiles d'or