Amélioration de la recherche PNL en oncologie

Précision des données en oncologie : licences, désidentification et annotations pour l'innovation des modèles de PNL

PNL en oncologie

Révolutionner les soins contre le cancer grâce aux technologies de pointe en PNL

Le client, un acteur majeur du secteur de la santé, avait besoin d’une solution avancée de PNL pour traiter un volume important de dossiers médicaux en oncologie. Dans le cadre d’une initiative cruciale visant à affiner la recherche en oncologie, la nécessité d’équilibrer l’analyse détaillée des données avec des normes strictes de confidentialité est primordiale. Cette étude de cas décrit nos contributions à l'amélioration des efforts de recherche du client grâce à l'annotation de données haute fidélité, à des pratiques rigoureuses de désidentification et à l'application de techniques de traitement du langage naturel (NLP), le tout dans le cadre réglementaire fourni par HIPAA.

Volume

Licence de données + désidentification des données
10 Nos Pages
Relations en oncologie
10 Nos Pages
Domaine non oncologique
10 Nos Pages
Négation
10 Nos Pages
Domaine Oncologie
10 Nos Pages
NER + Cartographie des relations
10 Nos Pages

Défis

Le projet nécessitait une compréhension nuancée de la documentation clinique, une identification précise des entités médicales et la capacité d'appliquer des étiquettes de négation avec précision, le tout dans un cadre sécurisé qui protège la vie privée des patients conformément aux réglementations HIPAA. L'entreprise exigeait non seulement une expertise technique dans la gestion de grands volumes de données complexes, mais également une approche stratégique pour intégrer les commentaires et maintenir la qualité à toutes les étapes du processus d'annotation.

Objectifs

Description détaillée des services

CatégoriesDescription
Couverture complète des données cliniquesCouvrant différents types de notes, paramètres de soins et sous-spécialités oncologiques, garantissant un ensemble de données robuste reflétant divers scénarios cliniques.
Désidentification rigoureuseVeiller à ce que tous les enregistrements étiquetés soient anonymisés conformément à la méthode Safe Harbor de la HIPAA, garantissant ainsi la confiance des clients dans la confidentialité et la sécurité des données.
Directives d'annotationCréation et mise en œuvre de directives standard d'annotation de données pour la préparation d'enregistrements étiquetés conformément aux normes HIPAA.
Stratégies d'annotation avancéesL'annotation manuelle de 10,000 XNUMX pages de dossiers liés à l'oncologie a été réalisée en mettant l'accent sur l'identification des statuts de négation et d'autres informations pertinentes conformément aux directives établies.
Assurance qualité rigoureuseAtteindre la norme de qualité spécifiée décrite dans la directive

Solution

Notre approche impliquait les stratégies clés suivantes :

Compilation d'ensembles de données personnalisés en oncologie

À partir d'une vaste archive de plus de 5 MN DSE, un sous-ensemble de données soigneusement choisi a été extrait, visant à répondre aux exigences spécialisées des clients en matière de données oncologiques en mettant l'accent sur les entités génomiques. Le processus de collecte impliquait la création d’une liste exhaustive de marqueurs tumoraux, de gènes, de variantes et d’étapes TNM, en utilisant des recherches par mots clés pour identifier les documents abondants dans ces données. Des expressions régulières ont été utilisées pour identifier une gamme de variations génétiques et de stades du cancer. Cette approche, combinée à une large couverture de données englobant divers types de documents, spécialités, milieux de soins et données provenant de plusieurs médecins, a permis de garantir un ensemble de données en oncologie complet et pertinent.

Compilation d'ensembles de données en oncologie

Désidentification rigoureuse

Le processus a strictement respecté la méthode de désidentification Safe Harbor de la HIPAA, qui garantit la confiance du client dans la confidentialité et la sécurité des données. Cela implique de supprimer toutes les informations de santé protégées (PHI) et de les remplacer par des espaces réservés étiquetés, conservant ainsi l'utilité des données tout en protégeant la confidentialité des patients.

Variables de désidentification

CatégoriesSous-catégorie
NomNom du patient, nom du médecin, nom de l'infirmière praticienne, nom du membre de la famille, nom du centre médical, nom de la clinique, nom de la maison de retraite, nom de l'entreprise, nom de l'université.
Âge 
DateModèle de date, modèle Mois Année, Jour Modèle Mois, Modèle Jour Année, Jour, Mois, Année, Saison
LocalisationPays, État, Ville, Rue, Code postal, Numéro de chambre, Numéro de suite, Numéro d'étage
IDNuméro de sécurité sociale, numéro de dossier médical, numéro de bénéficiaire du plan de santé, numéro de compte, numéro de certificat/licence, identifiant biométrique, identifiant d'enregistrement, numéro d'accession, numéro d'identification du véhicule, numéro de plaque d'immatriculationIdentificateurs d'appareil et numéro de série
Contactez-NousNuméro de téléphone, numéro de fax, adresse e-mail, URL Web, adresse IP

Mise en situation :

Le 25 septembre 2106, à 11h00, M. Harry Pace, âgé de 90 ans, a été admis à l'hôpital général de Forrest pour une opération programmée de la hanche, préalablement consulté par son médecin traitant, le Dr Jose Martin, et assisté par Kendra Reith, MARYLAND. Pendant son séjour, il a été pris en charge par Mary Hu, NP, et Suzan Ray, RN, avec R. Charles Melancon, PA, également consulté. Son opération, réalisée le jour même de son admission, s'est déroulée avec succès et aucune complication n'a été signalée. Après l'opération, M. Pace a été transféré à la salle 202, au 2e étage, pour y être rétabli. Son épouse, Emma Pace, était présente tout au long et a reçu toutes les mises à jour nécessaires. Au cours de son bref séjour, ses dossiers médicaux, notamment le MRN MR99062619 et le compte KV000014764, ont été traités conformément aux protocoles standard du Gracewood Nursing Home, son ancienne résidence. Il a été renvoyé plus tard le même jour vers les soins de la clinique ambulatoire d'Oakland pour poursuivre sa convalescence. Tout au long du processus, toutes les procédures ont été documentées et sécurisées dans le respect des normes de confidentialité.

Exemple : Dépersonnalisé

On [Modèle de date], à 11h00, M. [Nom du patient], âgé [Âge], a été admis à [Nom du centre médical] pour une opération programmée de la hanche, préalablement consulté par son médecin traitant le Dr. [Nom du médecin], et assisté par [Nom du médecin] MARYLAND. Durant son séjour, il était sous la garde de [Infirmière praticienne], NP, et [Infirmière praticienne], RN, avec [Nom du médecin], PA, également consultée. Son opération, réalisée le jour même de son admission, s'est déroulée avec succès et aucune complication n'a été signalée. Suite à l'opération, M. [Nom du patient] a été transféré dans la chambre no. [Numéro de chambre], Étage n° [Numéro d'étage], pour la récupération. Son épouse, [Nom du membre de la famille], était présente tout au long de l'audience et a reçu toutes les mises à jour nécessaires. Durant son bref séjour, ses dossiers médicaux, notamment MRN [Numéro de dossier médical] et compte [Numéro de compte], ont été traités selon les protocoles standards de [Nom de la maison de retraite], son ancienne résidence. Il a été libéré plus tard le même jour et confié aux soins de [Nom de la clinique] pour une récupération ultérieure. Tout au long du processus, toutes les procédures ont été documentées et sécurisées dans le respect des normes de confidentialité.

Directives d'annotation et techniques d'annotation avancées

Shaip a joué un rôle déterminant dans l'établissement et la mise en œuvre de directives standard d'annotation des données, garantissant que tous les enregistrements étiquetés étaient préparés de manière cohérente et conforme aux normes HIPAA. De plus, 10,000 XNUMX pages de divers dossiers médicaux ont été méticuleusement annotées, en mettant l’accent sur l’étiquetage détaillé des statuts de négation et d’autres entités cliniquement pertinentes, notamment diverses sous-spécialités en oncologie. L'annotation a été réalisée par une équipe d'annotateurs experts possédant des connaissances spécialisées en oncologie et en réglementation sur la confidentialité des données.

Critères d'annotation complexes

CatégoriesSous-catégorie
Annotation de date (oncologie)Date du diagnostic, date du stade, début, date de la procédure, date de début de la médecine, date de fin de la médecine, date de début de l'irradiation, date de fin de l'irradiation
Maladie (oncologie)Problème de cancer, histologie, état clinique, site corporel, comportement, grade, stade du cancer, stade TNM, test des marqueurs tumoraux, dimensions, code
Traitement (oncologie)Médecine contre le cancer, dosage des médicaments, fréquence, chirurgie du cancer, résultat de la chirurgie, modalités de rayonnement, dosage des rayonnements
GénomiqueCode de variation, gène étudié, méthode, spécimen
NégationNégatif, possiblement négatif, incertain, possiblement positif
TNS cliniqueProblème de cancer – Site corporel, Histologie – Site corporel, Comportement – ​​Site corporel, Chirurgie du cancer – Relations Site corporel, Modalité de rayonnement – ​​Site corporel, Histologie – Grade, Problème de cancer – Dimension

Mise en situation :

Énoncé de note clinique en oncologie

Déclaration de note clinique en oncologie

« La patiente Jane Doe a reçu un diagnostic de cancer du poumon non à petites cellules (CPNPC) de stade IIIB, en particulier un adénocarcinome, le 03/05/2023. Le cancer est localisé dans le lobe inférieur droit du poumon. Il est classé T3N2M0 selon le système de classification TNM, avec une taille tumorale de 5 cm x 3 cm. Une délétion de l’exon 19 de l’EGFR a été identifiée par analyse PCR de l’échantillon de biopsie tumorale. La chimiothérapie par Carboplatine AUC 5 et Pémétrexed 500 mg/m² a été débutée le 03/20/2023 et doit être administrée toutes les 3 semaines. Radiothérapie externe (EBRT) à la dose de 60 Gy en 30 fractions débutée le 04/01/2023. Le traitement du patient est en cours et il n'y a aucune preuve de métastases cérébrales sur la récente IRM. La possibilité d'une invasion lymphovasculaire reste à déterminer et la tolérance du patient au régime de chimiothérapie complet reste incertaine.

Déclaration de note clinique en oncologie

Énoncé de note clinique en oncologie

Assurance qualité rigoureuse

Mise en œuvre d'un cadre de gestion de projet flexible qui a facilité l'intégration efficace des commentaires des clients tout en respectant des normes de qualité strictes. Un protocole complet d'assurance qualité a été appliqué, conforme aux lignes directrices pour atteindre les critères de qualité requis. Ce protocole comportait des séries successives d'examen et de vérification, garantissant la précision et la fiabilité des données annotées. Une telle surveillance méticuleuse de la qualité est essentielle à l’élaboration d’une solution PNL fiable, essentielle à une prise de décision clinique éclairée et à l’excellence de la recherche.

Résultat

Livraison réussie de 10,000 XNUMX enregistrements étiquetés anonymisés de haute qualité, fournissant un ensemble de données sécurisé et précieux pour le développement du modèle PNL du client. L'application méticuleuse de la PNL et le respect des normes de désidentification HIPAA ont abouti à un ensemble de données hautement raffiné qui soutiendra les efforts de recherche en oncologie actuels et futurs du client, visant à terme à améliorer les résultats pour les patients en oncologie et l'efficacité de la prestation des soins.

Le succès du projet illustre notre capacité à traiter des données médicales complexes avec précision, contribuant ainsi à l'objectif du client d'améliorer les résultats des soins aux patients et d'accélérer le rythme de l'innovation en matière de soins de santé.

Notre partenariat avec Shaip a joué un rôle déterminant dans l’avancement de nos capacités en PNL dans le domaine de l’oncologie. Le traitement professionnel de 10,000 XNUMX dossiers médicaux, annotés de négations détaillées et d'autres entités cliniques, a démontré leur engagement envers l'excellence et la conformité. De plus, leur engagement envers les normes de confidentialité telles que HIPAA nous a fourni des ressources inestimables pour faire avancer nos initiatives d'IA visant à développer des traitements et des diagnostics oncologiques de pointe.

Or-5 étoiles

Accélérez votre IA dans le domaine de la santé
développement d'applications à 100%