Conversations synthétiques sur les soins de santé pour l’ASR

Permettre le développement de technologies ambiantes grâce à des conversations synthétiques sur les soins de santé

Technologie ambiante

Plus de 2000 XNUMX heures de données audio collectées et transcrites en milieu clinique

Dans le domaine en évolution rapide de l’IA conversationnelle, l’une des applications notables se trouve dans le secteur de la santé, où la technologie est utilisée pour rationaliser les interactions prestataire-patient. Notre client, un nom leader dans le domaine des technologies de la santé, a contacté Shaip pour lui demander d'améliorer son modèle de reconnaissance automatique de la parole (ASR) afin de mieux comprendre et transcrire les conversations à plusieurs interlocuteurs en milieu clinique. En raison des réglementations en matière de confidentialité, l'acquisition de dialogues réels était un défi ; l’idée était donc de créer et de retranscrire des interactions synthétiques mais réalistes entre prestataires de soins et patients.

Volume

2,000 heures, ou environ 12,000 à 24,000 interactions synthétiques individuelles de 10 durée moyenne en minutes.

Objectif

Notre objectif principal était de générer environ 2,000 12,000 heures d’enregistrements audio, se traduisant par 24,000 XNUMX à XNUMX XNUMX interactions synthétiques méticuleusement conçues, incarnant une diversité de genre, d’âge, d’accents et de rôles médicaux. Cet ensemble de données complet et authentique, conçu pour imiter des dialogues cliniques réels, a été créé dans le strict respect des réglementations en matière de confidentialité telles que HIPAA. Les interactions synthétiques ont servi de riche ensemble de données, contribuant à la formation et au perfectionnement du modèle ASR de notre client, améliorant considérablement sa capacité à gérer des conversations réelles en milieu clinique.

 

Objectifs

Défis

Conformité réglementaire

Garantir le respect des lois sur la confidentialité telles que la HIPAA tout en créant des interactions de soins de santé réalistes mais synthétiques peut s'avérer difficile.

La conformité réglementaire

Authenticité et diversité des données

La création d'interactions synthétiques qui imitent avec précision les dialogues cliniques du monde réel tout en englobant un large éventail de scénarios, d'accents, d'âges et de rôles médicaux nécessite une approche méticuleuse et une connaissance approfondie du domaine.

Authenticité et diversité des données

Assurance qualité

Atteindre un niveau élevé de précision dans la transcription, tel que le taux d’exactitude des mots (WER) ciblé de 95 % et le taux d’exactitude des étiquettes (TER) de 90 %, nécessite des processus d’assurance qualité rigoureux.

Capacités techniques

Garantir que l’infrastructure technique, y compris les plates-formes d’enregistrement et de transcription, puisse gérer le volume de données et maintenir la qualité constitue un défi de taille.

Recrutement et formation des ressources

Recruter des personnes ayant une formation médicale pour des jeux de rôle et s'assurer qu'elles adhèrent à des scénarios réalistes tout en maintenant un flux de conversation naturel peut s'avérer assez difficile. De plus, former les transcripteurs à adhérer à des directives de qualité strictes nécessite des efforts et une expertise considérables.

Approche/Solution

Collection audio et transcription

  • Création de scénario : Développement de scénarios réalistes reflétant les conditions non urgentes courantes rencontrées dans les pratiques de médecine familiale pour adultes, telles que l'hypertension, le diabète et la gestion de la douleur.
  • Jeu de rôle: Recrutement de personnes ayant une formation médicale pour jouer le rôle de prestataires de soins de santé et de patients, en adhérant aux scénarios fournis et en simulant des conversations cliniques réelles.
  • Enregistrement: Utilisation de l'application mobile Shaip Work pour capturer l'audio, garantissant une représentation diversifiée en termes de sexe, d'âge, d'accents et d'expériences professionnelles parmi les participants.

Validation et transcription

  • Exécuté des scripts de validation pour garantir l'exactitude et la qualité des fichiers audio.
  • Les transcriptions ont été réalisées sur la plateforme Bhasha, en respectant les directives spécifiques fournies et en garantissant une transcription textuelle des textes avec une diarisation précise.
  • Métadonnées annotées, notamment l'identifiant du locuteur, l'âge, le sexe, la langue maternelle et la formation/expérience médicale, qui étaient essentielles aux objectifs de formation du modèle du client.

Assurance qualité

  • Des contrôles de qualité complets effectués par le CQA et le PMO ont garanti un objectif de qualité de transcription de 95 % de taux de précision des mots (WER) et de 90 % de taux de précision des balises (TER).

Livraison de données

  • Nous avons structuré les données de manière claire et organisée et les avons livrées par lots, accompagnées de notes détaillées sur les lots et de répertoires de culture.
  • Veiller à ce que toutes les données, y compris les fichiers audio, les transcriptions et les métadonnées, soient correctement étiquetées et formatées selon les spécifications du client.

Commentaires et itérations

Établissement d'une boucle de rétroaction solide avec le client pour identifier toute lacune, garantissant que des corrections ont été apportées et qu'un ensemble de données complet et précis a été fourni.

Principales réalisations

  • Collecte et transcription réussies de 2000 heures d’interactions synthétiques en soins de santé.
  • Transcription rapide et précise avec un taux de précision remarquable, contribuant de manière significative à l'objectif du client d'améliorer son modèle ASR.
  • Capacité démontrée de Shaip à gérer des projets complexes à grande échelle avec une approche méticuleuse de la qualité et de la précision.

Résultat

Le projet méticuleusement exécuté facilité par Shaip a abouti à un riche ensemble de données qui a contribué de manière significative à l'amélioration du modèle ASR du client. Les interactions synthétiques ont créé une représentation réaliste des dialogues cliniques, aidant ainsi le client à obtenir un service vocal plus robuste et plus fiable pour les environnements de soins de santé. Grâce à une approche structurée et bien coordonnée, Shaip a assuré la réussite d’un projet complexe dans les délais impartis, consolidant ainsi son expertise dans la gestion de projets d’IA conversationnelle à grande échelle dans le domaine de la santé.

Notre collaboration avec Shaip a considérablement fait progresser notre projet en matière de technologie ambiante et d'IA conversationnelle dans le domaine de la santé. Leur expertise dans la création et la transcription de dialogues synthétiques sur les soins de santé a fourni une base solide, démontrant le potentiel des données synthétiques pour surmonter les défis réglementaires. Avec Shaip, nous avons surmonté ces obstacles et sommes désormais sur le point de concrétiser notre vision de solutions de soins de santé intuitives.

Or-5 étoiles

Accélérez votre IA dans le domaine de la santé
développement d'applications à 100%