Scribe médical automatisé

From Wikipedia, the free encyclopedia

Les assistants médicaux automatisés (aussi appelés scribes IA, assistants vocaux médicaux IA, assistants vocaux IA, technologies vocales ambiantes (TVA), assistants numériques, assistants virtuels ou assistants vocaux IA ambiants)[1] sont des outils informatiques (agents intelligents) qui travaillent pour le personnel médical, en arrière-plan, en produisant des brouillons de documentation clinique (à partir de transcription de consultations), d'ordonnances et de notes cliniques dictées. Dans le contexte d'un développement des NTIC en médecine et en particulier du dossier médical électronique, ils produisent et conservent des résumés de consultations, allégeant la charge administrative des cliniciens et améliorent l'efficacité de leur documentation.

Ils sont tous basés sur les progrès récents des LLM larges modèles de langage, communément dits « IA », qui connaissent une popularité croissante en 2024, surtout aux États-Unis[2].

Ils font évoquer des enjeux de protection de la vie privée et des données médicales (qui sont des données sensibles et un enjeu majeur d'éthique médicale, en raison de niveaux de sécurité qui varient considérablement selon les modèles. Ces outils intelligents, principalement dédiés à la transcription médicale automatisés pourraient théoriquement parfaitement fonctionner localement, même sans connexion Internet, mais la plupart sont des solutions propriétaires qui exigent que les données soient envoyées dans le cloud pour y être traitées et renvoyées à l'utilisateur, de manière sécurisée, certains fournisseurs utilisant par exemple un chiffrement à connaissance nulle (ce qui signifie que le fournisseur de services ne peut pas non plus accéder aux données)[1],[3]. Certains fournisseurs de systèmes de transcription automatisés s'engagent à ne pas utiliser les données de patients pour entraîner leurs IA, ni les louer ou les revendre à des tiers[4], mais rares sont ceux qui ont publié des données sur la sécurité ou l'utilité de leurs systèmes dans des revues scientifiques[1], et rares sont ceux qui répondent aux demandes des chercheurs étudiant ces produits[5].

Enfin, ils posent la question d'un éventuel remplacement progressif des emplois de secrétariat médical par l'IA.

Les médecins ont d'abord dicté leurs notes à une secrétaire, puis utilisé des dictaphones, dont le contenu était ensuite transcrit par la secrétaire ou le médecin.

Puis depuis les années 2020 avec l'apparition des LLM, l'intellligence artificielle peut exploiter la capture audio continue de la conversation (voire des photos ou scanns) pour faire tout ou partie de ce travail (sans supprimer le besoin de relecture et vérification).

Mais « peut-être en raison de pressions concurrentielles et/ou de désir de démontrer le retour sur investissement, les fournisseurs de scribes ambiants se sont rapidement étendus — au-delà de la transcription et du résumé — à une fonction de facturation[6],[7]. »

plusieurs des ces scribes intelligents intègrent déjà des modules de reconnaissance multilingue ou de traduction en temps réel, ce qui semble devoir être la tendance du secteur, car la traduction facilite grandement les consultations avec des patients ne parlant pas la langue du clinicien.

Les retours d'expérience des cliniciens sont positifs concernant l'efficacité documentaire, le gain de temps passé sur les notes, la hausse des clôtures de visites le jour même, la charge mentale lié à la documentation, avec un meilleur sentiment d’engagement envers les patients, mais ces retours sont mitigés concernant la longueur et/ou la qualité des notes générées par les scribes ambiants[8]. Certains les jugent précis et détaillés, tandis que d’autres les jugent trop sujets aux erreurs. Tous estiment qu'une relecture substantielles et attentive des notes ainsi générées est nécessaire, ce qui atténue l'impression de temps gagné[8].

Craintes quant à la confidentialité

Certains fournisseurs ne sont pas transparents quant au devenir des données utilisateur[9]. Certains peuvent les vendre à des tiers[1], qui sont a priori des entreprises technologiques à but lucratif, à des fins secondaires parfois non précisées[1]. Certains exigent que l'utilisateur signe un consentement pour une telle réutilisation de leurs données[10]. Certains intègrent les données utilisateur pour entraîner le logiciel[1] en promettant de les anonymiser ; Mais une désanonymisation est possible (c'est-à-dire que l'identité du patient peut être révélée)[9].

Il est intrinsèquement impossible d'empêcher un modèle linéaire mixte (LLM) de corréler ses entrées, car ces modèles fonctionnent en identifiant des schémas similaires dans de très grands ensembles de données. Des informations sur le patient seront retrouvées par croisement avec d'autres sources (par exemple, s'il a été blessé lors d'un incident à une date précise si cette information a été données par un média ; de l'information sur ses rendez-vous médicaux (lieux et heures précis) est probablement accessible via son opérateur mobile, ses applications ou des courtiers en données ; la date de naissance de son enfant sera par exemple probablement déduite de son historique d'achats en ligne ; et il pourrait évoquer des informations privées sur des changements de mode de vie ou sa sexualité, qu'une IA peut facilement croiser avec d'autres informations trouvées en lignes (forums, blogs, réseaux sociaux...). Le logiciel peut corréler ces informations avec le dossier de consultation clinique « anonymisé » et, interrogé sur le patient nommé, fournir des informations que celui-ci n'a partagées qu'avec son médecin en privé. Le dossier d'un patient ne concerne que ce dernier et une partie du personnel médical, mais il est inévitablement lié à d'autres données et dans de très nombreux cas, les antécédents médicaux sont intrinsèquement identifiables[4]. Selon la fréquence d'une pathologie, des rendez vous médicaux et les médicaments utilisés et bien d'autres données disponibles, l'anonymat K peut s'avérer insuffisant. La confidentialité différentielle pourrait théoriquement préserver la confidentialité.

Des entreprises courtage de données que sont devenues Google, Amazon et Microsoft ont créé ou acquis des services de transcription médicale[5], dont certains utilisent les données des utilisateurs à des fins secondaires[10], ce qui a suscité des inquiétudes en matière de concurrence[11]. Le transfert de dossiers de patients pour l'entraînement de l'IA a, par le passé, donné lieu à des poursuites judiciaires[4].

Les logiciels libres effectuent généralement toute la transcription localement, sur l'ordinateur du médecin[4],[12]. Ils sont largement utilisés dans le domaine de la santé, et certains organismes nationaux de santé publique organisent des journées de développement informatique pour concourir à les améliorer[4]

Revente et commercialisation des données

Plusieurs fournisseurs de services de transcription médicale automatisée incluent dans leurs contrats des clauses autorisant la réutilisation, la vente ou la commercialisation de données dépersonnalisées ou soumises par l'utilisateur. Bien que ces données soient généralement qualifiées d'anonymisées ou agrégées, ces pratiques soulèvent des questions d'éthique parmi les cliniciens et les défenseurs de la vie privée quant aux utilisations secondaires des informations médicales, au-delà de la simple documentation clinique.

  • Freed, une plateforme de transcription et de scribe par IA, indique dans ses conditions d'utilisation qu'elle peut « collecter, utiliser, publier, diffuser, vendre, transférer et exploiter de toute autre manière » les données anonymisées et agrégées issues des entrées des utilisateurs[4].
  • OpenEvidence indique également qu'elle peut « collecter, utiliser, transférer, vendre et divulguer des informations non personnelles et des données d'utilisation des clients à toutes fins, y compris à des fins commerciales »[4].
  • Doximity, qui propose un assistant médical doté d'IA dans le cadre de sa plateforme pour médecins, s'octroie une licence « non exclusive, irrévocable, mondiale, perpétuelle, illimitée, cessible, sous-licenciable et exempte de redevances » pour « copier, créer des œuvres dérivées, améliorer, distribuer, publier, analyser, indexer, étiqueter et commercialiser » le contenu soumis par les utilisateurs, sous réserve de sa politique de confidentialité[4].

Étant donné que ces termes autorisent une large utilisation secondaire — y compris la vente, la concession de licences, l'entraînement de modèles, les œuvres dérivées et l'exploitation commerciale de données dépersonnalisées ou soumises par l'utilisateur —, certains commentateurs ont recommandé aux cliniciens d'examiner attentivement les dispositions relatives au traitement des données lors de l'adoption d'outils de description par IA, en particulier dans les environnements cliniques où la confidentialité des patients et la conformité réglementaire sont essentielles.

Cryptage

L'authentification multifactorielle pour l'accès aux données est une pratique courante[1].

L'échange de clés Diffie-Hellman est généralement utilisé pour le chiffrement ; il s'agit de la méthode standard couramment employée pour des services tels que les opérations bancaires en ligne. Ce chiffrement est coûteux, mais pas inviolable ; il n'est généralement pas considéré comme sûr face à des écoutes clandestines menées par un État-nation disposant de ressources comparables[3].

Si le contenu est chiffré entre le client et le serveur distant du fournisseur de services (chiffrement de transport), le serveur possède une copie non chiffrée. Ceci est nécessaire si les données sont utilisées par le fournisseur de services (par exemple, pour l'entraînement du logiciel). Le chiffrement à divulgation nulle de connaissance implique que la seule copie non chiffrée se trouve chez le client, et que le serveur ne peut pas déchiffrer les données plus facilement qu'un attaquant utilisant une technique d'interception.

Plateformes

Les logiciels de traitement de données peuvent fonctionner sur des ordinateurs de bureau, des ordinateurs portables ou des appareils mobiles, sous différents systèmes d'exploitation. Les risques associés varient ; par exemple, les appareils mobiles peuvent être perdus[13],[4] Les systèmes d'exploitation sous-jacents, qu'ils soient mobiles ou de bureau, font également partie de la base informatique de confiance, et s'ils ne sont pas sécurisés, les logiciels qui en dépendent ne le sont pas non plus. 20 21[4].

Confabulation, omissions et autres erreurs

Comme les autres modèles de langage, les modèles de langage utilisés pour la transcription médicale sont sujets à la confabulation, c'est-à-dire qu'ils inventent du contenu en se basant sur des associations statistiques entre leurs données d'entraînement et l'enregistrement audio[9]. Ces modèles ne font pas la distinction entre la transcription de l'audio et la prédiction des mots suivants, mais effectuent les deux processus simultanément ; ils sont particulièrement susceptibles de transformer de courts silences ou des bruits parasites en paroles inventées pour les transcrire[14].

Les transcripteurs médicaux des LLM (Legal Management Professionals) sont connus pour parfois inclure des propos racistes ou empreints de préjugés ; ceci est dû au fait que les jeux de données d'entraînement de nombreux LLM contenaient des textes biaisés et des notions pseudo-scientifiques de racisme médical. Ils peuvent aussi se tromper de genre pour désigner les patients ce qui peut ensuite être source de confusion[9]. Une enquête a montré que la plupart des médecins préféraient que les transcripteurs soient formés sur des données vérifiées par des experts du domaine médical[15]. Des données d'entraînement pertinentes et précises augmentent la probabilité d'une transcription exacte, mais ne la garantissent pas[14]. Les logiciels entraînés sur des milliers de conversations cliniques réelles ont généré des transcriptions avec des taux d'erreur de mots plus faibles. Les logiciels entraînés sur des données d'entraînement transcrites manuellement ont obtenu de meilleurs résultats que ceux entraînés sur des données d'entraînement transcrites automatiquement[5]. Les transcripteurs automatiques (autoscribes) omettent parfois des parties des conversations, les jugeant non pertinentes. Ils peuvent classer à tort des informations pertinentes comme non pertinentes et les supprimer. Ils peuvent également confondre les symptômes anciens et actuels, ou encore mal classer des informations. Il arrive aussi qu'ils transcrivent mal le discours, en écrivant quelque chose d'incorrect. Si les cliniciens ne vérifient pas attentivement l'enregistrement, de telles erreurs pourraient se retrouver dans les dossiers médicaux et nuire aux patients[1].

Consentement du patient

Les organisations professionnelles exigent généralement que le recours à des autoscribes soit conditionné par le consentement du patient ; certaines peuvent exiger un consentement écrit. Les professionnels de santé doivent également respecter les lois locales sur la surveillance, qui peuvent criminaliser l'enregistrement de conversations privées sans consentement[1]. Des informations complètes sur le chiffrement, la transmission, le stockage et la destruction des données doivent être fournies. Dans certaines juridictions, il est illégal de transmettre les données à un pays ne disposant pas de lois équivalentes en matière de protection de la vie privée, ou de les traiter ou de les stocker sur place ; les fournisseurs qui ne peuvent garantir que leurs produits n'enverront pas illégalement de données à l'étranger ne peuvent être utilisés légalement[1].

Certains fournisseurs collectent des données en vue de leur réutilisation ou de leur revente. Les professionnels de santé sont généralement tenus d'examiner les conditions générales d'utilisation et d'identifier toute réutilisation de données[1]. Les cabinets de médecine générale sont généralement tenus d'informer les patients sur les utilisations secondaires de leurs données, de leur permettre de s'y opposer et d'obtenir leur consentement pour chaque utilisation secondaire spécifique. Les données ne doivent être utilisées qu'aux fins convenues[1],[4].

Technologie et marché

Le marché des scribes médicaux est, as of 2024 Le marché est extrêmement concurrentiel, avec plus de 50 produits disponibles. Nombre d'entre eux ne sont que des interfaces propriétaires autour des mêmes plateformes de gestion de dossiers médicaux (LLM) 8[11], y compris des plateformes dont les concepteurs ont averti qu'elles ne devaient pas être utilisées pour des applications critiques comme la médecine 25[16]. Certains fournisseurs commercialisent des assistants médicaux spécialisés dans des branches spécifiques de la médecine (bien que la plupart ciblent les médecins généralistes, qui représentent environ un tiers des médecins). De plus en plus, les fournisseurs présentent leurs produits comme allant au-delà de la simple prise de notes, affirmant qu'il s'agit d'assistants intelligents et de copilotes pour les médecins[11]. Ces usages élargis soulèvent davantage de questions quant à la précision des données[14],[10]. Extraire des informations de la conversation pour remplir automatiquement un formulaire, par exemple, peut s'avérer problématique : des symptômes peuvent être incorrectement étiquetés comme « absents », même s'ils ont été évoqués à plusieurs reprises. Les modèles n'ont pas réussi à extraire de nombreuses descriptions indirectes de symptômes, comme lorsqu'un patient a déclaré ne pouvoir dormir que quatre heures (au lieu d'utiliser le terme « insomnie »)[5].

Les LLM ne sont pas entraînés à générer des éléments nécessairement réels mais des approximations statistiques ; l'ajout de modèles structurés et de règles permet de fiabiliser leur extraction d'informations sémantiques[16], mais les « confabulations » ou « hallucinations » (résultats convaincants mais erronés) font partie intégrante de cette technologie.

Coûts pour le médecin ou la santé publique

À l'exception des logiciels entièrement libres et gratuits, les logiciels de transcription médicale sont relativement coûteux (coûts mensuels allant en 2025 généralement de 300 à 500 dollars/mois par clinicien, et parfois jusqu'à plusieurs milliers de dollars) et en 2025, selon Paige Nong et al., de l'École de santé publique de l'Université du Minnesota, les organisations de soins et de santé pourraient être plus enclines à les adopter la technologie si leur retour sur investissement (ROI) était démontré, au-delà de la réduction de la charge documentaire des cliniciens, alors que leur utilisation pour la facturation peut avoir des conséquences négatives inattendues (dont une hausse des dépenses de santé, une moindre satisfaction des cliniciens à long terme et une érosion de la confiance des patients)[6]. Ces chercheurs recommandent de privilégier une vision à long terme du retour sur investissement de ces scribes intelligents — en considérant notamment leur potentiel à réduire le coûteux turnover des cliniciens — plutôt que de s'appuyer sur des gains immédiats ; ils proposent pour cela (aux États-Unis) de créer un registre de l'usage de l'IA en santé pour permettre une évaluation transparente, de renforcer les audits Medicare afin de garantir la supervision clinique des codes facturés, et d'ajuster les remboursements lorsque l'intensification du codage liée aux scribes augmente artificiellement les dépenses. Ils insistent sur l'urgence d'une telle régulation proactive, face à l'adoption exponentiellement rapide de ces technologies[6].

Ces logiciels sont loués plutôt que vendus (logiciel en tant que service) et certaines entreprises fonctionnent selon un modèle freemium, offrant un certain nombre de transcriptions gratuites par mois, avant de faire payer le service[4].

Les scribes qui s'intègrent aux dossiers médicaux électroniques, éliminant ainsi le besoin de copier-coller, coûtent généralement plus cher[4]. Les logiciels de transcription audio entièrement libres sont gratuits. L'utilisateur peut les installer sur le matériel de son choix ou payer pour leur installation. Certains logiciels peuvent être installés sur l'appareil local (celui qui enregistre l'audio) ou sur un serveur local (par exemple, celui d'une clinique). Ils peuvent généralement être configurés pour ne transmettre aucune information à l'extérieur et peuvent même être utilisés sans connexion Internet.

Selon Nong et al. (2025), les scribes médicaux intelligents pourraient accroître les dépenses de santé de 3 manières : en facilitant une facturation plus intensive, en augmentant le nombre et la sévérité des diagnostics enregistrés et en repérant des actes manquants générateurs de revenus, des usages parfois utiles pour combler des lacunes de soins mais pouvant aussi entraîner des surcoûts sans bénéfice clinique pour les patients[6].

Impact sur la santé publique

Références

Voir aussi

Related Articles

Wikiwand AI