P55  - Création d'un système d'aide informatisée au codage Classification internationale des maladies (CIM) : choix de métrique de performance et utilisation de la hiérarchie CIM [résumé]

Marcou, Q. ;Berti-Equille, Laure; Novelli, N.

doi:10.1016/j.jeph.2024.202352

Publications des scientifiques de l'IRD

Marcou Q., Berti-Equille Laure, Novelli N. (2024). P55 - Création d'un système d'aide informatisée au codage Classification internationale des maladies (CIM) : choix de métrique de performance et utilisation de la hiérarchie CIM [résumé]. Journal of Epidemiology and Population Health, 72 (Suppl.1), 202352 [1 p.]. ISSN 2950-4333.

Titre du document

P55 - Création d'un système d'aide informatisée au codage Classification internationale des maladies (CIM) : choix de métrique de performance et utilisation de la hiérarchie CIM [résumé]

Année de publication

2024

Type de document

Article

Auteurs

Marcou Q., Berti-Equille Laure, Novelli N.

Source

Journal of Epidemiology and Population Health, 2024, 72 (Suppl.1), 202352 [1 p.] ISSN 2950-4333

Introduction : En plus d'une meilleure utilisation des données existantes, l'intelligence artificielle promet une aide pour la génération de données de meilleure qualité tout en allégeant la charge de collecte de données. Bien que des études récentes aient rapporté des résultats prometteurs en matière de classification automatique CIM, elles décrivent souvent des architectures de modèles spécifiques aux données d'entrée, et sont évaluées de manière hétérogène. Nos travaux explorent l'évaluation et la construction de systèmes de Codage assisté par ordinateur (CAO) plus efficaces en utilisant des approches génériques, mettant l'accent sur l'utilisation de la hiérarchie CIM, avec pour exemple l'utilisation de données de prescription médicamenteuses et un réseau de neurones séquentiel. Méthodes : Nous utilisons MIMIC-III, transformée au modèle de données OMOP-OHDSI. Nous évaluons diverses mesures de performance, ainsi que des approches d'apprentissage multitâche, hiérarchique et en présence de déséquilibre de classes pour les réseaux neuronaux. Résultats : Nous introduisons une métrique de performance, RE@R, adaptée à la tâche de codage CIM, qui offre des informations interprétables pour les praticiens de l'informatique médicale. Nous montrons que le filtrage de codes CIM diminue les performances de récupération sans amélioration des performances sur le sous-ensemble sélectionné. Nous montrons également que l'optimisation de métriques telles que le NDCG ou l'AUC Précision-Rappel permettent de surpasser les performances obtenues en utilisant la F1. Nous observons que l'entraînement simultané sur différents niveaux CIM offre des avantages mineurs pour le classement et des gains de temps d'exécution significatifs. Cependant, nous constatons les techniques d'apprentissage hiérarchique ou de correction du déséquilibre des classes n'améliorent pas les performances. Conclusion : Avec un réseau neuronal séquentiel, nous confirmons que les ordonnances médicales sont une source riche de données pour les systèmes de CAO, offrant des capacités de récupération compétitives pour une fraction de la charge de calcul comparé aux modèles basés sur du texte. Notre étude souligne l'importance du choix des métriques de performance cible et questionne les pratiques existantes liées à la sélection de sous-ensembles de codes CIM pour l'entraînement et l'évaluation d'algorithmes de CAO.

Plan de classement

Santé : généralités [050] ; Informatique [122]

Localisation

Fonds IRD [F B010092486]

Identifiant IRD

fdi:010092486

Demander le PDF DOI HAL

Contact

Coordonnées :
Mission Science Ouverte (MSO)
IRD - Délégation régionale Île-de-France & Ouest
Campus Condorcet - Hôtel à projets
8 cours des Humanités - 93322 Aubervilliers Cedex
Horizon Pleins textes
Aide

Export de données

CSV EndNote XML EndNote MODS Dublin core BibTeX