%0 Journal Article %9 ACL : Articles dans des revues avec comité de lecture non répertoriées par l'AERES %A Marcou, Q. %A Berti-Equille, Laure %A Novelli, N. %T P55 - Création d'un système d'aide informatisée au codage Classification internationale des maladies (CIM) : choix de métrique de performance et utilisation de la hiérarchie CIM [résumé] %D 2024 %L fdi:010092486 %G ENG %J Journal of Epidemiology and Population Health %@ 2950-4333 %N Suppl.1 %P 202352 [1 ] %R 10.1016/j.jeph.2024.202352 %U https://www.documentation.ird.fr/hor/fdi:010092486 %> https://www.documentation.ird.fr/intranet/publi/2025-01/010092486.pdf %V 72 %W Horizon (IRD) %X Introduction : En plus d'une meilleure utilisation des données existantes, l'intelligence artificielle promet une aide pour la génération de données de meilleure qualité tout en allégeant la charge de collecte de données. Bien que des études récentes aient rapporté des résultats prometteurs en matière de classification automatique CIM, elles décrivent souvent des architectures de modèles spécifiques aux données d'entrée, et sont évaluées de manière hétérogène. Nos travaux explorent l'évaluation et la construction de systèmes de Codage assisté par ordinateur (CAO) plus efficaces en utilisant des approches génériques, mettant l'accent sur l'utilisation de la hiérarchie CIM, avec pour exemple l'utilisation de données de prescription médicamenteuses et un réseau de neurones séquentiel. Méthodes : Nous utilisons MIMIC-III, transformée au modèle de données OMOP-OHDSI. Nous évaluons diverses mesures de performance, ainsi que des approches d'apprentissage multitâche, hiérarchique et en présence de déséquilibre de classes pour les réseaux neuronaux. Résultats : Nous introduisons une métrique de performance, RE@R, adaptée à la tâche de codage CIM, qui offre des informations interprétables pour les praticiens de l'informatique médicale. Nous montrons que le filtrage de codes CIM diminue les performances de récupération sans amélioration des performances sur le sous-ensemble sélectionné. Nous montrons également que l'optimisation de métriques telles que le NDCG ou l'AUC Précision-Rappel permettent de surpasser les performances obtenues en utilisant la F1. Nous observons que l'entraînement simultané sur différents niveaux CIM offre des avantages mineurs pour le classement et des gains de temps d'exécution significatifs. Cependant, nous constatons les techniques d'apprentissage hiérarchique ou de correction du déséquilibre des classes n'améliorent pas les performances. Conclusion : Avec un réseau neuronal séquentiel, nous confirmons que les ordonnances médicales sont une source riche de données pour les systèmes de CAO, offrant des capacités de récupération compétitives pour une fraction de la charge de calcul comparé aux modèles basés sur du texte. Notre étude souligne l'importance du choix des métriques de performance cible et questionne les pratiques existantes liées à la sélection de sous-ensembles de codes CIM pour l'entraînement et l'évaluation d'algorithmes de CAO. %$ 122 ; 050