Publications des scientifiques de l'IRD

Marcou Q., Berti-Equille Laure, Novelli N. (2023). P089 - Création d'un système d'aide informatisée au codage CIM : choix de métrique et utilisation de la hiérarchie CIM [résumé]. Revue d'Epidémiologie et de Santé Publique, 71 (suppl.2), 101733 [1 p.]. ISSN 0398-7620.

Titre du document
P089 - Création d'un système d'aide informatisée au codage CIM : choix de métrique et utilisation de la hiérarchie CIM [résumé]
Année de publication
2023
Type de document
Article
Auteurs
Marcou Q., Berti-Equille Laure, Novelli N.
Source
Revue d'Epidémiologie et de Santé Publique, 2023, 71 (suppl.2), 101733 [1 p.] ISSN 0398-7620
Introduction : Différentes versions de la CIM (Classification Internationale des Maladies) sont routinement utilisées dans plusieurs dizaines de pays pour l'annotation d'évènements de soins. En France notamment, l'annotation des séjours hospitaliers à l'aide de la CIM10-FR, par les cliniciens et/ou les services d'information médicale, est le pilier central du financement hospitalier à travers la tarification à l'activité (T2A). Pourtant le codage CIM est une tâche à la fois chronophage et difficile. Cette difficulté se traduit par une faible qualité des données, avec par exemple, une concordance inter-codeur estimée entre moyenne et pauvre pour les diagnostics principaux au niveau de détail requis pour la tarification. Il existe donc un triple enjeu pour la création de systèmes d'aide au codage: un gain de temps clinique, ainsi que l'amélioration de la qualité des données épidémiologiques pour la recherche et pour le financement du système de soin. Avec la publication de jeux de données hospitalières ouverts, de nombreux articles s'intéressant au codage CIM à partir de données du dossier clinique ont été publiés dans la dernière décennie. Néanmoins, ces publications étudient une grande variété d'algorithmes au moyen de métriques de performance et sur des sous-ensembles de données hétérogènes ciblant l'automatisation du codage plutôt que l'assistance au codage. A contre-pied de cette tendance, nous cherchons, par notre étude, à dégager plutôt les principes généraux pour la construction d'un système d'assistance informatisée au codage. Méthodes : Nous utilisons le jeu de données ouvert de réanimation MIMIC-III pour construire un système d'aide au codage CIM-9 basé sur les prescriptions médicamenteuses à l'aide d'un réseau de neurones séquentiel. Nous investiguons dans un premier temps le choix de la métrique de performance à optimiser pour produire le système de recommandation de codes le plus performant. Dans un second temps, nous interrogeons l'intérêt de la pratique de filtrage (basé sur la fréquence et/ou catégories) des codes pour la construction de système d'aide au codage. Enfin, nous investiguons également l'utilisation des propriétés hiérarchiques de la CIM à l'aide de réseaux de neurones pour la création d'un système d'aide au codage, en tirant parti de la corrélation des labels, en considérant le problème d'équilibre des classes et en utilisant explicitement les liens hiérarchiques. Résultats : Nos expériences montrent que la métrique de performance la plus couramment utilisée, la micro F1, est aussi la moins adaptée à la création d'un système d'aide au codage. Nos résultats suggèrent également qu'utiliser l'ensemble des codes, plutôt qu'un sous-ensemble choisi, permet d'en retrouver un nombre plus important pour un même nombre de codes proposés. En effet, notre réseau de neurone permet d'extraire de l'information pour la quasi totalité des codes même lorsque leur fréquence est très faible ou leur lien avec la prise médicamenteuse insoupçonné. Enfin, nos résultats suggèrent également que l'utilisation de la hiérarchie des codes est bénéfique, notamment pour les niveaux les plus profonds de la hiérarchie. Conclusion : Notre approche permet de dégager des principes généraux pour la construction d'un système d'aide au codage ainsi que la quantification de ses performances. L'exploitation de ces principes nous permet de surpasser les performances de l'état de l'art utilisant les prescriptions médicamenteuses pour l'aide au codage.
Plan de classement
Santé : généralités [050] ; Economie générale / Macroéconomie [094] ; Informatique [122]
Localisation
Fonds IRD [F B010090433]
Identifiant IRD
fdi:010090433
Contact