@phdthesis{fdi:010075963, title = {{I}nt{\'e}gration de donn{\'e}es multi-{\'e}chelles et extraction de connaissances en agronomie : exemples et perspectives}, author = {{L}armande, {P}ierre}, editor = {}, language = {{FRE}}, abstract = {{L}a compr{\'e}hension des relations g{\'e}notype-ph{\'e}notype est un des axes les plus important de la recherche en agronomie. {O}r les interactions g{\'e}notype-ph{\'e}notype sont complexes {\`a} identifier car elles s'expriment {\`a} diff{\'e}rentes {\'e}chelles mol{\'e}culaires dans la plante et subissent de fortes influences de la part des facteurs environnementaux. {L}es technologies d'analyses haut-d{\'e}bit ne permettent de capturer que partiellement cette dynamique. {M}{\^e}me si ces technologies permettent d'aller toujours plus loin dans l'obtention de nouvelles donn{\'e}es, notre connaissance reste encore parcel{L}aire pour {\'e}lucider les m{\'e}canismes mol{\'e}culaires qui r{\'e}gissent l'expression des caract{\`e}res ph{\'e}notypiques complexes. {L}es nouveaux d{\'e}fis consistent {\`a} comprendre les relations complexes existant entre les diff{\'e}rents {\'e}l{\'e}ments mol{\'e}culaires responsables de l'expression du ph{\'e}nome. {C}et objectif ne peut {\^e}tre atteint qu'en int{\'e}grant des informations de diff{\'e}rents niveaux dans un mod{\`e}le int{\'e}grateur utilisant une approche syst{\'e}mique afin de comprendre le fonctionnement r{\'e}el d'un syst{\`e}me biologique. {M}on projet de recherche aborde le probl{\`e}me suivant : {C}omment structurer et g{\'e}rer la complexit{\'e} des donn{\'e}es biologiques afin d'en extraire de la connaissance permettant d'identifier les m{\'e}canismes mol{\'e}culaires contr{\^o}lant l'expression de ph{\'e}notypes chez les plantes. {L}'objectif de ce projet sera de d{\'e}terminer si la repr{\'e}sentation d'information sous forme de graphes de connaissances est adapt{\'e}e pour formuler des hypoth{\`e}ses de recherche permettant de lier le g{\'e}notype au ph{\'e}notype. {E}n prenant le riz comme mod{\`e}le, l'objectif sera de construire des r{\'e}seaux d'interaction mol{\'e}culaires {\`a} partir de donn{\'e}es {\'e}parses afin d'identifier les g{\`e}nes cl{\'e}s pour l'am{\'e}lioration des plantes. {P}lusieurs approches de recherche sont envisag{\'e}es : int{\'e}gration des donn{\'e}es, enrichissement des connaissances, applications sur les graphes de connaissances. {D}ans ce processus, une premi{\`e}re voie consistera {\`a} transformer et int{\'e}grer dynamiquement ces donn{\'e}es dans la base de connaissance {A}gro{LD} pour les rendre plus facilement utilisables en terme algorithmique. {U}ne deuxi{\`e}me voie consistera {\`a} proposer de nouvelles m{\'e}thodes d'enrichissement des connaissances. {D}ans un premier temps, en se focalisant sur des m{\'e}thodes d'annotation s{\'e}mantique. {P}uis, afin d'enrichir les liens entre les diff{\'e}rents graphes g{\'e}n{\'e}r{\'e}s et ainsi produire un r{\'e}seau d'interaction qui permettra la d{\'e}couverte de nouvelles connaissances, de nouvelles m{\'e}thodes de liage de donn{\'e}es seront d{\'e}velopp{\'e}es. {E}nfin, afin de permettre une recherche d'information efficace, plusieurs m{\'e}thodes et algorithmes de priorisation de g{\`e}nes candidats seront {\'e}valu{\'e}es et propos{\'e}es.}, keywords = {{INFORMATIQUE} {SCIENTIFIQUE} ; {BASE} {DE} {DONNEES} ; {INTELLIGENCE} {ARTIFICIELLE} ; {AGRONOMIE} ; {AMELIORATION} {GENETIQUE} ; {BIOLOGIE} {MOLECULAIRE} ; {GENOTYPE} ; {PHENOTYPE} ; {ANALYSE} {SYSTEMIQUE} ; {ALGORITHME} ; {MODELISATION} ; {BIOINFORMATIQUE} ; {GENOMIQUE} {FONCTIONNELLE} ; {WEB} {SEMANTIQUE} ; {ONTOLOGIE}}, address = {{M}ontpellier}, publisher = {{IRD}}, pages = {144 multigr.}, year = {2019}, URL = {https://www.documentation.ird.fr/hor/fdi:010075963}, }