@phdthesis{fdi:010067415, title = {{P}an-g{\'e}nome du riz {A}fricain cultiv{\'e} {O}ryza glaberrima et de son anc{\^e}tre sauvage {O}ryza barthii}, author = {{M}onat, {C}{\'e}cile}, editor = {}, language = {{FRE}}, abstract = {{L}a diversit{\'e} d'une esp{\`e}ce est repr{\'e}sent{\'e}e par la somme de la diversit{\'e} de chacun des individus qui la compose. {E}lle peut-{\^e}tre observ{\'e}e {\`a} diff{\'e}rentes {\'e}chelles : individuelle, organique, tissulaire, cellulaire, g{\'e}nomique, g{\'e}nique, ou bien {\`a} l'{\'e}chelle de la base nucl{\'e}otidique. {L}'{\'e}tude de la diversit{\'e} d'une esp{\`e}ce est importante pour mieux la comprendre et nous permettre de retracer son histoire {\'e}volutive, de la comparer avec d'autres esp{\`e}ces notamment entre esp{\`e}ces sauvages et cultiv{\'e}es. {N}ous nous int{\'e}ressons aux processus de domestication, et particuli{\`e}rement {\`a} leurs impacts sur la structure du pan-g{\'e}nome. {L}e pan-g{\'e}nome est divis{\'e} en trois compartiments : (i) le core-g{\'e}nome qui contient tous les g{\`e}nes pr{\'e}sents chez tous les individus de l'esp{\`e}ce ; (ii) le g{\'e}nome dispensable qui contient l'ensemble des g{\`e}nes qui sont absents chez au moins un individu ; (iii) et enfin le g{\'e}nome individu-sp{\'e}cifique qui contient les g{\`e}nes pr{\'e}sents uniquement chez un individu. {L}'objectif de ce travail de th{\`e}se {\'e}tait de mettre au point une nouvelle m{\'e}thode d'analyse pang{\'e}nomique applicable sur un grand nombre d'individus. {P}our cela, nous avons travaill{\'e} sur un jeu de donn{\'e}es de res{\'e}quen{\c{c}}age massif du riz {A}fricain cultiv{\'e} {O}ryza glaberrima et de son anc{\^e}tre sauvage {O}ryza barthii. {D}ans un premier temps nous avons v{\'e}rifi{\'e} l'existence d'une structure pan-g{\'e}nomique sur notre mod{\`e}le. {P}our cela nous avons travaill{\'e} {\`a} petite {\'e}chelle avec trois accessions de l'esp{\`e}ce cultiv{\'e}e. {E}lles ont d'abord {\'e}t{\'e} s{\'e}quenc{\'e}es, assembl{\'e}es, annot{\'e}es puis nous avons cherch{\'e} {\`a} d{\'e}tecter des s{\'e}quences sp{\'e}cifiques {\`a} chacune de ces accessions. {D}ans un second temps nous avons mis au point notre m{\'e}thode en travaillant avec pr{\`e}s de 200 g{\'e}nomes des deux esp{\`e}ces. {C}es g{\'e}nomes ont {\'e}t{\'e} s{\'e}quenc{\'e}s grâce aux technologies {NGS} puis directement mapp{\'e}s sur un g{\'e}nome de r{\'e}f{\'e}rence externe, celui du riz {A}siatique. {N}ous avons alors appliqu{\'e} notre m{\'e}thode d'analyse pan-g{\'e}nomique bas{\'e}e sur la d{\'e}viation de la profondeur de s{\'e}quen{\c{c}}age pour chaque g{\`e}ne. {N}ous avons ensuite compar{\'e} les enrichissement d'ontologies par compartiments et par esp{\`e}ce dans le but d'identifier des diff{\'e}rences li{\'e}es aux processus de domestication. {E}nfin, nous avons {\'e}tudi{\'e} plus pr{\'e}cis{\'e}ment les appartenances pan-g{\'e}nomiques des membres de famille de g{\`e}nes. {P}arce que le pan-g{\'e}nome de l'esp{\`e}ce cultiv{\'e} est plus petit que le core-g{\'e}nome de l'esp{\`e}ce sauvage nous avons confirm{\'e} la perte de diversit{\'e} en terme de pr{\'e}sence/ absence de g{\`e}nes chez le riz {A}friacin au cours du processus de domestication. {C}urieusement nous avons aussi mis en avant l'augmentation du nombre de g{\`e}nes dispensable chez l'esp{\`e}ce cultiv{\'e}e par rapport {\`a} son relatif sauvage. {A}insi, malgr{\'e} une forte r{\'e}duction du pan-g{\'e}nome de l'esp{\`e}ce cultiv{\'e} lors de la "premi{\`e}re" s{\'e}lection, les 1000 g{\'e}n{\'e}rations de processus de domestication ont suffit {\`a} r{\'e}introduire une forme de diversit{\'e} {\`a} travers l'augmentation du nombre de g{\`e}nes dispensables. {A}fin d'automatiser une grande partie des manipulations d'analyses de donn{\'e}es {NGS} nous avons aussi d{\'e}velopp{\'e} un outil de g{\'e}n{\'e}ration de pipelines d'analyses. {D}e part sa g{\'e}n{\'e}ricit{\'e} et sa robustesse il pourra {\^e}tre utilis{\'e} dans diff{\'e}rents domaines, pour plusieurs types de donn{\'e}es. {G}râce aux nombreux logiciels qui y sont int{\'e}gr{\'e}s et de par le suivi que l'{\'e}quipe de d{\'e}veloppement entend poursuivre, il pourra {\^e}tre utilis{\'e} dans la caract{\'e}risation de plus en plus de choses. {P}ar exemple les variations structurales, les associations g{\'e}notypes-ph{\'e}notypes, l'{\'e}pig{\'e}n{\'e}tique et pourquoi pas la m{\'e}tag{\'e}nomique. {C}e travail a permis la mise au point d'une nouvelle m{\'e}thode d'analyse des donn{\'e}es pan-g{\'e}nomiques rapide de par sa vision globale plut{\^o}t que via des comparaisons deux-{\`a}-deux. {C}ette m{\'e}thode s'adresse aux g{\'e}nomes grands et complexes comme ceux des plantes, mais aussi aux jeux de donn{\'e}es massifs.}, keywords = {{AFRIQUE}}, address = {{M}ontpellier}, publisher = {{UM}}, pages = {142 multigr.}, year = {2016}, URL = {https://www.documentation.ird.fr/hor/fdi:010067415}, }