Déterminant de la taille des génomes chez les animaux : impact des éléments transposables et de la taille des
←
→
Transcription du contenu de la page
Si votre navigateur ne rend pas la page correctement, lisez s'il vous plaît le contenu de la page ci-dessous
Titre en français Déterminant de la taille des génomes chez les animaux : impact des éléments transposables et de la taille des populations English title Determinism of genome size variation in animals: impact of transposable elements and population size variation Résumé du projet de thèse Les animaux présentent des architectures génomiques étonnamment complexes et variables. Par exemple, la taille et le contenu du génome varient énormément d'un animal à l'autre. Plus de deux ordres de grandeur séparent le génome de 100 millions de paires de bases (pb) de Caenorhabditis elegans des 32 milliards de pb de l'axolotl mexicain (Ambystoma mexicanum). Cette variation ne s'explique cependant pas par une variation du nombre de gènes codant pour des protéines. En effet, notre génome est 20 fois plus grand que celui de la drosophile, même si nous n'avons que 1,5 fois plus de gènes codant pour les protéines. De manière générale, la taille du génome est positivement corrélée à la proportion d'ADN non codant et de séquences répétées (notamment les éléments transposables, ET) mais pas au nombre de gènes. Dans les années 2000, Michael Lynch a publié une série d'études influentes postulant que de nombreux aspects de la complexité de l'architecture du génome ont évolué principalement par l'action de forces non adaptatives telles que la dérive génétique et la mutation (Lynch, 2007). Lynch et Conery (Lynch and Conery, 2003) ont observé que la taille du génome est négativement corrélée au niveau de polymorphisme neutre (qui est proportionnel au produit de la taille effective de la population, Ne, et du taux de mutation, µ). Ils ont conclu que la prolifération des ET et d'ADN non codant est responsable de mutations légèrement délétères qui n'ont pas pu être contre-sélectionnées dans les organismes à faible diversité génétique, ce qui a conduit à une augmentation de la taille du génome chez ces espèces. Bien que séduisante parce qu'elle repose sur des principes universels de la génétique des populations, la théorie de Lynch (également connue sous le nom d'hypothèse du risque de mutation, MH) a rarement été testée empiriquement. Dans ce projet de thèse, nous proposons une stratégie alternative pour tester la théorie de Lynch, à savoir analyser spécifiquement les groupes d'animaux qui ont subi des diminutions répétées de Ne.
En effet, une comparaison entre des espèces étroitement liées ayant des Ne différents à long terme est essentielle pour démontrer l'importance de la dérive génétique sur l'évolution de l'architecture du génome. Cinq modèles biologiques seront utilisés, dont les isopodes Asellidae, les oiseaux passereaux, les drosophiles, les papillons swallowtail et les fourmis, ainsi qu'un modèle in silico. Les objectifs de ce projet de doctorat sont : ● Production des assemblages de génomes combinant les technologies Minion long-reads (long mais coûteux et sujet aux erreurs) et Illumina short-reads (court mais bon marché et précis). ● Annotation des ET pour les génomes de référence. ● Génotypage et estimation des patrons de polymorphisme des SNP et des TE ● Evaluation de l'impact des ET sur la taille du génome ● Estimation de la taille effective de la population (Ne) ● Estimation de l’impact des ET sur la valeur sélective des organismes en utilisant des données de polymorphisme et de divergence ● Reconstruction historique de la Ne basée sur la divergence interspécifique/le taux d'évolution en utilisant une méthode bayésienne développée par un membre du projet. L'objectif principal du projet de doctorat sera d'évaluer l'influence de Ne (et d'autres paramètres pertinents tels que les taux de recombinaison et d'indel) sur l'évolution de la taille du génome et de la proportion d'ADN non codant ainsi que sur la dynamique associée des ET. Summary of thesis project : Animals display strikingly complex and variable genome architectures. For example, genome size and genome content vary tremendously between animals. More than two orders of magnitude separate the 100 million base pair (bp) genome of Caenorhabditis elegans from the 32 billion bp of the Mexican axolotl (Ambystoma mexicanum). This variation is, however, not explained by a variation in the number of protein-coding genes. Indeed, our genome is 20 times larger than the one of the Drosophila fruit fly even if we have only 1.5 times more protein-coding genes 1. As a general pattern, genome size is positively correlated to the proportion of non-coding DNA and repeated sequences (especially transposable elements, TEs) but not to the number of genes. In the 2000s, Michael Lynch published a series of influential studies postulating that many aspects of genome architecture complexity have evolved mainly through the action of non-adaptive forces such as genetic drift and mutation2. Lynch and Conery 3 observed that genome size is negatively correlated with the level of neutral polymorphism (which is proportional to the product of effective population size, Ne, and mutation rate, µ). They concluded that the proliferation of transposable elements and non-coding DNA is responsible for mildly deleterious mutations that could not be counter-selected in organisms with low genetic diversity, leading to an increase in genome size in these species.
Although appealing because it is based on universal principles of population genetics, Lynch's theory (also known as the mutational-hazard hypothesis, MH) has rarely been tested empirically. In the PhD project, we propose an alternative strategy to test Lynch’s theory, namely to specifically analyze animal groups that have undergone repeated Ne decreases. Indeed, a comparison between closely related species with different long-term Ne is critical to demonstrate the importance of genetic drift on the evolution of genome architecture. Five biological models will be used, including Asellidae isopods (Lefébure et al., 2017), passerine birds (Leroy et al., 2021), Drosophila (Sessegolo et al., 2016), swallowtail butterflies (Allio et al., 2019) and ants, along with an in silico model (Beslon et al., 2010). This phD project aims are : ● Generate genomic resources for these groups : genome assembly combining Minion long-reads (long but costly and error-prone) and Illumina short-reads (short by cheap and accurate) technologies. ● Transposable element (TE) annotation for the reference genomes ● Estimation of polymorphism pattern of SNP and TE ● Assessment of the impact of TEs on genome size ● Effective population size (Ne) estimation ● Assessing the fitness of TE dynamics using polymorphism data ● Historical Ne reconstruction based on interspecific divergence/rate of evolution using a Bayesian method developed by a member of the project The main goal of the phD project will be to evaluate the influence of Ne (and other relevant parameters such as the recombination and indel rates) on the evolution of genome size and proportion of non-coding DNA as well as the associated dynamics of TE. References Allio, R., Scornavacca, C., Benoit, N., Clamens, A.-L., Sperling, F.A.H., Condamine, F.L., 2019. Whole genome shotgun phylogenomics resolves the pattern and timing of swallowtail butterfly evolution. Syst. Biol. https://doi.org/10.1093/sysbio/syz030 Beslon, G., Parsons, D.P., Sanchez-Dehesa, Y., Peña, J.-M., Knibbe, C., 2010. Scaling laws in bacterial genomes: a side-effect of selection of mutational robustness? Biosystems 102, 32–40. https://doi.org/10.1016/j.biosystems.2010.07.009 Lefébure, T., Morvan, C., Malard, F., François, C., Konecny-Dupré, L., Guéguen, L., Weiss-Gayet, M., Seguin-Orlando, A., Ermini, L., Sarkissian, C.D., Charrier, N.P., Eme, D., Mermillod-Blondin, F., Duret, L., Vieira, C., Orlando, L., Douady, C.J., 2017. Less effective selection leads to larger genomes.
Genome Res. 27, 1016–1028. https://doi.org/10.1101/gr.212589.116 Leroy, T., Rousselle, M., Tilak, M.-K., Caizergues, A.E., Scornavacca, C., Recuerda, M., Fuchs, J., Illera, J.C., De Swardt, D.H., Blanco, G., Thébaud, C., Milá, B., Nabholz, B., 2021. Island songbirds as windows into evolution in small populations. Curr. Biol. https://doi.org/10.1016/j.cub.2020.12.040 Lynch, M., 2007. The Origins of Genome Architecture., Sinauer Associates. ed. Lynch, M., Conery, J.S., 2003. The origins of genome complexity. Science 302, 1401–1404. https://doi.org/10.1126/science.1089370 Sessegolo, C., Burlet, N., Haudry, A., 2016. Strong phylogenetic inertia on genome size and transposable element content among 26 species of flies. Biol. Lett. 12, 20160407. https://doi.org/10.1098/rsbl.2016.0407 Conditions scientifiques matérielles (conditions de sécurité spécifiques) et financières du projet de recherche : Cette thèse est financée par le projet ANR NeGA “Influence of effective population size (Ne) on animal Genome Architecture” coordonné par Tristan Lefébure du laboratoire LEHNA et en collaboration avec le laboratoire LBBE à Lyon et le laboratoire ISEM à Montpellier. La direction de cette thèse sera portée par Annabelle Haudry (coordinatrice scientifique du projet pour le LBBE et spécialiste du modèle biologique Drosophiles), Anna-Sophie Fiston-Lavier (membre de l’ISEM et spécialiste des TEs ) et Benoit Nabholz (coordinateur scientifique du projet pour l’ISEM et spécialiste du modèle biologique oiseaux). Le/la doctorant.e, basé.e à Montpellier, sera amené.e à interagir avec l'ensemble des partenaires du projet, et à se déplacer régulièrement sur Lyon. Cette thèse se fera en parallèle avec une autre thèse sur l’évolution de la complexité des transcriptomes et l'évolution de l’expression en relation avec les variations Ne. Les deux doctorant.e.s seront encouragé.e.s à interagir et vont travailler en parallèle sur les mêmes modèles biologiques. L’ensemble des données de séquençage seront soit générées ou en cours d’acquisition. Le/la doctorant.e ne participera pas à la production des données brutes. Enfin, un ingénieur d’étude en bioinformatique a été recruté pour la gestion des ressources et assistera le/la doctorant.e dans les problématiques bioinformatiques (assemblage, annotation). Objectifs de valorisation des travaux de recherche du doctorants: Objectif de recherche fondamentale: publication dans des revues internationaux, dissémination des connaissances et résultats dans des conférences au niveau international (SMBE, ESEB) et national (JOBIM, Aphy) et partage des données de séquençage/assemblage dans des bases des données publiques.
Financement du projet doctoral : Projet ANR NeGA “Influence of effective population size (Ne) on animal Genome Architecture” coordonné par Tristan Lefébure du laboratoire LEHNA Candidature : Profil et compétences recherchées Le/la candidat.e devra avoir une formation en biologie évolutive, plus particulièrement en génétique des populations. Un intérêt pour la bioinformatique (programmation, analyse de données de séquençage) est attendu. La maîtrise des outils statistiques est également nécessaire pour le bon déroulement de la thèse. Profile and skills required The candidate should have a background in evolutionary biology, particularly in population genetics. An interest in bioinformatics (programming, sequencing data analysis) is expected. A good knowledge in statistics is also necessary. To postulate : Please send a CV and a short (one page) letter to : Anna-sophie Fiston-lavier ; Annabelle Haudry and Benoit Nabholz Dead-line : 15 Juillet 2021
Vous pouvez aussi lire