Déterminant de la taille des génomes chez les animaux : impact des éléments transposables et de la taille des

La page est créée Guy Chauvet
 
CONTINUER À LIRE
Titre en français
    Déterminant de la taille des génomes chez les animaux :
     impact des éléments transposables et de la taille des
                           populations

                        English title
  Determinism of genome size variation in animals: impact of
     transposable elements and population size variation

Résumé du projet de thèse

Les animaux présentent des architectures génomiques étonnamment complexes et
variables. Par exemple, la taille et le contenu du génome varient énormément d'un
animal à l'autre. Plus de deux ordres de grandeur séparent le génome de 100
millions de paires de bases (pb) de Caenorhabditis elegans des 32 milliards de pb
de l'axolotl mexicain (Ambystoma mexicanum). Cette variation ne s'explique
cependant pas par une variation du nombre de gènes codant pour des protéines. En
effet, notre génome est 20 fois plus grand que celui de la drosophile, même si nous
n'avons que 1,5 fois plus de gènes codant pour les protéines. De manière générale,
la taille du génome est positivement corrélée à la proportion d'ADN non codant et de
séquences répétées (notamment les éléments transposables, ET) mais pas au
nombre de gènes. Dans les années 2000, Michael Lynch a publié une série d'études
influentes postulant que de nombreux aspects de la complexité de l'architecture du
génome ont évolué principalement par l'action de forces non adaptatives telles que
la dérive génétique et la mutation (Lynch, 2007). Lynch et Conery (Lynch and
Conery, 2003) ont observé que la taille du génome est négativement corrélée au
niveau de polymorphisme neutre (qui est proportionnel au produit de la taille
effective de la population, Ne, et du taux de mutation, µ). Ils ont conclu que la
prolifération des ET et d'ADN non codant est responsable de mutations légèrement
délétères qui n'ont pas pu être contre-sélectionnées dans les organismes à faible
diversité génétique, ce qui a conduit à une augmentation de la taille du génome chez
ces espèces.

Bien que séduisante parce qu'elle repose sur des principes universels de la
génétique des populations, la théorie de Lynch (également connue sous le
nom d'hypothèse du risque de mutation, MH) a rarement été testée
empiriquement. Dans ce projet de thèse, nous proposons une stratégie
alternative pour tester la théorie de Lynch, à savoir analyser spécifiquement
les groupes d'animaux qui ont subi des diminutions répétées de Ne.
En effet, une comparaison entre des espèces étroitement liées ayant des Ne
différents à long terme est essentielle pour démontrer l'importance de la dérive
génétique sur l'évolution de l'architecture du génome. Cinq modèles biologiques
seront utilisés, dont les isopodes Asellidae, les oiseaux passereaux, les drosophiles,
les papillons swallowtail et les fourmis, ainsi qu'un modèle in silico.

Les objectifs de ce projet de doctorat sont :
   ● Production des assemblages de génomes combinant les technologies Minion
       long-reads (long mais coûteux et sujet aux erreurs) et Illumina short-reads
       (court mais bon marché et précis).
   ● Annotation des ET pour les génomes de référence.
   ● Génotypage et estimation des patrons de polymorphisme des SNP et des TE
   ● Evaluation de l'impact des ET sur la taille du génome
   ● Estimation de la taille effective de la population (Ne)
   ● Estimation de l’impact des ET sur la valeur sélective des organismes en
       utilisant des données de polymorphisme et de divergence
   ● Reconstruction historique de la Ne basée sur la divergence interspécifique/le
       taux d'évolution en utilisant une méthode bayésienne développée par un
       membre du projet.
L'objectif principal du projet de doctorat sera d'évaluer l'influence de Ne (et d'autres
paramètres pertinents tels que les taux de recombinaison et d'indel) sur l'évolution
de la taille du génome et de la proportion d'ADN non codant ainsi que sur la
dynamique associée des ET.

Summary of thesis project :

Animals display strikingly complex and variable genome architectures. For example,
genome size and genome content vary tremendously between animals. More than
two orders of magnitude separate the 100 million base pair (bp) genome of
Caenorhabditis elegans from the 32 billion bp of the Mexican axolotl (Ambystoma
mexicanum). This variation is, however, not explained by a variation in the number of
protein-coding genes. Indeed, our genome is 20 times larger than the one of the
Drosophila fruit fly even if we have only 1.5 times more protein-coding genes 1. As a
general pattern, genome size is positively correlated to the proportion of non-coding
DNA and repeated sequences (especially transposable elements, TEs) but not to the
number of genes. In the 2000s, Michael Lynch published a series of influential
studies postulating that many aspects of genome architecture complexity have
evolved mainly through the action of non-adaptive forces such as genetic drift and
mutation2. Lynch and Conery 3 observed that genome size is negatively correlated
with the level of neutral polymorphism (which is proportional to the product of
effective population size, Ne, and mutation rate, µ). They concluded that the
proliferation of transposable elements and non-coding DNA is responsible for mildly
deleterious mutations that could not be counter-selected in organisms with low
genetic diversity, leading to an increase in genome size in these species.
Although appealing because it is based on universal principles of population
genetics, Lynch's theory (also known as the mutational-hazard hypothesis,
MH) has rarely been tested empirically. In the PhD project, we propose an
alternative strategy to test Lynch’s theory, namely to specifically analyze
animal groups that have undergone repeated Ne decreases.

Indeed, a comparison between closely related species with different long-term Ne is
critical to demonstrate the importance of genetic drift on the evolution of genome
architecture. Five biological models will be used, including Asellidae isopods
(Lefébure et al., 2017), passerine birds (Leroy et al., 2021), Drosophila (Sessegolo et
al., 2016), swallowtail butterflies (Allio et al., 2019) and ants, along with an in silico
model (Beslon et al., 2010).

This phD project aims are :
   ● Generate genomic resources for these groups : genome assembly combining
       Minion long-reads (long but costly and error-prone) and Illumina short-reads
       (short by cheap and accurate) technologies.
   ● Transposable element (TE) annotation for the reference genomes
   ● Estimation of polymorphism pattern of SNP and TE
   ● Assessment of the impact of TEs on genome size
   ● Effective population size (Ne) estimation
   ● Assessing the fitness of TE dynamics using polymorphism data
   ● Historical Ne reconstruction based on interspecific divergence/rate of
       evolution using a Bayesian method developed by a member of the project

The main goal of the phD project will be to evaluate the influence of Ne (and other
relevant parameters such as the recombination and indel rates) on the evolution of
genome size and proportion of non-coding DNA as well as the associated
dynamics of TE.

References
Allio, R., Scornavacca, C., Benoit, N., Clamens, A.-L., Sperling, F.A.H., Condamine,
        F.L., 2019. Whole genome shotgun phylogenomics resolves the pattern and
        timing of swallowtail butterfly evolution. Syst. Biol.
        https://doi.org/10.1093/sysbio/syz030
Beslon, G., Parsons, D.P., Sanchez-Dehesa, Y., Peña, J.-M., Knibbe, C., 2010.
        Scaling laws in bacterial genomes: a side-effect of selection of mutational
        robustness? Biosystems 102, 32–40.
        https://doi.org/10.1016/j.biosystems.2010.07.009
Lefébure, T., Morvan, C., Malard, F., François, C., Konecny-Dupré, L., Guéguen, L.,
        Weiss-Gayet, M., Seguin-Orlando, A., Ermini, L., Sarkissian, C.D., Charrier,
        N.P., Eme, D., Mermillod-Blondin, F., Duret, L., Vieira, C., Orlando, L.,
        Douady, C.J., 2017. Less effective selection leads to larger genomes.
Genome Res. 27, 1016–1028. https://doi.org/10.1101/gr.212589.116
Leroy, T., Rousselle, M., Tilak, M.-K., Caizergues, A.E., Scornavacca, C., Recuerda,
       M., Fuchs, J., Illera, J.C., De Swardt, D.H., Blanco, G., Thébaud, C., Milá, B.,
       Nabholz, B., 2021. Island songbirds as windows into evolution in small
       populations. Curr. Biol. https://doi.org/10.1016/j.cub.2020.12.040
Lynch, M., 2007. The Origins of Genome Architecture., Sinauer Associates. ed.
Lynch, M., Conery, J.S., 2003. The origins of genome complexity. Science 302,
       1401–1404. https://doi.org/10.1126/science.1089370
Sessegolo, C., Burlet, N., Haudry, A., 2016. Strong phylogenetic inertia on genome
       size and transposable element content among 26 species of flies. Biol. Lett.
       12, 20160407. https://doi.org/10.1098/rsbl.2016.0407

Conditions scientifiques matérielles (conditions de sécurité spécifiques) et
financières du projet de recherche :

Cette thèse est financée par le projet ANR NeGA “Influence of effective population
size (Ne) on animal Genome Architecture” coordonné par Tristan Lefébure du
laboratoire LEHNA et en collaboration avec le laboratoire LBBE à Lyon et le
laboratoire ISEM à Montpellier. La direction de cette thèse sera portée par Annabelle
Haudry (coordinatrice scientifique du projet pour le LBBE et spécialiste du modèle
biologique Drosophiles), Anna-Sophie Fiston-Lavier (membre de l’ISEM et
spécialiste des TEs ) et Benoit Nabholz (coordinateur scientifique du projet pour
l’ISEM et spécialiste du modèle biologique oiseaux). Le/la doctorant.e, basé.e à
Montpellier, sera amené.e à interagir avec l'ensemble des partenaires du projet, et à
se déplacer régulièrement sur Lyon.
Cette thèse se fera en parallèle avec une autre thèse sur l’évolution de la complexité
des transcriptomes et l'évolution de l’expression en relation avec les variations Ne.
Les deux doctorant.e.s seront encouragé.e.s à interagir et vont travailler en parallèle
sur les mêmes modèles biologiques.
L’ensemble des données de séquençage seront soit générées ou en cours
d’acquisition. Le/la doctorant.e ne participera pas à la production des données
brutes.
Enfin, un ingénieur d’étude en bioinformatique a été recruté pour la gestion des
ressources et assistera le/la doctorant.e dans les problématiques bioinformatiques
(assemblage, annotation).

Objectifs de valorisation des travaux de recherche du doctorants:

Objectif de recherche fondamentale: publication dans des revues internationaux,
dissémination des connaissances et résultats dans des conférences au niveau
international (SMBE, ESEB) et national (JOBIM, Aphy) et partage des données de
séquençage/assemblage dans des bases des données publiques.
Financement du projet doctoral :

Projet ANR NeGA “Influence of effective population size (Ne) on animal Genome
Architecture” coordonné par Tristan Lefébure du laboratoire LEHNA

Candidature :

      Profil et compétences recherchées

Le/la candidat.e devra avoir une formation en biologie évolutive, plus
particulièrement en génétique des populations. Un intérêt pour la bioinformatique
(programmation, analyse de données de séquençage) est attendu. La maîtrise des
outils statistiques est également nécessaire pour le bon déroulement de la thèse.

      Profile and skills required

The candidate should have a background in evolutionary biology, particularly in
population genetics. An interest in bioinformatics (programming, sequencing data
analysis) is expected. A good knowledge in statistics is also necessary.

To postulate :

Please send a CV and a short (one page) letter to :
Anna-sophie Fiston-lavier ; Annabelle
Haudry  and Benoit Nabholz

Dead-line : 15 Juillet 2021
Vous pouvez aussi lire