Simulation de l'évolution génétique dans un contexte de sélection naturelle de trois populations indigènes nord-américaines
Problématique
Depuis leur arrivée en Amérique il y a 20 000 ans, les populations indigènes ont colonisé des environnements différents, allant des régions arctiques de l'Alaska aux zones tropicales du Mexique. Ces environnements ont appliqué des pressions sélectives variables et ont conduit à des différenciations génétiques importantes entre des populations issues d'un ancêtre commun.
Comment modéliser et visualiser la création de ces différences génétiques à travers une simulation d'évolution par sélection naturelle ?
Base scientifique
L'article choisi est écrit par W. Reynolds et édité par le PNAS en 2019. Il identifie les signaux de sélection naturelle dans trois populations indigènes. J'ai retenu trois gènes particulièrement marquants pour la simulation :
Mise en place de la simulation
Breed Person :
- Possède 3 traits génétiques booléens représentant les gènes étudiés : HS3ST, IL1R1, MUC19, initialisé aléatoirement à la création.
- Se déplace aléatoirement dans sa zone, est renvoyé au centre s'il sort.
- Peut se reproduire tous les 40 ticks s'il rencontre un autre individu reproductible.
- Hérédité de Mendel (100% de transmission si deux parents porteurs, 50% si un des deux, 0% sinon), géré via des variables intermédiaires pour contourner les limitations de SLNova.
- Apparaît avec une énergie aléatoire entre 50 et 100.
- Perd 1 point d'énergie par tick (mortalité de base).
- Perd un montant aléatoire entre 0 et la valeur de la pression sélective s'il ne possède pas le gène adapté à la zone.
- Meurt si son énergie est inférieure ou égale à 0.
- Couleur qui change au fil des générations.
Monde :
- Divisé en 3 zones circulaires différenciées par leurs couleurs : cyan (Alaska), jaune (Sud-Est US), rose (Mexique).
- Chaque zone exerce une pression sélective sur un gène particulier : HS3ST4 en Alaska, IL1R1 au Sud-Est US, MUC19 au Mexique.
- Un breed invisible "counter" qui se déplace au centre de chaque zone à chaque tick pour compter les individus porteurs de chaque gène et alimenter les graphiques en temps réel.
Interface :
- 3 graphiques qui affichent la fréquence (%) de chaque gène dans chaque population au fil du temps.
- Un slider qui permet d'ajuster la pression sélective dynamiquement durant la simulation.
Résultats
Attendus :
Sous l'effet de la sélection naturelle, on attend une augmentation progressive de la fréquence du gène adaptatif dans chaque zone, tandis que les gènes non adaptés stagnent ou régressent. À terme, trois populations génétiquement distinctes devraient émerger malgré une origine commune.
Observé :
La simulation confirme ces hypothèses. Dans chaque zone, le gène adaptatif prend progressivement le dessus sur les deux autres, plus ou moins rapidement selon la pression sélective appliquée via le slider. Le résultat global est sans appel : après plusieurs centaines de générations simulées, on se retrouve avec trois populations aux profils génétiques radicalement différents, alors qu'elles partaient toutes d'une distribution aléatoire identique.
Ces résultats illustrent un phénomène de "selective sweep" : le gène donnant un avantage se fixe progressivement dans chaque population de façon indépendante, cohérent avec la conclusion centrale de Reynolds et al.
Alaska : HS3ST4
Sud-Est US : IL1R1
Mexique : MUC19
Démonstration vidéo :