Information

14.7: Populationsgenetik - Biologie


Populationsgenetik ist die Untersuchung der Verteilungen und Veränderungen der Allelfrequenz in einer Population.

Lernziele

  • Definieren Sie einen Populationsgenpool und erklären Sie, wie sich die Größe des Genpools auf den evolutionären Erfolg einer Population auswirken kann

Wichtige Punkte

  • Ein Genpool ist die Summe aller Allele (Varianten eines Gens) in einer Population.
  • Allelfrequenzen reichen von 0 (bei keinem Individuum vorhanden) bis 1 (bei allen Individuen vorhanden); alle Allelfrequenzen für ein bestimmtes Gen addieren sich in einer Population zu 100 Prozent.
  • Je kleiner eine Population ist, desto anfälliger ist sie für Mechanismen wie natürliche Selektion und genetische Drift, da die Auswirkungen solcher Mechanismen verstärkt werden, wenn der Genpool klein ist.
  • Der Gründereffekt tritt auf, wenn ein Teil einer ursprünglichen Population eine neue Population mit einem separaten Genpool aufbaut, was zu einer geringeren genetischen Variation in der neuen Population führt.

Schlüsselbegriffe

  • Allel: eine von mehreren alternativen Formen desselben Gens, die eine bestimmte Position auf einem Chromosom einnehmen
  • gen Pool: der vollständige Satz einzigartiger Allele, der bei der Untersuchung des genetischen Materials jedes lebenden Mitglieds einer Art oder Population gefunden werden würde
  • Gründereffekt: eine Abnahme der genetischen Variation, die auftritt, wenn eine ganze Population von einer kleinen Anzahl von Gründern abstammt

Populationsgenetik

Ein Gen für ein bestimmtes Merkmal kann mehrere Variationen aufweisen, die Allele genannt werden. Diese Variationen kodieren für verschiedene Merkmale, die mit diesem Merkmal verbunden sind. Im ABO-Blutgruppensystem des Menschen sind beispielsweise drei Allele (IEIN, ICHB, oder i) das bestimmte Blutgruppenprotein auf der Oberfläche der roten Blutkörperchen zu bestimmen. Ein Mensch mit Typ IEIN Allel zeigt A-Typ-Proteine ​​(Antigene) auf der Oberfläche ihrer roten Blutkörperchen. Personen mit dem Phänotyp Blutgruppe A haben den Genotyp IEINichEIN oder ichEINich, Typ B habe ichBichB oder ichBi, Typ AB habe IEINichB, und Typ O haben ii.

Ein diploider Organismus kann nur zwei Allele für ein bestimmtes Gen tragen. Bei der menschlichen Blutgruppe bestehen die Kombinationen aus zwei Allelen wie IEINichEIN oder ichEINichB. Obwohl jeder Organismus nur zwei Allele tragen kann, können in der größeren Population mehr als diese beiden Allele vorhanden sein. In einer Bevölkerung von 50 Personen, in der alle Blutgruppen vertreten sind, kann es beispielsweise mehr I . gebenEIN Allele als i Allele. Populationsgenetik ist die Untersuchung, wie Selektionskräfte eine Population durch Veränderungen der Allel- und Genotypfrequenzen verändern.

Allelfrequenz

Die Allelfrequenz (oder Genfrequenz) ist die Rate, mit der ein bestimmtes Allel innerhalb einer Population auftritt. In der Populationsgenetik wird der Begriff Evolution als Veränderung der Häufigkeit eines Allels in einer Population definiert. Die Häufigkeiten reichen von 0, bei keinem Individuum vorhanden, bis 1, bei allen Individuen vorhanden. Der Genpool ist die Summe aller Allele an allen Genen einer Population.

Am Beispiel des ABO-Blutgruppensystems wird die Häufigkeit eines der Allele, zum Beispiel IEIN, ist die Anzahl der Kopien dieses Allels geteilt durch alle Kopien des ABO-Gens in der Population, d. h. alle Allele. Allelhäufigkeiten können als Dezimalzahl oder als Prozent angegeben werden und ergeben immer 1 oder 100 Prozent der Gesamtpopulation. Beispielsweise wird in einer Stichprobe von Menschen die Häufigkeit der IEIN Allel könnte 0,26 sein, was bedeuten würde, dass 26% der Chromosomen in dieser Population das I . tragenEIN Allel. Wenn wir auch wissen, dass die Frequenz des IB Allel in dieser Population 0,14 beträgt, dann beträgt die Häufigkeit des i-Allels 0,6, die wir erhalten, indem wir alle bekannten Allelhäufigkeiten von 1 subtrahieren (also: 1 – 0,26 – 0,14 = 0,6). Eine Veränderung einer dieser Allelfrequenzen im Laufe der Zeit würde eine Evolution in der Population darstellen.

Bevölkerungsgröße und Entwicklung

Wenn sich die Allelfrequenzen innerhalb einer Population zufällig ändern, ohne dass die Population gegenüber bestehenden Allelfrequenzen einen Vorteil hat, wird das Phänomen als genetische Drift bezeichnet. Je kleiner eine Population ist, desto anfälliger ist sie für Mechanismen wie genetische Drift, da Allele eher auf 0 (abwesend) oder 1 (allgemein vorhanden) fixiert werden. Zufällige Ereignisse, die die Allelfrequenzen verändern, haben einen viel größeren Effekt, wenn der Genpool klein ist. Genetische Drift und natürliche Selektion treten in Populationen normalerweise gleichzeitig auf, aber die Ursache der Häufigkeitsänderung ist oft nicht zu bestimmen.

Die natürliche Selektion beeinflusst auch die Allelfrequenz. Wenn ein Allel einen Phänotyp verleiht, der es einem Individuum ermöglicht, besser zu überleben oder mehr Nachkommen zu haben, wird die Häufigkeit dieses Allels zunehmen. Da viele dieser Nachkommen auch das nützliche Allel und damit den Phänotyp tragen, werden sie mehr eigene Nachkommen haben, die ebenfalls das Allel tragen. Im Laufe der Zeit breitet sich das Allel in der Population aus und kann sich festsetzen: Jedes Individuum in der Population trägt das Allel. Wenn ein Allel dominant, aber schädlich ist, kann es schnell aus dem Genpool entfernt werden, wenn sich das Individuum mit dem Allel nicht reproduziert. Ein schädliches rezessives Allel kann jedoch über Generationen in einer Population verbleiben, verborgen durch das dominante Allel bei Heterozygoten. In solchen Fällen sind die einzigen Individuen, die aus der Population eliminiert werden, diejenigen, die das Pech haben, zwei Kopien eines solchen Allels zu erben.

Der Gründereffekt

Der Gründereffekt tritt auf, wenn ein Teil einer Population isoliert wird und einen eigenen Genpool mit eigenen Allelfrequenzen aufbaut. Wenn eine kleine Anzahl von Individuen die Basis einer neuen Population bildet, kann sich diese neue Population genetisch stark von der ursprünglichen Population unterscheiden, wenn die Gründer nicht repräsentativ für die ursprüngliche Population sind. Daher können viele verschiedene Populationen mit sehr unterschiedlichen und einheitlichen Genpools alle aus derselben, größeren Population stammen. Zusammen können die Kräfte der natürlichen Selektion, der genetischen Drift und des Gründereffekts zu signifikanten Veränderungen im Genpool einer Population führen.


In den letzten zehn Jahren wurden riesige Mengen genomweiter Daten zur Genexpression, Genotypisierung und in jüngerer Zeit zur DNA-Methylierung generiert. Jede dieser drei weist eine interindividuelle Variation auf und ist somit Kandidaten für die Entdeckung von Varianten, die mit quantitativen Merkmalen korreliert sind. Sie werden daher derzeit auf Assoziationen mit Krankheiten, Umweltbelastungen, spezifischen Arzneimittelinterventionen und vielen anderen phänotypischen Wirkungen untersucht.

Eine der größten Herausforderungen in diesen sich schnell entwickelnden Omics-Gebieten besteht darin, Datensätze so zu integrieren, dass die Wechselbeziehungen zwischen den drei Variationsarten sichtbar werden. Während wir mehr Details über dieses Netzwerk von Interaktionen aufdecken, beginnen wir zu entdecken, wie sich Störungen der Genexpression, DNA-Methylierung oder des Genotyps auf genomweiter Ebene gegenseitig beeinflussen können. Derzeit bleibt die Frage, inwieweit alle drei Variabilitätstypen voneinander abhängig sind, wie diese Beziehungen zwischen Zelltypen und Individuen variieren und wie sich diese Beziehungen im Laufe des Lebens eines Individuums ändern.


Samenlose Pflanzen

​ Eigenschaften von Tracheophyten

Haben Gefäßgewebe für den Transport von Wasser und Nährstoffen

Zwei Haupttypen von Gefäßgewebe:

Xylem transportiert Wasser und Nährstoffe aus dem Boden in der Pflanze nach oben.

Phloem trägt Nahrung, die in den Blättern der Pflanze hergestellt wird, zu anderen Pflanzenteilen

Dieses Transportsystem ermöglicht es Tracheophyten, zu großen Größen heranzuwachsen.

Wurzeln, Stängel und Blätter haben

Samenlose Pflanzen entwickeln Sporen

Samenpflanzen entwickeln Samen.

Nicht blühende Pflanzen, Gymnospermen haben nackte Samen

Blühende Pflanzen, Angiospermen haben Samen bedeckt


Optogenetik: Licht, Kamera, Action! Ein Lichtstrahl, ein Schatten entlarvt

Visuelle Regeneration

Die genetische Heterogenität bei Netzhauterkrankungen wie Retinitis pigmentosa und altersbedingter Makuladegeneration macht deren Behandlung zu einer Herausforderung. Optogenetik könnte jedoch das Allheilmittel für diese Netzhauterkrankungen sein, da es sich um eine Intervention handelt, die unabhängig von der Ätiologie der Sehschwäche ist [ 42 ].

Durch Expression von ChR2 auf ON-Bipolarzellen oder retinalen Ganglienzellen über einen Plasmidvektor, einen adeno-assoziierten Virusvektor oder die Verwendung transgener Tierlinien kann der Sehweg bei Blaulichtbeleuchtung aktiviert werden [ 43–46 ]. Diese Strategie war erfolgreich bei der Wiederherstellung des Sehvermögens in mehreren Mausmodellen mit Photorezeptordegeneration.


Hintergrund

Genetische Interaktionen [1] haben die Evolutionsgeschichte des Lebens auf der Erde geprägt. Es wurde festgestellt, dass sie die Zugänglichkeit von Evolutionspfaden einschränken [2], Populationen auf suboptimale evolutionäre Zustände beschränken und auf größeren Zeitskalen die Artbildungsrate kontrollieren [3]. Epistatische Wechselwirkungen können auch für die Entstehung komplexer menschlicher Erkrankungen wie Diabetes relevant sein [4]. Komplexe Merkmale und Krankheiten werden durch eine Vielzahl genomischer Loci [5] bestimmt, deren unabhängige Wirkungen und Interaktionen [6] oft notwendig sind, um den interessierenden Phänotyp zu verstehen. Trotz der breiten Implikationen epistatischer Wechselwirkungen fehlt noch eine quantitative Charakterisierung ihrer typischen Stärke. In dieser Studie betrachten wir die Wachstumsrate in Hefe als Beispiel für ein komplexes Merkmal, das durch genetische Interaktionen moduliert wird.

Frühere Studien [7-10] zum Zusammenhang zwischen den Wachstumseffekten einer Mutation und ihren epistatischen Interaktionen basierten oft auf einer Handvoll Mutationen, und erst in den letzten Jahren wurden anekdotische Evidenz durch belastbare Aussagen auf der Grundlage großer Datensätze ersetzt . Der vielleicht beeindruckendste dieser Datensätze ist der, der mit der Veröffentlichung des Artikels „Die genetische Landschaft einer Zelle“ von Costanzo . öffentlich zugänglich gemacht wurde et al. [11]. Das Genom der angehenden Hefe Saccharomyce cerevisiae umfasst etwa 6.000 Gene, von denen etwa 1.000 essentiell sind. Lebensfähige Mutanten können konstruiert werden, indem man eines der ungefähr 5.000 nicht-essentiellen Gene ausschaltet, indem man die Expression der essentiellen Gene reduziert oder die Funktionalität der Genprodukte teilweise beeinträchtigt. Der Datensatz (siehe Zusatzdatei 1, Abbildung S1) wurde mit den Wachstumsraten von etwa 5,4 Millionen Doppel-Knockout-Mutanten zusammengestellt, einem beträchtlichen Anteil aller möglichen Doppel-Knockout-Mutanten in Hefe. Unterstützt vom Costanzo et al. Datensatz betrachten wir die grundlegende Frage, ob Mutationen mit größeren Auswirkungen stärkere genetische Wechselwirkungen haben.


Sonderangebote und Produktaktionen

Von der Innenklappe

Die schnelle Leistungssteigerung von Personalcomputern hat zur Verwendung ernsthafter Vorwärtszeitsimulationsprogramme in genetischen Studien geführt. Forward-Time Population Genetics Simulations präsentiert sowohl neue als auch häufig verwendete Methoden und stellt simuPOP vor, ein leistungsstarkes und flexibles neues Programm, das verwendet werden kann, um beliebige evolutionäre Prozesse mit einzigartigen Funktionen wie angepassten Chromosomentypen, willkürlichen nicht-zufälligen Paarungsschemata, virtuellen Subpopulationen, Informationen zu simulieren Felder und Python-Operatoren.

Das Buch beginnt mit einem Überblick über wichtige Konzepte und Modelle und zeigt dann, wie simuPOP eine Reihe von Standardmodellen der Populationsgenetik simulieren kann, mit dem Ziel, den Einfluss genetischer Faktoren wie Mutation, Selektion und Rekombination auf Standard-Wright zu demonstrieren -Fisher-Modelle. Der Rest des Buches widmet sich Anwendungen von Vorwärtszeitsimulationen in verschiedenen Forschungsthemen.

Populationsgenetische Simulationen in Zukunft beinhaltet:

Ein Überblick über derzeit verfügbare Forward-Time-Simulationsmethoden, deren Vor- und Nachteile

Eine Übersicht und Bewertung aktuell verfügbarer Software

Anwendungen in der Populationsgenetik

Anwendungen in der genetischen Epidemiologie, statistischen Genetik und Kartierung komplexer menschlicher Krankheiten

Das derzeit einzige Buch seiner Art auf diesem Gebiet, Forward-Time Population Genetics Simulations, wird Forscher und Studenten der Populations- und statistischen Genetik ansprechen.

Von der Rückseite

Die schnelle Leistungssteigerung von Personalcomputern hat zur Verwendung ernsthafter Vorwärtszeitsimulationsprogramme in genetischen Studien geführt. Forward-Time Population Genetics Simulations präsentiert sowohl neue als auch häufig verwendete Methoden und stellt simuPOP vor, ein leistungsstarkes und flexibles neues Programm, das verwendet werden kann, um beliebige evolutionäre Prozesse mit einzigartigen Funktionen wie angepassten Chromosomentypen, willkürlichen nicht-zufälligen Paarungsschemata, virtuellen Subpopulationen, Informationen zu simulieren Felder und Python-Operatoren.

Das Buch beginnt mit einem Überblick über wichtige Konzepte und Modelle und zeigt dann, wie simuPOP eine Reihe von Standardmodellen der Populationsgenetik simulieren kann, mit dem Ziel, den Einfluss genetischer Faktoren wie Mutation, Selektion und Rekombination auf Standard-Wright zu demonstrieren - Fisher-Modelle. Der Rest des Buches widmet sich Anwendungen von Vorwärtszeitsimulationen in verschiedenen Forschungsthemen.

Populationsgenetische Simulationen in Zukunft beinhaltet:

Ein Überblick über derzeit verfügbare Methoden der Vorwärtszeitsimulation, deren Vor- und Nachteile

Eine Übersicht und Bewertung aktuell verfügbarer Software

Anwendungen in der Populationsgenetik

Anwendungen in der genetischen Epidemiologie, statistischen Genetik und Kartierung komplexer menschlicher Krankheiten

Das derzeit einzige Buch seiner Art auf diesem Gebiet, Forward-Time Population Genetics Simulations, wird Forscher und Studenten der Populations- und statistischen Genetik ansprechen.

Über den Autor

Marek Kimmel, PhD, ist Direktor des Doktoratsstudiums in Bioinformatik und statistischer Genetik und Leiter der Bioinformatik-Gruppe an der Rice University. Er hat gemeinsame Ernennungen als Professor für Statistik an der Rice University, Professor für Biostatistik und Angewandte Mathematik am MD Anderson Cancer Center und Professor für Biometrie an der University of Texas School of Public Health.

Christopher I. Amos, PHD, ist Professor an der Abteilung für Genetik am MD Anderson Cancer Center der University of Texas. Er hat auch außerordentliche Ernennungen an der Rice University und in der Abteilung für Epidemiologie der University of Texas School of Public Health inne.


Ergebnisse

Die Scoping-Review-Recherche umfasste Publikationen aus den Jahren 2002 bis 2017. In den elektronischen Datenbanken BVS (n = 804) und Pubmed (n = 86) wurden mit den ausgewählten Suchbegriffen insgesamt 890 Studien identifiziert (Tabelle S1 Abbildung 1). Nachdem alle doppelten Dokumente entfernt wurden, wurden insgesamt 740 Titel und Abstracts gesichtet. Von diesen wurden 70 Studien ausgeschlossen (Volltext nicht verfügbar Stichprobenpersonen stammten aus anderen Ländern als Brasilien Studien, die auf einem anderen Format der Artikel mit nicht-menschlichen Stichproben als Forschungsarbeiten basierten). Schließlich wurden 670 Volltextartikel detailliert auf ihre Förderfähigkeit geprüft. Davon wurden 639 Publikationen ausgeschlossen, da unsere Einschlusskriterien nicht vollständig erfüllt waren. Wir entschieden uns, nur Studien mit Abstammungsschätzungen basierend auf autosomalen Markern zu analysieren und Studien mit klassischen Markern oder uniparentalen Markern auszuschließen. Als Ergebnis wurden 51 Studien ausgewählt, 31 durch Scoping-Review identifiziert und 20 aus den Referenzen der ausgewählten Artikel hinzugefügt, die insgesamt 81 Populationen umfassten (Tabelle S2). Darüber hinaus wurden die teilweise isolierten Populationen, Indianerstämme und afro-stämmige Gemeinschaften separat analysiert (Tabelle S3).


Populationsgenetische Struktur des Zitronenhais (Negaprion brevirostris) im Westatlantik: DNA-Mikrosatellitenvariation

DNA-Mikrosatellitenmarker wurden verwendet, um die genetische Populationsstruktur des Zitronenhais zu charakterisieren, Negaprion brevirostris, im Westatlantik. Diese Studie zeigt zum ersten Mal die Nützlichkeit von Mikrosatelliten zur Untersuchung der genetischen Populationsstruktur und der Paarungssysteme in den Chondricthyes. Zitronenhaie (hauptsächlich Jungfische) wurden an vier Standorten zerstörungsfrei beprobt, Gullivan Bay und Marquesas Key in Florida, Bimini, Bahamas und Atol das Rocas, Brasilien. Mindestens 545 Individuen wurden an jedem der vier Dinukleotid-Loci genotypisiert. Die Anzahl der Allele pro Locus reichte von 19 bis 43 und die erwarteten Heterozygoten reichten von 0,69 bis 0,90. Im Westatlantik wurde relativ wenig genetische Struktur gefunden, mit kleinen, aber signifikanten Werten für Schätzer von FNS und RNS unter den Bevölkerungen, θ (0.016) und ρ (0,026) bzw. Zwischen den karibischen Standorten und Brasilien wurden keine scharfen Diskontinuitäten festgestellt, und die meisten Allele wurden an allen vier Standorten gefunden, was darauf hindeutet, dass der Genfluss im gesamten Westatlantik ohne Hinweise auf unterschiedliche Bestände stattfindet.


Diskussion

Hier haben wir das erste große Produkt des PopSim-Konsortiums beschrieben: die stdpopsim-Bibliothek. Wir haben das Konsortium mit einer Reihe spezifischer Ziele im Hinterkopf gegründet: Standardisierung der Simulation innerhalb der Populationsgenetik-Community, erhöhte Reproduzierbarkeit und Benutzerfreundlichkeit komplexer Simulationen, gemeinschaftsbasierte Entwicklung und Entscheidungsfindung als Leitfaden für bewährte Verfahren in der Populationsgenetik und Benchmarking von Inferenzmethoden.

Die stdpopsim-Bibliothek ermöglicht eine rigorose Standardisierung komplexer populationsgenetischer Simulationen. Die Populationsgenetik als Feld muss sich noch um eine Reihe von Standards für die entscheidende Aufgabe der Methodenevaluation, die in unserer Disziplin von der Simulation abhängt, zusammenwachsen. Im Gegensatz dazu haben andere Gebiete wie die Strukturbiologie (Moult et al., 1995) und maschinelles Lernen Russakovsky et al., 2015 eine lange Erfolgsgeschichte bei der Erprobung standardisierter Methoden. Wir hoffen, dass unsere Bemühungen den Beginn einer ebenso langen und wertvollen Tradition in der Populationsgenetik darstellen.

Unser Ziel ist es, dass stdpopsim nicht nur eine Ressource für Entwickler von Computermethoden ist, sondern auch eine Ressource für empirische Forscher, die genomische Daten verwenden. stdpopsim könnte beispielsweise in Power-Analysen verwendet werden, um angemessene Stichprobengrößen zu bestimmen, oder in Sanity Checks, um zu sehen, ob beobachtete Daten (z. Derzeit würden viele Studien von solchen simulationsbasierten Prüfungen profitieren. Allerdings gibt es große Hürden bei der Umsetzung, da einzelne Forschungsgruppen komplexe, zuvor veröffentlichte demografische Modelle neu implementieren müssen, was durch zusätzliche Realismusschichten (z. B. Rekombinationskarten) besonders abschreckend wird.

Benchmarking der Populationsgrößeninferenz

In diesem Beitrag haben wir gezeigt, wie stdpopsim für direkte Vergleiche von Inferenzmethoden in einem gängigen Simulationssatz verwendet werden kann. Unsere Benchmarking-Vergleiche waren begrenzt, offenbaren aber dennoch einige informative Merkmale. Bei der Aufgabe der Schätzung der Populationsgrößenhistorie für simulierte menschliche Populationen stellen wir beispielsweise fest, dass die sequenzbasierten Methoden ( MSMC und smc++ ) insgesamt – zumindest für moderate Zeiten in der Vergangenheit – etwas besser abschneiden als die standortfrequenzspektrumbasierten Methode (Treppendiagramm), die dazu neigt, die Größe der Oszillationen zu überschätzen (Abbildung 2 und Anhang 1 – Abbildung 4). Im Gegensatz dazu übertrifft das Treppendiagramm die sequenzbasierten Methoden bei Simulationen von D. melanogaster oder A. thaliana Populationen, in denen das Kopplungsungleichgewicht reduziert ist (Abbildung 3 und Anhang 1 – Abbildung 6). In Simulationen zweier menschlicher Populationen (Abbildung 4) schneiden ∂ ⁡ a ⁢ ∂ ⁡ i und fastsimcoal2 einigermaßen gut bei der Rekonstruktion der simulierten YRI-Historie und der Schätzung der Divergenzzeiten ab, kämpfen jedoch mit der komplexeren simulierten CEU-Historie, zum großen Teil, weil die Methoden gehen von konstanten Populationsgrößen aus. Auf der anderen Seite hat smc++ nicht die gleichen Einschränkungen in Bezug auf seine abgeleitete Historie und schneidet daher viel besser mit der CEU-Historie ab, neigt jedoch dazu, Divergenzzeiten aufgrund der Annahme, dass keine Migration stattfindet, zu unterschätzen. Die Ergebnisse für die Zwei-Population D. melanogaster Modell (Anhang 1 – Abbildung 8) sind im Allgemeinen ähnlich. In diesen Vergleichen schneiden fastsimcoal2 und ∂ ⁡ a ⁢ ∂ ⁡ i fast identisch ab, was erwartet wird, weil sie dieselben Modelle an dieselben Zusammenfassungen der Daten anpassen und sich nur darin unterscheiden, wie sie Modellerwartungen berechnen und Parameter optimieren.

Alle Methoden zur Ableitung der demografischen Geschichte haben Stärken und Schwächen (wie kürzlich von Beichman et al., 2018 überprüft). Wir haben Schlussfolgerungen aus simulierten Gesamtgenomdaten verglichen, aber viele Faktoren beeinflussen die Wahl der Methodik. Markovasche Koaleszenzverfahren (MSMC und smc++) erfordern lange zusammenhängende Abschnitte von Sequenzdaten. Im Gegensatz dazu können Frequenzspektrummethoden (Treppendiagramm, ∂ ⁡ a ⁢ ∂ ⁡ i und fastsimcoal2 ) Sequenzierungsdaten mit reduzierter Darstellung verwenden, wie z. B. RADseq (Andrews et al., 2016). ∂ ⁡ a ⁢ ∂ ⁡ i und fastsimcoal2 erfordern im Gegensatz zu MSMC , smc++ und Treppendiagrammen ein vordefiniertes parametrisches Modell. Die Verwendung eines parametrischen Ansatzes führt zu weniger verrauschten Ergebnissen, aber ein zu einfaches Modell erfasst möglicherweise wichtige demografische Ereignisse nicht (Abbildung 4 und Anhang 1 – Abbildung 8), und andere Formen von Modellfehlspezifikationen können ebenfalls zu unerwünschtem Verhalten führen. Aus softwaretechnischer Sicht unterscheiden sich Methoden auch in ihrer einfachen Installation und Anwendung. Wir hoffen, dass unsere Arbeitsabläufe bei der Anwendung aller von uns in Betracht gezogenen Methoden helfen.

Insgesamt unterstreichen diese vorläufigen Experimente die Nützlichkeit von stdpopsim zum Vergleich einer Vielzahl von Inferenzmethoden auf der gleichen Grundlage unter einer Vielzahl unterschiedlicher demografischer Modelle. Darüber hinaus ermöglicht die Fähigkeit von stdpopsim, Daten mit und ohne signifikante Merkmale wie eine genetische Karte oder Änderungen der Populationsgröße zu generieren (z. B. Anhang 1 – Abbildung 5), die Untersuchung der Fehlermöglichkeiten gängiger Methoden. Darüber hinaus liefert der Vergleich von Methoden über die verschiedenen Genomorganisationen, genetischen Karten und demografischen Geschichten verschiedener Organismen hinweg wertvolle Informationen darüber, wie Methoden bei nicht-menschlichen Systemen funktionieren könnten. Schließlich liefert der Vergleich von Ergebnissen zwischen Methoden oder Simulationsläufen eine Schätzung der Inferenzunsicherheit, analog zum parametrischen Bootstrapping, insbesondere wenn verschiedene Methoden auf unterschiedliche Weise anfällig für Modellfehlspezifikationen sind.

Nächste Schritte

Stdpopsim soll ein vollständig offenes, von der Community entwickeltes Projekt sein. Unsere Implementierungen von Genomdarstellungen und genetischen Karten für einige der gängigsten Studiensysteme in der Computergenetik – Menschen, Drosophila, und Arabidopsis (unter anderem) – sollen nur ein Ausgangspunkt für die zukünftige Entwicklung sein. Forscher sind eingeladen, zur Ressource beizutragen, indem sie ihre Organismen und Modelle ihrer Wahl hinzufügen. Die stdpopsim-Ressource wird von klar dokumentierten Standardarbeitsanweisungen begleitet, die die Eintrittsbarrieren für neue Entwickler minimieren sollen. Auf diese Weise erwarten wir, dass sich die Ressource erweitert und an die sich entwickelnden Bedürfnisse der Genomik-Community der Bevölkerung anpasst.

Eines unserer Ziele ist es, Forschungsgemeinschaften zu engagieren, die andere Taxa untersuchen, um die Ressource auf viele weitere Arten auszuweiten. Obwohl wir demographische Modelle und Rekombinationskarten aufgenommen haben, gibt es viele biologische Prozesse, die wir nicht modellieren. Einige der Ergänzungen, die wir gerne hinzufügen möchten, sind: Selektion (einschließlich Verteilungen von Fitnesseffekten, Karten funktioneller Elemente, sowohl einzelne als auch wiederkehrende Trampereignisse und Selektion auf polygene Merkmale), Genkonversion, Mutationsmodelle (Ratenheterogenität), mehr realistische Demografie (überlappende Generationen, getrennte Geschlechter, Sterblichkeits-/Fruchtbarkeitspläne), geografische Bevölkerungsstruktur und nachgelagerte Aspekte der Datenqualität (Genotypisierungs- und Kartierungsfehler). Darüber hinaus ist eine eingehende Untersuchung der Auswirkungen der Neuskalierung der Populationsgröße unter vielen der oben genannten Szenarien gerechtfertigt, da unsere vorläufigen Ergebnisse mit neutralen Simulationen (Anhang 1 – Abbildungen 1 und 2). Einige andere wichtige Prozesse sind mit aktueller Simulationssoftware schwieriger zu modellieren, wie z. B. strukturelle Variation, sich ändernde Rekombinationskarten im Laufe der Zeit, transponierbare Elemente und kontextabhängige Mutation.

Wir möchten betonen, dass, obwohl die enthaltenen demografischen Geschichten zu den am häufigsten verwendeten Modellen für unsere aktuelle Artengruppe gehören, wir erwarten, dass die Menge der verfügbaren Modelle mit der Entwicklung neuer Methoden und neuer Modellierungsrahmen erweitert wird. Zum Beispiel beschreiben die aktuellen Modelle alle einen kleinen Satz diskreter, sich zufällig paarender Populationen, die wahrscheinlich gute Näherungen für die Populationsgeschichte in der Tiefe darstellen, aber für Methoden zur Beschreibung der Dynamik zeitgenössischer Populationen weniger nützlich sein können. Der Rahmen von Stdpopsim ist allgemein genug, um realistischere Bevölkerungsmodelle leicht zu integrieren, sobald sie veröffentlicht werden. Zusätzliche Aspekte des Frameworks, wie etwa Genom-Builds, werden sich auch weiterhin ändern, da unser Verständnis der Genomstruktur verbessert wird.


Schlussfolgerungen

In dieser Studie entwickelten wir 20 EST-SSR-Marker für P. edulis basierend auf EST-Sequenzen von P. barbatus in der GenBank hinterlegt. Alle Marker waren in den untersuchten Populationen polymorph und sind wertvolle genetische Werkzeuge, um das Ausmaß der genetischen Vielfalt und der Populationsstruktur nicht nur P. edulis aber auch von verschiedenen Arten der Familie Lamiaceae. Diese Marker wiesen eine größere Anzahl von Allelen nach, von denen einige private Allele waren, die mit wichtigen agronomischen Merkmalen in Verbindung gebracht werden können. Die Studie zeigte auch das Potenzial von EST-SSR-Markern bei der Definition von P. edulis genetische Vielfalt strukturiert ist und somit zur Entwicklung besserer In-situ- und Ex-situ-Managementstrategien sowie von Auswahlkriterien für das Keimplasma beiträgt, die in Züchtungsprogrammen zur Verbesserung verschiedener wünschenswerter Eigenschaften dieser Kultur verwendet werden sollen. Unter den 12 betrachteten Verwaltungszonen und Woredas weisen Wenbera, Awi und Wolaita Populationen mit einer relativ hohen genetischen Vielfalt auf und können daher als Hotspots für die In-situ-Erhaltung von P. edulis sowie Quellen wünschenswerter Allele für Zuchtwerte. Weitere Studien, die Keimplasma aus den verbleibenden Verwaltungszonen einschließen und die molekulare Charakterisierung mit agromorphologischen Analysen kombinieren, wären wichtig, um zusätzliche potenzielle Standorte für die Erhaltung und Entwicklung der leistungsstärksten Sorten aufzudecken. Insgesamt lieferte diese Studie Basisinformationen, die weitere Studien fördern, um die hohen wirtschaftlichen und endogenen Werte zu nutzen und die derzeitige schnelle genetische Erosion von zu stoppen und umzukehren P. edulis.


Schau das Video: Mutation und Rekombination Evolutionsfaktoren 1 (November 2021).