Masterprüfung mit Defensio, Nils Gubela

17.11.2022 17:00 - 18:30

Hörsaal B

Campus Vienna

Biocenter 5

17.11.2022, 17:00 Uhr
Hörsaal B, Campus Vienna, Biocenter 5

Titel: „A test for reversibility of Markov chains in molecular
evolution“

Kurzfassung:
Nukleotidsubstitutionen in DNA-Sequenzen werden mit Hilfe eines Markov-Modells der
molekularen Evolution modelliert, d. h. eines zeitkontinuierlichen Markov-Prozesses, der
durch eine Übergangsratenmatrix Q definiert ist. Aus einem Alignment von Sequenzen
kann auf verschiedene Weise ein phylogenetischer Baum abgeleitet werden. Viele modellbasierte
Methoden setzen ein explizites Substitutionsmodell voraus oder schätzen die
Übergangsratenmatrix aus dem Alignment. Üblicherweise werden Annahmen über die
Übergangsratenmatrix Q getroffen, um die Anzahl der freien Parameter zu reduzieren.
Eine gängige Annahme ist die Reversibilität, d. h. im Gleichgewicht ist der Fluss vom
Zustand i zum Zustand j gleich dem umgekehrten Fluss vom Zustand j zum Zustand i
für alle Zustände/Nukleotide i; j 2 fA,C,G,Tg. Geht man von einer reversiblen Ratenmatrix
aus, so verringern sich die freien Parameter auf neun. Daher ist es sinnvoll, ein
Alignment auf Reversibilität zu testen, bevor der phylogenetische Baum rekonstruiert
wird.
Reversibilität ist mit Stationarität verbunden, aber ein Prozess kann ein reversibles
Substitutionsmodell haben und (noch) nicht stationär sein. Für eine Vorgängersequenz
und eine Nachfolgersequenz stehen Methoden zur Verfügung, um die Reversibilität bei
gegebener Stationarität zu prüfen, z. B. der Bowker-Test für Symmetrie. Er prüft die
Stichproben-Diversitätsmatrix der beiden Sequenzen auf Symmetrie, eine Eigenschaft,
die Stationarität und Reversibilität der Markov-Kette impliziert und umgekehrt. Eine
nicht symmetrische erwartete Diversitätsmatrix impliziert entweder Reversibilität oder
Stationarität. Wird die Symmetrie abgelehnt, kann der Stuart-Test für marginale Symmetrie
verwendet werden, um die Stationarität der Markov-Kette zu messen, was Nicht-
Reversibilität impliziert. Stuart und Markham stellten fest, dass eine reversible Markov-
Kette eine quasisymmetrische Diversitätsmatrix erzeugt. Quasisymmetrische Matrizen
sind das Produkt aus einer Diagonalmatrix D und einer symmetrischen Matrix S. Sie
schlugen eine Methode zur Schätzung von D und damit auch von S anhand der Diversitätsmatrix
der Stichprobe vor. Der Bowker-Test auf Symmetrie wird dann auf die
geschätzte symmetrische Matrix S angewendet.
Im Folgenden erörtern wir die Vor- und Nachteile der drei vorgestellten Tests, um die
Reversibilität einer Markov-Kette zu testen. Außerdem zeigen wir, dass der Sharp-
Markham-Test für Quasisymmetrie falsch skaliert ist und nicht der gewünschten Verteilung
folgt. Wir schlagen einen neuen Test für Quasisymmetrie oder Reversibilität vor. Der
Test erzeugt eine Teststatistik aus den vier Kolmogorov-Zyklen, die Quasisymmetrie
definieren. Diese Teststatistik ist normalverteilt und hat im Falle der Reversibilität des
Substitutionsprozesses den Mittelwert null. Wir geben die mathematischen Details zur
Konstruktion der Normalverteilung unter der Annahme der Reversibilität an. Schließlich
erörtern wir eine Strategie zur Anwendung des Tests auf ein Multiple Sequence Alignment
von Sequenzen aus der heutigen Zeit anhand einiger anschaulicher Beispiele.

Organiser:

SPL 5

Location:
Hörsaal B, Campus Biocenter 5