Masterprüfung mit Defensio, Teodora Bucaciuc Mracica

03.11.2022 14:45 - 16:15

Durchführung per Videokonferenz

03.11.2022, 14:45
Durchführung per Videokonferenz

Titel: RNA structuredness of viral genomes

Kurzfassung:
Das Ziel dieser Masterarbeit ist es, die Strukturiertheit von allen vollständigen
RNS-Virengenomen aus der NCBI Datenbank zu bestimmen. Dazu wurde eine
Methode entwickelt, den Z-Score für alle Nukleotide eines Genoms zu berechnen,
mithilfe dessen die gesamten thermodynamischen Fähigkeiten des Genoms, stabile
sekundäre Strukturen zu bilden, ausgedrückt werden können. Das RNAfold-
Modul des ViennaRNA-Programms wurde in Verbindung mit einer Sliding-Window-
Methode verwendet, um ein ganzes Genom zu scannen; in jedem Sliding Window
wurde die Minimum Free Energy (MFE) berechnet sowie ein Z-Score bestimmt.
Der Z-Score wird kalkuliert, indem die native MFE mit dem Mittelwert
der MFEs mehrerer zufälliger Sequenzen verglichen wird, die dieselbe Länge und
Nukleotidzusammensetzung haben wie die native MFE; die Signifikanz einer errechneten
MFE wird in Form des Z-Scores als die Anzahl der Standardabweichungen vom
Mittelwert dargestellt. Folglich weist ein negativer Z-Score auf eine im Vergleich zu
zufälligen RNS-Sequenzen stabilere native RNS-Sequenz hin. Für jede Position im
Genom wurde ein durchschnittlicher Z-Score berechnet, indem die MFE-Werte aus
all jenen Sliding Windows gemittelt wurden, die ebendiese Position enthalten. Ein
automatisiertes Python-Programm wurde entwickelt, um den durchschnittlichen ZScore
in jedem Organismus aus einem Taxon zu bestimmen. Für jede Virusspezies
wurden automatisch eigene SLURM-Dateien erstellt und an das Computer-Cluster
des Instituts für Theoretische Chemie gesendet. Dadurch werden neben der ZScore-
Berechnung für jedes Nukleotid die Output-Daten gleichzeitig vor- und nachbearbeitet;
dazu zählen die Visualisierung der Genom-Annotationen zusammen mit
ihren durchschnittlichen Z-Scores oder die Integration anderer ViennaRNA-Module
in Form von Bash-Skripten und statistischen Datenanalysen.
Insgesamt wurden 4.142 RNS-Genome einzeln analysiert, annotiert, verarbeitet und
visualisiert. Zusätzlich zur Strukturanalyse des Genoms anhand der Z-Scores wurde
ebenfalls eine ausführliche Vergleichsanalyse zur Verteilung der Z-Scores in den
kodierenden und nicht-kodierenden Teilen der RNS durchgeführt. Die RNALfoldund
RNAplfold-Module aus dem ViennaRNA-Programmpaket wurden verwendet,
um die Stabilität lokaler Sekundärstrukturen zu analysieren sowie den Wert der
benötigten freien Energie zu berechnen, um diese Sequenzen zu entfalten; so soll
die Ausdrucksqualität eines spezifischen Proteins oder einer nicht-kodierenden RNS
bestimmt werden.
Diese Masterarbeit zeigt die globale RNS-Strukturiertheit in verschiedenen RNSVirengruppen
und erfasst wichtige Erkenntnisse zu den Strukturen der jeweiligen
RNS-Spezies, welche nicht nur für den Lebenszyklus eines Virus sondern potentiell
auch für die medizinische sowie biotechnologische Forschung entscheidende Implikationen
aufzeigen.
 

Organiser:

SPL 5

Location:

digital