15.11.2024, 10:15 Uhr
Durchführung per Videokonferenz
Titel: „Hierachical Lasso Models“
Kurzfassung:
In vielen Fachrichtungen werden Daten oft durch bestimmte Experimente gesammelt. Lasso-Modelle
sind klassische Werkzeuge, die in den meisten experimentellen Wissenschaften verwendet
werden, um Faktoren und Interaktionen zu identifizieren, die essentiell für die gesuchte
Variable sind. Zum Beispiel kann eine chemische Reaktion unter verschiedenen Bedingungen
durchgeführt werden, um Reaktionskomponenten zu identifizieren, die zum besten Ertrag führen.
Diese Modelle sind in modernen Anwendungen viel komplexer geworden: (i) man interessiert sich oft
für viel mehr als 2 Faktoren, (ii) es gibt normalerweise nur eine Beobachtung pro Kombination der
Faktorstufen, (iii) die Antworts- variable ist nicht unbedingt normal. Im Ergebnis sind keine der
klassischen Resultate anwendbar. Diese These zielt darauf ab, die oben erwähnten Aspekte
anzusprechen. In der Anwesenheit von vielen Faktoren und einzelnen Replikationen pro
Faktorstufenkom- bination ist es vernünftig anzunehmen, dass die Mehrheit der
Faktorstufenkombinationen nicht signifikant ist. Es ist verlockend, einen Lasso-Algorithmus direkt
anzuwenden, um Schätzungen und Modellauswahl in einem Schritt durchzuführen. Jedoch ist der
klassische Lasso-Algorithmus trotz der hierarchischen Struktur der Daten (es kann keinen Interak-
tionseffekt geben, wenn die Haupteffekte nicht signifikant sind) nicht anwendbar. Es
wurden viele Lasso-Algorithmen für hierarchische Daten unter verschiedenen Annahmen entwickelt.
Allerdings sind diese Algorithmen auf Zwei-Faktormodelle limitiert. Da mit der wachsenden Anzahl
von Faktoren die Komplexität der Struktur exponentiell zunimmt, ist es eine hochgradig
nicht-triviale Aufgabe, solche hierarchischen Lasso-Algorithmen auf multifaktorielle Modelle zu
erweitern. Diese These versucht, einen hierarchischen Lasso-Algorithmus für drei Faktoren zu
entwickeln, der für Antworten geeignet ist, die durch Verteilungen aus der Exponentialfamilie
modelliert werden. Die Methode sollte auf die Daten zur Deoxyfluorierung angewendet werden, die
eine nicht-normale Antwort aufweisen.