03.12.2025, 09:00 Uhr
Universität Wien
Besprechungsgraum 4.34
Währinger Str. 29
1090 Wien
Titel: Eye-Movement Similarity: Scanpath Analysis for Recognizing
Learning Disorders.
Kurzfassung:
Die Diagnose von Lernstörungen wie Dyslexie ist aufgrund subtiler und oft unspezifischer
Symptome anspruchsvoll, wodurch eine frühzeitige Erkennung durch Nicht-Expertinnen
und -Experten erschwert wird. Angesichts der erheblichen Auswirkungen auf Bildungswege
und persönliche Entwicklung sind Früherkennungsmethoden von zentraler Bedeutung.
Frühere Eye-Tracking-Studien weisen darauf hin, dass das okulare Verhalten
Rückschlüsse auf Leseschwierigkeiten erlaubt, beruhen jedoch häufig auf einzelnen
Datensätzen und uneinheitlichen Analyseverfahren, was Fragen nach Stabilität und
Verallgemeinerbarkeit aufwirft.
Dieses Projekt verwendet PyEyeSim, eine Open-Source-Bibliothek zur umfassenden
Analyse von Augenbewegungen, die sowohl Gaussian Hidden Markov Models (GHMM) als
auch ein neu entwickeltes Sakkadenwinkel-ÄhnlichkeitsmaSS umfasst. Diese Methoden
werden in Kombination mit modernen Klassifikatoren, einem Multi-Layer Perceptron
(MLP) und einem Convolutional Neural Network (CNN), systematisch untersucht um
den leistungsfähigsten Ansatz für ein generalisierbares diagnostisches Rahmenwerk zu
identifizieren. Grundlage bilden zwei unterschiedliche Datensätze: Der erste umfasst 70
Teilnehmende (35 Kontrollpersonen, 35 Dyslexie-Betroffene), die drei längere Textstimuli
lesen. Der zweite Datensatz enthält ursprünglich 200 Teilnehmende mit 36 kurzen
Sätzen und wurde nach Datenbereinigung in zwei Untergruppen aufgeteilt: 88 Personen
aus München (49 Kontroll-, 39 Dyslexie-Gruppe) und 83 aus Graz (60 Kontroll-, 23
Dyslexie-Gruppe), die sich in Sprache und Stimuluscharakteristik unterscheiden. Die
Datenaufteilung erfolgte mittels 5-facher Kreuzvalidierung (80/20 % im ersten Datensatz,
90/10 % im zweiten). Die Einbeziehung des Sakkadenwinkel-ÄhnlichkeitsmaSSes als
zusätzliches Eingangsmerkmal führte zu einer signifikanten Leistungssteigerung des
MLP-Modells. Im ersten Datensatz verbesserte sich die durchschnittliche Genauigkeit
bei Aufgabe 1 von 91.43% ± 5.35% auf 92.86% ± 4.52%, bei Aufgabe 2 blieb sie stabil
(90.00% ± 7.28% auf 91.43% ± 8.33%) und bei Aufgabe 3 stieg sie von 88.57% ± 5.71%
auf 90.00%±3.5%. Im zweiten Datensatz erreichte das erweiterte MLP eine Genauigkeit
von 97.77% über 5 Folds und blieb auch über 100 Folds hinweg robust über 90%:
91.44% ± 9.54% (München) und 93.50% ± 7.39% (Graz). In allen Fällen übertraf das
Modell Varianten ohne das ÄhnlichkeitsmaSS. Während das CNN konstant niedrigere
Werte erzielte, zeigte das GHMM eine starke Genauigkeit zwischen 91.11% und 95.55%
über die 5 Folds und näherte sich damit dem MLP an. Die Ergebnisse belegen, dass die
Kombination fortgeschrittener Augenbewegungsmetriken mit einer angepassten MLPArchitektur
ein robustes und generalisierbares Verfahren zur Früherkennung von Dyslexie
über lange und kurze Textstimuli hinweg bietet. Für kurze Stimuli stellt das GHMM
eine interpretierbare, einfache und zugleich leistungsfähige Alternative dar, die zusätzlich
Transparenz und Erklärbarkeit in diagnostischen Anwendungen fördert.
