Methods Lab beta 0.7

Dr. Rainer Düsing · Universität Osnabrück
Interaktive Statistik · Open Source · Universität Osnabrück

Methods Lab

Interaktive Visualisierungen für statistische Methoden — von der einfachen Regression über kausale Inferenz bis hin zu psychometrischen Modellen. Kein Code nötig, alle Konzepte direkt erfahrbar.

Dr. Rainer Düsing · Universität Osnabrück · Fachgebiet Forschungsmethodik, Diagnostik & Evaluation · ResearchGate ↗
Version beta 0.7 36 Tools verfügbar 5 Tools geplant Nur HTML / JS Kein Server
📖 Glossar: Zentrale Fachbegriffe dieses Labs werden im gemeinsamen Glossar des Bayes Thinking Lab ↗ erklärt — ein kuratiertes Nachschlagewerk für beide Labs.
01

Regression & Zusammenhänge

Die Grundlage für alle weiteren Sektionen: Wie schätzt man lineare Zusammenhänge, was bedeutet „unter Kontrolle von", und wie zerlegt man Effekte in direkte und indirekte Pfade? Von einfacher OLS-Regression über Mediation und Moderation bis hin zu hierarchisch geschachtelten Daten — diese Tools bilden das Fundament für das Verständnis der statistischen Paradoxe in Sektion 3 und der kausalen Methoden in Sektion 4.

02

Inferenz & Planung

Wie groß muss eine Stichprobe sein? Was ist ein bedeutsamer Effekt? Und was passiert, wenn Daten fehlen? Diese drei Fragen entscheiden über die Qualität jeder empirischen Studie — vor der Datenerhebung und nach ihr.

03

Statistische Paradoxe

Kontraintuitive Effekte, die selbst erfahrenen Forschern Fallen stellen. Alle Paradoxe hier beruhen auf Regressionslogik — deshalb kommt diese Sektion nach den Grundlagen. Wer Abschnitt 1 versteht, versteht auch, warum diese Ergebnisse nicht überraschend sind.

↩️
Regression zur Mitte
Blutdruck-Beispiel, r-Slider, bidirektionale Selektion. Warum „schlechte" Extremwerte beim zweiten Mal besser aussehen.
📡
Messfehler-Attenuation
Intelligenz & Schulleistung — Disattenuation, Lernkarten zur N-Instabilität und Reliabilitätswahl. Wie Messungenauigkeit Korrelationen verzerrt.
🌀
Berkson's Paradox
Talent + Fleiß → Erfolg — DAG, diagonale Selektionsgrenze, Collider Bias. Negative Korrelation in selektierten Stichproben.
⚖️
Lord's Paradox
ANCOVA vs. Differenzwert — wann führen beide Analysen zu gegensätzlichen Schlüssen? DAG, Schlüsselformel, Lege-artis-Entscheidung.
📊
Simpson's Paradox
Aggregierter Trend kehrt sich bei Aufschlüsselung um — Within- vs. Pooled-Regression, Konfundierungs-Slider, Verstärkung & Umkehr. Cross-Link zum Multilevel-Tool.
🔭
Range Restriction
Varianzeinschränkung interaktiv — wie Selektion auf X die Korrelation attenuiert. Scatter Gesamt vs. eingeschränkt, Streuungsbalken, Thorndike-Beziehung r(u), Korrektur Fall II. Steigung bleibt, r sinkt.
⚔️
Lindley's Paradox
p < .05, aber der Bayes-Faktor stützt H₀ — der Konflikt zwischen Frequentist und Bayes. Lindley-Modus, z-Verteilung H₀ vs. H₁, Divergenz über n. Synergie mit dem Bayes Thinking Lab.
Bald
🎭
Will Rogers Phenomenon
Reklassifikation hebt Mittelwert beider Gruppen gleichzeitig (Stage Migration). Wichtig für Verlaufsdaten und Stadieneinteilung.
Bald
🎲
Freedman's Paradox
Schrittweise Regression mit Zufallsprädiktoren: durch Zufall signifikante Variablen, R²-Überschätzung. Warnung an Applied-Statistiker.
Bald
🚌
Inspection Paradox
Man landet zufällig in überdurchschnittlich langen Intervallen (Busse, klinische Kohorten, Überlebensdaten). Length-biased Sampling.
04

Kausale Inferenz

Unter welchen Bedingungen darf man von Assoziation auf Kausalität schließen? Diese Sektion behandelt das Potential-Outcomes-Framework, natürliche Experimente und Matching-Methoden — das methodische Handwerkszeug der modernen Kausalanalyse.

05

Testtheorie & Messung

Wie misst man psychologische Konstrukte, und wie gut tut ein Test das? Von der klassischen Reliabilität bis zu modernen IRT-Modellen — diese Sektion deckt die Grundlagen der Psychometrie ab.

📋
KTT — Grundlagen
Wahrer-Wert-Modell X = T + E, Reliabilität als Varianzanteil, SEM, Konfidenzband um Testwerte, Spearman-Brown-Testlänge. Anker des Reliabilitätsthemas.
🔗
Messmodelle (CFA-Intro)
Parallel, tau-äquivalent, kongenerisch — Pfaddiagramm, implizierte Kovarianzmatrix, automatische Modellklassifikation, ω vs. α live. Brücke EFA → Reliabilität.
🧩
Faktoranalyse
PAF (echte EFA), korrektes Oblique (Pattern Matrix Λ), Reliabilitäts-Panel (α / ωt / ωh Schmid-Leiman), 3 Szenarien, Biplot.
🎯
Reliabilität: α vs. ω
Cronbachs α vs. McDonalds ω_t/ω_h — wann α unterschätzt (Kongenerität) und wann es Eindimensionalität vortäuscht (Mehrdimensionalität). Varianzzerlegung, Split-Half-Verteilung.
📐
IRT — Dichotome Modelle
1PL / 2PL / 3PL / 4PL + Rasch — ICC, TIF, Wright Map, MLE-Personenschätzer. Rasch vs. 1PL Unterschied explizit.
🎚️
IRT — Ordinale Modelle
PCM, GPCM, GRM — CRF, ESC, Item-Info für alle Items. Disordered-Threshold-Warnung, Faktoranalyse-Bezug in Hilfe.
🔍
Differential Item Functioning
2PL-Modell, 4 Items, Δb/Δa-Schieberegler, ICC-Vergleich, Differenzkurve, Gruppenverteilungen, Raju SA/UA, ETS A/B/C.
Bald
⚖️
Messinvarianz
Configural / metric / scalar — der CFA-Zwilling zum DIF-Tool. Wann sind Gruppenvergleiche von Mittelwerten überhaupt zulässig?
Bald
🧮
Generalisierbarkeitstheorie
G-Theorie als Mehr-Facetten-Erweiterung der KTT — Varianzkomponenten über Rater, Items, Anlässe; G- und D-Studien.
06

Diagnostik & Testgüte

Wie gut erkennt ein Instrument, was es erkennen soll? Klinische und psychologische Diagnostik braucht präzise Kennzahlen — von Sensitivität und Spezifität über Beurteilerübereinstimmung bis hin zur differenziellen Validität.

🎯
Sensitivität & Spezifität
ROC-Kurve, AUC, PPV/NPV in Abhängigkeit von Prävalenz — interaktiver Cutoff, Vierfeldertafel live.
Diagnostische Validität
Konstrukt-, Kriterium- und Inhaltsvalidität — Validitätskoeffizienten, Taylor-Russell-Tabellen, Nutzenwert-Analyse.
🎯
Taylor-Russell-Tafeln
Selektionsnutzen eines Tests — Erfolgsquote (PPV) aus Validität, Selektionsrate und Basisrate. Interaktive Tafel + Nomogramm mit Zielkreuz. Bivariate Normalverteilung, Cross-Link zu Range Restriction.
⚖️
Test Bias
Cleary-Modell, Meade & Fetzer, Adverse Impact — 3 Module, 4 Szenarien. Differential Prediction vs. Fairness in der Praxis.
📊
Diagnostische Intervalle
Einzelfalldiagnostik — der wahre Wert τ aus einem Testwert: Konfidenzintervall nach Äquivalenz- vs. Regressionshypothese und bayesianisches Credible-Interval. SEM, Regression zur Mitte, direkte Wahrscheinlichkeitsaussagen P(τ>T).
📈
Jacobson-Truax-Analyse
Reliable Change Index & klinische Signifikanz — RCI-Band, Cutoff a/b/c, 4-Felder-Klassifikation im Prä-Post-Plot. BDI-II als Beispiel.
📊
Normierungsverzerrung
T-Werte bei rechtsschiefen Verteilungen (SCL-90-Analogie) — Gamma, Log-Normal, Exponential, Ex-Gauss. Empirischer PR vs. T-Norm PR, Diskrepanztabelle, interaktive Parameter.
👤
Profilanalyse
Profilvergleich mit Cattell rₚ, McCrae Iₚₐ / rₚₐ, ICC_de — Profil-Elevation, Streuung und Form getrennt bewertet.
👥
ICC-Lab
Intraklassenkorrelation — alle 6 Shrout-&-Fleiss-Formen, Rater-Anzahl, absolute vs. konsistente Übereinstimmung.
Tool only
🤝
Beurteilerübereinstimmung
Cohens κ, gewichtetes κ, Kappa-Paradox, Prävalenz & Bias — wann κ täuscht und was man stattdessen berichten sollte.
🎲
Schwesterprojekt · Bayesianische Statistik
Bayes Thinking Lab

Frequentistische Methoden sind hier gut aufgehoben — aber für Priors, Posterior-Verteilungen, ROPE-Entscheidungen, Bayes-Faktoren und brms-Modelle gibt es das Bayes Thinking Lab: interaktive Tools, die Bayesianisches Denken von Grund auf erklären. Beide Labs ergänzen sich: Lindley's Paradox z. B. braucht beide Perspektiven.

Haftungsausschluss

Das Methods Lab ist ein kostenloses, quelloffenes Lehr- und Lernprojekt. Alle Inhalte dienen ausschließlich zu Bildungszwecken. Trotz sorgfältiger Erstellung der Inhalte und Implementierungen wird keine Gewähr für die Richtigkeit, Vollständigkeit oder Aktualität der dargestellten Berechnungen, Visualisierungen oder sonstigen Inhalte übernommen. Die Nutzung erfolgt auf eigene Verantwortung.

Eine Haftung für Schäden, die aus der Verwendung oder dem Vertrauen auf die bereitgestellten Informationen entstehen — insbesondere bei fehlerhaften Berechnungen durch Software-Bugs — wird ausdrücklich ausgeschlossen, soweit dies gesetzlich zulässig ist.

Für akademische, klinische oder sonstige professionelle Entscheidungen ist stets die eigenständige Überprüfung durch qualifizierte Fachpersonen erforderlich.

Über das Projekt

Das Methods Lab wird entwickelt und betreut von Dr. Rainer Düsing, Universität Osnabrück, Fachgebiet Forschungsmethodik, Diagnostik & Evaluation. Es ist das Schwesterprojekt des Bayes Thinking Lab.