Interaktive Statistik · Open Source · Universität Osnabrück

Methods Lab

Interaktive Visualisierungen für statistische Methoden — von der einfachen Regression über kausale Inferenz bis hin zu psychometrischen Modellen. Kein Code nötig, alle Konzepte direkt erfahrbar.

Dr. Rainer Düsing · Universität Osnabrück · Fachgebiet Forschungsmethodik, Diagnostik & Evaluation · ResearchGate ↗

Version beta 0.7 36 Tools verfügbar 5 Tools geplant Nur HTML / JS Kein Server

📖 Glossar: Zentrale Fachbegriffe dieses Labs werden im gemeinsamen Glossar des Bayes Thinking Lab ↗ erklärt — ein kuratiertes Nachschlagewerk für beide Labs.

Regression & Zusammenhänge

Die Grundlage für alle weiteren Sektionen: Wie schätzt man lineare Zusammenhänge, was bedeutet „unter Kontrolle von", und wie zerlegt man Effekte in direkte und indirekte Pfade? Von einfacher OLS-Regression über Mediation und Moderation bis hin zu hierarchisch geschachtelten Daten — diese Tools bilden das Fundament für das Verständnis der statistischen Paradoxe in Sektion 3 und der kausalen Methoden in Sektion 4.

📈

OLS & Multiple Regression

Einfache und multiple Regression — Koeffizienten, R², Annahmen und typische Verletzungen. Interaktive Dateninjektion.

🔗

Partialkorrelation

Korrelation zweier Variablen bereinigt um den Einfluss einer dritten. Suppressor-Effekte, Semipartialkorrelation, Pfadkoeffizienten.

➡️

Mediationsanalyse

Hayes/PROCESS Model 4 — DAG-Visualisierung, direkter und indirekter Effekt, Sobel/Aroian live, Bootstrap auf Knopfdruck.

✂️

Moderationsanalyse

Hayes/PROCESS Model 1 — Simple Slopes, Johnson-Neyman-Technik, Floodlight-Plot. Wann moderiert W den Effekt von X auf Y?

🏗️

Multilevel-Modelle

Complete / No / Partial Pooling im Vergleich, Shrinkage-Caterpillar-Plot, ICC-Schieber, Random Slopes (τ₁, ρ), Simpson-Paradoxon live erleben.

Inferenz & Planung

Wie groß muss eine Stichprobe sein? Was ist ein bedeutsamer Effekt? Und was passiert, wenn Daten fehlen? Diese drei Fragen entscheiden über die Qualität jeder empirischen Studie — vor der Datenerhebung und nach ihr.

NCT-Bug

📏

Effektgrößen

Cohen's d, r, η², f, OR/RR — Umrechnungen, Visualisierungen, Konfidenzintervalle. NCT-CI-Berechnung in Überarbeitung.

⚡

Power & Stichprobengröße

4-Kurven-Schar, H₀/H₁-Verteilung, Heatmap n×d, Sensitivitätskurve, MDES, SESOI. α, β, d, n interaktiv.

🕳️

Missing Data

MCAR, MAR, MNAR — Mechanismen verstehen, vier Imputationsstrategien vergleichen, Ampel-Grid für Bias und Effizienz.

Statistische Paradoxe

Kontraintuitive Effekte, die selbst erfahrenen Forschern Fallen stellen. Alle Paradoxe hier beruhen auf Regressionslogik — deshalb kommt diese Sektion nach den Grundlagen. Wer Abschnitt 1 versteht, versteht auch, warum diese Ergebnisse nicht überraschend sind.

↩️

Regression zur Mitte

Blutdruck-Beispiel, r-Slider, bidirektionale Selektion. Warum „schlechte" Extremwerte beim zweiten Mal besser aussehen.

📡

Messfehler-Attenuation

Intelligenz & Schulleistung — Disattenuation, Lernkarten zur N-Instabilität und Reliabilitätswahl. Wie Messungenauigkeit Korrelationen verzerrt.

🌀

Berkson's Paradox

Talent + Fleiß → Erfolg — DAG, diagonale Selektionsgrenze, Collider Bias. Negative Korrelation in selektierten Stichproben.

⚖️

Lord's Paradox

ANCOVA vs. Differenzwert — wann führen beide Analysen zu gegensätzlichen Schlüssen? DAG, Schlüsselformel, Lege-artis-Entscheidung.

📊

Simpson's Paradox

Aggregierter Trend kehrt sich bei Aufschlüsselung um — Within- vs. Pooled-Regression, Konfundierungs-Slider, Verstärkung & Umkehr. Cross-Link zum Multilevel-Tool.

🔭

Range Restriction

Varianzeinschränkung interaktiv — wie Selektion auf X die Korrelation attenuiert. Scatter Gesamt vs. eingeschränkt, Streuungsbalken, Thorndike-Beziehung r(u), Korrektur Fall II. Steigung bleibt, r sinkt.

⚔️

Lindley's Paradox

p < .05, aber der Bayes-Faktor stützt H₀ — der Konflikt zwischen Frequentist und Bayes. Lindley-Modus, z-Verteilung H₀ vs. H₁, Divergenz über n. Synergie mit dem Bayes Thinking Lab.

Bald

🎭

Will Rogers Phenomenon

Reklassifikation hebt Mittelwert beider Gruppen gleichzeitig (Stage Migration). Wichtig für Verlaufsdaten und Stadieneinteilung.

Bald

🎲

Freedman's Paradox

Schrittweise Regression mit Zufallsprädiktoren: durch Zufall signifikante Variablen, R²-Überschätzung. Warnung an Applied-Statistiker.

Bald

🚌

Inspection Paradox

Man landet zufällig in überdurchschnittlich langen Intervallen (Busse, klinische Kohorten, Überlebensdaten). Length-biased Sampling.

Kausale Inferenz

Unter welchen Bedingungen darf man von Assoziation auf Kausalität schließen? Diese Sektion behandelt das Potential-Outcomes-Framework, natürliche Experimente und Matching-Methoden — das methodische Handwerkszeug der modernen Kausalanalyse.

🔬

Kausale Inferenz — Grundlagen

DAGs, Potential Outcomes, IPW, G-Computation — fünf Module im Vollbild-Layout. Starkes Konfunding, live ATE-Schätzung.

🚧

Regression Discontinuity

Sharp RDD — Szenarien A–D, Polynomgrad-Slider, Fuzzy RDD und Polynomial-Fallstricke als aufklappbare Module.

📉

Difference-in-Differences

Regressionsmodell, ATT, Selektionsbias, naive Vergleiche ①②, live-aktualisierte Pfeile. Parallel-Trends-Annahme visuell.

🎯

Propensity Score Matching

Logistische PS-Schätzung, Greedy 1:1 Matching, IPW (ATT), Love Plot, Effektschätzer-Vergleich vor/nach Matching.

Testtheorie & Messung

Wie misst man psychologische Konstrukte, und wie gut tut ein Test das? Von der klassischen Reliabilität bis zu modernen IRT-Modellen — diese Sektion deckt die Grundlagen der Psychometrie ab.

📋

KTT — Grundlagen

Wahrer-Wert-Modell X = T + E, Reliabilität als Varianzanteil, SEM, Konfidenzband um Testwerte, Spearman-Brown-Testlänge. Anker des Reliabilitätsthemas.

🔗

Messmodelle (CFA-Intro)

Parallel, tau-äquivalent, kongenerisch — Pfaddiagramm, implizierte Kovarianzmatrix, automatische Modellklassifikation, ω vs. α live. Brücke EFA → Reliabilität.

🧩

Faktoranalyse

PAF (echte EFA), korrektes Oblique (Pattern Matrix Λ), Reliabilitäts-Panel (α / ωt / ωh Schmid-Leiman), 3 Szenarien, Biplot.

🎯

Reliabilität: α vs. ω

Cronbachs α vs. McDonalds ω_t/ω_h — wann α unterschätzt (Kongenerität) und wann es Eindimensionalität vortäuscht (Mehrdimensionalität). Varianzzerlegung, Split-Half-Verteilung.

📐

IRT — Dichotome Modelle

1PL / 2PL / 3PL / 4PL + Rasch — ICC, TIF, Wright Map, MLE-Personenschätzer. Rasch vs. 1PL Unterschied explizit.

🎚️

IRT — Ordinale Modelle

PCM, GPCM, GRM — CRF, ESC, Item-Info für alle Items. Disordered-Threshold-Warnung, Faktoranalyse-Bezug in Hilfe.

🔍

Differential Item Functioning

2PL-Modell, 4 Items, Δb/Δa-Schieberegler, ICC-Vergleich, Differenzkurve, Gruppenverteilungen, Raju SA/UA, ETS A/B/C.

Bald

⚖️

Messinvarianz

Configural / metric / scalar — der CFA-Zwilling zum DIF-Tool. Wann sind Gruppenvergleiche von Mittelwerten überhaupt zulässig?

Bald

🧮

Generalisierbarkeitstheorie

G-Theorie als Mehr-Facetten-Erweiterung der KTT — Varianzkomponenten über Rater, Items, Anlässe; G- und D-Studien.

Diagnostik & Testgüte

Wie gut erkennt ein Instrument, was es erkennen soll? Klinische und psychologische Diagnostik braucht präzise Kennzahlen — von Sensitivität und Spezifität über Beurteilerübereinstimmung bis hin zur differenziellen Validität.

🎯

Sensitivität & Spezifität

ROC-Kurve, AUC, PPV/NPV in Abhängigkeit von Prävalenz — interaktiver Cutoff, Vierfeldertafel live.

✅

Diagnostische Validität

Konstrukt-, Kriterium- und Inhaltsvalidität — Validitätskoeffizienten, Taylor-Russell-Tabellen, Nutzenwert-Analyse.

🎯

Taylor-Russell-Tafeln

Selektionsnutzen eines Tests — Erfolgsquote (PPV) aus Validität, Selektionsrate und Basisrate. Interaktive Tafel + Nomogramm mit Zielkreuz. Bivariate Normalverteilung, Cross-Link zu Range Restriction.

⚖️

Test Bias

Cleary-Modell, Meade & Fetzer, Adverse Impact — 3 Module, 4 Szenarien. Differential Prediction vs. Fairness in der Praxis.