Varianzanalyse
Die Varianzanalyse ist ein statistisches Verfahren der Datenanalyse und Mustererkennung, das versucht, die Varianz einer metrischenen Variablen durch eine oder mehrere Variablen zu erklären. Das Verfahren untersucht, ob (und gegebenenfalls wie) sich der Erwartungswert einer metrischen Zufallsvariablen in verschiedenen Gruppen (auch Klassen) unterscheidet. In Prüfgrößen des Verfahrens wird getestet, ob die Varianz zwischen den Gruppen größer ist als die Varianz innerhalb der Gruppen. Dadurch kann ermittelt werden, ob die Gruppeneinteilung sinnvoll ist oder nicht bzw. ob sich die Gruppen signifikant unterscheiden oder nicht.Beispiele für die Anwendung der Varianzanalyse sind die Untersuchung der Wirksamkeit von Medikamenten in der Medizin (siehe Doppelblindversuch) und die Untersuchung des Einflusses von Düngemitteln auf den Ertrag von Anbauflächen in der Landwirtschaft.
Siehe auch: Diskriminanzanalyse, Nullhypothese, Bestimmtheitsmaß
Table of contents |
2 Einfaktorielle Varianzanalyse 3 Zweifaktorielle Varianzanalyse 4 mehr als zwei Faktoren 5 Beispiel einer einfachen Varianzanalyse 6 Literatur |
Begriffe
Die metrische Variable, deren Wert durch die kategorialen Variablen erklärt werden soll, heißt
Die kategorialen Variablen heißen
Die Signifikanz einer ermittelten Gruppeneinteilung lässt sich anhand der F-Verteilung testen.
Bei dem folgenden Beispiel handelt es sich um eine einfache Varianzanalyse mit zwei Gruppen (auch
Zwei-Stichproben F-Test). In einem Versuch erhalten zwei Gruppen von Tieren () unterschiedliche Nahrung. Nach einer gewissen Zeit wird ihr Gewicht mit folgenden Werten gemessen:
Einfaktorielle Varianzanalyse
Bei der einfaktoriellen Varianzanalyse enthält das Modell nur einen Faktor (der dann beliebig viele Faktorstufen haben kann).
Das Modell in Effektdarstellung lautet:Yij: Zielvariable; Annahmegemäß in den Gruppen normalverteilt
I: Anzahl der Faktorstufen des betrachteten Faktors
ni: Stichprobenumfänge für die einzelnen Faktorstufen
μ: Mittelwert der Gesamtstichprobe
αi: Effekt der i-ten Faktorstufe
εij: Störvariablen, unahbhängig und Normalverteilt mit Erwartungswert 0 und gleicher Varianz.
Zweifaktorielle Varianzanalyse
Die zweifaktorielle Varianzanalyse berücksichtigt zur Erklärung der Zielvariablen zwei Faktoren (Faktor A und Faktor B). Das Modell (für den Fall mit festen Effekten)in Effektdarstellung lautet:Yijk: Zielvariable; Annahmegemäß in den Gruppen normalverteilt
I: Anzahl der Faktorstufen des ersten Faktors (A)
J: Anzahl der Faktorstufen des zweiten Faktors (B)
K: Anzahl der Beobachtungen pro Faktorstufe (hier für alle Kombinationen von Faktorstufen gleich)
αi: Effekt der i-ten Faktorstufe des Faktors A
βj: Effekt der j-ten Faktorstufe des Faktors B
&(αβ)ij: Interaktion (Wechselwirkung) der Faktoren auf der Faktorstufenkombination (i,j). Dies beschreibt einen besonderen Effekt, der nur auftritt, wenn die Faktorstufenkombination (i,j) vorliegt.
εijk: Störvariablen, unahbhängig und Normalverteilt mit
mehr als zwei Faktoren
auch mehrere Faktoren sind möglich. Allerdings steigt der Datenbedarf für eine Schätzung der Modellparameter mit der
Anzahl der Faktoren stark an. Auch die Darstellungen des Modells (z.B. in Tabellen) werden mit zunehmender Anzahl der Faktoren unübersichtlicher.Beispiel einer einfachen Varianzanalyse
Es soll untersucht werden, ob die unterschiedliche Nahrung einen signifikanten Einfluss auf das Gewicht hat. Der Mittelwert und die Varianz der beiden Gruppen betragen
Das zugrunde liegende Wahrscheinlichkeitsmodell setzt voraus, dass die Gewichte der Tiere normalverteilt sind. Die zu testende Nullhypothese ist
- "Die Mittelwerte der beiden Gruppen sind gleich"
- "Die Mittelwerte der beiden Gruppen sind gleich"
Es kann also mit einer Wahrscheinlichkeit von 95% davon ausgegangen werden, dass die Tiere in den beiden Gruppen im Mittel wirklich ein unterschiedliches Gewicht aufweisen.
Siehe auch: Chi-Quadrat-Test, t-Verteilung