Varianzanalyse<meta http-equiv="Content-type" content="text/html; charset=utf-8"> <link rel="shortcut icon" href="../../favicon.ico"><link rel="stylesheet" href="../../wikistatic.css"></head> <body><div id=topbar><table width='98%' border=0><tr><td><a href="../../h/ha/hauptseite.html" title="Hauptseite">Hauptseite</a> | <b><a href="http://de.wikipedia.org/wiki/Varianzanalyse" title="Varianzanalyse">Aktueller Wikipedia-Artikel</a></b></td> <td align=right nowrap><form name=search class=inline method=get action="../../../search/search.html"><input name=search size=19><input type=submit value=Search></form></td></tr></table></div> <div id=article><h1>Varianzanalyse</h1>Die <strong>Varianzanalyse</strong> ist ein <A HREF="../../s/st/statistik.html" title="Statistik">statistisches</A> Verfahren der <A HREF="../../d/da/datenanalyse.html" title="Datenanalyse">Datenanalyse</A> und <A HREF="../../m/mu/mustererkennung.html" title="Mustererkennung">Mustererkennung</A>, das versucht, die <A HREF="../../v/va/varianz.html" title="Varianz">Varianz</A> einer <A HREF="../../s/sk/skalenniveau.html" title="Skalenniveau">metrischenen</A> Variablen durch eine oder mehrere Variablen zu erklären. Das Verfahren untersucht, ob (und gegebenenfalls wie) sich der <A HREF="../../e/er/erwartungswert.html" title="Erwartungswert">Erwartungswert</A> einer metrischen Zufallsvariablen in verschiedenen Gruppen (auch <em>Klassen</em>) unterscheidet. In Prüfgrößen des Verfahrens wird getestet, ob die Varianz zwischen den Gruppen größer ist als die <A HREF="../../v/va/varianz.html" title="Varianz">Varianz</A> innerhalb der Gruppen. Dadurch kann ermittelt werden, ob die Gruppeneinteilung sinnvoll ist oder nicht bzw. ob sich die Gruppen signifikant unterscheiden oder nicht.<p> Beispiele für die Anwendung der Varianzanalyse sind die Untersuchung der Wirksamkeit von Medikamenten in der Medizin (siehe <A HREF="../../b/bl/blindstudie.html" title="Blindstudie">Doppelblindversuch</A>) und die Untersuchung des Einflusses von Düngemitteln auf den Ertrag von Anbauflächen in der Landwirtschaft.<p> <p> <em>Siehe auch:</em> <A HREF="../../d/di/diskriminanzanalyse.html" title="Diskriminanzanalyse">Diskriminanzanalyse</A>, <A HREF="../../n/nu/nullhypothese.html" title="Nullhypothese">Nullhypothese</A>, <A HREF="../../b/be/bestimmtheitsmaa_.html" title="Bestimmtheitsmaß">Bestimmtheitsmaß</A><p> <p><table border="0" id="toc"><tr><td align="center"> <b>Table of contents</b> <script type='text/javascript'>showTocToggle("show","hide")</script></td></tr><tr id='tocinside'><td align="left"> <div style="margin-left:2em;"> </div> </div> <A CLASS="internal" HREF="#Begriffe">1 Begriffe</A><BR> <A CLASS="internal" HREF="#Einfaktorielle Varianzanalyse">2 Einfaktorielle Varianzanalyse</A><BR> <A CLASS="internal" HREF="#Zweifaktorielle Varianzanalyse">3 Zweifaktorielle Varianzanalyse</A><BR> <A CLASS="internal" HREF="#mehr als zwei Faktoren">4 mehr als zwei Faktoren</A><BR> <A CLASS="internal" HREF="#Beispiel einer einfachen Varianzanalyse">5 Beispiel einer einfachen Varianzanalyse</A><BR> <A CLASS="internal" HREF="#Literatur">6 Literatur</A><BR> </td></tr></table><P> <A NAME="Begriffe"><H2>Begriffe</H2> Die metrische Variable, deren Wert durch die kategorialen Variablen erklärt werden soll, heißt <ul><li>Zielvariable oder </li><li>Abhängige Variable </li></ul>Die kategorialen Variablen heißen <ul><li>Einflussvariablen oder </li><li>Unabhängige Variablen oder </li><li>Faktoren (die Kategorien heißen dann Faktorstufen)<p> </li></ul> Die <A HREF="../../s/st/statistische_signifikanz.html" title="Statistische Signifikanz">Signifikanz</A> einer ermittelten Gruppeneinteilung lässt sich anhand der <A HREF="../../f/f_/f_verteilung.html" title="F-Verteilung">F-Verteilung</A> testen.<p> <A NAME="Einfaktorielle Varianzanalyse"><H2>Einfaktorielle Varianzanalyse</H2> Bei der einfaktoriellen Varianzanalyse enthält das Modell nur einen Faktor (der dann beliebig viele Faktorstufen haben kann). Das Modell in Effektdarstellung lautet:<p> <pre>Y<sub>ij</sub>: Zielvariable; Annahmegemäß in den Gruppen <A HREF="../../n/no/normalverteilung.html" title="Normalverteilung">normalverteilt</A> I: Anzahl der Faktorstufen des betrachteten Faktors n<sub>i</sub>: Stichprobenumfänge für die einzelnen Faktorstufen μ: Mittelwert der Gesamtstichprobe α<sub>i</sub>: Effekt der i-ten Faktorstufe ε<sub>ij</sub>: Störvariablen, unahbhängig und Normalverteilt mit Erwartungswert 0 und gleicher Varianz.<p> </pre><A NAME="Zweifaktorielle Varianzanalyse"><H2>Zweifaktorielle Varianzanalyse</H2> Die zweifaktorielle Varianzanalyse berücksichtigt zur Erklärung der Zielvariablen zwei Faktoren (Faktor A und Faktor B). Das Modell (für den Fall mit festen Effekten)in Effektdarstellung lautet:<p> <pre>Y<sub>ijk</sub>: Zielvariable; Annahmegemäß in den Gruppen normalverteilt I: Anzahl der Faktorstufen des ersten Faktors (A) J: Anzahl der Faktorstufen des zweiten Faktors (B) K: Anzahl der Beobachtungen pro Faktorstufe (hier für alle Kombinationen von Faktorstufen gleich) α<sub>i</sub>: Effekt der i-ten Faktorstufe des Faktors A β<sub>j</sub>: Effekt der j-ten Faktorstufe des Faktors B &(αβ)<sub>ij</sub>: Interaktion (Wechselwirkung) der Faktoren auf der Faktorstufenkombination (i,j). Dies beschreibt einen besonderen Effekt, der nur auftritt, wenn die Faktorstufenkombination (i,j) vorliegt. ε<sub>ijk</sub>: Störvariablen, unahbhängig und Normalverteilt mit </pre><A NAME="mehr als zwei Faktoren"><H2>mehr als zwei Faktoren</H2> auch mehrere Faktoren sind möglich. Allerdings steigt der Datenbedarf für eine Schätzung der Modellparameter mit der Anzahl der Faktoren stark an. Auch die Darstellungen des Modells (z.B. in Tabellen) werden mit zunehmender Anzahl der Faktoren unübersichtlicher.<p> <A NAME="Beispiel einer einfachen Varianzanalyse"><H2>Beispiel einer einfachen Varianzanalyse</H2><p> Bei dem folgenden Beispiel handelt es sich um eine einfache Varianzanalyse mit zwei Gruppen (auch <em>Zwei-Stichproben F-Test</em>). In einem Versuch erhalten zwei Gruppen von Tieren () unterschiedliche Nahrung. Nach einer gewissen Zeit wird ihr Gewicht mit folgenden Werten gemessen:<p> <dl><dd><strong>Gruppe 1:</strong> 45, 23, 55, 32, 51, 91, 74, 53, 70, 84 (Anzahl der Tiere ) </dd><dd><strong>Gruppe 2:</strong> 64, 75, 95, 56, 44, 130, 106, 80, 87, 115 (Anzahl der Tiere )<p> </dd></dl>Es soll untersucht werden, ob die unterschiedliche Nahrung einen signifikanten Einfluss auf das Gewicht hat. Der <A HREF="../../m/mi/mittelwert.html" title="Mittelwert">Mittelwert</A> und die <A HREF="../../v/va/varianz.html" title="Varianz">Varianz</A> der beiden Gruppen betragen<p> <dl><dd> </dd><dd><p> </dd></dl>Das zugrunde liegende Wahrscheinlichkeitsmodell setzt voraus, dass die Gewichte der Tiere <A HREF="../../n/no/normalverteilung.html" title="Normalverteilung">normalverteilt</A> sind. Die zu testende <A HREF="../../n/nu/nullhypothese.html" title="Nullhypothese">Nullhypothese</A> ist<p> <dl><dd><dl><dd> "Die Mittelwerte der beiden Gruppen sind gleich"<p> </dd></dl></dd></dl>Offensichtlich unterscheiden sich die Mittelwerte und . Diese Abweichung könnte jedoch auch im Bereich der natürlichen Schwankungen liegen. Um zu prüfen, ob die Unterscheidung signifikant ist, wird eine Testgröße mit bekannter <A HREF="../../w/wa/wahrscheinlichkeitsverteilung.html" title="Wahrscheinlichkeitsverteilung">Wahrscheinlichkeitsverteilung</A> berechnet. Dazu wird zunächst die gemeinsamen Varianz bestimmt:<p> <dl><dd><p> </dd></dl>Anmerkung: Manchmal wird bei dieser Berechnung auch die um eins verringerte Größe der Stichproben verwendet, also statt . Mit Hilfe der gemeinsamen Varianz berechnet sich die Testgröße als:<p> <dl><dd><p> </dd></dl>Die größe ist nach dem zugrunde liegenden Modell eine <A HREF="../../z/zu/zufallsvariable.html" title="Zufallsvariable">Zufallsvariable</A> mit einer -verteilung wobei die Anzahl der Gruppen und die Anzahl der Messwerte sind. Die Indizes werden als <em>Freiheitsgrade</em> bezeichnet. Der Wert der <A HREF="../../f/f_/f_verteilung.html" title="F-Verteilung">F-Verteilung</A> für gegebene Freiheitsgrade (F-<A HREF="../../q/qu/quantil.html" title="Quantil">Quantil</A>) kann in einer Fisher-Tafel nachgeschlagen werden. Dabei muss noch ein gewünschtes Signifikanzniveau (die Irrtumswahrscheinlichkeit) angegeben werden. Im vorliegenden Fall beträgt die Irrtumswahrscheinlichkeit von 5% . Das heisst dass bei allen Werten der Testgröße bis 4,41 die Nullhypothese angenommen werden kann. Da muss die Nullhypothese bei den vorliegenden Werten jedoch verworfen werden.<p> Es kann also mit einer Wahrscheinlichkeit von 95% davon ausgegangen werden, dass die Tiere in den beiden Gruppen im Mittel wirklich ein unterschiedliches Gewicht aufweisen.<p> <em>Siehe auch:</em> <A HREF="../../c/ch/chi_quadrat_test_1.html" title="Chi-Quadrat-Test">Chi-Quadrat-Test</A>, <A HREF="../../s/st/students_t_verteilung.html" title="Students t-Verteilung">t-Verteilung</A><p> <A NAME="Literatur"><H2>Literatur</H2> <ul><li> Fahrmeir u.A. (Hrsg): <em>Multivariate statistische Verfahren</em>. Walter de Gruyter, 1996 </li><li> Fahrmeir u.A.: <em>Statistik - Der Weg zur Datenanalyse</em>. Springer, 1999</li></ul></div><br><div id=footer><table border=0><tr><td> <small>Dies ist ein Artikel aus der freien Enzyklopädie <a href="http://de.wikipedia.org">Wikipedia</a>. Stand: August 2004. Der Artikel steht unter der <a href="http://www.gnu.org/licenses/fdl.txt">GNU Free Documentation License</a>.</small></td></tr></table></div>