Konfidenzintervall
Dieser Artikel enthält mathematische Symbole. Diese werden in der Tabelle mit mathematischen Symbolen erläutert.Mit einem Konfidenzintervall kann man in der mathematischen Statistik die Lage eines Parameters mit einer bestimmten Wahrscheinlichkeit abschätzen.
Table of contents |
2 Ausgewählte Konfidenzintervalle 3 Bemerkung |
Man interessiert sich für den unbekannten Verteilungsparameter einer Zufallsvariablen. Der "wahre" Parameter Γ (Gamma) wird durch eine Schätzfunktion g aus einer Stichprobe vom Umfang n geschätzt. Es wird davon ausgegangen, dass die Stichprobe in etwa die Grundgesamtheit widerspiegelt und dass deshalb die Schätzung in der Nähe des wahren Parameters liegen müsste. Die Schätzfunktion ist eine Zufallsvariable mit einer Verteilung, die den Parameter Γ enthält.
Man kann zunächst mit Hilfe der Verteilung ein Intervall angeben, in das die Zufallsvariable g mit einer Wahrscheinlichkeit 1−α fällt. 1−α wird Konfidenzkoeffizient genannt.
Das Verfahren wird anhand eines mit dem Erwartungswert μ und der Varianz σ2 normalverteilten Merkmals demonstriert: Es soll der Erwartungswert μ dieser Normalverteilung geschätzt werden. Verwendet wird die Schätzfunktion
Man standardisiert und erhält für die standardisierte Zufallsvariable
Beschreibung des Verfahrens
wobei die Zufallsvariable Xi (i=1,...,n) für die i-te Beobachtung sorgt. Es ist
Die Grenzen des Intervalls
in dem mit der Wahrscheinlichkeit 1−α liegt, bestimmen sich aus der Beziehung
Normalverteilung des Mittels
die Wahrscheinlichkeit
wobei z(α/2) das (α/2)-Quantil der Standardnormalverteilung ist. Löst man nach μ auf, resultiert aus dem Zufallsintervall
Es liegt also der wahre Parameter μ mit einer Wahrscheinlichkeit von 1−α in dem durch bestimmten Intervall. Ist die Stichprobe aber extrem ausgefallen, liegt der wahre Parameter nicht in dem Intervall. Dies ist in α·100 % aller Stichproben der Fall.
Von besonderem Interesse ist die Breite des Konfidenzintervalls. Diese bestimmt sich durch die Standardabweichung der Schätzfunktion. Durch Erhöhung des Stichprobenumfangs kann die Breite verringert werden. Erwünscht ist in der Regel ein schmales Konfidenzintervall.
Ausgewählte Konfidenzintervalle
Erwartungswert eines normalverteilten Merkmals mit bekannter Varianz: | |
Erwartungswert eines normalverteilten Merkmals mit unbekannter Varianz. Die Varianz der Grundgesamheit wird durch die Stichprobenvarianz geschätzt. t(1-α;n-1) ist das 1−α-Quantil der t-Verteilung mit n-1 Freiheitsgraden. Für n > 30 kann das Quantil der t-Verteilung näherungsweise durch das der Normalverteilung ersetzt werden. | |
Erwartungswert eines unbekannt verteilten Merkmals mit unbekannter Varianz, falls n>50 ist. | |
Varianz eines normalverteilten Merkmals. χ2(p;k) ist das p-Quantil der >χ2-Verteilung mit k Freiheitsgraden. | |
Anteilswert einer dichotomen Grundgesamtheit bei einem Urnenmodell mit Zurücklegen, falls ist. |
Ist die Zahl N der Elemente in der Grundgesamtheit bekannt, kann auch ein Konfidenzintervall für ein Urnenmodell ohne Zurücklegen angegeben werden. Hier wird die Standardabweichung noch mit einem Korrekturfaktor modifiziert. Wenn der Stichprobenumfang n < 9/(p(1-p)) ist, kann ein exaktes Konfidenzintervall mit Hilfe der F-Verteilung angegeben werden.
Konfidenzintervalle können gelegentlich auch Hypothesentests ersetzen. Beispielsweise testet man in der Regressionsanalyse, ob im multiplen Regressionsmodell mit der geschätzen Regressionshyperebene
Bemerkung
die wahren Regressionskoeffizienten βj (j = 1, ... , m) gleich Null sind. Wenn die Hypothese nicht abgelehnt wird, sind die entsprechenden Regressoren xj vermutlich für die Erklärung der abhängigen Variablen y unerheblich. Eine entsprechende Information liefert das Konfidenzintervall für einen Regressionskoeffizienten: Überstreicht das Konfidenzintervall die Null, kann mit einer Wahrscheinlichkeit von 1-α der Regressionskoeffizient ebenso gut Null sein, d.h. er ist statistisch insignifikant.