Binomialverteilung
Die Binomialverteilung ist eine der wichtigsten diskreten Wahrscheinlichkeitsverteilungen. Sie beschreibt Ergebnisse von Bernoulli-Prozessen.Ein Bernoulli-Prozess (auch: Bernoulli-Kette) besteht aus einer Abfolge mehrerer, unter gleich bleibenden Bedingungen durchgeführter Bernoulli-Versuche.
Ein Bernoulli-Versuch (auch: Bernoulli-Experiment) ist ein Zufallsversuch mit genau zwei möglichen Ergebnissen. Die Wahrscheinlichkeit dieser Ergebnisse wird durch die Bernoulli-Verteilung beschrieben.
Die negative Binomialverteilung wird in einem eigenen Artikel behandelt.
Table of contents |
2 Bernoulli-Prozess und Binomial-Verteilung 3 Eigenschaften der Binomialverteilung 4 Weitere Beispiele: |
Ein Bernoulli-Versuch ist ein Zufallsversuch mit genau zwei möglichen Ergebnissen, die wir im folgenden als Erfolg und Misserfolg bezeichnen werden. Die Wahrscheinlichkeit für einen Erfolg sei p; dann ist die Wahrscheinlichkeit für einen Misserfolg q = 1 - p.
Beispiele:
Bernoulli-Versuch und Bernoulli-Verteilung
Die Bernoulli-Verteilung ist die Wahrscheinlichkeitsverteilung P(X) einer Zufallsvariable X, die bei Erfolg den Wert 1 und bei Misserfolg den Wert 0 annimmt. Die Fallunterscheidung
Ein Bernoulli-Prozess ist ein zeitlich diskreter stochastischer Prozess, der aus einer endlichen oder abzählbar-unendlichen Folge Bernoulli-Versuchen besteht. Er kann durch eine Folge von Zufallsvariablen X1, X2, X3,..., beschrieben werden, deren jede mit der konstanten Wahrscheinlichkeit p den Wert X=1 (Erfolg) und mit der Wahrscheinlichkeit q=1-p den Wert X=0 (Misserfolg) annimmt.
Je nach Fragestellung interessiert man sich für eine oder mehrere der folgenden Zufallsvariablen:
Die Binomialverteilung besitzt den Erwartungswert np und die Varianz npq.
Die Binomialverteilung besitzt die Symmetrie B(k | p,n) = B(k | q,n-k).
Dieses Bild zeigt die Binomialverteilung für p=0.5 und verschiedene Werte von n als Funktion von k:
Diese Funktion ist spiegelsymmetrisch um den Wert k=n/2:
Die Breite der Verteilung wächst proportional zur Standardabweichung σ=(√n)/2. Der Funktionswert bei k=n/2, also das Maximum der Kurve, sinkt proportional zu σ. Dementsprechend kann man Binomialverteilungen mit unterschiedlichem n aufeinander skalieren, indem man die Abszisse k-n/2 durch σ teilt und die Ordinate mit σ multipliziert:
Das folgende Bild zeigt noch einmal reskalierte Binomialverteilungen, nun für andere Werte von n und in einer Auftragung, die besser verdeutlicht, dass sämtliche Funktionswerte mit steigendem n gegen eine gemeinsame Kurve konvergieren. Indem man die Stirling-Formel auf die Binomialkoeffizienten anwendet, findet man, dass diese Kurve (im Bild schwarz durchgezogen) eine Gaußsche Glockenkurve ist:
Und hier die gleichen Daten in einer halblogarithmischen Auftragung, die sehr zu empfehlen ist, wenn man überprüfen möchte, ob auch seltene Ereignisse, die um mehrere Standardabweichungen vom Erwartungswert abweichen, einer Binomial- oder Normalverteilung folgen:
Im Grenzfall großer n konvergiert die Binomialverteilung gegen eine Normalverteilung:
Eine asymptotisch asymmetrische Binomialverteilung, deren Erwartungswert np für große n gegen eine von n unabhängige Konstante λ konvergiert, kann man durch die Poisson-Verteilung nähern:
Bernoulli-Prozess und Binomial-Verteilung
Beispiele:
Eigenschaften:
Die Zufallsvariable K, die angibt, wie viele von n Bernoulli-Versuchen erfolgreich waren, folgt der Binomial-Verteilung. Wir leiten diese Verteilung anhand eines Beispiels her:
Davon verallgemeinert, lautet die Wahrscheinlichkeit, in n Bernoulli-Versuchen genau k mal Erfolg zu haben,
Antwort: Die Wahrscheinlichkeit erst zwei Sechsen, dann drei Nicht-Sechsen zu werfen ist p2q3. Da es auf die Reihenfolge aber nicht ankommt, ist diese Wahrscheinlichkeit zu multiplizieren mit der Anzahl der Möglichkeiten, zwei (ununterscheidbare) Sechserwürfe auf fünf Würfe zu verteilen. Der Kombinatorik zufolge ist diese Anzahl durch den Binomialkoeffizienten "5 über 2" gegeben; die gesuchte Wahrscheinlichkeit lautet also:
mit q=1-p. Diese Funktion heißt Binomial-Verteilung oder binomische Verteilung. Es gibt keine einheitliche Notation; neben B(k | p,n) findet man viele andere Schreibweisen wie zum Beispiel Pp(k|n) oder Wpn(k).Eigenschaften der Binomialverteilung
Symmetrische Binomialverteilung (p gleich 1/2)
wie die folgende Auftragung zeigt:
Dies ist die Wahrscheinlichkeitsdichte zur Standard-Normalverteilung N(0,1). Im zentralen Grenzwertsatz wird dieser Befund dahingehend verallgemeinert, dass auch Folgen anderer diskreter Wahrscheinlichkeitsverteilungen gegen die Normalverteilung konvergieren.Allgemeiner Fall (p≠1/2)
Näherungen im Fall sehr vieler Bernoulli-Versuche
Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np>4 und nq>4. Je asymmetrischer die Binomialverteilung, umso größer muss n sein, bevor die Normalverteilung eine brauchbare Näherung liefert.
Eine Faustregel besagt, dass diese Näherung brauchbar ist, sofern np≤10 und n>1500p.
n | Wahrscheinlichkeit (n) in % |
0 | 32.768 |
1 | 40.96 |
2 | 20.48 |
3 | 5.12 |
4 | 0.64 |
5 | 0.032 |
∑ | 100 |
Erw.Wert | 1 |
Streuung | 0.8 |
n | Wahrscheinlichkeit (n) in % |
0 | 3.457161303360777 |
1 | 13.828645213443108 |
2 | 24.89156138419759 |
3 | 26.55099880981076 |
4 | 18.585699166867535 |
5 | 8.921135600096417 |
6 | 2.973711866698805 |
7 | 0.6797055695311554 |
8 | 0.1019558354296733 |
9 | 0.009062740927082069 |
10 | 0.0003625096370832828 |
∑ | 100 |
Erw.Wert | 2.8571428571428568 |
Streuung | 2.040816326530612 |