Streuung (Statistik)
Unter Streuung fasst man in der deskriptiven Statistik verschiedene Maßzahlen zusammen, die der Einschätzung der Streubreite von Stichprobenwerten um ihren Mittelwert dienen. Die verschiedenen Berechnungsmethoden unterscheiden sich prinzipiell durch ihre Beeinflussbarkeit bzw. Empfindlichkeit gegenüber Ausreißern.
R ist aufgrund der Tatsache, dass - unabhängig von der Stichprobengröße - nur zwei Werte (die so genannten Extremwerte) berücksichtigt werden, nicht robust gegenüber Ausreißern.
Innerhalb des QR kommen 50% aller Messwerte zu liegen, er ist - wie auch der Median bzw Q50 - unempfindlich gegenüber Ausreißern.
Die absolute Abweichung berechnet sich als der Betrag der Abstände der einzelnen Werte vom Median oder arithmetischen Mittelwert. Sie ist robuster als die Standardabweichung. In der Regel wird die Abweichung vom Median verwendet, da das arithmetische Mittel weniger restistent gegenüber Ausreißern ist. Bisweilen wird statt der mittleren Abweichungen auch der Median der Abweichungen verwenden, da die Mittelung auch wieder anfällig gegenüber Ausreißern in den Daten ist.
Quelle: Tukey, JW. Exploratory Data Analysis. Addison-Wesley Publishing Co., Reading, Massachusetts, 1977Maßzahlen
Spannweite (range)
Die Spannweite ist das einfachste Streuungsmaß und berechnet sich einfach als Distanz zwischen dem größten und dem kleinsten Messwert:(Inter-)Quartilabstand ((inter-)quartile range)
Hat man die Quartile Q25 und Q75 berechnet, so bezeichnet man deren Differenz als Quartilabstand oder QR:Mittlere absolute Abweichung
Varianz und Standardabweichung (engl.: variance bzw. standard deviation)
Siehe auch: Varianz, Standardabweichung.Graphische Darstellungsformen
Box-and-Whisker-Plot
Die wörtliche Übersetzung "Kasten-und-Schnurrhaare-Darstellung" deutet auf die Form der im Graphen verwendeten Symbole hin:
___
|
-----
| |
| |
| |
+---+
| |
-----
|
|
___
Dabei markieren die horizontalen Kanten der box das 25- und das 75%-Quartil und die Enden der whiskers die am weitesten außen liegenden "verbundenen" Werte. "Verbunden" sind alle Werte, die nicht mehr als das 1,5-fache des
Interquartilsabstandes von der Box entfernt liegen. Weiter außen liegende Werte werden als Einzelpunkte dargestellt.