Häufigkeitsverteilung
Eine Häufigkeitsverteilung ist eine Methode zur statistischen Beschreibung von Daten (Messwerten, Merkmalswerten). Mathematisch gesehen ist eine Häufigkeitsverteilung eine Funktion, zu jedem vorgekommenen Wert angibt, wie häufig dieser Wert vorgekommen ist. Man kann eine solche Verteilung als Tabelle, als Grafik oder modellhaft über eine Funktionsgleichung beschreiben.Die Häufigkeitsverteilung ist in der Deskriptiven Statistik, was die Wahrscheinlichkeitsverteilung in der Wahrscheinlichkeitstheorie ist; für eine Darstellung mathematischer Funktionen, die zur Näherung von Häüfigkeitsverteilungen herangezogen werden (wie zum Beispiel die Normalverteilung), siehe den Artikel Wahrscheinlichkeitsverteilung.
Die Datenmenge bildet die zunächst ungeordnete Urliste. Als erstes wird die Urliste geordnet oder sortiert. Aus der geordneten Urliste lassen sich bereits Medianwert, Spannweite, Quantile und Interquantilbereiche entnehmen.
Dann fassen wir gleiche Werte zusammen und notieren zu jedem Wert, wie oft er vorkommt, seine absolute Häufigkeit. Beziehen wir die absoluten Häufigkeiten auf die Gesamtzahl der Werte, den Probenumfang, erhalten wir die relativen Häufigkeiten.Wir haben nun eine geordnete Menge von Wertepaaren (Merkmalswert und zugehörige relative Häufigkeit).
Addieren wir - beim kleinsten Merkmalswert beginnend - die relativen Häufigkeiten auf und ordnen jedem Merkmalswert die bis dahin erreichte Summe (einschließlich seines eigenen Beitrags) zu, so erhalten wir die Verteilungssumme. Sie gibt für jeden Merkmalswert an, wie groß der Anteil der Werte kleiner oder gleich dem zugehörigen Merkmalswert ist. Der Anteil beginnt mit 0 und geht bis 1 oder 100 %. Stellt man die Tabelle grafisch dar, ergibt sich eine schwach monoton steigende Kurve, meist in gestreckter S-Form. Es gibt zahlreiche Versuche, reale Verteilungssummen durch Funktionsgleichungen näherungsweise wiederzugeben. Die Verteilungssummen in Abhängigkeit von den Merkmalswerten sind die einfachste Art der Darstellung einer Häufigkeitsverteilung.
Die weitere Rechnung erfordert eine Einteilung der Merkmalswerte in Klassen. Man gelangt dann zu den Verteilungsdichten, die im Fall einer stetigen Verteilung die Ableitung der Verteilungssummenfunktion nach dem Merkmalswert sind. Ferner lässt sich die Häufigkeit nicht nur durch Zählen ermittelns, sondern beispielsweise auch durch Wägen. Wir erhalten dann eine Massenverteilung anstelle einer Anzahlverteilung. Im Prinzip eignet sich jede additive Größe zum Messen der Häufigkeit.
Siehe auch
Literatur