Multivariate Verfahren
Mit Multivariaten Verfahren werden multivariat verteilte statistische Variablen untersucht. Man betrachtet hier nicht eine Variable isoliert (univariat verteilt), sondern das Zusammenwirken mehrerer Variablen zugleich, ihre Abhängigkeitsstruktur.Häufig verwendete Multivariate Methoden sind
- Diskriminanzanalyse
- Hauptkomponentenanalyse
- Faktorenanalyse
- Clusteranalyse
- Multidimensionale Skalierung
Die klassischen Verfahren sind durchwegs lineare Modelle, die besondere Anforderungen an die verwendeten Daten stellen. So sollten die Daten ausreißerfrei und nicht asymmetrisch verteilt sein. Bei Abweichen der Daten von der geforderten Struktur behilft man sich beispielsweise, indem man vorhandene Ausreißer entfernt oder die Daten einer nichtlinearen Transformation, etwa Logarithmieren unterzieht. Es existieren auch vielfach alternative Methoden, die iterativ gewonnene Lösungen ermöglichen.
Häufig verwendete Kriterien für eine optimale Lösung sind
- Distanzen zwischen Punkten im mehrdimensionalen Raum. Erwähnenswert ist hier vor allem die Mahalanobis-Distanz, die man grob vereinfacht als Quadrat der Euklidischen Distanz bezeichnen könnte.
- Varianzen, die minimiert bzw. maximiert werden. Die Varianz dient in der Informationstheorie als Maß für den Informationsgehalt von Daten.
Zweifelhaft ist die intensive Verwendung dieser Verfahren mit rangskalierten Daten, beispielsweise die Auswertung von Fragebögen in der Psychologie.
für Anwendung der Multivariaten Verfahren:
Beispiele