Data-Mining
Unter Data-Mining versteht man das systematische (in der Regel automatisierte oder halbautomatische) Entdecken und Extrahieren unbekannter, nicht trivialer und wichtiger Informationen aus großen Mengen von Daten. Data-Mining wird neben Text-Mining oder OLAP zu den Methoden des Business Intelligence gezählt.
Im Gegensatz zum Abrufen von vorgegebenen Standardabfragen (z. B. durch OLAP) werden im Data-Mining, als einem kreativen Prozess, im Arbeitsfortschritt Hypothesen entwickelt und überprüft. Die Datenbestände werden nach Regelmäßigkeiten, Mustern und Strukturen, Abweichungen, jeglicher Art von Beziehungen und gegenseitigen Beeinflussungen untersucht. Der Prozess der Mustererkennung und Wissensextraktion wird auch 'Knowledge Discovery in Databases' (KDD) genannt.
Verschiedene Data-Mining-Verfahren sind:
- Clusteranalyse (Gruppierung von Objekten aufgrund von Ähnlichkeiten) - Assoziationsregeln (z.B. Warenkorbanalyse) - Klassifikation (Einordnung von Objekten in bestimmte Klassen/Kategorien, z.B. mit Entscheidungsbäumen) - Regressionsanalyse
Table of contents |
2 Verwandte Gebiete |
• Kundensegmentierung im Marketing (in Bezug auf ähnliches Kaufverhalten bzw. Interessen, gezielte Werbemassnahmen)
Besonderheiten von Textdokumenten:
Möglicher Ansatz:
Vergleich zweier Dokumente ist der Vergleich der Vektoren des jeweiligen Dokumentes. Dazu werden die Vektoren normiert (Einheitsvektor?) und der Cosinus zwischen den Vektoren bestimmt.
Das Verfahren dient zur Bestimmung:
Im analytischen CRM kommt es darauf an, möglichst viel und alles wichtige an Wissen aus den in den Kundendaten erhaltenen Informationen zu gewinnen.
So lassen sich Abwanderungstendenzen, Betrugstatbestände usw. aber auch neue Zielgruppenmerkmale aus den Daten lesen. Durch das analytische CRM kann man Eigenschaften, Verhaltensweisen und Wertschöpfungspotenziale von Kunden besser erkennen und einschätzen.
Siehe auch:
Anwendungsgebiete
• Warenkorbanalyse (zur Preisoptimierung, Produktplatzierung im Supermarkt)
• Web Usage Mining (Web Mining, Personalisierung von Web-Sites -> Erstellung von Zugriffsprofilen)
• Text-Mining (Anwendung von Data-Mining-Verfahren auf große Mengen von (Online-)Textdokumenten)
• unstrukturiert
• Probleme des automatischen Textverstehens (vage Inhalte, Metaphern-Gebrauch, gleiches Wort kann verschiedene Bedeutungen haben...)
• Inkonsistenzen möglich
• verschiedene Sprachen
Zunächst werden aus den Textdokumenten Metadaten erzeugt und auf diese die Datamining Techniken angewandt.
Transformation von jedem einzelnen Dokument in ein hochdimensionalen Vektor (100000 Dimensionen und mehr) von Term-Häufigkeiten (Term: 1 oder mehrere aufeinanderfolgende Wörter). Der Text wird dann durch Punkte im hochdimensionalen Raum präsentiert; die Wortreihenfolge bleibt unberücksichtigt.
Ähnlichkeit: <- Skalarprodukt
- wie ähnlich Dokumente sind
- Clusterung von ähnlichen Dokumenten zu bestimmten Themengebiet
-...CRM Management von Kundenbeziehungen
Verwandte Gebiete
Datenanalyse,
Künstliche Intelligenz,
Statistik,
Information-Retrieval,
Bibliometrie,
Informationsmanagement und Wissensmanagement,
Web Mining,
Text-Mining