Entscheidungsbaum<meta http-equiv="Content-type" content="text/html; charset=utf-8"> <link rel="shortcut icon" href="../../favicon.ico"><link rel="stylesheet" href="../../wikistatic.css"></head> <body><div id=topbar><table width='98%' border=0><tr><td><a href="../../h/ha/hauptseite.html" title="Hauptseite">Hauptseite</a> | <b><a href="http://de.wikipedia.org/wiki/Entscheidungsbaum" title="Entscheidungsbaum">Aktueller Wikipedia-Artikel</a></b></td> <td align=right nowrap><form name=search class=inline method=get action="../../../search/search.html"><input name=search size=19><input type=submit value=Search></form></td></tr></table></div> <div id=article><h1>Entscheidungsbaum</h1><strong>Entscheidungsbäume</strong> sind eine spezielle Darstellungsform von Entscheidungsregeln. Sie veranschaulichen aufeinanderfolgende hierarchische Entscheidungen. Sie haben eine Bedeutung in der <ul><li> Wahrscheinlichkeitsrechnung mit bedingten Wahrscheinlichkeiten (Beispiel bei <A HREF="../../a/ab/absolute_ha_ufigkeit.html" title="Absolute Häufigkeit">Absolute Häufigkeit</A>), </li><li> im <A HREF="../../d/da/data_mining.html" title="Data-Mining">Data-Mining</A> und </li><li> <A HREF="../../e/en/entscheidungstheorie.html" title="Entscheidungstheorie">Entscheidungstheorie</A>:in der ärztlichen Entscheidungsfindung (Medizin) und in der Notfall-Medizin (engl.).<p> </li></ul> <p><table border="0" id="toc"><tr><td align="center"> <b>Table of contents</b> <script type='text/javascript'>showTocToggle("show","hide")</script></td></tr><tr id='tocinside'><td align="left"> <div style="margin-left:2em;"> </div> </div> <A CLASS="internal" HREF="#Funktionsweise">1 Funktionsweise</A><BR> <A CLASS="internal" HREF="#Beispiel einer Anwendung">2 Beispiel einer Anwendung</A><BR> <A CLASS="internal" HREF="#Vor- und Nachteile">3 Vor- und Nachteile</A><BR> <A CLASS="internal" HREF="#Wirksamkeit und Fehlerrate">4 Wirksamkeit und Fehlerrate</A><BR> <A CLASS="internal" HREF="#Kombination mit Neuronalen Netzen">5 Kombination mit Neuronalen Netzen</A><BR> <A CLASS="internal" HREF="#Algorithmen im Vergleich">6 Algorithmen im Vergleich</A><BR> <A CLASS="internal" HREF="#Anwendungsprogramme">7 Anwendungsprogramme</A><BR> <A CLASS="internal" HREF="#Siehe auch">8 Siehe auch</A><BR> <A CLASS="internal" HREF="#Weblinks">9 Weblinks</A><BR> </td></tr></table><P> <A NAME="Funktionsweise"><H2>Funktionsweise</H2> Entscheidungsbäume beginnen mit einem Stamm, an dessen Ende sich eine <A HREF="../../v/ve/verzweigung.html" title="Verzweigung">Verzweigung</A> befindet, die in mehrere - mit Wahrscheinlichkeiten versehene - wiederum verzweigte Äste führt. Jeder Endpunkt des Baums ist durch einen eindeutigen Weg erreichbar.<p> Entscheidungsbäume werden verwendet, um besser und mit weniger Fehlern eine Entscheidung treffen zu können. Im binären Entscheidungsbaum wird eine Serie von Fragen gestellt, welche alle mit Ja oder Nein beantwortet werden können. Diese Serie ergibt ein Resultat, welches durch eine Regel bestimmt ist. Die Regel ist einfach ablesbar, wenn man von der Wurzel her den Ästen des Baumes folgt, bis man zu einem bestimmten Blatt gelangt, welches das Resultat der Fragereihe darstellt. <p> Entscheidungsbäume trennen die Daten in mehrere Gruppen, welche jeweils durch eine Regel mit mindestens einer Bedingung bestimmt werden.<p> Um eine <A HREF="../../k/kl/klassifikation.html" title="Klassifikation">Klassifikation</A> abzulesen, geht man dem Baum entlang abwärts. Bei jedem Knoten wird ein Attribut abgefragt und ein Entscheid getroffen. Dieses Prozedere wird so lange fortgesetzt, bis man ein Blatt erreicht.<p> Generiert werden die Entscheidungsbäume üblicherweise im Top-Down-Prinzip. Bei jedem Schritt wird das Attribut gesucht, mit welchem man die Daten am besten klassifizieren kann. Dieses Attribut wird zur Aufteilung der Daten gebraucht, so dass man die verbliebenen, noch nicht klassifizierten Daten, in weiteren Schritten separat betrachten kann. Entscheidungsbäume werden deshalb auch Klassifikationsbäume genannt.<p> Entscheidungsbäume können als Systeme zur Regelinduktion angesehen werden. Sie sind einfach und verständlich präsentierbar. Ihre Generierung ist schnell durchführbar.<p> <A NAME="Beispiel einer Anwendung"><H2>Beispiel einer Anwendung</H2> Eine Bank möchte mit einer Direct Mailing- Aktion einen neuen Service verkaufen. Um den Gewinn zu maximieren, sollen mit der Aktion diejenigen Haushalte angesprochen werden, welche der Kombination von demografischen Variablen entsprechen, die der entsprechende Entscheidungsbaum als optimal erklärt hat. Dieser Prozess wird Data Segmentation oder auch <em>Segmentation Modeling</em> genannt.<p> Der Entscheidungsbaum liefert also gute Tipps, wer positiv auf den Versand reagieren könnte. Dies erlaubt der Bank, nur diejenigen Haushalte anzuschreiben, welche der Zielgruppe entsprechen.<p> <A NAME="Vor- und Nachteile"><H2>Vor- und Nachteile</H2> Die mögliche Größe der Entscheidungsbäume kann sich negativ auswirken. Jede einzelne Regel ist zwar leicht abzulesen, den Gesamtüberblick zu haben ist jedoch sehr schwierig. Es wurden deshalb so genannte Pruning-Methoden entwickelt, welche die Entscheidungsbäume auf eine vernünftige Größe kürzen. Beispielsweise kann man die maximale Tiefe der Bäume beschränken oder eine Mindestanzahl der Objekte pro Knoten festlegen.<p> Oft bedient man sich der Entscheidungsbäume nur als Zwischenschritt zu einer effizienteren Darstellung des Regelwerkes. Um zu den Regeln zu gelangen, werden durch verschiedene Verfahren unterschiedliche Entscheidungsbäume generiert. Dabei werden häufig auftretende Regeln extrahiert. Die Optimierungen werden überlagert, um einen robusten, allgemeinen und korrekten Regelsatz zu erhalten. Dass die Regeln in keinerlei Beziehungen zueinander stehen und dass widersprüchliche Regeln erzeugt werden können, wirkt sich nachteilig auf diese Methode aus.<p> Ein großer Vorteil von Entscheidungsbäumen ist, dass sie gut erklärbar und nachvollziehbar sind. Dies erlaubt dem Benutzer, das Ergebnis auszuwerten und Schlüsselattribute zu erkennen. Dies ist vor allem nützlich, wenn die Qualität der Daten nicht bekannt ist. Die Regeln selber können ohne großen Aufwand in eine einfache Sprache wir <A HREF="../../s/sq/sql.html" title="SQL">SQL</A> übernommen werden.<p> <A NAME="Wirksamkeit und Fehlerrate"><H2>Wirksamkeit und Fehlerrate</H2> Die Wirksamkeit eines Entscheidungsbaumes kann an der Anzahl Prozentpunkte abgelesen werden, welche die Daten korrekt klassifizieren. Einige Regeln funktionieren besser als andere.<p> <A NAME="Kombination mit Neuronalen Netzen"><H2>Kombination mit Neuronalen Netzen</H2> Entscheidungsbäume werden häufig als Basis für <A HREF="../../n/ne/neuronales_netz.html" title="Neuronales Netz">Neuronale Netze</A> verwendet. Sie brauchen nicht so viele Beispiele wie die Neuronalen Netze. Dafür können sie ziemlich ungenau sein, besonders wenn sie klein sind. Große Bäume bergen hingegen die Gefahr, dass etliche Beispiele bei den Trainingsfällen nicht gesehen und registriert werden. Deshalb versucht man Entscheidungsbäume mit Neuronalen Netzen zu kombinieren. Daraus entstanden die so genannten TBNN, welche die Regeln der Entscheidungsbäume in die Neuronalen Netze übersetzen.<p> <A NAME="Algorithmen im Vergleich"><H2>Algorithmen im Vergleich</H2> Die Methoden der Entscheidungsfindung änderten sich ziemlich stark in den letzten Jahrzehnten, mit dem Aufkommen der aktuellen Algorithmen. Einige Fachbegriffe wie Wurzel, Kante, Knoten u.ä. wurden allerdings schon sehr früh benutzt. Noch nicht sehr alt sind die verschiedenen Algorithmen, die zur Berechnung der Entscheidungsbäume verwendet werden.<p> Die Praxis unterscheidet verschiedene unterschiedliche Baumtypen. Am bekanntesten sind die <A HREF="../../c/ca/cart__algorithmus_.html" title="CART (Algorithmus)">CARTs</A> (<em>Classification And Regression Trees</em>) und die CHAIDs (<em>Chi-square Automatic Interaction Detectors</em>). In letzter Zeit häufig verwendet wurde auch der <A HREF="../../c/c4/c4_5.html" title="C4.5">C4.5</A>-Algorithmus. Früher wurde stattdessen oft der <A HREF="../../i/id/id3.html" title="ID3">ID3</A>-Algorithmus verwendet.<p> <A NAME="Anwendungsprogramme"><H2>Anwendungsprogramme</H2> Es gibt etliche Anwendungsprogramme, die Entscheidungsbäume implementiert haben. So zum Beispiel die beiden Statistiksoftwarepakete <A HREF="../../s/sp/spss.html" title="SPSS">SPSS</A> und <A HREF="../../s/sa/sas_institute.html" title="SAS Institute">SAS</A>. Beide verwenden übrigens - wie die meisten anderen Data Mining-Software-Pakete auch - den CHAID-Algorithmus.<p> <A NAME="Siehe auch"><H2>Siehe auch</H2> <A HREF="../../k/ka/ka_nstliche_intelligenz.html" title="Künstliche Intelligenz">Künstliche Intelligenz</A>, <A HREF="../../m/ma/maschinelles_lernen.html" title="Maschinelles Lernen">Maschinelles Lernen</A>, <A HREF="../../n/ne/neuronales_netz.html" title="Neuronales Netz">Neuronales Netz</A>, <A HREF="../../t/to/top_down_induction_of_decision_trees.html" title="Top-Down Induction of Decision Trees">Top-Down Induction of Decision Trees</A><p> <A NAME="Weblinks"><H2>Weblinks</H2> <ul><li> <A HREF="http://www.medical-cybernetics.de/methods/decis-theory/<p></li></ul>" class="external">http://www.medical-cybernetics.de/methods/decis-theory/<p></li></ul></A></div><br><div id=footer><table border=0><tr><td> <small>Dies ist ein Artikel aus der freien Enzyklopädie <a href="http://de.wikipedia.org">Wikipedia</a>. Stand: August 2004. Der Artikel steht unter der <a href="http://www.gnu.org/licenses/fdl.txt">GNU Free Documentation License</a>.</small></td></tr></table></div>