Segmentierung (Bildbearbeitung)<meta http-equiv="Content-type" content="text/html; charset=utf-8"> <link rel="shortcut icon" href="../../favicon.ico"><link rel="stylesheet" href="../../wikistatic.css"></head> <body><div id=topbar><table width='98%' border=0><tr><td><a href="../../h/ha/hauptseite.html" title="Hauptseite">Hauptseite</a> | <b><a href="http://de.wikipedia.org/wiki/Segmentierung_(Bildbearbeitung)" title="Segmentierung (Bildbearbeitung)">Aktueller Wikipedia-Artikel</a></b></td> <td align=right nowrap><form name=search class=inline method=get action="../../../search/search.html"><input name=search size=19><input type=submit value=Search></form></td></tr></table></div> <div id=article><h1>Segmentierung (Bildbearbeitung)</h1>Die <strong>Segmentierung</strong> ist ein Teilgebiet der digitalen <A HREF="../../b/bi/bildverarbeitung.html" title="Bildverarbeitung">Bildverarbeitung</A>, spezieller des <A HREF="../../c/co/computer_vision.html" title="Computer Vision">maschinellen Sehens</A>. Die Erzeugung von inhaltlich zusammenhängenden Regionen durch Zusammenfassung benachbarter <A HREF="../../p/pi/pixel.html" title="Pixel">Pixel</A> oder <A HREF="../../v/vo/voxel.html" title="Voxel">Voxel</A> entsprechend einem bestimmten Homogenitätskriterium bezeichnet man als Segmentierung.<p> <p><table border="0" id="toc"><tr><td align="center"> <b>Table of contents</b> <script type='text/javascript'>showTocToggle("show","hide")</script></td></tr><tr id='tocinside'><td align="left"> <div style="margin-left:2em;"> </div> </div> <A CLASS="internal" HREF="#Einordnung">1 Einordnung</A><BR> <A CLASS="internal" HREF="#Eigenschaften">2 Eigenschaften</A><BR> <A CLASS="internal" HREF="#Verfahren">3 Verfahren</A><BR> <div style="margin-left:2em;"> <A CLASS="internal" HREF="#Pixelorientierte Verfahren">3.1 Pixelorientierte Verfahren</A><BR> <A CLASS="internal" HREF="#Kantenorientierte Verfahren">3.2 Kantenorientierte Verfahren</A><BR> <A CLASS="internal" HREF="#Regionenorientierte Verfahren">3.3 Regionenorientierte Verfahren</A><BR> <A CLASS="internal" HREF="#Modellbasierte Verfahren">3.4 Modellbasierte Verfahren</A><BR> <A CLASS="internal" HREF="#Texturorientierte Verfahren">3.5 Texturorientierte Verfahren</A><BR> </div> <A CLASS="internal" HREF="#Probleme">4 Probleme</A><BR> <A CLASS="internal" HREF="#Anwendungen">5 Anwendungen</A><BR> <A CLASS="internal" HREF="#Software">6 Software</A><BR> <div style="margin-left:2em;"> <A CLASS="internal" HREF="#eCognition">6.6 eCognition</A><BR> <A CLASS="internal" HREF="#Bildbarbeitungsprogramme">6.7 Bildbarbeitungsprogramme</A><BR> <A CLASS="internal" HREF="#Schrifterkennungsprogramme">6.8 Schrifterkennungsprogramme</A><BR> </div> <A CLASS="internal" HREF="#Referenzen">7 Referenzen</A><BR> <div style="margin-left:2em;"> <A CLASS="internal" HREF="#Literatur">7.9 Literatur</A><BR> <A CLASS="internal" HREF="#Weblinks">7.10 Weblinks</A><BR> </td></tr></table><P> <A NAME="Einordnung"><H2>Einordnung</H2> Segmentierung ist im Prozess des maschinellen Sehens üblicherweise der erste Schritt der Bildanalyse und kommt nach der Bildvorverarbeitung. Hier der Ablauf:<p> <em>Szene</em> -> Bildaufnahme -> Bildvorverarbeitung -> <strong>Segmentierung</strong> -> Merkmalsextraktion -> <A HREF="../../k/kl/klassifizierung.html" title="Klassifizierung">Klassifizierung</A> -> <em>Aussage</em><p> <A NAME="Eigenschaften"><H2>Eigenschaften</H2> Man spricht von einer <strong>vollständigen</strong> Segmentierung, wenn jeder Pixel (mindestens) einem Segment zugeordnet wird. Bei einer <strong>überdeckungsfreien</strong> Segmentierung wird jeder Pixel höchstens einem Segment zugeordnet. Bei einer vollständigen <em>und</em> überdeckungsfreien Segmentierung ist jeder Pixel also <em>genau</em> einem Segment zugeordnet. Eine Segmentierung nennt man <strong>zusammenhängend</strong>, wenn jedes Segment ein zusammenhängendes Gebiet bildet.<p> <A NAME="Verfahren"><H2>Verfahren</H2> Es sind viele Verfahren zur automatischen Segmentierung bekannt. Grundsätzlich werden sie oft in pixel-, kanten- und regionenorientierte Verfahren eingeteilt. Zusätzlich unterscheidet man modellbasierte Verfahren, bei denen man von einer bestimmten Form der Objekte ausgeht, und texturbasierte Verfahren, bei denen auch eine innere homogene Struktur der Objekte berücksichtigt wird.<p> Die Grenzen zwischen den Verfahren sind oft fließend. Auch kann man verschiedene Verfahren kombinieren, um bessere Ergebnisse zu erzielen.<p> Natürlich kann man auch in einem nichtautomatischen Verfahren die Segmentierung ausführen, sprich ein Mensch nimmt die Einteilung vor. Da die automatischen Verfahren weit entfernt sind von Perfektion, gibt es auch die Möglichkeit zur semiautomatischen Bearbeitung.<p> <A NAME="Pixelorientierte Verfahren"><H3>Pixelorientierte Verfahren</H3> Pixelorientierte Verfahren, treffen für jeden einzelnen Bildpunkt eine Entscheidung, ob er zu einem bestimmten Segment gehört oder nicht. Diese Entscheidung kann, aber muss nicht, durch die Umgebung beeinflusst sein. Punktorientierte Verfahren sind meist einfach zu berechnen, liefern per se aber erstmal keine zusammenhängenden Segmente.<p> Das verbreitetste Verfahren ist sicherlich das <A HREF="../../s/sc/schwellwertverfahren.html" title="Schwellwertverfahren">Schwellwert-Verfahren</A>. Eine Verallgemeinerung dieses Ansatzes stellen Klassifikatoren dar.<p> <A NAME="Kantenorientierte Verfahren"><H3>Kantenorientierte Verfahren</H3> In diesen Verfahren wird im Bild nach <A HREF="../../k/ka/kante__geometrie_.html" title="Kante (Geometrie)">Kantenn</A> oder Objektübergängen gesucht. Viele Algorithmen liefern noch keine geschlossenen Kantenzüge, diese müssen erst mit weiteren Verfahren zusammengefügt werden, damit sie Objekte einschließen. Eigentlich liegen Kanten immer <em>zwischen</em> den Pixeln eines Bildes. Die Ergebnisse eines Algortihmus können <A HREF="../../p/po/polygon.html" title="Polygon">Polygone</A> (bzw. Linien) sein, aber manche Operationen liefern die Kanten auch als andersfarbige Pixel.<p> Mit Verfahren wie dem Sobel-Operator und dem <A HREF="../../l/la/laplace_operator.html" title="Laplace-Operator">Laplace-Operator</A>, sowie einer Gradientensuche lassen sich zu einer Kante gehörige Pixel finden. Diese sind aber noch lose und müssen mit Kantenverfolgungsalgorithmen komplettiert werden. Ein populäres Verfahren zur Erzeugung einer zusammenhängenden Objektsilhouette oder zumindest von Kantenzügen aus den Kantenpixeln ist das Live-Wire Verfahren der Autoren E. Mortensen und W. A. Barrett. Die Idee kann anschaulich gesprochen mit einem Navigationsystem verglichen werden, welches einen optimalen Weg vom Start- zum Zielort ermittelt. Optimal bedeutet im Kontext der Segmentierung, dass der Weg zwischen Start und Ziel immer über die stärksten Kantenpixel führt. Die optimale Wegewahl ist dann ein Standardproblem der Informatik und kann beispielsweise mit einer Breitensuche gelöst werden.<p> Ein ebenfalls sehr bekanntes Verfahren ist die <A HREF="../../w/wa/wasserscheidentransformation.html" title="Wasserscheidentransformation">Wasserscheidentransformation</A>, die auf Graustufenbildern arbeitet und immer geschlossene Kantenzüge liefert. Weitere Verfahren sind parallele und sequentielle Kantenextraktion, optimale Kantensuche, aktive Konturen (siehe <A HREF="http://www-ibt.etec.uni-karlsruhe.de/forschung/aktivekonturen/" class="external">[1]</A>), Active Shape Models und Snakes.<p> <A NAME="Regionenorientierte Verfahren"><H3>Regionenorientierte Verfahren</H3> Diese Verfahren betrachten Punktmengen als Gesamtheit und versuchen dadurch zusammenhängende Objekte zu finden. Häufige Verwendung finden die Verfahren des Region-Growing, Region-Splitting, Pyramid Linking und Split and Merge.<p> <A NAME="Modellbasierte Verfahren"><H3>Modellbasierte Verfahren</H3> Hierbei wird ein Modell der gesuchten Objekte zugrundegelegt. Dies kann beispielsweise die Form betreffen. Man setzt also Wissen über das Bild mit ein. Ein bekanntes Verfahren ist die Hough-Transformation, mit deren Hilfe man Punkte zu Linien oder Kreisen zusammenfügen kann, indem man sie in einem Parameterraum abbildet. Ebenfalls finden statistische Modelle und Segmentierung über Templates (Template-Matching) Verwendung. Bei letzterem Verfahren wird im Bild nach gegebenen Vorlagen gesucht.<p> <A NAME="Texturorientierte Verfahren"><H3>Texturorientierte Verfahren</H3> Manche Bildobjekte besitzen keine einheitliche Farbe, sondern eine einheitliche <A HREF="../../t/te/textur.html" title="Textur">Textur</A>. Beispielsweise kann ein Objekt Rillen besitzen, die dann in der Fotografie als abwechselnde Streifen dunkler und heller Farbe erscheinen. Damit diese Objekte nicht in viele kleine Objekte anhand der Textur zerlegt werden, benutzt man Ansätze, mit denen man versucht diesem Problem zu begegnen. Diese Verfahren sind teilweise im Grenzbereich zur Klassifikation oder erlauben gleichzeitige Segmentierung und Klassifizierung.<p> <ul><li> Cooccurence-Matrizen (Haralick-Matrizen) </li><li> Texturenergiemaße (Texture-Energy-Measure) </li><li> Lauflängenmatrizen (Run-Length-Matrix) </li><li> fraktale Dimensionen und Maße </li><li> Markoff-Random-Fields und Gibbs-Potentiale </li><li> strukturelle Ansätze </li><li> signaltheoretische Konzepte<p> </li></ul><A NAME="Probleme"><H2>Probleme</H2> Oftmals ist die <A HREF="../../q/qu/qualita_t.html" title="Qualität">Qualität</A> einer Segmentierung nicht optimal. In diesen Fällen kann man ein besseres Verfahren wählen, oder die Ergebnisse optimieren, indem man eine <strong>Vorbearbeitung</strong> (auch <em>Preprocessing</em>) oder eine <strong>Nachbearbeitung</strong> anschließt. Beides kann sowohl automatisch (wenn man die Probleme des Prozesses bereits identifiziert hat), als auch händisch erfolgen.<p> Ein Problem vieler Segmentierungsalgorithmen ist die Anfälligkeit für wechselnde Beleuchtung innerhalb des Bildes. Dies kann dazu führen, dass immer nur ein Bildteil korrekt segmentiert wird, in den anderen die Segmentierung aber unbrauchbar ist. Helligkeitsunterschiede kann man mit einer Vorbearbeitung ausgleichen, zum Beispiel indem man eine Shading-Korrektur anwendet.<p> Häufige Probleme sind beispielsweise <strong>Übersegmentierung</strong> (zu viele Segmente) und <strong>Untersegmentierung</strong> (zu wenige Segmente). Dem kann man begegnen, indem man das Verfahren um Wissen der zu verarbeitenden Daten anreichert, im einfachsten Fall kann man die erwartete Anzahl der Segmente angeben. Außerdem kann man einen nachfolgenden Klassifikationsschritt einfügen, um gleich klassifizierte Segmente zusammenzufassen. Natürlich können die Segmente auch per Hand zusammengefasst werden.<p> Viele der vorgestellten Algorithmen (Schwellwertverfahren, Wasserscheidentransformation) arbeiten nur auf einkanaligen Graustufenbildern. Bei der Verarbeitung von Mehrkanalbildern (zum Beispiel Farbbildern) bleiben Informationen ungenutzt. Man benötigt weitere Bearbeitungsschritte, um mehrere einkanalige Segmentierungen zusammenzufassen.<p> <A NAME="Anwendungen"><H2>Anwendungen</H2> Segmentierung ist oft der erste Schritt der Bildanalyse für eine anschließende Weiterverarbeitung der Daten, beispielsweise eine <A HREF="../../k/kl/klassifizierung.html" title="Klassifizierung">Klassifizierung</A>.<p> Die Anwendungen für solche Verfahren sind vielfältig. Am häufigsten werden derzeit automatische Segmentierungen in der <A HREF="../../m/me/medizin.html" title="Medizin">Medizin</A> angewandt, zum Beispiel in der <A HREF="../../c/co/computertomografie.html" title="Computertomografie">Computertomographie</A> oder in der <A HREF="../../m/ma/magnetresonanztomografie.html" title="Magnetresonanztomografie">Magnetresonanztomographie</A>. Auch in der Geodatenverarbeitung werden Segmentierungen verwendet, beispielsweise werden Satellitenbilder oder Luftbilder (siehe <A HREF="../../f/fe/fernerkundung.html" title="Fernerkundung">Fernerkundung</A>) zu geometrischen Daten segmentiert. Auch zur automatischen optischen Qualitätskontrolle von Werkstücken (zum Beispiel: ist das Bohrloch an der richtigen Stelle?) wird Segmentierung verwendet. Ebenfalls wird Segmentierung in der <A HREF="../../t/te/texterkennung.html" title="Texterkennung">Schrifterkennung</A> (OCR) verwendet, um durch Binarisierung des gescannten Bildes Schrift vom Hintergrund zu trennen.<p> <A NAME="Software"><H2>Software</H2> <A NAME="eCognition"><H3>eCognition</H3> eCognition ist eine in der Fernerkundung und Medizin angewendete kommerzielle Bildsegmentierungssoftware mit Klassifizierungswerkzeug (siehe: <A HREF="http://www.definiens-imaging.com" class="external">http://www.definiens-imaging.com</A> )<p> <A NAME="Bildbarbeitungsprogramme"><H3>Bildbarbeitungsprogramme</H3> Viele Bildbearbeitungsprogramme, wie das freie <A HREF="../../g/gi/gimp.html" title="Gimp">GIMP</A> und das kostenlose <A HREF="../../i/ir/irfanview.html" title="IrfanView">IrfanView</A> bieten einfache Segmentierungsalgorithmen an, wie etwa nach Schwellwertverfahren oder Kantendetektion mit Sobel- oder Laplace-Operatoren.<p> <A NAME="Schrifterkennungsprogramme"><H3>Schrifterkennungsprogramme</H3> Schrifterkennungsprogramme können als ersten Schritt eine Segmentierung einsetzen, um die Schrift vom Hintergrund zu trennen.<p> <A NAME="Referenzen"><H2>Referenzen</H2><p> <A NAME="Literatur"><H3>Literatur</H3> <ul><li> Thomas Lehmann, Walter Oberschelp, Erich Pelikan, Rudolf Repges: <em>Bildverarbeitung für die Medizin</em>, Springer-Verlag Berlin Heidelberg, <A HREF="../../1/19/1997.html" title="1997">1997</A>, ISBN 3-540-61458-3 </li><li> Bernd Jähne: <em>Digitale Bildverarbeitung</em>, 5., überarbeitete und erweiterte Auflage, Springer-Verlag, <A HREF="../../2/20/2002.html" title="2002">2002</A>, ISBN 3-540-41260-3 </li><li> Dr. Rainer Steinbrecher: <em>Bildverarbeitung in der Praxis</em>, R. Oldenbourg Verlag München Wien, <A HREF="../../1/19/1993.html" title="1993">1993</A>, ISBN 3-489-22372-0 </li><li> Rafael C. Gonzalez, Richard E. Woods: <em>Digital Image Processing</em>, Addison-Wesley Publishing Company, <A HREF="../../1/19/1992.html" title="1992">1992</A>, ISBN 0-201-50803-6 (englisch) </li><li> Thomas Bräunl, Stefan Feyrer, Wolfgang Rapf, Michael Reinhardt: <em>Parallele Bildverarbeitung</em>, Addison-Wesley Publishing Company, <A HREF="../../1/19/1995.html" title="1995">1995</A>, ISBN 3-89319-951-9<p> </li></ul><A NAME="Weblinks"><H3>Weblinks</H3> <ul><li> <A HREF="http://www.iat.uni-bremen.de/mitarbeiter/nordbruch/research_projects/diploma/Kap4_Segmentierung.html" class="external">Kapitel zur Segmentierung in einer Diplomarbeit zu visionbasierter Roboterregelung</A> </li><li> <A HREF="http://www.informatik.uni-bremen.de/~khuebner/pub/robocup/" class="external">Techniken zur Farbsegmentierung</A> </li><li> <A HREF="http://www-lehre.inf.uos.de/cg2/material/20021113/ausarbeitung.pdf" class="external">Verfolgung von farblich markierten Objekten</A> (PDF) </li><li> <A HREF="http://www.chilicon.de/~hafner/diss/diss.html" class="external">Dissertationsarbeit zur Farbsegmentierung</A> </li><li> <A HREF="http://mbi.dkfz-heidelberg.de/mbi/TR/TR49/dipl.bch.html" class="external">Diplomarbeit zur Bildsegmentierung</A> </li><li> <A HREF="http://www.mnementh.de/Studium/Segmentierung.pdf" class="external">Seminarvortrag zur Segmentierung</A><p></li></ul></div><br><div id=footer><table border=0><tr><td> <small>Dies ist ein Artikel aus der freien Enzyklopädie <a href="http://de.wikipedia.org">Wikipedia</a>. Stand: August 2004. Der Artikel steht unter der <a href="http://www.gnu.org/licenses/fdl.txt">GNU Free Documentation License</a>.</small></td></tr></table></div>