Compiler<meta http-equiv="Content-type" content="text/html; charset=utf-8"> <link rel="shortcut icon" href="../../favicon.ico"><link rel="stylesheet" href="../../wikistatic.css"></head> <body><div id=topbar><table width='98%' border=0><tr><td><a href="../../h/ha/hauptseite.html" title="Hauptseite">Hauptseite</a> | <b><a href="http://de.wikipedia.org/wiki/Compiler" title="Compiler">Aktueller Wikipedia-Artikel</a></b></td> <td align=right nowrap><form name=search class=inline method=get action="../../../search/search.html"><input name=search size=19><input type=submit value=Search></form></td></tr></table></div> <div id=article><h1>Compiler</h1>Ein <strong>Compiler</strong> (auch <strong>Kompilierer</strong> oder <strong>Übersetzer</strong>) ist ein <A HREF="../../c/co/computerprogramm.html" title="Computerprogramm">Computerprogramm</A>, das ein in einer Quellsprache geschriebenes Programm in ein <A HREF="../../s/se/semantik.html" title="Semantik">semantisch</A> äquivalentes Programm einer Zielsprache umwandelt. Üblicherweise handelt es sich dabei um die Übersetzung eines von einem <A HREF="../../p/pr/programmierer.html" title="Programmierer">Programmierer</A> in einer Programmiersprache geschriebenen Quelltextes in <A HREF="../../a/as/assemblersprache.html" title="Assemblersprache">Assemblersprache</A> oder <A HREF="../../m/ma/maschinensprache.html" title="Maschinensprache">Maschinensprache</A>. Die Anwendung eines Compilers wird als <A HREF="../../k/ko/kompilierung.html" title="Kompilierung">Kompilierung</A> bezeichnet.<p> Der <A HREF="../../c/co/compilerbau.html" title="Compilerbau">Compilerbau</A>, also die Programmierung eines Compilers, ist eine eigenständige <A HREF="../../d/di/disziplin.html" title="Disziplin">Disziplin</A> innerhalb der <A HREF="../../i/in/informatik.html" title="Informatik">Informatik</A>.<p> Die Bezeichnungen <em>Compiler</em> oder <em>Kompilierer</em> sind eigentlich irreführend, weil sie von der Zusammenstellung von Tabellen herrühren, die der Compiler intern für seine Datenverwaltung benötigt, was aber an der Kernaufgabe eines Compilers vorbeigeht. <p> Verwandt mit einem <strong>Compiler</strong> ist ein <A HREF="../../i/in/interpreter.html" title="Interpreter">Interpreter</A>, der ein Programm nicht in die Zielsprache übersetzt, sondern Schritt für Schritt direkt ausführt. <p> <p><table border="0" id="toc"><tr><td align="center"> <b>Table of contents</b> <script type='text/javascript'>showTocToggle("show","hide")</script></td></tr><tr id='tocinside'><td align="left"> <div style="margin-left:2em;"> </div> </div> <A CLASS="internal" HREF="#Aufbau eines Compilers">1 Aufbau eines Compilers</A><BR> <div style="margin-left:2em;"> <A CLASS="internal" HREF="#Analysephase (auch "Frontend")">1.1 Analysephase (auch "Frontend")</A><BR> <div style="margin-left:2em;"> <A CLASS="internal" HREF="#Lexikalische Analyse">1.1.1 Lexikalische Analyse</A><BR> <A CLASS="internal" HREF="#Syntaktische Analyse">1.1.2 Syntaktische Analyse</A><BR> <A CLASS="internal" HREF="#Semantische Analyse">1.1.3 Semantische Analyse</A><BR> </div> <A CLASS="internal" HREF="#Synthesephase (auch "Backend")">1.2 Synthesephase (auch "Backend")</A><BR> <div style="margin-left:2em;"> <A CLASS="internal" HREF="#Programmoptimierung">1.2.4 Programmoptimierung</A><BR> <A CLASS="internal" HREF="#Codegenerierung">1.2.5 Codegenerierung</A><BR> </div> </div> <A CLASS="internal" HREF="#Programmoptimierung">2 Programmoptimierung</A><BR> <div style="margin-left:2em;"> <A CLASS="internal" HREF="#Reduzierung von Assemblerinstruktionen">2.3 Reduzierung von Assemblerinstruktionen</A><BR> <A CLASS="internal" HREF="#Statische Formelauswertung zur Übersetzungszeit">2.4 Statische Formelauswertung zur Übersetzungszeit</A><BR> <A CLASS="internal" HREF="#Eliminierung toten Programmcodes">2.5 Eliminierung toten Programmcodes</A><BR> <A CLASS="internal" HREF="#Erkennung von nicht benötigten Variablen">2.6 Erkennung von nicht benötigten Variablen</A><BR> <A CLASS="internal" HREF="#Optimierung von Schleifen">2.7 Optimierung von Schleifen</A><BR> <A CLASS="internal" HREF="#Reduzierung von Paging zur Laufzeit">2.8 Reduzierung von Paging zur Laufzeit</A><BR> </div> <A CLASS="internal" HREF="#Bedeutende Compiler">3 Bedeutende Compiler</A><BR> </td></tr></table><P> <A NAME="Aufbau eines Compilers"><H2>Aufbau eines Compilers</H2><p> Es lassen sich im Wesentlichen zwei Phasen unterscheiden: eine Analysephase, die den Quelltext analysiert und daraus einen <A HREF="../../s/sy/syntaxbaum.html" title="Syntaxbaum">Syntaxbaum</A> erzeugt, sowie die Synthesephase, die daraus das Zielprogramm erzeugt.<p> <A NAME="Analysephase (auch "Frontend")"><H3>Analysephase (auch "Frontend")</H3> <A NAME="Lexikalische Analyse"><H4>Lexikalische Analyse</H4> Die <A HREF="../../w/wo/wortschatz.html" title="Wortschatz">lexikalische</A> Analyse zerteilt den eingelesenen Quelltext in zusammengehörende <em>Token</em> verschiedener <A HREF="../../k/kl/klasse__objektorientierte_programmierung_.html" title="Klasse (objektorientierte Programmierung)">Klassen</A>, z.B. <A HREF="../../d/de/deskriptor.html" title="Deskriptor">Schlüsselwörter</A>, Bezeichner, <A HREF="../../z/za/zahl.html" title="Zahl">Zahlen</A> und <A HREF="../../o/op/operator.html" title="Operator">Operatoren</A>. Dieser Teil des Compilers heißt <A HREF="../../l/le/lexikalischer_scanner.html" title="Lexikalischer Scanner">Scanner</A> oder Lexer.<p> Ein Scanner benutzt gelegentlich einen separaten <em>Screener</em>, um <A HREF="../../w/wh/whitespace.html" title="Whitespace">Whitespace</A> (<em>Leerraum</em>, also Leerzeichen, Zeilenenden, usw.) und <A HREF="../../k/ko/kommentar__programmierung_.html" title="Kommentar (Programmierung)">Kommentare</A> zu überspringen.<p> <A NAME="Syntaktische Analyse"><H4>Syntaktische Analyse</H4> Die syntaktische Analyse überprüft, ob der eingelesene Quellcode formal richtig ist, d.h. der <A HREF="../../s/sy/syntax.html" title="Syntax">Syntax</A> (Grammatik) der Quellsprache entspricht. Dabei wird die Eingabe in einen Syntaxbaum umgewandelt. Dieser Teil wird auch als <A HREF="../../p/pa/parser.html" title="Parser">Parser</A> bezeichnet. <p> <A NAME="Semantische Analyse"><H4>Semantische Analyse</H4> Die semantische Analyse überprüft die statische <A HREF="../../s/se/semantik.html" title="Semantik">Semantik</A>, also "logische Rahmenbedingungen". Zum Beispiel muss eine Variable deklariert worden sein, bevor sie verwendet wird, und Zuweisungen müssen mit ihrem <A HREF="../../d/da/datentyp.html" title="Datentyp">Datentyp</A> kompatibel (verträglich) sein.<p> <A NAME="Synthesephase (auch "Backend")"><H3>Synthesephase (auch "Backend")</H3> Die Synthesephase erzeugt aus dem in der Analysephase erstellten Baum den <A HREF="../../q/qu/quelltext.html" title="Quelltext">Programmcode</A> der Zielsprache.<p> <A NAME="Programmoptimierung"><H4>Programmoptimierung</H4> Siehe <A HREF="#Programmoptimierung_2" class='internal' title="">Programmoptimierung</A>.<p> <A NAME="Codegenerierung"><H4>Codegenerierung</H4> Bei der Codegenerierung wird endgültig aus dem Syntaxbaum der Programmcode in der Zielsprache erzeugt. Falls die Zielsprache die Maschinensprache ist, kann das Ergebnis direkt ein ausführbares Programm sein oder eine so genannte Objektdatei, die durch das <A HREF="../../l/li/linker__programm_.html" title="Linker (Programm)">Linken</A> mit weiteren Objektdateien zu einer <A HREF="../../b/bi/bibliothek__programmierung_.html" title="Bibliothek (Programmierung)">Bibliothek</A> oder einem ausführbaren Programm führt.<p> <A NAME="Programmoptimierung"><H2>Programmoptimierung</H2> Üblicherweise bietet ein Compiler Optionen für verschiedene Optimierungen mit dem Ziel, die <A HREF="../../l/la/laufzeit.html" title="Laufzeit">Laufzeit</A> oder den Speicherplatzbedarf des Zielprogramms zu verkleinern. <p> Die Optimierung erfolgt in Abhängigkeit von den Eigenschaften der <A HREF="../../h/ha/hardware.html" title="Hardware">Hardware</A>, insbesondere wieviele <A HREF="../../r/re/register.html" title="Register">Register</A> der <A HREF="../../p/pr/prozessor.html" title="Prozessor">Prozessor</A> des Computers zur Verfügung stellt.<p> Einige Optimierungen führen dazu, dass der Compiler Programmkonstrukte in semantisch äquivalente, aber günstigere Konstrukte umwandelt, die keine Entsprechung im Quellcode haben. Eine Folge ist, dass es bei Aktivierung entsprechender Optimierungen kaum noch möglich ist, den Programmablauf mit einem interaktiven <A HREF="../../d/de/debugger.html" title="Debugger">Debugger</A> zu verfolgen.<p> Im Folgenden betrachten wir einige <strong>Optimierungsmöglichkeiten eines Compilers</strong>. Dabei handelt es sich naturgemäß nur um Feinabstimmung an einem bestehenden Programm. "Optimierung" bedeutet auch nicht, dass das Programm danach in irgendeiner Weise optimal wäre, nur besser. Es ist auch möglich, dass das Programm nachher "totoptimiert" ist, also die Optimierung über das Ziel soweit hinausgeschossen ist, dass das Programm effektiv langsamer ausgeführt wird. Viele Optimierungen moderner Compiler sind solche Abwägungen zwischen dem, was möglich ist, und dem, was sinnvoll ist. Die Grenze zwischen beiden ist meist nicht klar ersichtlich und muss durch Tests herausgefunden werden.<p> Es sollte nicht vergessen werden, dass das größte Optimierungspotenzial oft darin besteht, den <A HREF="../../a/al/algorithmus.html" title="Algorithmus">Algorithmus</A> selbst zu verändern bzw. durch einen besseren zu ersetzen. Dieser Vorgang kann nicht automatisiert werden, sondern muss durch den <A HREF="../../p/pr/programmierer.html" title="Programmierer">Programmierer</A> erfolgen.<p> <A NAME="Reduzierung von Assemblerinstruktionen"><H3>Reduzierung von Assemblerinstruktionen</H3><p> Wenn man zum Beispiel in einer höheren Programmiersprache den Inhalt von 2 Variablen vertauscht, dann benötigt man eine Hilfsvariable:<p> <table cellpadding="5" cellspacing="0" align="center" border="1" ><tr> <caption ><strong>Reduzierung von Assemblerinstruktionen</strong> </caption> </th><th style="background:#efefef;" > <table ><tr> <td align="center" >höhere </td></tr><tr > <td align="center" >Programmiersprache </td></tr></table> </th><th style="background:#ffdeaa;" >Assembler ohne Optimierung </th><th colspan="2" style="background:#ffdecf;" >Assembler mit Optimierung </td></tr><tr > <td align="center" >t = a </td><td > <table ><tr> <td >a --> Register 1 </td></tr><tr > <td >Register 1 --> t </td></tr></table> </td><td >a --> Register 1 </td></tr><tr > <td align="center" >a = b </td><td > <table ><tr> <td >b --> Register 2 </td></tr><tr > <td >Register 2 --> a </td></tr></table> </td><td >b --> Register 2 </td></tr><tr > <td align="center" >b = t </td><td > <table ><tr> <td >t --> Register 3 </td></tr><tr > <td >Register 3 --> b </td></tr></table> </td><td > <table ><tr> <td >Register 1 --> b </td></tr><tr > <td >Register 2 --> a </td></tr></table> <tr > </tr></table><p> Mit Optimierung benötigt man nur 4 Assemblerbefehle anstatt 6, außerdem wird der Speicherplatz für die Hilfsvariable <em>t</em> nicht gebraucht. D.h. diese Vertauschung wird schneller ausgeführt und benötigt weniger <A HREF="../../a/ar/arbeitsspeicher.html" title="Arbeitsspeicher">Hauptspeicher</A>.<p> <A NAME="Statische Formelauswertung zur Übersetzungszeit"><H3>Statische Formelauswertung zur Übersetzungszeit</H3><p> Die Berechnung des Kreisumfangs mittels<p> <pre> <pre> pi = 3.14 u = 2 * pi * r </pre></pre> kann ein Compiler bereits zum Übersetzungszeitpunkt zu "u = 6.28 * r" auswerten. Dies spart die Multiplaktion "2*pi" zur Laufzeit des erzeugten Programms. Diese Vorgehensweise wird als Konstantenfaltung (engl. "constant folding") bezeichnet.<p> <A NAME="Eliminierung toten Programmcodes"><H3>Eliminierung toten Programmcodes</H3><p> Wenn der Compiler erkennen kann, dass ein Teil des Programmes niemals durchlaufen wird, dann kann er diesen Teil bei der Übersetzung weglassen. <pre> Beispiel: ... <pre> goto 900 200 k=3 900 i=7 ... </pre></pre> Wenn in diesem Programm niemals ein GOTO auf das Label 200 erfolgt, dann kann auf die Anweisung "200 k=3" verzichtet werden.<p> <A NAME="Erkennung von nicht benötigten Variablen"><H3>Erkennung von nicht benötigten Variablen</H3><p> Wird eine Variable nicht benötigt, dann wird sie auch nicht berechnet. <pre> Beispiel: subroutine test (a,b) <pre> b = 2 * a c = 3.14 * b return </pre></pre> Hier wird die Variable c nicht benötigt: Sie steht nicht in der Parameterliste, wird in späteren Berechnungen nicht verwendet und wird auch nicht ausgegeben. Deshalb entfällt die Anweisung "c = 3.14 * b".<p> <A NAME="Optimierung von Schleifen"><H3>Optimierung von Schleifen</H3><p> Insbesondere <A HREF="../../s/sc/schleife__programmierung_.html" title="Schleife (Programmierung)">Schleifen</A> versucht man zu optimieren, indem man z.B.: <ul><li> möglichst viele Variablen in Registern hält (z.B. die Schleifenvariable) </li><li> Berechnungen innerhalb der Schleife, die in jedem Durchlauf das selbe ergeben, nur einmal berechnet </li><li> die Schleife komplett auflöst (englisch <em>loop unrolling</em>), falls die Anzahl der Schleifendurchläufe konstant ist. Die Anweisungen innerhalb der Schleife werden dann sequentiell (hintereinander) ausgeführt ohne Verwendung einer Schleife.<p> </li></ul><A NAME="Reduzierung von Paging zur Laufzeit"><H3>Reduzierung von Paging zur Laufzeit</H3><p> Zusammenhängender Code - z. B. eine Schleife - sollte zur Laufzeit möglichst auf der gleichen "Seite" (zusammenhängend vom Betriebssystem verwalteter Speicherblock) im Hauptspeicher liegen. Dies kann man evtl. dadurch erreichen, dass man dem Programmcode geeignete Leeranweisungen ("NOPs" - <em>N</em>o <em>OP</em>eration) hinzufügt. Dadurch wird der Programmcode zwar größer, aber wegen des reduzierten Pagings wird das Programm schneller ausgeführt.<p> <A NAME="Bedeutende Compiler"><H2>Bedeutende Compiler</H2> <ul><li> <A HREF="../../g/gn/gnu_compiler_collection.html" title="GNU Compiler Collection">GNU Compiler Collection</A> (GCC) </li><li> Intel C Compiler (ICC) </li><li> <A HREF="../../m/mi/microsoft_visual_c_plusplus.html" title="Microsoft-Visual-C-Plusplus">Microsoft Visual C++</A> </li></ul>oder auch viele andere, die zusammen mit IDEs ausgeliefert werden (Visual Basic, Delphi etc.)<p> <p> <p> <p> <p> <p> <p></div><br><div id=footer><table border=0><tr><td> <small>Dies ist ein Artikel aus der freien Enzyklopädie <a href="http://de.wikipedia.org">Wikipedia</a>. Stand: August 2004. Der Artikel steht unter der <a href="http://www.gnu.org/licenses/fdl.txt">GNU Free Documentation License</a>.</small></td></tr></table></div>