SQL
SQL (Structured Query Language) ist eine Abfragesprache für relationale Datenbanken. Sie hat eine relativ einfache Syntax, die an die englische Umgangssprache angelehnt ist, und stellt eine Reihe von Befehlen zur Definition von Datenstrukturen nach der relationalen Algebra, zur Manipulation von Datenbeständen (Anfügen, Bearbeiten und Löschen von Datensätzen) und zur Abfrage von Daten zur Verfügung. Durch ihre Rolle als Quasi-Standard ist SQL von großer Bedeutung, da eine weitgehende Unabhängigkeit von der benutzten Software erzielt werden kann. Die meisten SQL-Implementierungen bieten darüber hinaus allerdings noch herstellerspezifische Erweiterungen, die nicht dem Standard-Sprachumfang entsprechen.Viele bekannte Datenbanksysteme wie DB2, Microsoft SQL Server, MySQL, Oracle, PostgreSQL und neueren Versionen von Access implementieren Teile des SQL Sprachstandards.
Die Grundlage aller relationalen Datenbanken legte 1970 Edgar F. Codd mit seinem Artikel "A Relational Model of Data for Large Shared Data Banks". Codd arbeitete damals im IBM-Forschungslabor in San Jose, Kalifornien. Bei den auf diesen Artikel folgenden weltweiten Forschungsarbeiten war ein Aspekt die Entwicklung relationaler Sprachen. Die Bedeutendste von der kommerziellen Sichtweise her war die "Structured English Query Language" SEQUEL, die in den IBM Forschungslabors 1974 entwickelt wurde. 1976 wurde SEQUEL /2 definiert und aus rechtlichen Gründen in SQL umbenannt. Der Prototyp System R wurde 1977 funktionsfähig implementiert und enthielt einen Großteil der Sprache SQL.
Nach den Erfolgen bei den Benutzern von System R beschlossen mehrere Firmen SQL-basierte Datenbanken auf den Markt zu bringen. Das System ORACLE der Firma Relational Software Inc (später in Oracle Corporation umbenannt) kam 1980 vor IBMs SQL/DS (1981) auf den Markt. Die Urversion der noch aktuell verfügbaren SQL-Implementierung DB2 von IBM entstand 1983. INGRES folgte im Jahre 1985, SYBASE 1986. SQL hatte sich innerhalb von 10 Jahren zum de-facto-Standard in der Welt der Datenbanken etabliert.
Das American National Standards Institute (ANSI) beauftragte 1982 die Standardisierung einer relationalen Sprache, die 1986 ratifiziert wurde und zum guten Teil aus dem IBM-Dialekt von SQL bestand. 1987 wurde SQL/86 auch als ISO-Standard akzeptiert. Aktualisierungen und Erweiterungen erfolgten mit SQL/89, SQL/92 und SQL/99.
Neue SQL-Version SQL:2003 vor der Veröffentlichung
Im Juni dieses Jahres (2003) wurden bei einer Tagung der Arbeitsgruppe der ISO/IEC JTC1/SC32/WG3 in Stockholm die Arbeiten an 9 SQL-Dokumenten abgeschlossen. Die letzte Abstimmungsrunde startet in den nächsten Wochen und Anfang des Jahres 2004 sollten die Dokumente veröffentlicht werden.
Befehle zur Datendefinition
Befehle zur Vergabe von Rechten.
In den oben vorgestellten Befehlen
Bei statischem SQL sind die SQL-Anweisungen fix in einem Anwendungsprogramm kodiert (so genanntes Embedded SQL). Während der Programmvorbereitung übersetzt ein Precompiler die SQL-Befehle in Funktionsaufrufe, anschließend definiert ein Optimizer den besten Zugriffspfad auf die Daten und speichert diesen im Datenbanksystem ab.
Dynamisches SQL wird dagegen während der Laufzeit eines Programms interpretiert und der Zugriffspfad wird bei jedem Durchlauf neu optimiert.
Beide Arten von SQL haben ihre Vor- und Nachteile. Statisches SQL mit voroptimierten Zugriffen erspart den aufwändigen Aufruf des Optimizers und wird deshalb häufig für zeitkritische Transaktionsverarbeitungen gebraucht. Das flexiblere dynamische SQL kommt dort zum Tragen, wo zur Codierzeit die auszuführenden SQL - Anweisungen noch nicht bekannt sind.
Siehe auch: SQL-Injection
Geschichte
Sprachelemente und Beispiele
Die Sprache SQL wird in drei Teilsprachen ungergliedert: die Data Manipulation Language (DML, Datenabfrage und -manupilation), die Data Definition Language (DDL, Datendefinition) und die Data Control Language (DCL, Rechteverwaltung).Data Manipulation Language
Befehle zur Datenabfrage: SELECT
Wählt alle Einträge aus der Tabelle Adressen, bei denen in der Spalte Name der Wert Müller steht.
select * from Adressen where Name="Müller"
Zeigt die Spalte Name aus der Tabelle Adressen an. Da die abgefragten Datensätze im Normalfall nicht geordnet werden, muss ein Ordnungsbegriff (hier der Name) ausdrücklich angegeben werden.
select Name from Adressen order by Name
Gibt die Anzahl der Datensätze in der Tabelle Adressen aus. Die Ausgabe besteht lediglich aus einer Zeile und einer Spalte, welche die Überschrift Anzahl_Adressen trägt.select count (*) Anzahl_Adressen from Adressen
Befehle zur Datenmanipulation: INSERT, UPDATE, DELETE
Fügt eine Zeile mit den geg. Werten für die Spalten Name, Vorname und Ort in die Tabelle Adressen hinzu.
insert into Adressen (Name, Vorname, Ort) values ('Schroeder', 'Knut', 'Köln')
Ändert das Feld Ort aller Einträge auf "Berlin" wenn dieser Eintrag als Namen "Schroeder" aufweist.
update Adressen set Ort="Berlin" where Name="Schroeder"
Löscht alle Einträge aus der Tabelle Adressen
truncate table Adressen
Löscht alle Datensätze aus der Tabelle Adressen mit dem Namen Müller.delete from Adressen where name="Müller"
Data Definition Language: CREATE, ALTER, DROP
Erzeugt eine neue Tabelle namens Laender mit den Spalten Kuerzel_ISO und Land_Name, wobei Kuerzel_ISO der Primärschlüssel ist und in keiner der Spalten leere Felder erlaubt sind.
create table Laender (Kuerzel_ISO character (2) primary key, Land_Name varchar2 (50) not null)
Definiert eine neue Spalte namens Kuerzel_Auto in der Tabelle Laender.
alter table Laender add Kuerzel_Auto varchar2 (3)
Löscht die gesamte Tabelle Adressen.
drop table Adressen
Legt einen Index auf die Spalte Name der Tabelle Adressen. der Index bekommt die Bezeichnung idx_Adressen und beschleunigt die Suche nach Datensätzen in der Tabelle Adressen, wenn der Name als Suchkriterium angegeben wird.
create index idx_Adressen on Adressen (Name)
Löscht den Index idx_Adressen.drop index idx_Adressen
Data Control Language: GRANT and REVOKE
SQL-Datentypen
create table
und alter table
wird bei der Definition jeder Spalte angegeben, welches Datenformat sie unterstützen soll. Dazu liefert SQL eine ganze Reihe standardisierter Datentypen mit. Dies sind die wichtigsten von ihnen:
Ganzzahl (positiv oder negativ)
integer
Ganzzahl (positiv oder negativ) mit maximalnumber (n)
n
Stellen
Festkommazahl (positiv oder negativ) mit maximalnumber (n, m)
n
Stellen, davon m
nach dem Komma
Gleitkommazahl (positiv oder negativ) mit maximalfloat (m)
m
Stellen nach dem Komma
Zeichenkette (also Text) mitcharacter (n)
n
druckbaren und/oder nicht druckbaren Zeichen
Zeichenkette (also Text) mit maximalvarchar (n)
, varchar2 (n)
n
druckbaren und/oder nicht druckbaren Zeichen. Die Variante varchar2
ist für Oracle spezifisch.
Datum (bei Oracle inklusive Uhrzeit)
date
Boolesche Variable (kann die Werteboolean
true
(wahr) oder false
(falsch) annehmen). Dieser Datentyp fehlt in Oracle.
Binärdaten von maximalraw (n)
n
Bytes LängeStatisches und Dynamisches SQL
Die meisten Datenbanken, welche SQL unterstützen, unterscheiden zwischen statischem und dynamischem SQL.SQL-Datenbanksysteme
Literatur
Obwohl bereits etwas betagt, ist dieses Buch gerade als wissenschaftlich fundierte und trotzdem leicht verständliche Einführung in SQL sehr zu empfehlen.
München: Addison-Wesley Neuaufl. 2003. ISBN 3-8272-2085-8
Weblinks