Semantic Web
Das Semantic Web (deutsch semantisches Netz; auch als semantisches Web bezeichnet) ist eine Erweiterung des WWW um maschinenlesbare Daten, welche die Semantik der Inhalte formal festlegen. Das Konzept beruht auf einem Vorschlag von WWW-Erfinder Tim Berners-Lee.Informationen sollen zusätzlich zu der für Menschen lesbaren Form auch formal, in einer für Maschinen verarbeitbaren Form repräsentiert werden, damit Programme darauf operieren können.
Zwar verweist die wortwörtliche Übersetzung "Semantisches Netz" auf eine Verwandtschaft mit der Theorie der semantischen Netzwerke (semantic nets), es handelt sich jedoch um eine konkrete, in der Entwicklung befindliche Implementierung eines verteilten semantischen Netzes. Die Annotation der HTML/XML-Seiten im Web geschieht z. B. mittels Wissens-/Ontologie-Repräsentationssprachen wie RDF oder dem darauf aufbauenden OWL.
Oft wird der Begriff des Semantic Webs nur in Verbindung mit RDF gebracht, obwohl die Vision des Semantic Webs natürlich andere Repräsentationen nicht ausschließt. Nach Berners-Lee et. al. Artikel im Scientific American (2001-05), der in fast jeder Publikation über das Semantic Web zitiert wird, ist das Semantic Web eine Erweiterung des herkömmlichen Webs in der Informationen mit eindeutigen Bedeutungen versehen werden, um die Arbeit zwischen Mensch und Maschine zu erleichtern: "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation" (ebenda).
RDF als Auszeichnungssprache für Metadaten basiert auf sog. triples oder statements aus subject, predicate (oder property) und object, die analog zu name-value Paaren zu sehen sind. Beliebigen Ressourcen (typischerweise Webseiten) werden bestimmte Werte, wie z. B. Autor, Erstelldatum zugewiesen, wobei eben die URL der Webseite das Subjekt, die Eigenschaft "Autor" das Prädikat und schließlich der Name des Autors das Objekt darstellt. Da idealerweise für die Eigenschaften bekanntes und weitverbreitetes Vokabular benutzt wird, wie z. B. das Dublin Core Element Set (DC), das eindeutige URLs für die wichtigsten Metadatentypen bereitstellt, sind die Informationen der so ausgezeichneten Ressourcen auch für Computerprogramme als dieses Metadatum identifizierbar und entsprechend interpretierbar, also z. B. ein Autor als eben solcher.
Das Konzept dieser RDF triples ist stark an Conceptual Graphs (CG) (John F. Sowa) angelehnt und somit nicht neu. Unglücklicherweise ist die Serialisierung im XML Kontext jedoch sehr umständlich, so dass zum einen ständig einfachere Notationen erfunden werden, wie z. B. n3 und n4, und zum anderen eine weite Verbreitung nicht von heute auf morgen stattfindet. Diese Erschwernis ist auch Hand in Hand mit einer fehlenden sofortigen "Belohnung" der Mühen einer Metadatenauszeichnung zu sehen. Das World Wide Web ist v. a. deshalb so schnell gewachsen, weil HTML einfach ist und die Publikation desselben durch eine sofortige, weltweite Verfügbarkeit im Web belohnt wird.
Auch weil das Semantic Web und RDF/OWL beides Ideen und Konzepte des World Wide Web Consortium (W3C) sind, werden andere Technologien kaum beachtet. So sind z. B. XML Topic Maps ein gemeinhin leichter zu verstehendes Konzept, das einzelne Themen (Topics) in den Vordergrund stellt, jedoch mangels Unterstützung immer mehr in den Hintergrund gedrängt wird.
Table of contents |
2 Literatur 3 Weblinks |
Techniken des Semantic Web beginnen sich nur langsam und teilweise durchzusetzen. Anwendungsbeispiele sind:
Beispiele für das Semantic Web
Literatur
Weblinks
In englischer Sprache: