Dokumentenmanagement
Unter Dokumentenmanagement versteht man in Deutschland vielfach die Verwaltung von ursprünglich meist papierbehafteten Dokumenten. Im Amerikanischen steht "Document Management" dagegen für die Verwaltung von Dateien mit Checkin/Checout, Versionierung und anderen Funktionen. Inzwischen gilt Dokumentenmanagement als eine Komponente des übergreifenden ECM Enterprise Content Management.
Archivierung
Die klassische Form des Dokumentenmanagements ist die Archivierung. Bibliotheken sind eine spezielle Form eines Archivs. Um das Wiederauffinden der Dokumente zu ermöglichen, werden sie nach bestimmten Kriterien gekennzeichnet. Die Kriterien hängen von der Art des Archivs ab und können z. B. das Erscheinungsjahr, das Dokumentenformat, den Autor, den Gegenstand und viele andere Kriterien herausstechend darstellen. Diese Referenzschlüssel finden sich dann in den Katalogen, so dass man mit ihrer Hilfe die Dokumente auffinden kann.
Heute werden die Kataloge meist elektronisch zur Verfügung gestellt. Dazu gibt es auf Rechnern Softwaresysteme, die eine Datenbank mit den den Dokumentendaten beinhalten und verschiedene Zugangswege zur Pflege (insbesondere Ergänzung) des Datenbank sowie zur Suche zur Verfügung stellen. Solche Systeme heißen Dokumentenmanagementsysteme (DMS). Während man früher ohne Kenntnis des Aktenzeichens z. B. bei einer Behörde keine Chance hatte, an seine Unterlagen zu kommen, so gibt es mit Hilfe elektronischer DMS auch die Möglichkeit, diese anhand anderer Kriterien zu ermitteln.
Im deutschen hat der Begriff Dokument einen konkreten Bezug zu papiergebundenem Schriftgut. Unter einem Dokument wird häufig auch ein Schriftstück mit hoher inhaltlicher Qualität und rechtlicher Bedeutung verstanden. Das Dokument wird damit sehr nah an den im Gesetz verankerten Urkundenbegriff gerückt. Dies zeigt sich besonders in abgeleiteten Begriffen wie Dokumentenechtheit. Deutsche Anwender denken daher beim Begriff Dokumentenmanagement zunächst an gescanntes Schriftgut und bewegen sich damit nur in einem Teilgebiet dieser Technologien.
Der Begriff ”elektronisches Dokument” bezieht sich im Prinzip auf alle Arten von unstrukturierten Informationen, die als geschlossene Einheit in einem DV-System als Datei vorliegen. Es kann sich dabei um ein gescanntes Faksimile oder ein digital übermitteltes Fax aber auch um eine Datei aus einem Textverarbeitungsprogramm, einen Datenbankauszug oder eine Liste handeln.
Eine weitere Quelle für den Begriff Dokument in Zusammenhang mit Dokumentenmanagement-Systemen ist die Bezeichnung ”Dokumentation”, die sich auf eine Zusammenstellung von Dokumenten zu einem bestimmten Sachverhalt bezieht. Einige ”klassische” Dokumenten-Management-Systeme verfolgen daher auch das Ziel, aus verschiedenen Einzelkomponenten, die in unterschiedlichen Versionen vorliegen können, zu einem definierten Zeitpunkt eine in sich geschlossene, aktuelle Dokumentation zusammenzustellen.
Aus den verschiedenen Ursprüngen des Begriffs Dokument wird auch verständlich, wie sich bei Anbietern und Anwendern Mißverständnisse hinsichtlich der unterschiedlichen Bedeutungen ergeben konnten. Wichtig ist daher zu ermitteln, welche Dokumente in eine Dokumentenmanagement-Lösung überführt werden sollen und wie sie physisch, formal und inhaltlich aufgebaut sind. Ausschlaggebend für die Verwaltung ist ferner der Nutzungs- und Rechtscharakter der Dokumente: dynamische, in Bearbeitung befindliche Textdateien sind von unveränderbar und langfristig aufzubewahrenden Dokumenten zu unterscheiden. Ein Dokument hat daher in der Regel folgende Merkmale:
Im folgenden wird der Begriff Dokument für elektronische Dokumente aus unterschiedlichsten Quellen, die in einem DV-System als Datei, Bestandteil einer Datei oder Objekt vorliegen, verwendet.
Elementare Dokumente, die aus einem Objekt bestehen, enthalten nur Daten eines Typs, also keine eingebetteten Grafiken, Bilder oder Aufrufe anderer Objekte.
Aus mehreren Objekten zusammengesetzte Dokumente werden auch als Compound Docu-ments bezeichnet. Compound Documents bestehen aus zusammengesetzten Dateien, die Text, Formatinformation, Bilder, Tabellen etc. sowie Hyperlinks oder Verweise auf andere Komponenten beinhalten können.
Einzelobjekte, komplexe Objekte, Verweisinformationen, Links und Verwaltungsdaten können zur besseren Handhabung auch in Containern zusammengefasst werden.
Entsprechend ihrer Komplexität können somit elementare Dokumente, Compound Documents und Container-Dokumente unterschieden werden.
Ein selbstbeschreibendes elektronisches Dokument besteht neben seinem Inhalt aus Attributdaten (Metadaten), die den Zugriff auf Dokumente und deren Katalogisierung erlauben. Diese werdenheute meisten in XML auf Basis einer DTD oder eines Schema abgebildet.
Im englischen Sprachgebrauch werden solche Objekte als ”Selfcontained Document Object)” bezeichnet. Im deutschen werden sie auch als ”selbstbeschreibende Informationsobjekte” bezeichnet. Sie setzen sich aus einer beliebigen Inhaltskomponente (Einzelobjekt, Container, Liste u.ä.) und einem vorgeschalteten, mit der Inhaltskomponente verbundenen ”Header” zusammen. Die Headerkomponente kann selbst aus verschiedenen Teilen zusammengesetzt sein. Sie beginnt in der Regel mit einer neutralen Beschreibung, welche Merkmale und Attribute im Header erwartet werden können. Auf dieser Beschreibung beruht der selbsterklärende Charakter der Dokumente.
Ein Header beinhaltet im allgemeinen folgende Attribute, die als Metadaten zum Dokument gehören:
Die Attribute können auch ausgewertet werden, wenn die Verwaltungsdatenbank nicht im Zugriff ist oder das Informationsobjekt in eine Umgebung außerhalb des erzeugenden Systems versandt wurde.
Durch die Zusammenführung herkömmlicher Technologien des Dokumentenmanagement (im weiteren Sinn) mit Internettechnologien, Web Content Management und Portalen entstand Ende der 1990er Jahre ECM Enterprise Content Management. Dokumentenmanagement gilt heute nur noch als eine integrierte Komponente von übergreifenden Systemen mit Workflow, Collaboration, Records Management, elektronischer Archivierung, Inputmanagement und Outputmanagement. Übergreifend hat sich seit ca. dem Jahr 2000 für die Branche der Begriff Dokumenten-Technologien oder (engl.) DRT Document related Technologies eingebürgert.Verschiedene Dokumentarten
Das Dokumentenmanagement unterscheidet sich je nach Art der Dokumente.
Technische Zeichnungen
In Konstruktionsbüros, Maschinenbauunternehmen und ähnlichen Unternehmen werden technische Zeichnungen aufbewahrt. Es kann sich dabei um Zehn- oder gar Hunderttausende von oftmals großformatigen Zeichnungen handeln, die typischerweise in großen Schubladen flach aufbewahrt werden. Die Referenzen heißen hier Zeichnungsnummern, müssen aber nicht unbedingt Zahlen sein. Das Dokumentenmanagement erlaubt in diesem Fall die Suche nach Art der Zeichnung, insbesondere auch des Auftraggebers, und stellt die Zeichnungsnummer zur Verfügung. Daneben werden weitere Produktionshinweisen, etwa geeignete Maschinen, mit angegeben, Die Zeichnungen werden meist formatabhängig abgespeichert.Bibliotheken
Bibliotheken haben ihre Bücher in riesigen Arsenalen gespeichert, zu denen der Besucher üblicherweise keinen Zugang hat. Er sucht in einem Dokumentenmanagementsystem am Bildschirm, ermittelt die Registraturbezeichnung und bestellt anhand dieser das Buch zur Ausleihe. Ein Beispiel hierfür findet sich auf den Seiten der Deutschen Bibliothek extern als Online-Katalog OPAC.Behördenakten
Sehr viele Dokumente befinden sich bei Behörden. Sie heißen dort Akten. Akten werden üblicherweise in der Registratur aufbewahrt und ggf. vom Beamten angefordert. Die Anforderung erfolgt über das Aktenzeichen. Über die Art des Aktenzeichens gibt es detaillierte Vorschriften, die jedoch von Behörde zu Behörde verschieden sind. Ohne Aktenzeichen kann eine Akte traditionell nicht mehr aufgefunden werden. Ein Beispiel für die Aktenzeichenvergabe beim Bundessozialgericht findet sich im dortigen Aktenplan.Sonstige Unterlagen
Unzählige Institutionen bewahren Dokumente auf, so z. B. Krankenhäuser, Geschäftsunternehmen, Vereine, Selbständige usw. Die grundlegenden Probleme des Wiederauffindens sind überall die gleichen. Gleichwohl sind alle Fälle anders gelagert. So ist die Größenordnung der Anzahl der Dokumente von Bedeutung. Es ist ein Unterschied, ob nur zehntausend oder mehrere Millionen von Dokumenten verwaltet werden müssen. Die Vertraulichkeit der Dokumente ist sehr unterschiedlich; manche sind geheim, andere sind öffentlich. Auch die Frage, wer Dokumente sucht, ist wesentlich. Ist dies das breite Publikum, müssen die Darstellungsformen aus sich selbst heraus verständlich sein. Greift nur ausgebildetes Personal zu, ist dies nicht erforderlich und in Fällen vertraulicher Unterlagen auch nicht erwünscht. Auch ist erheblich, ob sich die Dokumente verändern oder nicht, ob sie wesentlich anwachsen oder nicht, ob häufig oder nur sehr selten auf die zugegriffen werden soll. Je nachdem müssen Dokumentenmanagementsysteme unterschiedlich ausgelegt werden.Dokumente in elektronischer Form
Einzeldokumente, z. B. Briefe, werden oftmals nicht mehr auf Papier aufbewahrt, sondern elektronisch. (Mehr folgt, Stichworte: Scanner)Vorgangsbearbeitung
Häufig werden im Zusammenhang mit Dokumentenmanagementsystemen auch die Vorgänge automatisiert. man spricht dann von Vorgangsbearbeitungssystemen. (Mehr folgt, Stichworte: elektronische Abzeichnung)Was ist ein elektronisches Dokument?
Dokument
Der Begriff Dokument wird heute noch sehr unterschiedlich interpretiert. Im angelsächsischen wird er häufig für Textdateien verwendet. Dies zeigt sich zum Beispiel deutlich an der verwendeten Endung ”.doc” für Dateinamen von Textdokumenten. Es wird daher auch zwischen Document Imaging, der Verwaltung von gescanntem Schriftgut, und Document Management, der Verwaltung von bereits digital erzeugten Texten unterschieden.
In der Regel ergeben sich alle diese Merkmale aus dem Dokument selbst. Sie werden in DV-Systemen für die Verwaltung, den Zugriff und die Bereitstellung genutzt. Aus ihnen ergeben sich auch die Schutz- und Suchmerkmale für das Dokumentenmanagement-System.Formen von Dokumenten
Dokumente können aus verschiedenen Quellen in ein Dokumenten-Management-System gelangen:
Ein Dokument kann weiterhin aus einem oder mehreren Einzelobjekten wie beispielsweise
bestehen. Selbstbeschreibende elektronische Dokumente
Container-Dokumente können in der Regel nur vom erzeugenden Programm zerlegt, interpretiert und angezeigt werden. Soll ein nur einmal gespeichertes Dokument aus verschiedenen Zusammenhängen heraus genutzt oder über andere als das erzeugende Programm auf einzelne Komponenten des Containers zugegriffen werden, muß das Container-Dokument alle benötigten Struktur-, Identifizierungs- und Verwaltungsinformationen mit sich tragen. Sind diese Bedingungen erfüllt, bezeichnet man Dokumente als selbstbeschreibend.
Hierzu gehören zum Beispiel Anzahl und Reihenfolge der folgenden Attribute, Attributnamen, Attributformate etc., heute in XML definiert
Dies wird in der Regel durch einen ”Unique Identifier”, einen eindeutigen Schlüssel für die Identifizierung jedes Objektes gelöst. Für Unique Identifier existieren sowohl allgemeine Standardisierungen als auch brancheninterne Festlegungen. Der Unique Identifier wird benutzt, um auf das Objekt zuzugreifen und es als einmalig vorhandenes Dokument zu identifizieren. In der Regel sind im Unique Identifier Entstehungsort und -datum des Objektes mit Uhrzeit kodiert.
Hierunter ist der Aufbau der Inhaltskomponente zu verstehen, die nur aus einem einzelnen Faksimile, aber auch aus einer strukturierten DV-Liste, einem mehrseitigen Dokument oder einem zusammengesetzten Container bestehen kann.
Hierzu gehören beschreibende Daten der Erzeugung der Inhaltskomponente. Formatinformationen werden zur Reproduktion der Information ausgewertet (zum Beispiel für Anzeige, Bearbeitung und Druck).
Beispiele für Nutzungsinformationen sind Erzeuger, vorgesehene Benutzergruppe, Status der Information oder Verknüpfung auf zulässige Bearbeitungsoperationen.
Hierzu gehören Prüfsummen, Zugriffsschutzmerkmale, gegebenenfalls eine ”elektronische Signatur" und andere Attribute.
Referenzinformationen beinhalten die Zugehörigkeit zu anderen Objekten wie Folgeseiten, vordefinierte Dokumentklassen, Ersatz anderer Dokumente durch ”logische Löschung”, Notizen, Versionsmanagement, Hintergrund-Faksimile, etc.
Hierunter sind beschreibende Attribute und Ordnungsmerkmale zu verstehen, die in der Regel in der Verwaltungsdatenbank für den direkten Zugriff benutzt werden. Sie dienen im Header für Prüfungs-, Wiederherstellungs- und Anzeigefunktionen.Unterscheidung in Dokumentenmanagement im engeren Sinn und Dokumentenmanagement in weiteren Sinn
Die elektronische Archivierung wird dem Umfeld Dokumentenmanagement zugerechnet. Die unterschiedlichen Dokumentenmanagement-Technologien sind in starkem Maße voneinander abhängig, der Einsatz einer Komponente ist im allgemeinen nicht ohne den Zugriff auf andere Komponenten sinnvoll. Allen Produktkategorien ist gemeinsam, daß unterschiedliche Arten von Dokumenten - gescannte Faksimiles, Faxeingang, Dateien aus Büroanwendungen, Multimediaobjekte usw. - datenbankgestützt und unabhängig von herkömmlichen hierarchischen Dateimanagementsystemen verwaltet werden. Der Einsatz von Datenbanken erlaubt die Handhabung großer Informationsmengen und einen direkten Zugriff auf einzelne Dokumente und Dokumentengruppen. In diesem Zusammenhang ist zum Beispiel der Bereich Imaging unter dem Gesichtspunkt zu betrachten, daß es sich hierbei nur um eine spezielle Art von Dokumenten handelt. Unter einem Dokumentenmanagement-System im weiteren Sinn sollen daher verschiedene Systeme und deren Zusammenspiel wie
verstanden werden, wobei unter den klassischen Dokumentenmanagement-Systemen im engeren Sinn, die ursprünglich aus der Notwendigkeit entstanden sind, Managementfunktionen und Services für die enorm wachsenden Dateibestände zur Verfügung zu stellen,
zu verstehen sind. Zur Abgrenzung dieser Produkte von Document Imaging, Workflow und Groupware spricht man heute auch häufig von Compound-Document-Management-Lösungen.Weiterentwicklung des Dokumentenmanagement