Bioinformatik
Die Bioinformatik (englisch bioinformatics, auch computational biology) ist ein relativ junges Fachgebiet, das sich mit den informatischen Grundlagen und Anwendungen der Speicherung, Organisation und Analyse von biologischen Daten befasst. Anfangs stammten diese Daten hauptsächlich aus der Genetik, inzwischen wird die Bioinformatik aber auch in der Pharmazie, zur Vorhersage von Proteinstrukturen und -interaktion uvm. verwendet.Die ersten reinen Bioinformatikanwendungen wurden für die DNA-Sequenzanalyse entwickelt. Dabei geht es primär um das schnelle Auffinden von Mustern in langen DNA-Sequenzen und die Lösung des Problems, wie man zwei oder mehr ähnliche Sequenzen so übereinander legt und gegeneinander ausrichtet, dass man eine möglichst optimale Übereinstimmung erzielt (sequence alignment). Zur Anwendung kommen dabei Algorithmen der dynamischen und heuristischen Programmierung. Seltener benötigt man bei biologischen Fragestellungen die Suche nach exakten Übereinstimmungen von kurzen Sequenzenabschnitten, typischerweise für hochkonservierte Signale wie Start- oder Stoppcodons.
Desweiteren wurden Methoden zum Auffinden von Genen in unbekannten DNA-Sequenzen entwickelt (Genvorhersage, engl. gene finding oder gene prediction). Dieses Problem wird mit verschiedenen Rechenmethoden und Algorithmen angegangen, darunter statistische Sequenzanalyse, Markow-Ketten, künstliche neuronale Netze zur Mustererkennung, etc.
Mit der Aufklärung und weitreichenden Funktionsanalyse verschiedener vollständiger Genome (z.B. des Fadenwurmss Caenorhabditis elegans) verlagert sich der Schwerpunkt bioinformatischer Arbeit auf Fragestellungen der Proteomik, wie z.B. dem Problem der Proteinfaltung also der Frage nach der Sekundär- oder Tertiärstruktur bei gegebener Aminosäuresequenz.
Forschungsinstitute im deutschsprachigen Raum, die sich mit Bioinformatik beschäftigen, sind u.a. die Max-Planck-Institute für Biochemie und Molekulargenetik, das Deutsche Krebsforschungszentrum, das European Molecular Biology Laboratory und das Biozentrum der Universität Basel.
Ein nicht unerheblicher Teil der Arbeit eines Bioinformatikers besteht - neben mathematisch anspruchsvollen Analysen - in der Datenaufbereitung und Speicherung in geeignet indizierten und verlinkten biologischen Datenbanken. Die verwirrende Vielfalt von DNA- (z.B. GenBank) und Proteindatenbanken (z.B. Swiss-Prot) weltweit führte bisher oft zu redundanter und damit fehlerlastiger Datenhaltung, zumal DNA-Sequenzen teils in Fragmenten, teils in vollständig assemblierten Genomen vorliegen. Idealerweise würde die Speicherung von Genom- und Proteomdaten eine Rekonstruktion der Regelwerke eines gesamten Organismus erlauben. Die gewünschte Abbildung von identifizierten Proteinen zu "ihrem" Gen und umgekehrt sowie die Zuordnung von Proteinen zu einem metabolischen Pfad ist aber noch nicht in Sicht. Ein wesentlicher Punkt neben fehlerbehafteten Einträgen und doppelter Datenhaltung unter unterschiedlichen Schlüsseln ist die weitgehende Abwesenheit von kontrollierter Vokabularien und Ontologienn, die eine Zuordnung von Funktionsbezeichnungen quer durch alle Ebenen ermöglichen.
Der Bioinformatik wird im englischen Sprachraum oft die computational biology gegenübergestellt, die einen weiteren Bereich als die klassische Bioinformatik abdeckt, meist benutzt man beide Begriffe jedoch synonym.
Siehe auch
Weblinks