Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Hauptinhalt

PG 558: Eclipse4Bio

Ein bioinformatischer Workflow

Informationen

Zusammenfassung des Themas

In der biologischen Forschung, insbesondere in der Genetik und der Molekularbiologie, fallen heute Datenmengen an, die ohne automatisierte Prozesse nicht verarbeitet werde können. Diesem Problem widmet sich die Bioinformatik entwickelt. Als ein Resultat der Bestrebungen der (angewandten) Bioinformatik stehen heute viele Web Services zur Verfügung, die Zugriff auf biologische Datenbanken oder Bioinformatik-Analysealgorithmen erlauben.

Die in Forschungsprojekten generierten genetischen und molekularbiologischen Daten werden häufig mit Hilfe mehrerer solcher öffentlich verfügbaren Dienste analysiert. Eine spezielle Kombination solcher Schritte zur Lösung eines bestimmten Analyseproblems definiert einen Workflow. Oft werden diese Workflows von Forschern manuell "ausgeführt", was jedoch zeitaufwändig und fehleranfällig ist. Gerade bei der wiederholten Anwendung auf zahlreiche Datensätze ist eine Automatisierung der Workflowausführung notwendig.

Mit Eclipse4Bio sollte eine auf offenen Standards basierende Plattform für Bioinformatik-Workflows realisiert und evaluiert werden. Sie wurde dazu mit bestehenden Systemen umfassend verglichen, wobei die Frage im Vordergrund stand, ob sich speziell für Geschäftsprozesse entwickelte Technologien auch für wissenschaftliche Workflows einsetzen lassen.


Arbeit der Projektgruppe

Die Eclipse4Bio-Software wurde auf Basis von gängigen Werkeugen und Technologien realisiert. Die Software besteht aus vier Komponenten:
  1. Ein grafischer Workflow-Editor auf Basis des Eclipse Modeling Framework und des Frameworks Graphiti, in dem Workflows visuell entworfen und bearbeitet werden können.
  2. Ein textueller Workflow-Editor, der eine Text-zentrische Bearbeitung von Workflows analog zu Quellcode ermöglicht.
  3. Ein Übersetzer für Workflows, der diese in sogenannte Jobs für Spring Batch, ein quelloffenes Ausführungssystem, transformiert. Spring Batch ist dann für die eigentliche Ausführung verantwortlich.
Die Arbeit der Projektgruppe resultierte in einer den Ansprüchen der Bioinformatik gewachsenen Arbeitsumgebung, die durch ihre Nutzung von in der industriellen Praxis bewährten Softwarekomponenten demonstrierte, dass auf Basis von diesen forschungsorientierte Systeme bereit gestellt werden können.


Materialien


Endbericht

Der Endbericht der Projektgruppe ist bei Eldorado verfügbar.


Nebeninhalt

Kontakt

Dipl.-Inf. Stefan Naujokat
Prof. Dr. Bernhard Steffen