Software components for increased data reuse and reproducibility in phylogenetics and phylogenomics

Die in dieser Arbeit entwickelten Softwarekomponenten tragen zur Erhöhung der Wiederverwendbarkeit wissenschaftlicher Daten und der Reproduzierbarkeit der zugrundeliegenden Studien bei, indem sie eine eindeutige Annotation mit Metadaten (z.B. Verknüpfungen von Rohdaten oder Informationen über verwen...

Author: Stöver, Ben
Further contributors: Müller, Kai F. (Thesis advisor)
Document types:Doctoral thesis
Media types:Text
Publication date:2018
Date of publication on miami:07.12.2018
Modification date:07.12.2018
Edition statement:[Electronic ed.]
Subjects:Metadaten; Merkmalsdaten; Multisequenzalignments, phylogenetische Bäume; bioinformatische Software; eindeutige Annotation metadata; character data; multiple sequence alignments, phylogenetic trees; bioinformatical software; unambiguous annotation
DDC Subject:570: Biowissenschaften; Biologie
License:InC 1.0
Language:English
Format:PDF document
URN:urn:nbn:de:hbz:6-96159516963
Permalink:http://nbn-resolving.de/urn:nbn:de:hbz:6-96159516963
Digital documents:diss_st%C3%83%C2%B6ver.pdf

Die in dieser Arbeit entwickelten Softwarekomponenten tragen zur Erhöhung der Wiederverwendbarkeit wissenschaftlicher Daten und der Reproduzierbarkeit der zugrundeliegenden Studien bei, indem sie eine eindeutige Annotation mit Metadaten (z.B. Verknüpfungen von Rohdaten oder Informationen über verwendete Methoden) ermöglichen und die übersichtliche Gegenüberstellung von Ergebnissen unterschiedlicher Methoden zum Multisequenzalignment und zur Phylogenierekonstruktion erlauben. Während die bioinformatischen Bibliotheken JPhyloIO und LibrAlign grundlegende Funktionalitäten in leicht wiederverwendbarer Form für Entwickler zur Verfügung stellen, bieten die darauf aufbauenden Anwendungen Lösungen für Endnutzer. Der Taxonomic Editor der EDIT Plattform deckt dabei taxonomische Daten ab, während PhyDE 2 und der AlignmentComporator entsprechende Funktionalität für Multisequenzalignments und ihre Metadaten anbieten. TreeGraph 2 bietet entsprechenden Funktionalität für phylogenetische Bäume und ist bereits weltweit in umfangreicher Verwendung. Alle entwickelten Komponenten sind unter http://bioinfweb.info/Software frei verfügbar.

The software components developed in this thesis contribute to an increased reusability of scientific data and to a greater reproducibility of underlying studies by allowing unambiguous annotation with metadata (e.g., links to raw data or information on applied methods) and clear comparison of results from alternative methods for multiple sequence alignment and phylogenetic inference. The bioinformatical libraries JPhyloIO and LibrAlign provide fundamental and easily reusable functionality for developers, while the applications based on them offer solutions for end users. The Taxonomic Editor of the EDIT platform covers taxonomic data, while PhyDE 2 and AlignmentComparator offer respective functionality for multiple sequence alignments and related metadata. TreeGraph 2 provides required functionality for phylogenetic trees and is currently in wide use worldwide. All developed software is freely available at http://bioinfweb.info/Software.