What's new

28.07.2016 | Poster and Workshop at ECCB

A second poster from our working group will be presented at ECCB 2016. Daniela Beisser will present a poster about Taxonomic assignment of protist metatranscriptome sequences. She will also present the topic during the ECCB workshop “W11 – Recent Computational Advances in Metagenomics (RCAM’16)” on 4th September. See the workshop website for more information.

Taxonomic assignment of protist metatranscriptome sequences
Daniela Beisser, Nadine Graupner, Lars Grossmann, Jens Boenigk and Sven Rahmann

Abstract:
Next generation sequencing (NGS) technologies are increasingly applied to analyse complex microbial ecosystems by mRNA sequencing of whole communities, also known as metatranscriptome sequencing. In principle, each sequenced mRNA allows to both identify the species of origin and assign a function to the transcribed gene. While the functional information is sufficiently covered by databases such as Uniprot, NCBI, KEGG and many others, species identification is currently limited by incomplete reference databases. Inferring the community composition from metratranscriptomic samples is thus still a difficult problem. At the moment, most analyses are restricted to prokaryotic communities, which enjoy better database coverage, or to communities of few known species with sequenced genomes, or to a combination of rRNA and mRNA sequencing. However, the latter approach does not allow to link taxonomic and functional information directly.

Our approach focuses on an accurate assignment of taxonomic groups to metatranscriptomic reads. We constructed a custom database that comprises all major eukaryotic groups, developed a stand-alone tool to assign reads with a low false discovery rate and created a workflow for complete metatranscriptome analysis. The workflow covers all bioinformatic steps: preprocessing of the raw data, taxonomic and functional assignment, and visualisation of the results.

28.07.2016 | Poster about EAGLE at ECCB

A poster about the Exome Analysis GraphicaL Environment (EAGLE) was accepted for the ECCB 2016 at The Hague. Felix Mölder will present the poster there.

EAGLE: an easy-to-use web-based exome analysis environment
Christopher Schröder, Felix Mölder, Christoph Stahl and Sven Rahmann

Abstract:
High throughput exome sequencing is a widely used technology for deciphering mutations in the coding regions of a genome at relatively low cost. While bioinformatics analyses of exome sequencing data mostly agree on best practices regarding the analysis steps, called genomic variants depend on the set of parameters and applied filtering. We present EAGLE, a software that combines a best practices variant calling workflow with a web frontend. By storing the called variant information in HDF5 files (instead of SQL databases), EAGLE allows filtering and parameter tuning in almost real time. This enables iterative tuning of thresholds, or the selection of different samples for filtering by medical PIs via the web interface. The web interface presents metadata, annotations, quality control data and statistics to facilitate a comprehensive data analysis on different levels.

Juli 2016 | mundo berichtet über Projekt “Data Driven Materials Design”

Im aktuellen Sonderheft des Forschungsmagazins mundo zum Thema “Materials Chain” ist ein Bericht über das Projekt Data Driven Materials Design erschienen. Das vom 01.10.2012 – 30.09.2014 vom Mercator Research Center Ruhr (MERCUR) geförderte Projekt galt dem systematischen Design neuer Materialien durch die interdisziplinäre Zusammenarbeit zwischen Materialwissenschaften und Informatik. Dabei handelte es sich um eine Kooperation zwischen den Fakultäten für Physik und Astronomie (Prof. Drautz) und für Maschinenbau (Prof. Ludwig) der Ruhr-Universität Bochum mit zwei Informatik-Lehrstühlen der TU Dortmund (Prof. Morik) und der Universität Duisburg-Essen (Prof. Rahmann) zum Data Mining bzw. zur Hochdurchsatzanalyse.

19.07.2016 | Neues Fachprojekt im WiSe 2016/17

Im folgenden Wintersemester 2016/2017 werden Marianna D’Addario und Sven Rahmann erneut ein Fachprojekt Bioinformatik an der TU Dortmund anbieten. Dieses Semester wird es sich thematisch um “Sequenzanalyse mit q-Grammen” drehen.
Der Termin ist immer Donnerstags um 14:15. Nähere Informationen finden sich auf der Webseite.

19.07.2016 | Neue Masterarbeit zum Thema Unterscheidung echter genetischer Varianten von systematischen Sequenzierfehlern

Till Hartmann, der schon früher am Lehrstuhl für Genominformatik als studentische Hilfskraft am dinopy-Projekt gearbeitet hat, wird seine Masterarbeit in Informatik am Lehrstuhl schreiben.
Thematisch geht es darum, in Hochdurchsatz-Sequenzdaten systemstische Sequenzierfehler von echten genetischen Varianten mit Hilfe von Methoden des maschinellen Lernens zu unterscheiden. Die Arbeit gliedert sich ein in das Teilprojekt C1 “Merkmalsselektion in hochdimensionalen Daten am Beispiel der Risikoprognose in der Onkologie” des SFB 876 “Verfügbarkeit von Information durch Analyse unter Ressourcenbeschränkung”.
Willkommen und viel Erfolg dabei, Till!