Data Science auf dem Campus Senftenberg

Im Rahmen der International Biotechnology Innovation Days wurden am 23. Mai zwei parallele Data Science Workshops am Campus Senftenberg durchgeführt.

Die Analyse von biomedizinischen Daten ist eine der großen Aufgaben in der Forschung, da die voranschreitende Digitalisierung des Labors riesige Datenmengen mit sich bringt. Diese lassen sich mit klassischen Methoden kaum mehr ordnen und analysieren lassen. Das ist insbesondere der Fall, wenn man modernen bioanalytischen Technologien, wie dem Next Gerneration Sequencing arbeitet. Weltweit entwickeln daher Forscher in nahezu allen Fachrichtungen effiziente Algorithmen, offene Datenaustausch-Formate und Visualisierungstechniken, um aus den Daten Rückschlüsse ziehen zu können. In der Forschung ist es insbesondere wichtig, dass dies mit offenen Technologien und Standards erfolgt, damit die Ergebnisse reproduzierbar sind. Die Fortschritte in der Gesundheitsforschung sind stark von den verwendeten statischen und bioinformatorischen Verfahren abhängen. Nicht zuletzt geht es auch um die Frage, wie Forschungsergebnisse besser in die Praxis umgesetzt werden können. Denn auch industrielle Prozesse sind durch die voranschreitende Digitalisierung stark von datenwissenschaftlichen Methoden abhängig. Datenwissenschaftler sind derzeit sehr stark in der Industrie gefragt.

Im Rahmen der International Biotechnology Innovation Days wurden am 23. Mai zwei parallele Data Science Workshops am Campus Senftenberg durchgeführt. Der Einführungsworkshop "Introduction to Data Science in R" bot ein Training im Data Mining mit der Statistiksprachumgebung R an. R ist ein sich schnell entwickelndes Werkzeug zur Datenanalyse, das sowohl von der Wissenschaft als auch von der Industrie (Google, Microsoft oder Facebook) genutzt wird. Die im Workshop vorgestellten Beispiele konzentrierten sich auf Anwendungen in den Natur- und Lebenswissenschaften. Der Workshop führte die Teilnehmer in die wichtigsten Konzepte der Datenwissenschaft ein und vermittelt praktische Erfahrungen ohne Vorkenntnisse in R. Der Kurs wurde von Michał Burdukiewicz von der University of Wrocław und Stefan Rödiger (BTU) durchgeführt.
Der fortgeschrittenen Workshop "Advanced Data Science in R - Machine Learning" richtete sich an Teilnehmer, die bereits mit R vertraut sind. In dem Kurs wurden die Teilnehmer in die grundlegenden Konzepte des Maschinellen Lernens eingeführt. Anschließend lernten die Teilnehmer, wie Sie mit dem mlr-Paket die gängigsten Techniken des Machinellen Lernen in R effizient und einfach anwenden können. Der Kurs wurde von Jakob Richter von der Technischen Universität Dortmund und der LMU München durchgeführt. Er ist ein erfahrener Datenwissenschaftler und kennt als Mitentwickler von mlr die Besonderheiten des Pakets.

Der Workshopleiter Stefan Rödiger: "Der Workshop war ein großer Erfolg. Wir hatten mit 30 Teilnehmern für beide Workshops gerechnet. Am Ende haben sich 46 Teilnehmer für die Kurse registriert. Erfreulicherweise haben wir exzellente technische Unterstützung von unseren Kollegen aus der Medizininformatik erhalten. Mein Dank gilt hier Prof. Martin Weigert, Prof. Schneider und insbesondere Holger Kutterer."

Kontakt

Dr. rer. med. Stefan Rödiger
Multiparameterdiagnostik
T 03573 85-936
Stefan.Roediger(at)b-tu.de
Die Teilnehmerinnen und Teilnehmer im Anschluss an den Workshop auf dem Campus Senftenberg