Forschungsdaten

Was sind Forschungsdaten?

Forschungsdaten bezeichnen (digitale) Daten, die je nach Fachkontext während eines Forschungsprozesses entstehen oder sein Ergebnis sind1. Ob Messreihen, Bilder oder Software-Anwendungen: Das Spektrum an Datentypen und Formaten ist überaus vielfältig.

Ein verantwortungsvolles Datenmanagement:

  • beinhaltet die sachgerechte Datenerschließung, -verarbeitung und -aufbewahrung
  • verhindert Datenverlust & Datenmissbrauch
  • gewährleistet eine langfristige Nutzbarkeit
  • macht den Forschungsprozess transparent
  • ermöglicht ein effektives Teilen der Daten mit der Fachwelt

Die Verwaltung der Forschungsdaten beginnt idealerweise schon vor Beginn des Forschungsprojekts mit dem Aufsetzten eines Datenmanagementplans (DMP). DMPs werden zunehmend auch von Forschungsförderern und Drittmittelgebern als Teil des Förderantrags verlangt.

1) Kindling, M.; Schirmbacher, P. (2013): "Die digitale Forschungswelt" als Gegenstand der Forschung. In: Information : Wissenschaft und Praxis 64 (2/3), S. 127-136.

Datenlebenszyklus

Der sachgerechte Umgang mit Forschungsdaten orientiert sich an den Stationen des Datenlebenszyklus. Je nach Fachdisziplin können die Stationen, die digitale Daten durchlaufen, leicht variieren.
Im Allgemeinen werden aber die folgenden sechs Phasen angegeben:

  • Erstellung/Erhebung
  • Verarbeitung
  • Analyse
  • Archivierung
  • Zugang
  • Nachnutzung
Datenmanagementplan erstellen

Wie mit den im Forschungsprojekt erstellten Daten umgegangen werden soll, beschreibt der sogenannte Datenmanagementplan (DMP). Er dokumentiert systematisch die Speicherung, Verzeichnung, Pflege und Verarbeitung der Daten. Der DMP ist wichtig, um Daten für Dritte interpretierbar und nachnutzbar zu machen - auch über das Projektende hinaus. Es ist sinnvoll, frühzeitig zu klären, welche Verantwortlichkeiten im Umgang mit den Daten vorliegen. Dazu sind bspw. folgende Fragen zu klären:

  • Welche Daten werden im Projekt erzeugt und verwendet?
  • Welche Daten müssen nach Projektende archiviert werden?
  • Wer ist für die Vergabe von Metadaten zuständig?
  • Wie lange und wo sollen die Daten archiviert werden?
  • Wer darf die Daten nach Projektende nutzen und unter welchen Lizenzbestimmungen?
  • etc.

Nationale und internationale Forschungsförderer erwarten für die Mittelvergabe zunehmend Datenmanagementpläne als Bestandteil der Förderanträge. Die für das Datenmanagement notwendigen Ressourcen können in der Regel in Drittmittelanträgen geltend gemacht werden. Kostenfreie Werkzeuge zur Erstellung eines DMP sowie Muster-DMPs für Projektanträge bei DFG, BMBF und Horizon 2020 finden Sie unter den folgenden Links:

Förderrichtlinien

Professionelles Forschungsdatenmanagement im Sinne einer nachhaltigen Sicherung und (möglichst) öffentlichen Zugänglichmachung von digitalen Daten ist bereits Anspruch vieler Forschungsförderer und Verlage.
Das EU-Rahmenprogramm Horizon 2020 wie auch die DFG verlangen, dass Datenmanagementpläne als Teil des Förderantrags eingereicht werden. DFG und BMBF erwarten weiterhin verbindliche Angaben zur Verwertung der Daten nach Abschluss des Projektes wie auch die Verfügbarmachung der Forschungsdaten in einem Repositorium. Eine wachsende Zahl von Verlagen wissenschaftlicher Fachzeitschriften (z.B. die Nature Publishing Group) verknüpft die Veröffentlichung von Forschungsergebnissen mit dem Einreichen publikationsbezogener Daten als Supplemente. Diese sollen auch für die Leser einsehbar sein.

Eine Übersicht und weiterführende Informationen zum Forschungsdatenmanagement in Förderrichtlinien bietet die Plattform forschungsdaten.info sowie die RWTH Aachen.

Hinweise einzelner Forschungsförderer:

Metadaten vergeben

Metadaten ("Daten über Daten") sind strukturierte Informationen über Ihre Forschungsdaten. Sie werden unabhängig von oder zusammen mit den Daten, die sie näher beschreiben, abgespeichert. Gut durchdachte und dokumentierte Metadaten spielen eine zentrale Rolle für das Finden, Durchsuchen und (Nach-)Nutzen von Daten. Sie gewährleisten, dass Forschungsdaten für einen längeren Zeitraum und verschiedene Personen interpretierbar bleiben und ggf. untereinander ausgetauscht werden können.

Jede wissenschaftliche Community entwickelt ihre eigenen Metadatenstandards, die den Bedürfnissen bestimmter Fächer beziehungsweise Fachgruppen angepasst sind.

Eine Zusammenstellung von Metadatenstandards finden Sie bei forschungsdaten.info.

Geeignete Archivierung (& Repositorium finden)

Im Sinne der Guten Wissenschaftliche Praxis sind Forschungsdaten für mindestens 10 Jahre sicher aufzubewahren (siehe Leitlinien zum Umgang mit Forschungsdaten der Deutschen Forschungsgemeinschaft).
Die Universitätsbibliothek empfiehlt, die Daten in professionellen Datenzentren zu archivieren. Diese nennt man auch Repositorien. Langfristig können so Datenverlusten und Datenmissbrauch verhindert werden.

Repositorium finden

Forschungsdaten können in Online-Repositorien archiviert und über diese veröffentlich werden. In den letzten Jahren sind hunderte unterschiedliche Repositorien für verschiedene Fachgebiete entstanden. Je nach wissenschaftlicher Disziplin kann die Auswahl sehr groß und unübersichtlich sein. Einen Überblick über mehr als 1500 international existierende Repositorien sowie eine Suchfunktion mit einer großen Auswahl an Sucheinstellungen bietet die Registry of Research Data Repositoriesre3data. Diverse Icons geben Auskunft darüber, welche Charakteristiken die jeweiligen Plattformen aufweisen. Beispielsweise kann gezielt nach bestimmten Nutzungs- und Lizenzbedingungen gefiltert werden. Bei der Entscheidungsfindung sollte außerdem darauf geachtet werden, ob die Archive zertifiziert und damit vertrauenswürdig sind.

Veröffentlichung

Bereits seit einigen Jahren spielt die Forderung nach einer freien Zugänglichkeit von Ergebnissen öffentlich finanzierter Forschung eine zentrale Rolle in der Wissenschaftspolitik. Darunter fallen -soweit möglich- auch die projektbezogenen Daten.
Forschungsdaten können auf verschiedenen Wegen sichtbar und zitierbar gemacht werden:

  • Als eigenständige Publikation in einem Repositorium
  • Als klassisches Datensupplement zur Ergänzung einer Textpublikation
  • Als Data Paper in einem Datenjournal

Geeignete Repositorien finden Sie in der Registry of Research Data Repositories (↗Repositorium finden). Zudem können Forschungsdaten bei vielen Verlagen als Datensupplemente zur Ergänzung der Textpublikation eingereicht werden.
Einige Zeitschriften haben sich vollkommen auf die Beschreibung und Begutachtung von Datensätzen spezialisiert. So genannte Data Paper ermöglichen formales Peer-Review, Publikation und Zitierung von Forschungsdaten. Eine Auswahl verfügbarer Datenjournale bietet
forschungsdaten.org und die Humboldt-Universität zu Berlin.

Persistente Identifikatoren

Persistente Identifikatoren stellen sicher, dass digitale Objekte selbst bei einer sich ändernden Internetadresse dauerhaft auffindbar, abrufbar und zitierbar bleiben.
Häufig verwendete Identifikator-Systeme sind DOI (Digital Object Identifiers) und URN (Uniform Resource Names). Diese ähneln zwar äußerlich den klassischen Webadressen (URLs), sind jedoch deutlich langlebiger. Im Gegensatz zu URLS verweisen sie nicht auf einen "Ort im Internet", sondern direkt auf den Inhalt selbst. Damit werden fehlerhafte Zugriffe durch Broken Links (bekannt unter Error 404: Page not found) reduziert.
URN können kostenfrei über die Deutsche Nationalbibliothek, DOI über die Mitglieder von Data Cite (GESIS, TIB, ZB MED und ZBW) bezogen werden.

FDM Services an der BTU

Wir unterstützen Sie gerne im Umgang mit Ihren Forschungsdaten. Schulungen und Workshops zum Thema Forschungsdatenmanagement und Datenmanagementpläne finden in unserem Kursangebot. Sie können auch gerne einen individuellen Beratungstermin vereinbaren.