Forschungsdaten veröffentlichen

Wie können Forschungsdaten veröffentlicht werden?

Forschungsdaten können in fachspezifischen, interdisziplinären oder institutionellen Repositorien zugänglich gemacht werden. Zum Teil werden sie auch auf der Instituts- oder privaten Homepage hinterlegt.
Am attraktivsten ist die Veröffentlichung in einem fachspezifischen Repositorium, da dort die Form der Datenablage von vornherein am passfähigsten ist und die
Daten im geeigneten inhaltlichen Kontext präsentiert werden können. Steht ein solches für bestimmte Forschungsrichtungen nicht zur Verfügung, können interdisziplinäre oder institutionelle Repositorien genutzt werden.

Forschungsdatenrepositorien finden

Eine Übersicht über eine Vielzahl an Forschungsrepositorien bietet re3data. Filterungsmöglichkeiten bestehen unter anderem für Fächer und Art der Daten.

Weitere Sammlungen von Forschungsrepositorien:

Übersicht zu Datenrepositorien zusammengestellt von Nature

Liste von Repositorien auf einem Wiki zu Open Access

Suchportal nach passenden Repositorien (von fairsharing.org)

Daten teilen

Um die Forschungsdaten möglichst zuverlässig auffindbar zu machen, sollten sie mit weiteren Angaben z.B. zu den Autor*innen beschrieben werden (siehe Metadaten).

Die Forschungsdaten sollten möglichst in offenen Dateiformaten abgelegt werden (siehe Dateiformate) und so aufbereitet sein, dass andere Wissenschaftler*innen die Daten verstehen und weiterverwenden können. Ggf. kann hier eine zusätzliche Dokumentation als eigenständige Datei sinnvoll sein.

Um ein zuverlässiges Zitieren der Daten zu ermöglichen, werden Forschungsdaten automatisch mit einem eindeutigen Identifier, meist einer DOI, ausgestattet.

Forschungsdaten zu wissenschaftlichen Artikeln

Gegebenenfalls wird eine Veröffentlichung der Forschungsdaten direkt zu einem Artikel vom Verlag ermöglicht oder ist sogar gefordert. Hier sind die Vorgehensweisen bei den verschiedenen Verlagen sehr unterschiedlich und müssen im Einzelfall recherchiert werden.

Interdisziplinäre Repositorien

Auswahl an existierenden interdisziplinären Repositorien

  • Zenodo: durch EU-Mittel gefördertes Repositorium; bisher keine Kosten für Forschungsdaten mit geringem Datenvolumen; speichert auch die Large Hadron Collider-Daten von CERN (insgesamt rund 100 PB Speicherplatz)
  • Dryad: Non-Profit Organisation, die Gebühren für die Veröffentlichung von Forschungsdaten verlangt
  • figshare: kostenlose Veröffentlichung von Forschungsdaten; bietet auch privaten (nichtöffentlichen) Speicherplatz an; wird von diversen Universitäten genutzt
  • Harvard Dataverse: Repositorium, in dem Wissenschaftler*innen aller Fachdisziplinen publizieren können
  • Open Science Framework: Repositorium, um Forschungsdaten (auch Laborbücher etc.) zu speichern, mit Kolleg*innen zu teilen oder auch öffentlich zu machen
  • Mendeley Data: zurzeit kostenlose Veröffentlichung; ggf. werden in Zukunft Kosten abhängig von den Dateigrößen erhoben

Stand: 26.05.2021

Was ist bei der Veröffentlichung zu beachten?

Dateiformate

Im Laufe der Zeit veraltet Software und wird ersetzt. Somit veralten auch Dateiformate, in denen die Forschungsdaten ursprünglich erzeugt wurden. Um zu gewährleisten, dass die Daten in Zukunft nachgenutzt werden können, empfiehlt es sich offene Datenformate zu verwenden, so dass die Daten leichter in aktuelle Datenformate umgewandelt werden können. Ist dies nicht möglich, empfiehlt sich die Verwendung von Formaten, die sich in der jeweiligen Wissenschaftscommunity zum Standard etabliert haben.

Vorschläge für gut archivierbare Datenformate:

  • Textuelle Forschungsdaten: XML, TXT, HTML, PDF/A
  • Forschungsdaten in Tabellenform: CSV
  • Datenbanken: XML, CSV
  • (umfangreiche) Datensätze: CSV, HDF5, CDF
  • Bilder: TIFF, PNG, JPEG
  • Audio: FLAC, WAV, MP3

Metadaten

In den begleitenden Angaben zu den Forschungsdaten, den sogenannten Metadaten, werden wichtige Informationen hinterlegt.
Schlagworte, Stichworte und weitere Angaben zur thematischen Einordnung der Forschungsdaten helfen, den Datensatz möglichst gut auffindbar zu machen.
Dann sollten auch Bezüge zu weiteren Forschungsdaten, zu dazugehörigen Publikationen oder auch zu Forschungsprojekten hinterlegt werden, so dass z.B. die zugehörigen Publikationen direkt verlinkt werden können.

Rechtliches

Ebenso wie bei Büchern, Zeitschriftenartikeln usw. werden die Forschungsdaten unter bestimmten Lizenzen (Copyright-Bestimmungen) veröffentlicht. Typische Lizenzen sind Creative Commons, Open Data Commons, Open/Non-Commercial Government Licence oder auch Public Domain (weitere Informationen auf einer externen Webseite).
Um die einfache Nachnutzbarkeit veröffentlichter Forschungsdaten zu gewährleisten, empfiehlt sich die Verwendung möglichst freier Lizenzen. 

Eine Veröffentlichung von Forschungsdaten setzt voraus, dass man die entsprechenden Rechte besitzt sowie, dass die Rechte Dritter, bspw. bei personenbezogenen Daten oder Geheimhaltungsabreden, nicht verletzt werden. Wurden zum Beispiel Grafiken oder Bilder bereits in Verlagspublikationen verwendet, könnten die Rechte an diesen Objekten, je nach Vertrag, beim Verlag liegen.