Projektabschluss
Zum Abschluss Ihres Forschungsprojektes stellt sich die Frage, was mit Ihren Forschungsdaten geschehen wird. Je nach Wert und Nachnutzungspotential existieren verschiedene Möglichkeiten zur Publikation von Forschungsdaten, um sie Dritten zur Verfügung zu stellen. Zudem sollten Sie sich Gedanken um eine geeignete Archivierung Ihrer Daten machen, damit Ihre Forschungsergebnisse - im Sinne der Guten Wissenschaftlichen Praxis - nachvollziehbar und reproduzierbar bleiben.
Forschungsdaten publizieren
-
Warum sollte ich meine Daten veröffentlichen?
Für die Publikation von Forschungsdaten sprechen verschiedene Gründe. Dazu zählen nicht nur die erhöhte Sichtbarkeit und Reputation der wissenschaftlichen Leistungen, etwa bei Zitation und Nachnutzung von eigenen Forschungsdaten durch Dritte. Im Sinne der Guten Wissenschaftlichen Praxis dient die Veröffentlichung der Datengrundlage auch der Nachvollziehbarkeit und Reproduzierbarkeit von Forschungsergebnissen. Wissenschaftlicher Austausch und Kooperationen profitieren von der Offenlegung von Forschungsdaten. Ebenso erhöht sich potenziell der Einfluss von Forschungsergebnissen auf gesellschaftliche Debatten und politische Entscheidungen. Häufig wird auch in Bezug auf Open Science argumentiert, dass die Erzeugnisse öffentlich finanzierter Forschung grundsätzlich öffentlich zugänglich sein sollten. Nicht zuletzt vor diesem Hintergrund empfehlen Drittmittelgeber zunehmend die Veröffentlichung von Forschungsdaten, sofern keine Gründe dagegen sprechen.
Es gibt durchaus Fälle, in denen Sie Ihre Daten nicht veröffentlichen sollten oder dürfen, zum Beispiel, wenn diese urheberrechtlich geschützt sind, der Geheimhaltung unterliegen oder einen Personenbezug haben. Teilweise lassen sich solche Probleme jedoch im Vorfeld durch eine vorausschauende Projektplanung ausräumen (siehe Projektplanung). Klären Sie daher so früh wie möglich entsprechende Rechtsfragen mit Ihren Projektpartner*innen und anderen beteiligten Akteuren, holen Sie informierte Einverständniserklärungen ein und planen Sie Strategien für die Anonymisierung Ihrer Datensätze (siehe Rechtsfragen). Wir beraten Sie gerne in allen Phasen Ihres Forschungsprojektes zur Datenpublikation: [Email protection active, please enable JavaScript.]
-
Repositorien, Data Supplements & Data Journals
Damit Ihre publizierten Daten auch von Dritten genutzt und zitiert werden können, sollten Sie sich für Ihre Datenpublikation an den FAIR-Prinzipien orientieren. Diese besagen, dass Daten möglichst auffindbar (Findable), zugänglich (Accessible), verwendbar (Interoperable) und nachnutzbar lizenziert (Reusable) sein sollten.
Die Mehrheit von Datensätzen wird in Repositorien publiziert. Dies hat den Vorteil, dass diese Daten über entsprechende Suchdienste auch unabhängig von Textpublikationen gefunden und zitiert werden können. Grundsätzlich empfehlen wir Ihnen, sich an ein disziplinspezifisches Repositorium zu wenden, das auf die jeweiligen Datenformate und Metadatenstandards spezialisiert und in Ihrer Fachcommunity möglichst sichtbar ist. Viele Einrichtungen bieten Ihren Forschenden auch institutionelle Repositorien an. Als Angehörige der Universität Bonn können Sie unseren Dienst RADAR nutzen, ein disziplinübergreifendes Datenarchiv zur Veröffentlichung und Archivierung von Forschungsdaten. Neben RADAR gibt es auch andere allgemeine Repositorien, die für die Publikation verschiedenster Datensätze genutzt werden können. Bitte beachten Sie unsere disziplinspezifischen Hinweise für die Suche nach geeigneten Repositorien.
Wissenschaftliche Zeitschriften bieten vermehrt die Möglichkeit, Forschungsdaten als Anhang, bzw. als ergänzendes Material zu einem Artikel beizulegen. Dies hat zwar den Vorteil, dass die Publikation der Daten „in einem Rutsch“ mit dem Artikel erfolgt, ohne sich mit den Anforderungen anderer Plattformen auseinandersetzen zu müssen. Inwiefern diese Form der Datenpublikation jedoch den FAIR-Prinzipien entspricht, ist von der Umsetzung der jeweiligen Zeitschrift, bzw. des Verlages abhängig.
Als „Königsweg“ der Datenpublikation etablieren sich zunehmend auch Data Journals. Hier können Sie die Qualität Ihrer Forschungsdaten durch ein Peer Review-Verfahren nachweisen und ein Data Paper veröffentlichen. Data Paper eignen sich vor allem für Datensätze mit herausragender Qualität und hohem Nachnutzungspotential. Jedoch existieren (bislang) nicht für alle Fachdisziplinen geeignete Data Journals. Eine Auflistung von Data Journals finden Sie auf Forschungsdaten.org: https://www.forschungsdaten.org/index.php/Data_Journals
Für weitere Fragen bei der Suche nach der geeigneten Publikationsform für Ihre Daten stehen wir gerne unter [Email protection active, please enable JavaScript.] zur Verfügung. Weitere Information zu Publikationsformen von Forschungsdaten bieten folgende Ressourcen:
- CESSDA: Data publishing routes https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/6.-Archive-Publish/Data-publishing-routes
- Biernacka, Katarzyna et al. (2019). Wie FAIR sind Deine Forschungsdaten? https://doi.org/10.5281/zenodo.2547338
- OpenAire: How to find a trustworthy repository for your data? https://www.openaire.eu/find-trustworthy-data-repository
- Forschungsdaten.info: Datenjournale – Peer-Review-Publikationen für Daten https://www.forschungsdaten.info/themen/aufbereiten-und-veroeffentlichen/datenjournale/
-
Datenaufbereitung
Vor der Veröffentlichung gilt es, die Daten so aufzubereiten, dass sie von Dritten auch interpretiert und nachgenutzt werden können. Dies beginnt mit einem Selektions- und Kuratierungsprozess: welche Dateien in welchen Versionen sollen Teil der Publikation werden bzw. welche werden aussortiert? Zentrales Kriterium bei der Auswahl sollte das Nachnutzungspotential der Daten sein. Denken Sie dabei nicht nur an eine Verwendung erhobener Daten zur Bearbeitung weiterer Forschungsfragen, sondern erwägen Sie auch andere Nutzungsszenarien. Könnten Ihre Daten z.B. für die Lehre interessant sein, oder haben Sie Materialien, die in methodischer Hinsicht hilfreich sein könnten (Erhebungsverfahren, Fragebögen, Analysetechniken, Visualisierungsskripte etc.). Ein weiteres Kriterium für die Selektion ist die Datenmenge. Insbesondere bei großen Datensätzen können mit der Publikation auch erhebliche Kosten verbunden sein.
Alle Daten, die Sie veröffentlichen, sollten so umfassend dokumentiert sein, dass Dritte diese eigenständig verstehen und einordnen können, möglichst auch ohne Kenntnisse Ihrer Arbeiten. Beachten Sie hierzu auch unsere Hinweise zur Datendokumentation.
Sind die bestehenden Urheber- und Verwertungsrechte an den Daten geklärt? Sind evtl. notwendige Einverständniserklärungen eingeholt und Personenbezüge anonymisiert (beachten Sie auch unsere Hinweise zu Rechtsfragen) Kontrollieren Sie Ihre Daten auch nach formalen Kriterien, wie Datums- und Zahlenformaten, Werteskalen, Konventionen zur Benennung von Feldern und Variablen, verwendeten Abkürzungen, Rechtschreibfehlern usw. Achten Sie auch auf ungewollte Leer- oder Sonderzeichen, weil diese eine notorische Fehlerquelle für die automatische Datenverarbeitung darstellen.
-
Weitere Hinweise zur Datenaufbereitung finden Sie hier:
- J. Trixa & T. Ebel (2015) (Verbund Forschungsdaten Bildung): Hinweise zur Aufbereitung quantitativer Daten https://www.forschungsdaten-bildung.de/get_files.php?action=get_file&file=fdb-informiert-nr-4.pdf
- Forschungsdaten.info: Datenvalidierung https://www.forschungsdaten.info/themen/veroeffentlichen-und-archivieren/datenvalidierung/
- Digital Curation Center: Five steps to decide what data to keep http://www.dcc.ac.uk/resources/how-guides/five-steps-decide-what-data-keep
-
Metadatenvergabe
Üblicherweise werden Sie Ihre Daten vor der Publikation mit Metadaten versehen. Metadaten sind – allgemein formuliert – Informationen, die Ihren Datensatz in einer strukturierten Form beschreiben. Ohne Metadaten wäre Ihr Datensatz für Dritte praktisch wertlos, weil der Inhalt der Daten nicht ersichtlich würde. Bei Forschungsdaten umfassen Metadaten sowohl bibliographische und administrative Angaben, die Auskunft über die Entstehung des Datensatzes geben, als auch fachliche und inhaltliche Angaben, die jedoch je nach Wissenschaftsbereich sehr unterschiedlich sein können. Entsprechend gibt es viele verschiedene Metadatenstandards, die jeweils ein festes Set von Feldern zur Beschreibung des Datensatzes vorgeben. Das Spektrum reicht von allgemein gehaltenen Standards, wie dem weit verbreiteten DataCite-Schema (https://schema.datacite.org/meta/kernel-4.3/) bis hin zu fachlich spezialisierten Schemata wie der Ecological Metadata Language (https://nceas.github.io/eml/). In der Regel werden Metadaten in textbasierten Auszeichnungssprachen wie XML oder JSON vorgehalten, die sowohl mensch- als auch maschinenlesbar sind. Dadurch erst werden Forschungsdaten über entsprechende Suchdienste find- und nachnutzbar. Viele Datenrepositorien erleichtern jedoch die Vergabe von Metadaten durch Eingabemasken und Hilfetexte, so dass Sie mit den technischen Aspekten meist nicht direkt konfrontiert werden.
Wir beraten Sie gerne zu Fragen von Metadaten. Beachten Sie auch unsere disziplinspezifischen Hinweise zu diesem Thema. Zudem könnten folgende Ressourcen für Sie nützlich sein:
- Riley, Jenn (2017): Understanding metadata. What is metadata, and what is it for? Baltimore, MD: National Information Standards Organization (NISO Primer series) https://www.niso.org/publications/understanding-metadata-2017
- Cornell University: Metadata and describing data: https://data.research.cornell.edu/content/writing-metadata
- DataCite Metadata Generator: https://dhvlab.gwi.uni-muenchen.de/datacite-generator/
- Forschungsdaten.info: Metadaten und Metadatenstandards https://www.forschungsdaten.info/themen/aufbereiten-und-veroeffentlichen/metadaten-und-metadatenstandards/
-
Nutzungslizenzen
Wenn Sie Ihre Forschungsdaten veröffentlichen, versehen Sie diese in der Regel mit einer Nutzungslizenz. Diese legt fest, was mit Ihren Daten unter welchen Bedingungen gemacht werden darf. Für digitale Werke kommen häufig standardisierte Creative Commons (CC) Lizenzen zum Einsatz, die die gängigsten Nutzungsszenarien für urheberrechtlich geschütztes Material abbilden.
Obwohl CC-Lizenzen bei publizierten Forschungsdaten weit verbreitet sind, gibt es auch Lizenzen die speziell für Daten und Datenbanken ausgelegt sind. Das Projekt Open Data Commons (ODC) (https://opendatacommons.org/) bietet folgende Lizenzen an: „Public Domain Dedication and License“ (PDDL, analog zu CC0), „Attribution License (ODC-By, analog zu CC-BY)“ und Open Database License (ODC-ODbL, analog zu CC-BY-SA).
Über die Lizenz räumen Sie Dritten also bestimmte Rechte für die Nachnutzung Ihrer Daten ein. Dies setzt jedoch voraus, dass Sie auch wirklich die Rechte an den Daten innehaben. In diesem Punkt bestehen in Bezug auf Forschungsdaten häufig Unklarheiten und es können verschiedene Rechtsbereiche eine Rolle spielen, wie Urheberrecht, Leistungsschutzrecht, Datenschutzrecht, Persönlichkeitsrecht oder Arbeitsrecht (siehe auch Abschnitt zu Rechtsfragen). Bevor Sie Daten lizenzieren, sollten Sie also prüfen, von welchen Seiten Rechtsansprüche an den Daten bestehen könnten. Grundsätzlich gilt: wenn keine Schutzrechte an Daten bestehen, sind diese Gemeingut und als Public Domain zu kennzeichnen. Sie können (und sollten) diese Daten zwar veröffentlichen, haben aber keine Urheberrechte an diesen Daten, die durch CC- oder ODC-Lizenzen geltend gemacht werden könnten.
Sie können gerne mit weiteren Fragen zur Datenlizensierung an uns herantreten. Bitte beachten Sie jedoch, dass die Servicestelle Forschungsdaten keine verbindliche Rechtsberatung durchführen kann. Wenden Sie sich daher im Zweifelsfall an das Justitiariat der Universität Bonn.
-
Folgende Ressourcen zum Thema Lizenzen könnten für Sie hilfreich sein:
- Ball, Alex (2014): How to License Research Data? Digital Curation Centre http://www.dcc.ac.uk/sites/default/files/documents/publications/reports/guides/How_To_License_Research_Data.pdf
- Das Portal Forschungslizenzen http://forschungslizenzen.de
- Forschungsdaten.info: Forschungsdaten veröffentlichen? Die wichtigsten rechtlichen Aspekte https://zenodo.org/record/3368293
- Baumann, Paul; Krahn, Philipp; Lauber-Rönsberg, Anne (2020): Entscheidungsbaum für die Veröffentlichung von Forschungsdaten. Dresden: Technische Universität Dresden. https://d-nb.info/122783327X/34
- Kreutzer, Till; Lahmann, Henning (2021): Rechtsfragen bei Open Science (Legal Issues with Open Science). Hamburg University Press http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:gbv:18-3-2112
- Kreutzer, Till (Hg.) (2014): Open Content. A practical guide to using Creative Commons Licences https://commons.wikimedia.org/wiki/File:Open_Content_-_A_Practical_Guide_to_Using_Creative_Commons_Licences.pdf
- Public License Selector https://ufal.github.io/public-license-selector/
Forschungsdaten archivieren
Nachdem Sie Ihr Projekt abgeschlossen haben, stellt sich die Frage, wohin mit den Forschungsdaten? Die Gute Wissenschaftliche Praxis verlangt eine Aufbewahrung der Daten für mindestens zehn Jahre, um dem Anspruch der Überprüfbarkeit und Nachvollziehbarkeit wissenschaftlicher Erkenntnisse gerecht zu werden. Darüber hinaus dient eine durchdachte Archivierung auch Ihnen selber, wenn Sie Ihre Forschungen zu einem späteren Zeitpunkt noch einmal aufgreifen möchten. Forschungsdaten sollten einschließlich einer beschreibenden Dokumentation sowie ggf. Zwischenergebnissen und Verarbeitungswerkzeugen archiviert werden. Die Archivierung ist in der Regel unabhängig davon, ob ein Teil der Daten auch als Publikation zugänglich gemacht wird. Dies bedeutet jedoch nicht, dass Sie grundsätzlich sämtliche Dateien und Dateiversionen archivieren müssen. Ähnlich wie bei der Publikation erfordert die Archivierung eine Selektion und Aufbereitung der Daten (siehe oben). In der Regel können Sie selber am besten beurteilen, welche Daten in welcher Form aufbewahrt werden sollten, um der Dokumentationspflicht Genüge zu tun.
Archivieren Sie Ihre Daten nicht auf einem USB-Stick in der Schreibtischschublade! Je nach Umfang, Format, Gehalt und Sensibilität der Daten bieten sich unterschiedliche Archivierungsstrategien an. Im einfachsten Fall können Sie Ihre Daten auch selber vorhalten, dann aber auf mindestens drei unterschiedlichen Datenträgern an mindestens zwei unterschiedlichen Standorten (siehe auch Speicher- und Backupstrategien). Beachten Sie die begrenzte Lebensdauer von Speichermedien. Um Datenmissbrauch vorzubeugen, sollten Sie die Datenträger verschlüsseln. Wir empfehlen Ihnen, eine zusätzliche Kopie Ihrer Daten auf der File-Service-Infrastruktur der Universität Bonn abzulegen (siehe Abschnitt Speicherung und Sicherheit).
Neben solchen eigenverantwortlichen Lösungen bieten verschiedene Datenrepositorien (siehe oben) eine professionelle Archivierung, die teilweise auch auf längere Zeiträume ausgelegt ist (Langzeitarchivierung). Als Angehörige der Universität Bonn können Sie Ihre Daten auch über den RADAR-Service für bis zu 15 Jahre archivieren. Hier entscheiden Sie alleine, wer Zugang zu Ihren Daten bekommt. Andere Repositorien verfügen über verschiedene Sicherheitslevel, um sensible Daten vor unbefugtem Zugriff zu schützen.
Neben der reinen Aufbewahrung von Datensätzen in unbeschädigtem Zustand (bitstream preservation) birgt die Archivierung von Forschungsdaten noch eine weitere Herausforderung. Betriebssysteme, Softwareumgebungen und Datenformate verändern sich kontinuierlich. Dateien, die Sie heute abspeichern, können Sie vielleicht zukünftig gar nicht mehr öffnen, weil eine Software nicht mehr erhältlich ist, auf kommenden Systemen nicht installiert werden kann, oder weil ein Format nicht mehr unterstützt wird. Sie können aber zwei Maßnahmen ergreifen um dieses Risiko des Datenverlustes zu minimieren. (1) Dokumentation: je ausführlicher Sie die Software-Umgebung beschreiben (Tool-Version, verwendete AddOns, Betriebssystem usw.), desto einfacher lässt sich diese im Zweifelsfall nachbauen. Dies gilt insbesondere, wenn Sie spezialisierte Software verwenden, die nicht weit verbreitet ist. (2) Datenformate: legen Sie Ihre Daten in Formaten ab, die möglichst offen und standardisiert sind (siehe auch Abschnitt Forschungsdaten organisieren). Solche Formate sind meist interoperabel – können also viel besser in unterschiedlichen Systemumgebungen verarbeitet werden.
Wir beraten Sie gerne zu allen Fragen der Datenarchivierung. Zudem könnten folgende Ressourcen hilfreich sein:
- Briney, Kristin A. (2020) Project Close-Out Checklist for Research Data https://resolver.caltech.edu/CaltechAUTHORS:20200519-142758925
- Forschungsdaten.info: Langzeitarchivierung https://www.forschungsdaten.info/themen/bewahren-und-nachnutzen/langzeitarchivierung/
- Rekowski, Thomas. (2018). Durability of Storage Media. Zenodo. https://doi.org/10.5281/zenodo.1468358
- Weichselgartner, Erich et al. (2011): Archivierung von Forschungsdaten. In: Stephan Büttner und Hans-Christoph Hobohm (Hg.): Handbuch Forschungsdatenmanagement. Bad Honnef: Bock + Herchen, S. 191–202. https://d-nb.info/1129690342/34
- Redwine, Gabriela; Beagrie, Neil (2015): Personal Digital Archiving http://dx.doi.org/10.7207/twr15-01
Bildquellen:
Publications and Data: Auke Herrema (CC-BY)
Data Repository: Roche DG, Lanfear R, Binning SA, Haff TM, Schwanz LE, et al. (2014) CC-BY 4.0
Metadata: Jørgen Stamp CC-BY 2.5 DK
CC-Lizenzen: TU Darmstadt CC-BY-SA 3.0 DE
Floppy Box: Jeremy KeithCC-BY 2.0
Icon Publizieren: Adrien Coquet from the Noun ProjectCC-BY 3.0 US
Icon Archivieren: Nicolas Vicent from the Noun ProjectCC-BY 3.0 US