3.1. FAIR-Prinzipien#
In Bezug auf die Nachnutzung von (Forschungs-)Daten wollen wir Sie hier mit den FAIR-Prinzipien vertraut machen. Diese stellen Grundsätze des Datenmanagements dar, die unter anderem den Austausch und die weitere Nutzung von Daten vereinfachen. FAIR ist das Akronym von Findable, Accessible, Interoperable und Reusable - also auffindbar, zugänglich, interoperabel (bzw. kompatibel) und wiederverwendbar. Diese 2016 veröffentlichten Prinzipien, die seit 2019 auch in den “Leitlinien zur Sicherung guter wissenschaftlicher Praxis” der Deutschen Forschungsgemeinschaft verankert sind [Forschungsgemeinschaft, 2022], haben sich mittlerweile zu einem Standard entwickelt [Spiecker et al., 2022].

Fig. 3.1 Die FAIR-Prinzipien.#
Bildquelle: The Turing Way Community, & Scriberia. (2020). Illustrations from the Turing Way book dashes. Zenodo. https://doi.org/10.5281/zenodo.3695300
Die FAIR-Prinzipien wurden im Projekt PARTHENOS von Hollander et al. (2019) zu Richtlinien zusammengefasst, die im Folgenden - noch einmal gekürzt - vorgestellt werden [Hollander, 2019].
Die Auffindbarkeit von Daten lässt sich zum Beispiel durch die Verwendung von Persistenten Identifikatoren (s. Abschnitt Persistent Identifier (PID)) wesentlich vereinfachen. Dieser Aspekt ist von zentraler Bedeutung für alle FAIR-Prinzipien. Weiterhin sollten Forschungsdaten immer mit Quellen versehen werden wie es die fachspezifischen Standards erfordern (s. Abschnitt Datenzitierung). Darüber hinaus sollten die Daten mit aussagekräftigen Metadaten beschrieben werden, für die es bereits einige disziplinspezifische und -übergreifende Standards und Schemata gibt.
Unter Zugänglichkeit fällt die Auswahl eines vertrauenswürdigen Repositoriums als Speicherort für die Daten und die klare Regelung des Zugriffs auf diese sowie die Verwendung von standardisierten Protokollen.
Eine Interoperabilität von Daten lässt sich einstellen, wenn Daten sowohl von Menschen als auch Maschinen einfach mit anderen Daten verknüpft werden können. Dies lässt sich durch gut dokumentierte und maschinenlesbare APIs, eindeutig definierte und für das Fachgebiet relevante Vokabulare und offene, standardisierte Dateiformate erreichen.
Die Wiederverwendbarkeit von Daten lässt sich von vornherein unterstützen, indem transparent dokumentiert wird, was die Daten beinhalten. Die präzise Benennung von Daten - auch nach Konventionen - erleichtert eine Nachnutzung ebenfalls. Die Nutzung von gängigen, in der Disziplin typischen Formaten ist hier erneut zu nennen und schließlich vereinfacht zudem die Verwendung von Lizenzen die Nachnutzung von Daten erheblich, da dadurch klar definiert ist, wer welche Rechte hat und wer die Daten wie verwenden darf.
FAIR in der Praxis
Falls Sie sich fragen, was das mit ihrer (Daten-)Praxis zu tun hat, seien hier ein paar Stichworte genannt:
Eine gute Dokumentation, Aus- und Bezeichnung von Daten erleichtert Ihnen und Ihren Kolleg:innen das Arbeiten mit diesen - auch in Zukunft.
Wenn Sie eigene Forschung betreiben, werden Sie sich freuen, wenn es zu Ihrer Forschungsfrage Vergleichsdaten aus anderen Städten oder Bundesländern gibt, die Sie nachnutzen können.
Sie müssen gar keine eigenen Daten erheben, weil zu einer bestimmten Problematik bereits viele Daten vorliegen bzw. die Erhebung überproportional aufwändig wäre.
Wenn Ihre Daten nachgenutzt werden, wird Ihre Forschung unter neuen Aspekten weitergeführt. Sie bleibt dadurch länger relevant und kann zu einem wichtigen Impuls für neue Ideen werden.
Weitere Informationen
Eine detaillierte Ausformulierung der Prinzipien auf Englisch findet sich auf der Webseite der Initiative GO FAIR und eine deutsche Übersetzung der originalen Prinzipien ist bei Zenodo einsehbar [Wilkinson et al., 2016]. Zum Prüfen der so genannten FAIRness von Daten haben sich Checklisten etabliert. Eine von diesen stammt von Jones und Grootveld (2017), die ebenfalls bei Zenodo zugänglich ist [Jones and Grootveld, 2017]. Sie stellt die Basis für die Übung im nächsten Abschnitt dar.
Literatur
Deutsche Forschungsgemeinschaft. Guidelines for safeguarding good research practice. code of conduct. April 2022. URL: https://doi.org/10.5281/zenodo.6472827, doi:10.5281/zenodo.6472827.
Helli Hollander. PARTHENOS Leitfaden zur "FAIRifizierung" des Datenmanagements und der Ermöglichung der Nachnutzung von Daten. 2019. URL: https://zenodo.org/records/3363078.
Sarah Jones and Marjan Grootveld. How fair are your data? November 2017. URL: https://doi.org/10.5281/zenodo.5111307, doi:10.5281/zenodo.5111307.
Claus Spiecker, Janina Richter, Paul Walter, Maria Chlastak, Christine Burkart, Esther Schneidenbach, Reinhard Messerschmidt, Kirsten Endres, Christian Djeffal, and Eva Nürnberger. EcoDM - ökosystem Datenmanagement: Analysen - Empfehlungen - FAIRifizierung. Technical Report, Zenodo, April 2022. URL: https://zenodo.org/records/6256398 (visited on 2024-06-06), doi:10.5281/zenodo.6256398.
Mark D. Wilkinson, Michel Dumontier, IJsbrand Jan Aalbersberg, Gabrielle Appleton, Myles Axton, Arie Baak, Niklas Blomberg, Jan-Willem Boiten, Luiz Bonino da Silva Santos, Philip E. Bourne, Jildau Bouwman, Anthony J. Brookes, Tim Clark, Mercè Crosas, Ingrid Dillo, Olivier Dumon, Scott Edmunds, Chris T. Evelo, Richard Finkers, Alejandra Gonzalez-Beltran, Alasdair J.G. Gray, Paul Groth, Carole Goble, Jeffrey S. Grethe, Jaap Heringa, Peter A.C. 't Hoen, Rob Hooft, Tobias Kuhn, Ruben Kok, Joost Kok, Scott J. Lusher, Maryann E. Martone, Albert Mons, Abel L. Packer, Bengt Persson, Philippe Rocca-Serra, Marco Roos, Rene van Schaik, Susanna-Assunta Sansone, Erik Schultes, Thierry Sengstag, Ted Slater, George Strawn, Morris A. Swertz, Mark Thompson, Johan van der Lei, Erik van Mulligen, Jan Velterop, Andra Waagmeester, Peter Wittenburg, Katherine Wolstencroft, Jun Zhao, and Barend Mons. Die fair-prinzipien für das wissenschaftliche datenmanagement und data stewardship. March 2016. URL: https://doi.org/10.5281/zenodo.6247015, doi:10.5281/zenodo.6247015.