3.4. 🏆Selbsttest: Wissen und Praxis#
Hinweis
Diese Übungsaufgaben dienen Ihrer Selbsteinschätzung und helfen Ihnen, das im Kapitel Gelernte zu reflektieren.
Sie können die Fragen in beliebiger Reihenfolge beantworten und auch mehrfach versuchen.
So funktioniert es:
Wählen Sie bei jeder Frage die Antwort(en), die Sie für richtig halten
Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfältig durch
Die Erklärungen helfen Ihnen, Ihr Verständnis zu vertiefen – auch bei korrekten Antworten
Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um Wissenslücken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.
Geschätzte Zeit: XXX
Viel Erfolg!
3.4.1. Frage 1#
3.4.2. Frage 2#
3.4.3. Frage 3#
3.4.4. Frage 4#
3.4.5. Frage 5#
3.4.6. Aufgabenstellung#
In dieser Übung werden Sie die FAIRness eines realen Forschungsdatensatzes anhand einer Checkliste evaluieren. Alle notwendigen Informationen sind in der Aufgabenstellung enthalten.
Realer Datensatz#
Sie bewerten den Datensatz “Hochschulpersonal nach Hochschularten und Hochschulen” vom BMBF, der über das europäische Datenportal verfügbar ist: Link zum Datensatz
Eigenschaften des Datensatzes:#
Verfügbar in drei Formaten: CSV, XLS und HTML
Hat einen Hauptidentifikator des Datenbereitstellers und einen uriRef des europäischen Portals
Lizenz: DL-DE BY 2.0 (Datenlizenz Deutschland – Namensnennung)
Download ohne Registrierung möglich
Zeitraum: 2014-2023
Inhalte: Unterscheidung nach Hochschularten (Universitäten, Pädagogische Hochschulen, etc.) und Personaltypen (hauptberuflich/nebenberuflich, wissenschaftlich/technisch/Verwaltung)
Spaltennamen nur auf Deutsch
Quelle im Datensatz angegeben: “Statistisches Bundesamt (Statistischer Bericht Hochschulpersonalstatistik, Fachserie 11 Reihe 4.4)”
Keine separate Dokumentation oder Variablenbeschreibungen vorhanden
Keine Methodikbeschreibung verfügbar
Das europäische Datenportal hat eine “Metadata Quality Assurance” für diesen Datensatz
Metadaten sind in verschiedenen Formaten verfügbar (RDF/XML, Turtle, JSON-LD, etc.)
FAIR-Checkliste#
Bewerten Sie die FAIRness dieses realen Datensatzes anhand der folgenden Checkliste. Für jede Aussage wählen Sie “Ja” oder “Nein” und begründen Ihre Entscheidung in 1-2 Sätzen.
Findable (Auffindbar)#
Begründung:
Begründung:
Begründung:
Begründung:
Accessible (Zugänglich)#
Begründung:
Begründung:
Begründung:
Begründung:
Interoperable (Interoperabel)#
Begründung:
Begründung:
Begründung:
Begründung:
Reusable (Wiederverwendbar)#
Begründung:
Begründung:
Begründung:
Begründung:
Auswertung und Reflexion#
Nach dem Ausfüllen der Checkliste beantworten Sie bitte folgende Fragen:
Wie bewerten Sie die Gesamtqualität des Datensatzes in Bezug auf die FAIR-Prinzipien? Welches Prinzip wird am besten erfüllt, welches am schlechtesten?
Welche drei konkreten Maßnahmen würden Sie empfehlen, um die FAIRness dieses Datensatzes zu verbessern? Begründen Sie Ihre Empfehlungen.
Inwiefern unterstützt die Verfügbarkeit über das europäische Datenportal die FAIR-Prinzipien? Welche Aspekte könnten dennoch verbessert werden?
Musterlösung
FAIR-Checkliste
Findable (Auffindbar)
Der Datensatz verfügt über einen persistenten Identifikator (z.B. DOI, URN).
Ja
Begründung: Der Datensatz hat sowohl einen Hauptidentifikator des Datenbereitstellers (https://www.datenportal.bmbf.de/portal/2.5.56) als auch einen uriRef des europäischen Portals, die beide als persistente Identifikatoren fungieren.
Der Datensatz ist mit aussagekräftigen Metadaten beschrieben.
Ja
Begründung: Die Metadaten sind in verschiedenen standardisierten Formaten (RDF/XML, Turtle, JSON-LD, etc.) verfügbar und enthalten wichtige Informationen wie Titel, Lizenz, Format und Änderungsdatum.
Die Metadaten geben eindeutig an, wie auf den Datensatz zugegriffen werden kann.
Ja
Begründung: Die Metadaten enthalten Download-Links (dcat:downloadURL) und der Zugang ist über das Portal ohne Registrierung möglich.
Die Metadaten sind in einer durchsuchbaren Ressource indexiert.
Ja
Begründung: Der Datensatz ist über das europäische Datenportal indexiert und durchsuchbar, auch wenn spezifische Suchbegriffe erforderlich sind.
Accessible (Zugänglich)
Der Datensatz kann über standardisierte Kommunikationsprotokolle abgerufen werden.
Ja
Begründung: Der Datensatz kann über Standard-Webprotokolle (HTTP/HTTPS) heruntergeladen werden.
Das Protokoll zum Zugriff auf die Daten ist offen, kostenlos und universell implementierbar.
Ja
Begründung: HTTP/HTTPS-Protokolle sind offen, kostenlos und universell implementierbar.
Die Metadaten bleiben zugänglich, auch wenn die Daten nicht mehr verfügbar sind.
Ja
Begründung: Die Metadaten sind im europäischen Datenportal gespeichert und würden auch bei Nichtverfügbarkeit der Daten vom ursprünglichen Anbieter erhalten bleiben.
Falls erforderlich, sind Authentifizierungs- und Autorisierungsverfahren klar beschrieben.
Ja
Begründung: Es sind keine Authentifizierungs- oder Autorisierungsverfahren erforderlich, was klar ersichtlich ist (kein Registrierungshinweis).
Interoperable (Interoperabel)
Der Datensatz verwendet eine formale, zugängliche, gemeinsame und weit verbreitete Sprache zur Wissensrepräsentation.
Teilweise/Nein
Begründung: Die Spaltennamen sind nur auf Deutsch verfügbar, was die internationale Interoperabilität einschränkt, auch wenn die Datenstruktur standardisiert ist.
Der Datensatz verwendet Vokabulare, die den FAIR-Prinzipien folgen.
Nein
Begründung: Es gibt keine Hinweise darauf, dass spezielle FAIR-konforme Vokabulare verwendet werden; die Terminologie ist domänenspezifisch aber nicht standardisiert.
Der Datensatz enthält qualifizierte Verweise auf andere Daten.
Teilweise
Begründung: Es gibt einen Verweis auf die Originalquelle (Statistisches Bundesamt), aber keine strukturierten Verweise auf verwandte Datensätze.
Der Datensatz liegt in einem nicht-proprietären Format vor.
Ja
Begründung: Der Datensatz ist als CSV verfügbar, was ein offenes, nicht-proprietäres Format ist (zusätzlich zu XLS und HTML).
Reusable (Wiederverwendbar)
Der Datensatz hat eine klare und zugängliche Datennutzungslizenz.
Ja
Begründung: Die DL-DE BY 2.0 Lizenz ist klar angegeben und erlaubt die Nutzung unter Nennung des Bereitstellers.
Der Datensatz enthält detaillierte Herkunftsinformationen.
Teilweise
Begründung: Die Quelle (Statistisches Bundesamt) ist angegeben, aber detaillierte Informationen zur Datenerhebung und -verarbeitung fehlen.
Der Datensatz folgt Community-Standards.
Ja
Begründung: Die Bereitstellung in gängigen Formaten (CSV, XLS) entspricht den Standards der Community für statistische Daten.
Der Datensatz enthält angemessene Dokumentation über seine Erstellung.
Nein
Begründung: Es fehlen separate Dokumentation, Variablenbeschreibungen und eine ausführliche Methodikbeschreibung.
Auswertung und Reflexion (Musterantworten)
Gesamtqualität: Der Datensatz erfüllt die FAIR-Prinzipien überwiegend gut. Am besten erfüllt wird das Prinzip “Accessible” (Zugänglichkeit), da der Datensatz ohne Hürden über standardisierte Protokolle zugänglich ist und klare Lizenzierung vorliegt. Am schlechtesten erfüllt wird das Prinzip “Reusable” aufgrund fehlender ausführlicher Dokumentation und Methodikbeschreibung.
Verbesserungsmaßnahmen:
Bereitstellung einer umfassenden Dokumentation mit Variablenbeschreibungen und Methodikbeschreibung direkt beim Datensatz
Mehrsprachige Beschreibungen (mindestens Englisch) für internationale Nutzung
Strukturierte Verlinkung zu verwandten Datensätzen und Verwendung standardisierter Vokabulare
Europäisches Datenportal: Das Portal unterstützt die FAIR-Prinzipien erheblich durch standardisierte Metadaten, Suchfunktionen, Qualitätsbewertungen und dauerhafte Archivierung. Verbesserungen könnten in besseren Suchfunktionen (funktionierender “Ähnliche Datensätze”-Button) und mehrsprachiger Unterstützung liegen.