4.6. 🏆Selbsttest: Wissen und Praxis#
Hinweis
Diese Übungsaufgaben dienen Ihrer Selbsteinschätzung und helfen Ihnen, das im Kapitel Gelernte zu reflektieren.
Sie können die Fragen in beliebiger Reihenfolge beantworten und auch mehrfach versuchen.
So funktioniert es:
Wählen Sie bei jeder Frage die Antwort(en), die Sie für richtig halten
Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfältig durch
Die Erklärungen helfen Ihnen, Ihr Verständnis zu vertiefen – auch bei korrekten Antworten
Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um Wissenslücken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.
Geschätzte Zeit: XXX
Viel Erfolg!
4.6.1. Frage 1#
4.6.2. Frage 2#
4.6.3. Frage 3#
4.6.4. Frage 4#
4.6.5. Aufgabe 1: Erklärung der Formatwahl#
Szenario: Sie arbeiten an einem Forschungsprojekt und müssen entscheiden, in welchem Format Sie Ihre tabellarischen Daten veröffentlichen. Sie haben die Wahl zwischen XLSX und CSV.
Erklären Sie in 2-3 Sätzen, warum die Wahl des Dateiformats für die Maschinenlesbarkeit wichtig ist.
Basierend auf dem Kapitelinhalt: Welches Format würden Sie für die Veröffentlichung von Forschungsdaten empfehlen und warum?
In welchem Fall könnte XLSX trotz seiner Einschränkungen sinnvoll sein?
Musterlösung
1. Bedeutung der Formatwahl: Die Wahl des Dateiformats beeinflusst erheblich, wie gut Daten von verschiedenen Software-Systemen automatisch verarbeitet werden können. Maschinenlesbare Formate ermöglichen es, Daten programmgesteuert zu analysieren, ohne manuelle Konvertierung oder Anpassungen. Dies ist besonders wichtig für die Reproduzierbarkeit und Nachnutzung von Forschungsdaten.
2. Empfehlung: Basierend auf dem Kapitel würde ich CSV empfehlen, da es sich um ein nicht-proprietäres, offenes Format handelt, das unabhängig von spezifischer Software verwendet werden kann. CSV-Dateien sind einfach strukturiert und können von praktisch allen Analyse-Tools gelesen werden, was die Interoperabilität und Nachnutzung fördert.
3. XLSX-Anwendungsfall: XLSX könnte sinnvoll sein, wenn komplexe Formatierungen, mehrere Arbeitsblätter oder eingebettete Formeln für die Interpretation der Daten wichtig sind. Allerdings sollte in solchen Fällen zusätzlich eine CSV-Version für die maschinelle Verarbeitung bereitgestellt werden.
4.6.6. Aufgabe 2: Bewertung nach dem 5-Sterne-Modell#
Szenario: Sie sollen das 5-Sterne-Modell auf folgenden fiktiven Datensatz anwenden:
Datensatz-Eigenschaften:
Name: “Universitätsstudierende nach Fächergruppen 2023”
Anbieter: Statistisches Landesamt XY
Lizenz: Creative Commons BY 4.0
Format: Verfügbar als Excel-Datei (.xlsx) und als CSV-Datei
Identifikator: Feste URL auf der Webseite des Landesamts, aber kein DOI oder URN
Verlinkungen: Keine strukturierten Links zu anderen Datensätzen
Zugang: Kostenloser Download ohne Registrierung
Bewertungsschema:
Bewerten Sie den Datensatz für jeden Stern. Da das Modell kaskadierend ist, bewerten Sie schrittweise von Stern 1 bis zum höchsten erreichbaren Stern.
Begründung:
Begründung:
Begründung:
Begründung:
Begründung:
Reflexionsfragen#
Welche zwei konkreten Maßnahmen würden Sie empfehlen, um die Sterne-Bewertung dieses Datensatzes zu verbessern?
Warum ist das kaskadierende System des 5-Sterne-Modells sinnvoll?
Musterlösung
Bewertung nach dem 5-Sterne-Modell
1. Stern - Offene Lizenz:
Ja - 1 Stern wird vergeben
Begründung: Creative Commons BY 4.0 ist eine offene Lizenz, die die freie Nutzung, Bearbeitung und Weitergabe der Daten unter Namensnennung erlaubt.
2. Stern - Maschinenlesbare, strukturierte Daten:
Ja - 2. Stern wird vergeben
Begründung: Sowohl Excel als auch CSV sind strukturierte, maschinenlesbare Formate, die automatisch verarbeitet werden können.
3. Stern - Nicht-proprietäres Format:
Ja - 3. Stern wird vergeben
Begründung: Der Datensatz ist als CSV verfügbar, was ein offenes, nicht-proprietäres Format ist, das unabhängig von spezifischer Software verwendet werden kann.
4. Stern - Persistenter Identifikator (URI):
Nein - Bewertung bleibt bei 3 Sternen
Begründung: Eine feste URL ist nicht dasselbe wie ein persistenter Identifikator (DOI, URN). URLs können sich ändern und bieten keine Garantie für dauerhafte Verfügbarkeit.
5. Stern - Verlinkung mit anderen Daten:
Nein - (nicht erreichbar, da bereits bei 4. Stern gescheitert)
Begründung: Es gibt keine strukturierten Verlinkungen zu anderen Datensätzen.
Gesamtbewertung: 3 Sterne
Reflexionsfragen (Musterantworten):
Verbesserungsmaßnahmen:
Vergabe eines persistenten Identifikators (DOI oder URN) für den Datensatz
Strukturierte Verlinkung zu verwandten Datensätzen (z.B. zu ähnlichen Statistiken anderer Jahre oder Bundesländer)
Kaskadierende System: Das kaskadierende System ist sinnvoll, weil es eine logische Hierarchie der Datenqualität und -offenheit abbildet. Höhere Stufen bauen auf niedrigeren auf - ohne offene Lizenz (1 Stern) macht Maschinenlesbarkeit (2 Sterne) für die Nachnutzung wenig Sinn. Ohne persistenten Identifikator (4 Sterne) sind Verlinkungen (5 Sterne) nicht dauerhaft möglich.