1.1. Lernziele#
Nach erfolgreichem Durchlaufen dieses JupyterNotebooks können im Erfolgsfall die folgenden Lernziele erreicht werden:
Grundsätze des Datenmanagements
Die vier FAIR-Prinzipien können definiert und ihre Bedeutung anhand eines konkreten Beispiels erläutert werden.
Die FAIRness eines gegebenen Datensatzes kann anhand einer Checkliste bewertet werden.
Sicherstellen der Qualität von Datensätzen
Zentrale Qualitätskriterien für Datensätze können definiert und ihre Bedeutung für die Forschung erläutert werden.
Die Unterschiede zwischen XLSX- und CSV-Dateiformaten können erklärt und Vor- und Nachteile für verschiedene Anwendungsfälle aufgezeigt werden.
Die Qualität eines gegebenen Datensatzes kann anhand einer Checkliste bewertet werden.
Die allgemein anerkannten Methoden der Datenzitierung können beschrieben werden.
Persistente Identifikatoren (PIDs) können definiert und ihre Rolle in der Datenzitierung erläutert werden.
Zwischen verschiedenen Arten von PIDs (z.B. DOI, ORCID) kann unterschieden und ihre spezifischen Einsatzbereiche identifiziert werden.
Datenaufbereitung und -strukturierung
Der Begriff Datenaufbereitung kann definiert und seine Bedeutung für die Qualitätsverbesserung und Informationsgewinnung aus Datensätzen erklärt werden.
Spezifische Datenaufbereitungstechniken können identifiziert und ihre Anwendung in einem gegebenen Datensatz beschrieben werden.
Die Wichtigkeit einer klaren Datenstruktur für effektive Datenaufbereitung kann erläutert und anhand eines Beispiels demonstriert werden.
Datenanalyse und -reproduzierbarkeit
Die Wichtigkeit einer sorgfältigen Dokumentation bei der Durchführung einer deskriptiven Analyse kann beschrieben und anhand eines konkreten Beispiels (aus der Fallstudie zur Reproduzierbarkeit) können mindestens drei für die Reproduzierbarkeit besonders relevante Aspekte erläutert werden.
Eine Software (RStudio) kann angewendet werden, um Daten in einer angemessenen Form zu visualisieren.