Zusammenfassung

6. Zusammenfassung#

In dieser Selbstlerneinheit lag der Fokus auf wichtigen Metadatenkonzepten, illustriert an einer beispielhaften Fragestellung, die sich u.a. mit den offenen Daten zum Thema Bewässerungsbedarf von Bäumen in einer bestimmten Region auseinandergesetzt hat. Obwohl die ganz zufriedenstellende Beantwortung aufgrund der mangelhaften Implementierung der Metadatenstandards teils missgelungen ist, haben wir versucht, ein fundiertes Verständnis für die Bedeutung von Metadatenqualität und derer Erfragen zu vermitteln.

Die Einheit begann mit einer Einführung in das Konzept des Semantic Web, das Informationen durch semantische Technologien strukturierter, verknüpfter und maschinenlesbar macht. Die Teilnehmer lernten die Grundlagen von Ontologien und Taxonomien kennen, die eine zentrale Rolle bei der Strukturierung und Nachnutzung von Daten spielen. Ergänzend wurde auf die Bedeutung der Linked Data eingegangen, die eine präzise Verknüpfung und Nachverfolgbarkeit von Informationen ermöglicht und die Grundlage für eine verbesserte Reproduzierbarkeit in der Datenverarbeitung darstellt.

Ein weiterer Schwerpunkt lag auf dem DCAT-AP Metadatenstandard, der speziell für die strukturierte Bereitstellung und Nachnutzung von Verwaltungsdaten in Deutschland angepasst wurde. Die Teilnehmende erhielten einen Überblick über die Rolle von DCAT-AP.de bei der Standardisierung und Interoperabilität von Metadaten sowie über dessen praktische Relevanz für eine effiziente und transparente Dateninfrastruktur im öffentlichen Sektor.

Die Qualität von Metadaten wurde ebenfalls ausführlich behandelt, wobei die FAIR-Prinzipien (Findability, Accessibility, Interoperability und Reusability) und das Metadata Quality Assessment (MQA) als zentrale Werkzeuge vorgestellt wurden. Anhand von Beispielen aus dem deutschen Datenportal GovData wurde gezeigt, wie Schwachstellen in der Metadatenqualität identifiziert und verbessert werden können, um eine reibungslose Nachnutzung der Daten zu gewährleisten.

Im praktischen Teil wurde die Abfragesprache SPARQL eingeführt, die speziell zur Abfrage von Daten im RDF-Format entwickelt wurde. Die Teilnehmende erlernten die Syntax und Anwendung von SPARQL, um gezielt Metadaten aus Open-Data-Portalen wie data.europa.eu abzurufen. Mithilfe von Jupyter Notebooks konnten sie Abfragen interaktiv erstellen und typische Herausforderungen wie unvollständige Metadaten oder fehlende Paginierungsfunktionen analysieren und lösen.

Die Einheit ermöglichte es den Teilnehmer:innen, durch die Kombination von theoretischem Wissen und praktischen Übungen ein tiefgehendes Verständnis für die Bedeutung von Metadatenqualität, Standardisierung und semantischen Technologien zu entwickeln. Sie konnten diese Kompetenzen auf eine Fallstudie anwenden, um reale Herausforderungen im Umgang mit offenen Daten zu bewältigen.