4.1. Kontrolle und Werkzeuge#
Es ist zunächst sinnvoll, sich mit dem Konzept der Metadaten vertraut zu machen, bevor wir uns mit deren Abfrage beschäftigen. Die einfachste Definition von Metadaten lautet: „Daten über Daten“ – also Informationen, die dazu dienen, Datensätze einzuordnen und zu kategorisieren, damit diese leichter auffindbar und übersichtlich bleiben. Verschiedene Arten von Metadaten erfüllen unterschiedliche Funktionen [Riley, 2017]. So enthalten zum Beispiel beschreibende Metadaten für ein Dokument Informationen wie den Autor, das Erstellungsdatum, die Dateigröße und Schlagwörter. Technische Metadaten für eine relationale Datenbank könnten dagegen die Struktur der Tabellen, Datentypen und Beziehungen zwischen den Tabellen beschreiben.
Aufgrund der enormen Datenmengen, die heutzutage verarbeitet werden, sind Metadaten unverzichtbar. Sie ermöglichen einen verbesserten Datenzugriff und vereinfachen die Navigation durch umfangreiche Datensätze, wodurch Rohdaten in wertvolle Erkenntnisse umgewandelt werden können. Ein Einzelhandelsunternehmen könnte beispielsweise Metadaten nutzen, um Verkaufsdaten für einen bestimmten Monat, gefiltert nach Produktkategorie und Region, schnell zu finden, ohne das gesamte Datenvolumen durchsuchen zu müssen [Duval et al., 2002]. Metadaten sind auch somit entscheidend für die Datenverwaltung und das Datenmanagement.
Metadaten, wie alle anderen Datentypen, sollen auffindbar, zugänglich, interoperabel (bzw. kompatibel) und wiederverwendbar sein. Nützliche Qualitätskriterien für Metadaten sind beispielsweise die FAIR-Prinzipien. In einer weiteren Fallstudie von QUADRIGA beleuchten wir detailliert die Philosophie und Richtlinien, die den FAIR-Prinzipien zugrunde liegen. Weitere Informationen finden Sie hier.
Die FAIR-Prinzipien dienen als Grundlage für das Metadata Quality Assessment (MQA), ein vom Konsortium des data.europa.eu-Portals entwickeltes Tool zur Bewertung der Qualität der von data.europa.eu erhobenen Metadaten.
Das MQA zielt darauf ab, die Qualität der Metadaten für Daten des öffentlichen Sektors in Europa zu bewerten und die größten Hindernisse, die einer besseren Datenqualität entgegenstehen, zu identifizieren. Die Untersuchung konzentriert sich auf spezifische Fragestellungen, wie die Einhaltung von DCAT-AP-Standards, die Offenlegung zusätzlicher Informationen, die Zugänglichkeit und Maschinenlesbarkeit der referenzierten Daten sowie die Lizenzverwendung.
Auf dem Metadata Quality Dashboard des europäischen Metadatenportals wird eine Bewertung aller gesammelten europäischen Portale zusammengefügt und dargestellt. Mithilfe dieser Werkzeuge lässt sich beurteilen, welche Portale gemäß den FAIR-Prinzipien die vollständigsten und “saubersten” Datensätze anbieten. Die Prozentzahlen geben den Anteil der Datensätze an, die den jeweiligen Kriterien entsprechen. Durch den Verlauf kann man nachvollziehen, wie diese Anteile im Laufe der Jahre schwanken, insbesondere da kontinuierlich neue Datensätze hinzugefügt werden, die die Kriterien erfüllen oder nicht. Im Übersichtsbereich ist beispielsweise ersichtlich, dass das nationale spanische Datenportal eine ausgezeichnete Bewertung erhalten hat (Stand März 2025). Lassen Sie uns nun das Open Data Portal Deutschland betrachten und einschätzen, wie fortgeschritten die Open-Data-Initiative in Deutschland ist und welche Schwachstellen noch bestehen. In der folgenden Übung können Sie eigenständig die Seite durchstöbern und potenzielle Unzulänglichkeiten ausfindig machen.
Was Sie mitnehmen sollten
Metadaten sind entscheidend, um Daten schnell und effizient zu organisieren, zu kategorisieren und auffindbar zu machen. Sie ermöglichen eine bessere Navigation durch große Datenmengen und tragen zur Umwandlung von Rohdaten in wertvolle Informationen bei. Die Anwendung der FAIR-Prinzipien für Metadaten stellt sicher, dass diese Daten zugänglich, interoperabel und wiederverwendbar sind, und wird durch Werkzeuge wie das Metadata Quality Assessment (MQA) zur Bewertung und Verbesserung der Metadatenqualität unterstützt.