Metadaten und Werkzeuge zur Qualitätsbestimmung

4.1. Metadaten und Werkzeuge zur Qualitätsbestimmung#

Der Titel “Kontrolle und Werkzeuge” erscheint mir nicht passend. Zudem ist es unsinnig, Grundlagenwissen zu Metadaten zu vermitteln oder nur zu wiederholen, wenn im vorherigen Kapitel bereits DCAT-AP thematisiert wurde. Habe es trotzdem drin gelassen, da sonst das ganze Kapitel keinen Sinn hat.

Ein Schlagwortkatalog an der Universitätsbibliothek Graz

Fig. 4.1 Karteikarten in einem Schlagwortkatalog, CC BY-SA Marcus Gossler.#

4.1.1. Metadaten#

Bevor wir uns mit der Abfrage von Metadaten beschäftigen, ist es sinnvoll, vorhandenes Wissen zu Metadaten zu rekapitulieren. Metadaten sind Informationen über Daten, die dazu dienen, diese einzuordnen und zu kategorisieren, damit sie u. a. leichter auffindbar sind.
Es gibt verschiedene Arten von Metadaten, die unterschiedliche Funktionen erfüllen [Riley, 2017]. So enthalten zum Beispiel beschreibende Metadaten Informationen wie die Autor:innen, das Erstellungsdatum, die Dateigröße und Schlagwörter. Technische Metadaten (beispielsweise einer relationalen Datenbank) könnten dagegen die Struktur von Tabellen, Datentypen und Beziehungen zwischen den Tabellen beschreiben.

Weitere Informationen

Das ”Kompetenzzentrum Open Data” (CCOD) des ”Bundesverwaltungsamtes” (BVA) hat 2023 eine 2. Version des ”Leitfadens Metadaten” veröffentlicht, der eine kurze Einführung in die Thematik mit Fokus auf den Auszeichnungsprozess beim deutschen Datenportal ”GovData” bietet.

Metadaten sind unverzichtbar, um Daten zu finden. Das bedeutet im Umkehrschluss auch, dass Metadaten der Schlüssel sind, wenn es darum geht, eigene (Forschungs)Daten auffindbar zu veröffentlichen. Sie ermöglichen einen verbesserten Datenzugriff und vereinfachen die Navigation durch umfangreiche Datensätze, wodurch Rohdaten in wertvolle Erkenntnisse umgewandelt werden können. Ein Einzelhandelsunternehmen könnte beispielsweise Metadaten nutzen, um Verkaufsdaten für einen bestimmten Monat, gefiltert nach Produktkategorie und Region, schnell zu finden, ohne das gesamte Datenvolumen durchsuchen zu müssen [Duval et al., 2002]. Metadaten sind somit auch entscheidend für die Datenverwaltung und das Datenmanagement.

Metadaten sollten, wie die Daten, die sie beschreiben, auffindbar, zugänglich, interoperabel (bzw. kompatibel) und wiederverwendbar sein. Sie sollten also entsprechend den FAIR-Prinzipien ausgezeichnet sein. In einer weiteren unserer Lerneinheiten finden Sie eine Einführung in die FAIR-Prinzipien.

Weitere Informationen

Der Open Data Support der Europäischen Kommission hat ein Trainingsmodul als Präsentation (pdf) zur Qualität von offenen Daten und Metadaten veröffentlicht.

Die Qualität von Daten ist zudem Thema einer weiteren Lerneinheit des Projektes QUADRIGA.

Falls Sie noch nach einem grundsätzlichen Überblick zum Thema Metadaten suchen, sei Ihnen das Kleine Handbuch Metadaten von Stefanie Rühle, Kompetenzzentrum Interoperable Metadaten, empfohlen.

4.1.2. Überprüfen der Metadatenqualität#

Die FAIR-Prinzipien dienen auch als Grundlage für das Metadata Quality Assessment (MQA), ein vom Konsortium des europäischen Datenportals data.europa.eu entwickeltes Tool zur Bewertung der Qualität der von data.europa.eu erhobenen Metadaten.

Das MQA zielt darauf ab, die Qualität der Metadaten für Daten des öffentlichen Sektors in Europa zu bewerten und die größten Hindernisse, die einer besseren Datenqualität entgegenstehen, zu identifizieren. Die Untersuchung konzentriert sich auf spezifische Fragestellungen, wie die Einhaltung von DCAT-AP-Standards, die Offenlegung zusätzlicher Informationen, die Zugänglichkeit und Maschinenlesbarkeit der referenzierten Daten sowie die Lizenzverwendung.

Die Bewertung ist an die FAIR-Prinzipien angelehnt und erfolgt in den fünf Dimensionen Auffindbarkeit, Zugänglichkeit, Interoperabilität, Wiederverwendbarkeit und Kontext. Dabei werden für einzelne Dimensionen verschiedene Indikatoren bewertet und Punkte vergeben. Die insgesamt erreichte Punktzahl entscheidet am Ende über die Bewertung in den vier Kategorien “Exzellent”, “Gut”, “Ausreichend” oder “Mangelhaft”.

Darstellung der Indikatoren der Dimensionen des Metadata Quality Assessment.

Fig. 4.2 Darstellung einzelner Indikatoren innerhalb der Dimensionen Auffindbarkeit und Zugänglichkeit.#

Bildquelle: Screenshot der Indikatoren der Bewertungsdimensionen Auffindbarkeit und Zugänglichkeit des Metadata Quality Assessment, https://data.europa.eu/mqa/?locale=de, Amt für Veröffentlichungen der Europäischen Union, Zugriff am 03.07.2025.

Durch den Verlauf kann man nachvollziehen, wie diese Anteile im Laufe der Jahre schwanken, insbesondere da kontinuierlich neue Datensätze hinzugefügt werden, die die Kriterien erfüllen oder nicht. Im Übersichtsbereich ist beispielsweise ersichtlich, dass das spanische Datenportal Your Open DAta auf data.europa.eu eine gute Bewertung erhalten hat, wobei in auffällig ist, dass die Auffindbarkeit 100% erhält, während die Zugänglichkeit voll oder fast gar nicht gegeben ist:

Darstellung der Auffindbarkeit und der Zugänglichkeit des spanischen Datenportals "Your Open DAta"

Fig. 4.3 Darstellung der Auffindbarkeit und der Zugänglichkeit des spanischen Datenportals Your Open DAta.#

Screenshot der Evalutaion des spanischen Datenportals Yor Open DAta, https://data.europa.eu/mqa/catalogues/yoda?locale=de, Amt für Veröffentlichungen der Europäischen Union, Zugriff am 01.08.2025.

Auf dem Metadata Quality Dashboard des europäischen Metadatenportals wird eine Bewertung aller europäischen Portale geboten und die besten 12 Portale hervorgehoben.

Was Sie mitnehmen sollten

Metadaten erleichtern die Suche nach und die Verwendung von Daten. Sie ermöglichen eine bessere Navigation durch große Datenmengen und erleichtern die Nachnutzung. Die Anwendung der FAIR-Prinzipien auf die Metadaten stellt sicher, dass diese Daten auffindbar, zugänglich, interoperabel und wiederverwendbar sind, was durch Werkzeuge wie das Metadata Quality Assessment (MQA) überprüft werden kann.

Literatur

[DHSW02]

Erik Duval, Wayne Hodgins, Stuart Sutton, and Stuart L Weibel. Metadata principles and practicalities. D-lib Magazine, 8(4):1–10, 2002.

[Ril17]

Jenn Riley. Understanding metadata. Washington DC, United States: National Information Standards Organization (http://www.niso.org/publications/press/UnderstandingMetadata.pdf), 23:7–10, 2017.