3.1. Einführung Metadaten#
Fig. 3.1 Metadata, © @Markus Winkler via Unsplash#
Metadaten sind Daten über Daten. Oder, wie Johanna Drucker es treffend formuliert: “Think of metadata as the information about a resource or digital asset”. Die Bandbreite der Erscheinungsformen von Metadaten reicht von sehr einfachen Beschreibungen, wie etwa den grundlegenden “Get Info” -Angaben zu einem digitalen Objekt, bis hin zu hochkomplexen Metadatenstrukturen mit mehreren Ebenen, Feldern und Hierarchien, wie sie insbesondere in Museen, kulturellen Einrichtungen und Archiven zur Erschließung und Verwaltung von Beständen genutzt werden.
Als Bestandteil von Dateien und Dokumenten geben Metadaten im Kern zusätzliche, strukturierte Informationen an, die den eigentlichen (Forschungs-)Daten, Ressourcen oder Objekten, die sie beschreiben, beigefügt werden. Häufig stehen die Metadaten aber auch als Platzhalter für das Objekt selbst, wie es beispielsweise in Bibliothekskatalogen der Fall ist. Hier wird das ursprüngliche Objekt (z.B. ein Buch oder Film) über Metadaten definiert und identifiziert, um Materialien zu lokalisieren und Informationen einzugrenzen. Auf diese Weise ermöglichen Metadaten die Beschreibung, Identifizierung und Klassifizierung von (digitalen) Objekten und kulturellen Artefakten.
Fig. 3.2 Ergebnisansicht eines Bestandeintrags im Katalog der Deutschen Kinemathek Bibliothek#
Für die Publikation von Forschungsdaten sind Metadaten unerlässlich, da erst durch die ergänzenden Informationen Daten zuverlässig auffindbar, eindeutig identifizierbar und damit zitierfähig werden. Die zentrale Bedeutung von Metadaten in der digitalen Forschungspraxis hebt auch Drucker hervor:
“Metadata is an essential aspect of any digital scholarship or research. Data have to be described and identified in order to be useful.”
Die Charakterisierung von Daten über Metadaten ermöglicht es Forschenden somit, Daten in ihre jeweiligen Kontexte einzuordnen, ihre Herkunft und Struktur nachzuvollziehen und ihre Qualität zu bewerten.
3.1.1. Arten von Metadaten#
Es gibt verschiedene Typen von Metadaten, die hinsichtlich ihrer Art und Funktion unterschieden werden:
| Metadatentyp | Eigenschaften und Funktionen | Beispiele |
|---|---|---|
| Deskriptive (inhaltliche) bzw. bibliographische Metadaten | Helfen beim Auffinden oder Verstehen einer Ressource und bieten inhaltliche Eingrenzung | Titel, Autor, Beschreibung, Keywords, Publikationsdatum uvm. |
| Administrative Metadaten |
Helfen bei der Verwaltung und langfristigen Sicherung der Daten Unterarten:
|
Dateityp und -größe, Speicherort, Erstellungsdatum, Provenance, Zugriffsrechte, Lizenzen uvm. |
| Strukturelle Metadaten | Beschreiben die Anordnung und Hierarchie eines Objekts oder einer Sammlung, d.h. die Beziehung der einzelnen Teile zueinander | Kapitelstruktur eines Buchs, sequentielle Abfolge eines Films, Verlinkungsstrukturen einer Website, Codelisten uvm. |
| Prozessmetadaten | Dokumentieren die Schritte und Methoden, die zur Entstehung und Verwendung von Daten angewendet werden | Verarbeitungsschritte, Tools, Transformationen, Workflows, Versionsverlauf uvm. |
Nicht immer sind die einzelnen Metadaten-Kategorien klar voneinander zu trennen. So kann es beispielsweise Überlappungen zwischen Prozessmetadaten und administrativen Metadaten geben, wenn es um technische Beschreibungen wie Dateiformat, Erstellungsdatum oder Migration geht. Nichtsdestotrotz ist eine grundlegende Charakterisierung der Funktionen und Eigenschaften verschiedener Metadatentypen im Forschungsprozess sehr hilfreich.
3.1.2. Exkurs: Markup-Sprachen#
Metadaten liegen oft in maschinenlesbarer Form vor - in sogenannten Markup-Sprachen. Dies unterstützt die Interoperabilität der Daten hinsichtlich Weiterverwendung und Austausch.
Was sind Markup-Sprachen?
Markup-Sprachen (dt. Auszeichnungssprache) sind maschinenlesbare Sprachen. Sie strukturieren und formatieren Texte und Dateien, indem sie ihnen Eigenschaften - sogenannte tags - hinzufügen. Die bekannteste Markup-Sprache ist HTML.
Am häufigsten wird dabei die Markup-Sprache XML verwendet. Metadaten liegen dann als Datensatz in einem XML-Dokument vor.
Fig. 3.3 XML-Beispiel, © NISO#
Wie funktioniert XML?
XML nutzt definierte Elemente bzw. Tags, um anzugeben, welche Bedeutung den jeweils enthaltenen Werten zukommt. Elemente können auch andere Elemente enthalten. Ein XML-Dokument ist ähnlich aufgebaut wie eine Baumstruktur, beginnend mit einem Stammelement.
In den Digital Humanities hat sich die auf XML basierte Markup-Sprache TEIals gängiger Standard etabliert. TEI wurde gezielt an die Bedürfnisse geisteswissenschaftlicher Forschung angepasst.
Mehr Informationen zu XML & TEI
Neben solchen spezifischen, auf Markup-Sprachen basierenden Strukturierungen von Metadaten, die in erster Linie für die Auszeichnung von Texten genutzt werden, spielen auch allgemeine Metadatenstandards eine wichtige Rolle. Im nächsten Kapitel gehen wir auf zwei gängige Standards ein.