3.1. Einführung Metadaten#

../_images/abb_k03_metadata.png

Fig. 3.1 Metadata, © @Markus Winkler via Unsplash#

Metadaten sind Daten über Daten. Oder, wie Johanna Drucker es treffend formuliert: “Think of metadata as the information about a resource or digital asset”. Die Bandbreite der Erscheinungsformen von Metadaten reicht von sehr einfachen Beschreibungen, wie etwa den grundlegenden “Get Info” -Angaben zu einem digitalen Objekt, bis hin zu hochkomplexen Metadatenstrukturen mit mehreren Ebenen, Feldern und Hierarchien, wie sie insbesondere in Museen, kulturellen Einrichtungen und Archiven zur Erschließung und Verwaltung von Beständen genutzt werden.

../_images/abb_k03_bandbreite_metadaten.png

Als Bestandteil von Dateien und Dokumenten geben Metadaten im Kern zusätzliche, strukturierte Informationen an, die den eigentlichen (Forschungs-)Daten, Ressourcen oder Objekten, die sie beschreiben, beigefügt werden. Häufig stehen die Metadaten aber auch als Platzhalter für das Objekt selbst, wie es beispielsweise in Bibliothekskatalogen der Fall ist. Hier wird das ursprüngliche Objekt (z.B. ein Buch oder Film) über Metadaten definiert und identifiziert, um Materialien zu lokalisieren und Informationen einzugrenzen. Auf diese Weise ermöglichen Metadaten die Beschreibung, Identifizierung und Klassifizierung von (digitalen) Objekten und kulturellen Artefakten.

../_images/abb_k03_kinemathek_katalog.png

Fig. 3.2 Ergebnisansicht eines Bestandeintrags im Katalog der Deutschen Kinemathek Bibliothek#

Für die Publikation von Forschungsdaten sind Metadaten unerlässlich, da erst durch die ergänzenden Informationen Daten zuverlässig auffindbar, eindeutig identifizierbar und damit zitierfähig werden. Die zentrale Bedeutung von Metadaten in der digitalen Forschungspraxis hebt auch Drucker hervor:

“Metadata is an essential aspect of any digital scholarship or research. Data have to be described and identified in order to be useful.”

Die Charakterisierung von Daten über Metadaten ermöglicht es Forschenden somit, Daten in ihre jeweiligen Kontexte einzuordnen, ihre Herkunft und Struktur nachzuvollziehen und ihre Qualität zu bewerten.

3.1.1. Arten von Metadaten#

Es gibt verschiedene Typen von Metadaten, die hinsichtlich ihrer Art und Funktion unterschieden werden:

Metadatentyp Eigenschaften und Funktionen Beispiele
Deskriptive (inhaltliche) bzw. bibliographische Metadaten Helfen beim Auffinden oder Verstehen einer Ressource und bieten inhaltliche Eingrenzung Titel, Autor, Beschreibung, Keywords, Publikationsdatum uvm.
Administrative Metadaten Helfen bei der Verwaltung und langfristigen Sicherung der Daten

Unterarten:
  • Technische Metadaten
  • Metadaten zur Erhaltung
  • Rechtliche Metadaten
Dateityp und -größe, Speicherort, Erstellungsdatum, Provenance, Zugriffsrechte, Lizenzen uvm.
Strukturelle Metadaten Beschreiben die Anordnung und Hierarchie eines Objekts oder einer Sammlung, d.h. die Beziehung der einzelnen Teile zueinander Kapitelstruktur eines Buchs, sequentielle Abfolge eines Films, Verlinkungsstrukturen einer Website, Codelisten uvm.
Prozessmetadaten Dokumentieren die Schritte und Methoden, die zur Entstehung und Verwendung von Daten angewendet werden Verarbeitungsschritte, Tools, Transformationen, Workflows, Versionsverlauf uvm.

Nicht immer sind die einzelnen Metadaten-Kategorien klar voneinander zu trennen. So kann es beispielsweise Überlappungen zwischen Prozessmetadaten und administrativen Metadaten geben, wenn es um technische Beschreibungen wie Dateiformat, Erstellungsdatum oder Migration geht. Nichtsdestotrotz ist eine grundlegende Charakterisierung der Funktionen und Eigenschaften verschiedener Metadatentypen im Forschungsprozess sehr hilfreich.

3.1.2. Exkurs: Markup-Sprachen#

Metadaten liegen oft in maschinenlesbarer Form vor - in sogenannten Markup-Sprachen. Dies unterstützt die Interoperabilität der Daten hinsichtlich Weiterverwendung und Austausch.

Was sind Markup-Sprachen?

Markup-Sprachen (dt. Auszeichnungssprache) sind maschinenlesbare Sprachen. Sie strukturieren und formatieren Texte und Dateien, indem sie ihnen Eigenschaften - sogenannte tags - hinzufügen. Die bekannteste Markup-Sprache ist HTML.

Am häufigsten wird dabei die Markup-Sprache XML verwendet. Metadaten liegen dann als Datensatz in einem XML-Dokument vor.

../_images/abb_k03_xml_beispiel.png

Fig. 3.3 XML-Beispiel, © NISO#

In den Digital Humanities hat sich die auf XML basierte Markup-Sprache TEIals gängiger Standard etabliert. TEI wurde gezielt an die Bedürfnisse geisteswissenschaftlicher Forschung angepasst.

Neben solchen spezifischen, auf Markup-Sprachen basierenden Strukturierungen von Metadaten, die in erster Linie für die Auszeichnung von Texten genutzt werden, spielen auch allgemeine Metadatenstandards eine wichtige Rolle. Im nächsten Kapitel gehen wir auf zwei gängige Standards ein.