3.1.3. Allgemeine Metadatenstandards#

../_images/abb_k03_metadatenstandard.png

Das System der Strukturierung von Metadaten wird als Metadatenstandard bezeichnet. Metadatenstandards sind also Klassifizierungssysteme. Häufig liegen diese Standards in XML vor und geben bereits eine Struktur vor, wobei der Einsatz von kontrolliertem Vokabular bei der Standardisierung der Inhalte hilft (z.B. Getty Thesaurus).

“Dies reicht von kontrollierten Wortlisten, die fehlerhafte oder unterschiedliche Schreibweisen von Konzepten vereinheitlichen, über Taxonomien und Thesauri, die Über- und Unterbegriffe wie auch Synonyme zu Konzepten enthalten, bis hin zu Ontologien, die Eigenschaften und Relationen zwischen Konzepten modellieren.”

Es gibt eine Vielzahl von fächerübergreifenden, generischen Metadatenstandards. Zwei der bekanntesten stellen wir kurz vor.

Dublin Core#

Ein weit verbreiteter, generischer Standard zur Beschreibung von Dokumenten und anderen Objekten ist der sogenannte Dublin Core. Er besteht aus einem Set aus 15 allgemeinen, weit verbreiteten Elementen (siehe auch hier), darunter beispielsweise title, creator, subject oder description, und wird vielseitig für verschiedenste Ressourcen eingesetzt – von digitalen Objekten in Repositorien über Webseiten bis hin zu Bibliotheksbeständen.

../_images/abb_k03_dublin_core.png

Fig. 3.4 Dublin Core und die 15 Elemente#

Die 15 Elemente des DC und ihre Beschreibungen#

Element Beschreibung
dc:title Titel der Ressource (Name, Bezeichnung)
dc:creator Person oder Organisation, die die Ressource geschaffen hat
dc:subject Themen, Schlagworte oder Klassifikationen
dc:description Beschreibung, Zusammenfassung oder Abstract der Ressource
dc:publisher Herausgebende Institution, die die Ressource veröffentlicht
dc:contributor Weitere Personen oder Organisationen, die zur Ressource beigetragen haben
dc:date Relevantes Datum (z. B. Erstellung, Veröffentlichung)
dc:type Art bzw. Typ der Ressource (z.B. Text, Bild, Dataset)
dc:format Format/Medium der Ressource (z.B. PDF, PNG, audio/mpeg, txt/xml)
dc:identifier Eindeutige Kennung/Identifikator der Ressource (z.B. DOI, URN, ISBN, URL)
dc:source Ursprungsquelle, aus der die Ressource hervorgeht oder abgeleitet ist
dc:language Sprache der Ressource (z.B. ISO-639-Code)
dc:relation Beziehungen zu anderen Ressourcen (z.B. Teil-von, Version, Referenz)
dc:coverage Räumliche oder zeitliche Abdeckung (Ort, Region, Zeitraum)
dc:rights Rechte, Lizenzen und Nutzungsbedingungen der Ressource

Vor- und Nachteile des DC-Metadatenschemas#

Vorteile

  • Weit verbreitet und international genutzt

  • Disziplinübergreifend

  • Einfacher Einstieg und geringe Komplexität

  • Interoperabel

Nachteile

  • Eher ungeeignet für komplexere Forschungs- oder Fachdaten

  • Keine spezifische Struktur für für Versionierung oder Zitation von Forschungsdaten

  • Uneinheitliche Nutzungsmöglichkeiten

DataCite#

Das DataCite Schema ist eine strukturierte Liste bestehend aus Kern-Metadaten und ihren Eigenschaften. Es wird insbesondere für die bibliographische Beschreibung von Forschungsdaten, für Publikation, Zitation sowie die Registrierung von DOIs genutzt. Bestimmte Elemente, wie z.B. Autoroder Titel, sind verpflichtende Bestandteile, andere Elemente, wie z.B. Fachbereich oder Beschreibung, werden empfohlen oder sind optional. Das Metadatenschema sowie praxisnahe Anwendungsbeispiele werden in XML und JSON zur Verfügung gestellt. Ein DataCite Metadatengenerator (aktuell für die Schema Version 4.6.) der Ludwig-Maximilians-Universität München generiert durch Eingabe der Metadatenfelder automatisch ein DataCite-XML Schema. Dieses kann heruntergeladen und in einem Repositorium der Wahl den Forschungsdaten beigefügt werden. Mehr Informationen zur Anwendung gibt es auf der Github-Page.

../_images/abb_k03_data_cite.png

Fig. 3.5 Elemente des DataCite Schemas - notwendig (links) & empfohlen (rechts)#

Vor- und Nachteile des DataCite-Metadatenschemas#

Vorteile

  • Enge Verknüpfung mit DOIs

  • Zitierbare Referenzierung von Daten in Publikationen

  • International etablierter Standard in Forschungsdateninfrastrukturen

  • Interoperabel

Nachteile

  • Komplexer und voraussetzungsreich

  • Weniger geeignet als universeller Minimalstandard

  • Fokus liegt auf Zitation und Publikation, weniger auf inhaltliche Beschreibungen

Beide Metadatenstandards sind auch in den Digital Humanities etabliert und bieten einen guten Einstieg. Welcher am Ende für das eigene Projekt genutzt werden soll, hängt von verschiedenen Variablen der jeweiligen Datensätze ab. Für eigene Projekte ist es daher ratsam, sich frühzeitig über geeignete Metadatenschemata zu informieren. Der folgende Fragenkatalog soll dabei helfen, eine passende Auswahl zu treffen.

Praxisnaher Fragenkatalog für die Auswahl des Metadatenschemas#

1. Umfang und Komplexität der Daten
  • Handelt es sich um komplexe oder überschaubare Daten?
  • Gibt es verschiedene Datentypen (z.B. Texte, Audio, Video, Bilder usw.) oder ist der Datenbestand homogen?
2. Inhaltliche Aspekte
  • Welche Bestandteile der Datensätze sollen in den Metadatendokumentationen beschrieben werden (z. B. Inhalt, Struktur, Entstehungskontext, Methoden, Rechte)?
  • Werden grundlegende bibliographische Angaben benötigt oder fachspezifische?
3. Publikation und Zitation
  • Soll das Schema insbesondere für die Publikation und Zitation genutzt werden (DOIs)?
  • Sollen die Forschungsdaten langfristig referenzierbar sein?
4. Ressourcen und Kompetenzniveau
  • Welche zeitlichen und technischen Ressourcen bzw. Kapazitäten gibt es im Projekt, um sich ggf. auch in komplexere Schemata einzuarbeiten?
  • Stehen Personen mit Vorwissen zu Metadatenstandards oder technischen Formaten (z. B. XML, TEI, RDF) zur Verfügung?
5. Minimalstandard oder mehr?
  • Reicht für den Zweck des Projektes ein Minimalstandard (z. B. wenige, generische Felder), oder sind detaillierte, fachlich spezialisierte Metadaten erforderlich?

Allgemeine, generische Schemata sind ein guter Einstieg für Projektanfänge. Häufig decken sie jedoch die Erfordernisse des jeweiligen Fachs nicht genügend ab. In der Praxis werden Metadatenschemata daher konfiguriert oder angepasst, um die Fach- bzw. Projektspezifika zu adressieren. Daran anknüpfend rückt im nächsten Kapitel die Filmwissenschaft in den Fokus, um fachspezifische Metadatenstandards exemplarisch zu vertiefen.