3.1.3. Allgemeine Metadatenstandards#
Das System der Strukturierung von Metadaten wird als Metadatenstandard bezeichnet. Metadatenstandards sind also Klassifizierungssysteme. Häufig liegen diese Standards in XML vor und geben bereits eine Struktur vor, wobei der Einsatz von kontrolliertem Vokabular bei der Standardisierung der Inhalte hilft (z.B. Getty Thesaurus).
“Dies reicht von kontrollierten Wortlisten, die fehlerhafte oder unterschiedliche Schreibweisen von Konzepten vereinheitlichen, über Taxonomien und Thesauri, die Über- und Unterbegriffe wie auch Synonyme zu Konzepten enthalten, bis hin zu Ontologien, die Eigenschaften und Relationen zwischen Konzepten modellieren.”
Was sind Taxonomien und Ontologien?
Taxonomien sind Benennungssysteme, bestehend aus kontrolliertem Vokabular, um Dinge und Objekte zu bezeichnen. Ontologien sind Wissensmodelle, die Informationen als relationale Strukturen organisieren und Konzepte systematisieren.
Es gibt eine Vielzahl von fächerübergreifenden, generischen Metadatenstandards. Zwei der bekanntesten stellen wir kurz vor.
Dublin Core#
Ein weit verbreiteter, generischer Standard zur Beschreibung von Dokumenten und anderen Objekten ist der sogenannte Dublin Core. Er besteht aus einem Set aus 15 allgemeinen, weit verbreiteten Elementen (siehe auch hier), darunter beispielsweise title, creator, subject oder description, und wird vielseitig für verschiedenste Ressourcen eingesetzt – von digitalen Objekten in Repositorien über Webseiten bis hin zu Bibliotheksbeständen.
Fig. 3.4 Dublin Core und die 15 Elemente#
Die 15 Elemente des DC und ihre Beschreibungen#
| Element | Beschreibung |
|---|---|
| dc:title | Titel der Ressource (Name, Bezeichnung) |
| dc:creator | Person oder Organisation, die die Ressource geschaffen hat |
| dc:subject | Themen, Schlagworte oder Klassifikationen |
| dc:description | Beschreibung, Zusammenfassung oder Abstract der Ressource |
| dc:publisher | Herausgebende Institution, die die Ressource veröffentlicht |
| dc:contributor | Weitere Personen oder Organisationen, die zur Ressource beigetragen haben |
| dc:date | Relevantes Datum (z. B. Erstellung, Veröffentlichung) |
| dc:type | Art bzw. Typ der Ressource (z.B. Text, Bild, Dataset) |
| dc:format | Format/Medium der Ressource (z.B. PDF, PNG, audio/mpeg, txt/xml) |
| dc:identifier | Eindeutige Kennung/Identifikator der Ressource (z.B. DOI, URN, ISBN, URL) |
| dc:source | Ursprungsquelle, aus der die Ressource hervorgeht oder abgeleitet ist |
| dc:language | Sprache der Ressource (z.B. ISO-639-Code) |
| dc:relation | Beziehungen zu anderen Ressourcen (z.B. Teil-von, Version, Referenz) |
| dc:coverage | Räumliche oder zeitliche Abdeckung (Ort, Region, Zeitraum) |
| dc:rights | Rechte, Lizenzen und Nutzungsbedingungen der Ressource |
Vor- und Nachteile des DC-Metadatenschemas#
✅ Vorteile
Weit verbreitet und international genutzt
Disziplinübergreifend
Einfacher Einstieg und geringe Komplexität
Interoperabel
❌ Nachteile
Eher ungeeignet für komplexere Forschungs- oder Fachdaten
Keine spezifische Struktur für für Versionierung oder Zitation von Forschungsdaten
Uneinheitliche Nutzungsmöglichkeiten
DataCite#
Das DataCite Schema ist eine strukturierte Liste bestehend aus Kern-Metadaten und ihren Eigenschaften. Es wird insbesondere für die bibliographische Beschreibung von Forschungsdaten, für Publikation, Zitation sowie die Registrierung von DOIs genutzt. Bestimmte Elemente, wie z.B. Autoroder Titel, sind verpflichtende Bestandteile, andere Elemente, wie z.B. Fachbereich oder Beschreibung, werden empfohlen oder sind optional. Das Metadatenschema sowie praxisnahe Anwendungsbeispiele werden in XML und JSON zur Verfügung gestellt.
Ein DataCite Metadatengenerator (aktuell für die Schema Version 4.6.) der Ludwig-Maximilians-Universität München generiert durch Eingabe der Metadatenfelder automatisch ein DataCite-XML Schema. Dieses kann heruntergeladen und in einem Repositorium der Wahl den Forschungsdaten beigefügt werden. Mehr Informationen zur Anwendung gibt es auf der
Github-Page.
Fig. 3.5 Elemente des DataCite Schemas - notwendig (links) & empfohlen (rechts)#
Vor- und Nachteile des DataCite-Metadatenschemas#
✅ Vorteile
Enge Verknüpfung mit DOIs
Zitierbare Referenzierung von Daten in Publikationen
International etablierter Standard in Forschungsdateninfrastrukturen
Interoperabel
❌ Nachteile
Komplexer und voraussetzungsreich
Weniger geeignet als universeller Minimalstandard
Fokus liegt auf Zitation und Publikation, weniger auf inhaltliche Beschreibungen
Beide Metadatenstandards sind auch in den Digital Humanities etabliert und bieten einen guten Einstieg. Welcher am Ende für das eigene Projekt genutzt werden soll, hängt von verschiedenen Variablen der jeweiligen Datensätze ab. Für eigene Projekte ist es daher ratsam, sich frühzeitig über geeignete Metadatenschemata zu informieren. Der folgende Fragenkatalog soll dabei helfen, eine passende Auswahl zu treffen.
Praxisnaher Fragenkatalog für die Auswahl des Metadatenschemas#
1. Umfang und Komplexität der Daten
- Handelt es sich um komplexe oder überschaubare Daten?
- Gibt es verschiedene Datentypen (z.B. Texte, Audio, Video, Bilder usw.) oder ist der Datenbestand homogen?
2. Inhaltliche Aspekte
- Welche Bestandteile der Datensätze sollen in den Metadatendokumentationen beschrieben werden (z. B. Inhalt, Struktur, Entstehungskontext, Methoden, Rechte)?
- Werden grundlegende bibliographische Angaben benötigt oder fachspezifische?
3. Publikation und Zitation
- Soll das Schema insbesondere für die Publikation und Zitation genutzt werden (DOIs)?
- Sollen die Forschungsdaten langfristig referenzierbar sein?
4. Ressourcen und Kompetenzniveau
- Welche zeitlichen und technischen Ressourcen bzw. Kapazitäten gibt es im Projekt, um sich ggf. auch in komplexere Schemata einzuarbeiten?
- Stehen Personen mit Vorwissen zu Metadatenstandards oder technischen Formaten (z. B. XML, TEI, RDF) zur Verfügung?
5. Minimalstandard oder mehr?
- Reicht für den Zweck des Projektes ein Minimalstandard (z. B. wenige, generische Felder), oder sind detaillierte, fachlich spezialisierte Metadaten erforderlich?
Allgemeine, generische Schemata sind ein guter Einstieg für Projektanfänge. Häufig decken sie jedoch die Erfordernisse des jeweiligen Fachs nicht genügend ab. In der Praxis werden Metadatenschemata daher konfiguriert oder angepasst, um die Fach- bzw. Projektspezifika zu adressieren. Daran anknüpfend rückt im nächsten Kapitel die Filmwissenschaft in den Fokus, um fachspezifische Metadatenstandards exemplarisch zu vertiefen.