6.1. Forschungsdatenmanagement in der Filmwissenschaft#
Die Forschung in den Digital Humanities erzeugt Daten, die oft mit großen Aufwand generiert wurden und die als Ausgangspunkt für weitere Projekte dienen können. Nicht zuletzt deshalb liegt es nahe, diese Datensätze zu publizieren, um sie öffentlich zugänglich und für andere Forschende nachnutzbar zu machen. Die Publikation der Daten ist ein elementarer Bestandteil des Forschungsdatenmanagements, das mit den datengetriebenen Digital Humanities auch in den Geisteswissenschaften immer wichtiger wird. Die folgenden Abschnitte stellen die Grundzüge des Forschungsdatenmanagement dar, gehen darauf ein, was Forschungsdaten sind und welche Stellung das Forschungsdatenmanagement in der Filmwissenschaft hat. Es werden Repositorien als Speicherorte für Datensätze vorgestellt und abschließend erläutert, welche Formen der Datenpublikation sich etabliert haben.
6.1.1. Forschungsdatenmanagement (FDM)#
Das Thema des Forschungsdatenmanagements (abgekürzt FDM) ist in den Naturwissenschaften bereits seit längerer Zeit relevant, da deren Methoden durch Experimente, Messungen oder Simulationen Daten generieren. Für die Nachprüfbarkeit der Forschungsergebnisse müssen diese Daten auch anderen Wissenschaftler:innen zugänglich sein.
FDM wird aber auch in den Geisteswissenschaften immer häufiger notwendig, um die wissenschaftliche Qualität zu gewährleisten, z.B. im Rahmen der Digital Humanities und deren quantitativ orientierten Ansätzen. Die Zugänglichkeit der Daten spielt hier für die Beurteilung der Forschungsergebnisse eine wichtige Rolle. Die Einreichung von Datenmanagementplänen ist mittlerweile auch in den geisteswissenschaftlichen Fächern ein fester Bestandteil von Projektanträgen. Viele Hochschulen haben sich darauf eingestellt und bieten eigene Beratungsstellen zu Fragen des Forschungsdatenmanagements an.
Ausgangspunkt für Überlegungen zum Forschungsdatenmanagement ist dabei oft der sogenannte Forschungsdatenlebenszyklus, der die Stellung von Forschungsdaten im Forschungsprozess abbildet.

Fig. 6.1 Forschungsdatenlebenszyklus (Quelle: open-access.network, CC BY 4.0)#
Die einzelnen Phasen dieses Datenlebenszyklus müssen in den Forschungsdatenmanagementplänen berücksichtigt werden. Teile dieses Lebenszyklus haben wir auch in vorherigen Kapiteln unserer Fallstudie durchlaufen. Am Anfang stand die Planung: Wir wollen mit den studentischen Filmen aus dem Filmarchiv der Filmuniversität arbeiten. Auf der Grundlage dieser Idee haben wir die erste Fragestellung formuliert, welche Auswirkungen die Ereignisse der Wende auf das studentische Filmschaffen hatten. Diese Fragestellung wurde im Anschluss weiter konkretisiert. Dabei kristallisierte sich heraus, dass im Zentrum unserer Fallstudie die Bildung eines Filmkorpus und die Erhebung der filmografischen Daten zu diesen Filmen stehen sollten. Diese Daten wurden uns von der Universitätsbibliothek zur Verfügung gestellt und von uns aufbereitet, also bereinigt, und durch das Erstellen von Visualisierungen analysiert. Die letzten drei Stationen im Lebenszyklus - Datenpublikation, -archivierung und -nachnutzung, werden in diesem Kapitel erläutert.
Bereits vor Projektbeginn sollen sich Forschende durch Erstellung eines Datenmanagementplans damit auseinandersetzen, welche Daten in verschiedenen Projektphasen notwendig sind, wie sie mit diesen umgehen möchten und welcher organisatorischer, technischer und auch finanzieller Aufwand damit verbunden ist. Es stellt sich die Frage, welche vorhandenen Daten aus anderen Forschungsprojekten einbezogen werden können und wie – gerade bei der Förderung der Forschung durch öffentliche Gelder – entstehende Daten nachhaltig zur Verfügung gestellt und nachgenutzt werden können. [Einwächter, 2019] Auch die Langzeitarchivierung muss dabei im Blick behalten werden: Oft wird von den Förderinstitutionen vorgegeben, dass Daten mindestens 10 Jahre lang gespeichert werden müssen.[1]
6.1.2. Was sind Forschungsdaten#
Was wird unter Forschungsdaten verstanden? Sophie Einwächter weist darauf hin, dass oft nicht klar ist, ob mit Forschungsdaten Gegenstände oder Ergebnisse von Forschung gemeint sind. [Einwächter, 2019] Eine einheitliche Definition liegt nicht vor und der Begriff Forschungsdaten lässt sich gerade in den Geisteswissenschaften nur schwer fassen. Dies liegt u.a. daran, dass Forschungsdaten immer in ihren Disziplinen und Kontexten betrachtet werden müssen und unterschiedliche Ausprägungen annehmen können. Verallgemeinernd können Forschungsdaten als alle Daten gesehen werden, die Gegenstand eines Forschungsprozesses sind, während diesem entstehen oder dessen Ergebnis sind. Gerade im geisteswissenschaftlichen Bereich müssen diese nicht immer digital vorliegen, z.B. Texte in der Literatur- und Geschichtswissenschaft, und können ggf. im Rahmen des Projektes in eine digitale Form überführt werden.
In der Regel hat man es mit heterogenen Material zu tun, wie schriftliche und bildliche Quellen oder Materialsammlungen. [Dang, 2020] In der Film- und Medienwissenschaft kommen hier eine Vielzahl von möglichen Daten infrage. Zunächst einmal die Filme selbst und Texte zu den Filmen. Als Forschungsdaten können aber auch Annotationen, Screenshots, Filmprotokolle, Listen von Timecodes und Forschungsliteratur gesehen werden. [Einwächter, 2019] Für die filmgeschichtliche Forschung führen Marion Goller und Adelheid Heftberger “Urkunden, Zensurdokumente, Firmenakten, Montagelisten, Presseartikel aus Tageszeitungen, Plakate, Briefe, Tabellen” als Beispiele für Forschungsdaten an, aber auch selbst erstellte Dokumente und Diagramme. [Goller and Heftberger, 2018]
Was als Forschungsdaten verstanden wird, hängt also von den Herangehensweisen und Interessen spezifischer Forschungsprojekte ab. Es ist immer auch eine Frage der eingenommenen Perspektive, was als für die eigene Forschung als relevant und langfristig erhaltenswert gesehen wird.
6.1.3. Forschungsdatenmanagement in der Filmwissenschaft#
Wie in anderen geisteswissenschaftlichen Bereichen beginnt sich das Forschungsdatenmanagement auch in der Filmwissenschaft erst nach und nach zu etablieren. Sarah-Mai Dang weist darauf hin, dass wir alle in gewisser Weise bereits Forschungsdatenmanagement betreiben – wenn auch nicht bewusst: Wir benennen Dateien auf unserem Computer nach einem bestimmten System, ordnen diese in einem Ablagesystem auf dem Rechner und recherchieren und archivieren Literatur mit Unterstützung von spezifischen Verwaltungsprogrammen. [Dang, 2020]
Auch im Laufe dieser OER haben wir bereits mehrmals Beispiele angeführt, die eng mit dem Thema Forschungsdatenmanagement verbunden sind. Projekte wie Cinemetrics, Media History Digital Library (MHDL) oder das Women Film Pioneers Project (WFPP) sammeln, verwalten und veröffentlichen Informationen zu Einstellungslängen von Filmen, Filmliteratur oder Biografien von Frauen im frühen Film als Datenbanken im Internet. Auch mit dem Datensatz zu filmografischen Angaben studentischer Filme der Filmuniversität und deren Visualisierungen haben wir Forschungsdaten generiert, über deren Veröffentlichung und Archivierung wir uns Gedanken machen müssen. Sogar die Filme selbst können als Forschungsdaten gesehen werden, bei deren Veröffentlichung ergibt sich ein spezielles Problem, da Fragen des Urheberrechts beachtet werden müssen. Auch muss geklärt werden, ob ein Datensatz personenbezogene Daten beinhaltet und ob diese überhaupt publiziert werden können.
Für die Publikation muss der Datensatz genau beschrieben werden, worauf im nächsten Abschnitt zu Formen der Datenpublikation eingegangen wird. Zudem sollen die Daten möglichst den FAIR-Prinzipien entsprechen, was bedeutet, dass Daten findable (auffindbar), accsessible (zugänglich), interoperable (interoperabel) und reuseable (nachnutzbar) sind. Die FAIR-Prinzipien werden in einem Kapitel der Fallstudie 1 - Tabelle genau erläutert.
6.1.4. Repositorien#
Damit Datensätze nach einer Publikation auffindbar und zugänglich bleiben, müssen geeignete Formen der Veröffentlichung gefunden werden. Eine Möglichkeit, Forschungsdaten zugänglich zu machen, ist eine frei zugängliche Datenbank im Internet. Wie bei allen veröffentlichten Daten ist es wichtig zu hinterfragen, in welchem Kontext die Datensätze entstanden sind. Der Kontext beeinflusst die Beschaffenheit des Datensatzes, etwa welche Daten überhaupt erfasst werden (vgl. Kapitel Daten und Metadaten). Es sollte also z.B. reflektiert werden, wer diese Daten auf welche Weise wann und zu welchem Zweck erhoben hat. Ein genaues Verständnis der Datenquelle ist für die weitere Arbeit mit den Daten unabdingbar. Wie die Analyse solcher Quellen aussehen kann, führt Sarah-Mai Dang exemplarisch anhand filmportal.de und dem Women Film Pioneers Project (WFPP) vor. [Dang, 2025]
Eine Möglichkeit, Forschungsdaten zu veröffentlichen, sind Repositorien. In diesen werden meist nicht nur Datensätze, sondern auch Bücher, Aufsätze, Blogs, Videos und zahlreiche weitere Formen von Materialien aus Forschung und Lehre zugänglich gemacht. Ein besonderer Fokus liegt in der Regel auf Open Access Publikationen, die direkt heruntergeladen werden können, für andere Veröffentlichungen liegen entsprechende bibliografische Daten vor. Getragen werden solche Repositorien häufig durch gemeinnützige Organisationen oder Fachgemeinschaften, die einen langfristigen Betrieb und eine Qualitätssicherung gewährleisten können.
Wie können diese Repositorien nun gefunden werden? Hierfür gibt es eigene Plattformen im Internet, die Repositorien verzeichnen und über feingranulare Suchfunktionen verfügen. Im Registry of Research Data Repositories / re3data.org kann z.B. auf der Startseite nach Stichworten gesucht werden (z.B. “film studies”) und die Ergebnisanzeige durch Anklicken verschiedener Filter auf der linken Seite weiter eingegrenzt werden (z.B. nach Fachgebieten, Dokumenttypen, Ländern, Lizenztypen, Schlagworte etc.).

Fig. 6.2 Screenshot einer Trefferliste auf (red3data.org)#
Zusätzlich stellt re3data.org grafische Darstellungen zur Verfügung, mithilfe derer man die Inhalte intuitiv durch Klicks auf Fachbereiche oder Länder erkunden kann.

Fig. 6.3 Screenshot einer grafischen Suchoberfläche auf (red3data.org)#
Die einzelnen Repositorien haben verschiedene Ausrichtungen und Reichweiten. Sie können z.B. für alle Fachbereiche aus allen Ländern und Sprachen offen oder eher auf einzelne Disziplinen und Regionen begrenzt sein. Zwischen diesen beiden Polen treten zahlreiche weitere Ausprägungen auf. Exemplarisch sollen hier zwei Beispiele vorgestellt werden, welche diese beiden Pole repräsentieren.
Die Plattform Zenodo wurde ursprünglich vom CERN etabliert, um den Gedanken der Open Science zu unterstützen. Gefördert wird Zenodo von der Europäischen Union. Es ist transdisziplinär und stellt neben Datensätzen auch Publikationen, Präsentationen, Software, Poster oder Videos zur Verfügung. Neben der Suche nach Wortfolgen ist auch hier eine Filterung nach zahlreichen Kriterien möglich, z.B. Fachgebieten, Dokumententypen oder Dateiarten.

Mit einem Klick auf den Treffer-Titel gelangt man zur Detailansicht des Eintrags, bei der der Datensatz beschrieben wird und heruntergeladen werden kann.
Ein Beispiel für ein fachspezifisches Repositorium ist media/rep/. Es wird von der Deutschen Forschungsgemeinschaft (DFG) gefördert und sammelt Veröffentlichungen aus dem Bereich der kulturwissenschaftlich orientierten Medien- und Filmwissenschaft. media/rep/ legt den Fokus ebenfalls auf Open Access Publikationen in Form von Aufsätzen, Blogs, Büchern, Podcasts etc. und kooperiert hierfür mit Verlagen. Es wurde jedoch auch ein eigener Bereich für Forschungsdaten eingeführt, der stetig weiter ausgebaut wird. Auch hier kann nach Wortfolgen gesucht und das Ergebnis mit Filtern weiter eingegrenzt werden.

Fig. 6.5 Screenshot eines Suchergebnisses auf (media/rep/)#
Im Gegensatz zu Zenodo, bei dem auf der Plattform zur Verfügung gestellte Beiträge meist nicht begutachtet werden, ist media/rep/ ein kuratiertes Repositorium, das Inhalte vor Veröffentlichung prüft und Autor:innen in Fragen der Open Access Publikation auch berät.
Im nächsten Abschnitt werden nun verschiedene Formen der Datenpublikation vorgestellt.
6.1.5. Literatur#
Sarah-Mai Dang. Forschungsdatenmanagement in der Filmwissenschaft. Daten, Praktiken und Erkenntnisprozesse. montage AV, 29(1):119–140, 2020.
Sarah-Mai Dang. Managing the Past: Research Data and Film History, pages 135–156. De Gruyter, 2025. URL: https://www.degruyter.com/document/doi/10.1515/9783111082486-007/html, doi:10.1515/9783111082486-007.
Sophie G. Einwächter. Forschungsdaten (in) der Film- und Medienwissenschaft | Zeitschrift für Medienwissenschaft. June 2019. URL: https://zfmedienwissenschaft.de/online/forschungsdaten-der-film-und-medienwissenschaft.
Marion Goller and Adelheid Heftberger. Die Öffnung von Forschungsdaten in den Film- und Medienwissenschaften: praktische und urheberrechtliche Herausforderungen. Fachinformationsdienst für internationale und interdisziplinäre Rechtsforschung, May 2018. URL: https://intr2dok.vifa-recht.de/receive/mir_mods_00003639, doi:10.17176/20180515-233758.