Forschungsdaten in der Film- & Medienwissenschaft

Forschungsdaten in der Film- & Medienwissenschaft#

Unter film- und medienwissenschaftliche Forschungsdaten fallen diverse textuelle, visuelle, auditive und audiovisuelle Datentypen, die entweder primär selbst Untersuchungsgegenstand sind (z. B. ein Film) oder zu denen in sekundären Arbeitsschritten Dokumentationen und Dateien entstehen (z. B. Annotationen).

Wie Sarah-Mai Dang herausstellt, gewinnen Forschungsdaten in der Film- und Medienwissenschaft zunehmend an Bedeutung. Diese Entwicklung sei auf mehrere Ursachen zurückzuführen: zum einen den wachsenden Diskurs um digitale Methoden und Werkzeuge in der Forschung, zum anderen den Ausbau der Digital Humanities und entsprechender Infrastrukturprojekte wie beispielsweise DARIAH-DE – einer deutschen Initiative für digitale Infrastrukturen in den Geistes- und Kulturwissenschaften. Vor diesem Hintergrund ist es notwendig, sowohl den Begriff der Forschungsdaten als auch die konzeptionelle Seite des Forschungsdatenmanagements aus der Perspektive unserer Fachdisziplin zu definieren und an die fachspezifischen Anforderungen anzupassen. Besonders relevant ist dabei die Heterogenität der Daten und Datenquellen, die aus dem Medium Bewegtbild selbst hervorgehen. Hinzu kommt die Frage des Urheberrechts für Film- und Videoquellen – eine Herausforderung, mit der die Film- und Medienwissenschaft nach wie vor konfrontiert ist. Durch das “äußerst heterogene Material” sowie die typische Vermischung und Zusammensetzung verschiedener Datentypen, wie z. B. Audio- und Videoaufnahmen, ist es nicht immer möglich, genaue Kategorisierungen vorzunehmen. Sind Screenshots oder extrahierte Szenen aus einem Film bereits Sekundärdaten, da sie eine zeitlich selektive und repräsentative Auswahl des Originalmaterials darstellen oder immer noch im Ursprung Teil der Primärquelle? Gleiches gilt für digitale Kopien oder restaurierte Fassungen eines Films, die das Originalmaterial zwar bewahren, zugleich aber durch den Prozess der Digitalisierung oder Restaurierung neue mediale, technische und ästhetische Eigenschaften erzeugen.

Auch wenn sich nicht alle Forschungsdaten eindeutig zuordnen lassen, ist es für eine gute Dokumentation und Organisation im Forschungsalltag notwendig, sowohl nachgenutzte als auch neu erhobene Daten kategorial zu definieren.

Rechtliche Vorgaben

Dies ist insbesondere vor dem Hintergrund unterschiedlicher rechtlicher Vorgaben relevant. Die Verbreitung oder Vervielfältigung von Bild- und Filmmaterial unterliegt oftmals dem Urhebergesetz und muss sorgfältig geprüft werden. Gleiches gilt für personenbezogene Angaben. Weitere Informationen zu rechtlichen Vorgaben finden sich in unserer QUADRIGA Fallstudie: “Studentische Filme an der Filmuniversität Babelsberg zur Wendezeit (1985-1999)”

Die folgende Übersicht bietet eine grundlegende Einordnung filmwissenschaftlicher Forschungsdaten in Primär- und Sekundärdaten:

../_images/abb_k02_prim%C3%A4r_sekund%C3%A4rdaten.png

🎞️ Primärdaten

Filme und Filmausschnitte – analoge oder digitale Originalwerke
Videos – Rohmaterial, Screen Recordings, Aufzeichnungen
Bilder, Fotografien, Abbildungen – visuelle Primärquellen
Audiomaterial – Soundtracks, Interviews, Originaltonspuren
Apps, Websites, Games – Interface-Analysen
Empirische Statistiken – Box Office, Streamingdaten
Digitalisierte Archivalien – Drehbücher, Produktionsdokumente
Social-Media-Content – Clips, Memes, Thumbnails, Kommentare
Filmplakate, Pressematerialien

📝 Sekundärdaten

Sequenzprotokolle
Schnittfrequenzprotokolle – Shot-Length-Daten
Annotationen – ELAN, VIAN, Advene uvm.
Analysedaten – Farb-, Bewegungs-, Ton-, Sentimentanalysen
Transkripte – Audio- oder Videotranskripte
Visualisierungen – Zeitachsen, Netzwerke, Diagramme
Annotierte Screenshots/Stills
Exzerpte und Notizen
Metadaten – technisch, semantisch, beschreibend
Schlagwortklassifikationen – Taxonomien, Thesauri
Bibliografische Angaben – Filmographien
Tabellen und Datensätze
Datenbanken/Korpora – FilmColors, BFI National Archive uvm.
Zitations-/Referenzdatenbanken – Zotero, EndNote
APIs und Linked Data – Wikidata-Abfragen
Softwaregenerierte Auswertungen – KI-gestützte Objekterkennung
Textuelle/visuelle Codierungen – Inhaltsanalysen

Die Auseinandersetzung um die Beschaffenheit und Nutzung von Forschungsdaten ist insbesondere dann relevant, wenn die Prozesshaftigkeit der Wissensproduktion mitgedacht wird: woher kommen die Daten? Wie werden sie erhoben und aufbereitet? Wie werden sie kuratiert und verfügbar gemacht? Ferner sollte es auch immer eine kritische Auseinandersetzung über die Entstehung von Forschungsdaten und -ergebnissen geben. Denn Daten können, je nach Kontext, Biases unterliegen. Ein Anspruch auf Objektivität ist daher nicht einlösbar. Ein repräsentatives Beispiel ist die weltweit größte Filmdatenbank IMDb, deren Inhalte kommerziell von Amazon betrieben und gepflegt werden. Die Datenanforderungen sowie die Auswahl und Gewichtung der Inhalte sind dabei von geschlechtsspezifischen und diskriminierenden Inklusions- und Exklusionsmechanismen geprägt. Welche Filme dabei als “gut” oder “schlecht” gerankt werden, hängt von diversen soziopolitischen, ökonomischen aber auch algorithmischen Variablen ab. Ebenso beeinflussen etwa Nutzer:innenbewertungen und Kommentare die Sichtbarkeit bestimmter Filme oder Personengruppen – während andere Perspektiven systematisch marginalisiert werden.

Daten, die aus solchen öffentlichen oder kommerziellen Quellen genutzt (bzw. nachgenutzt) werden, sollten daher immer kritisch geprüft und kontextualisiert werden. Sowohl mit Blick auf ihre Herkunft als auch auf die expliziten oder impliziten Wertungslogiken, denen sie unterliegen.