7. Zusammenfassung und Reflexion#

Digitale Werkzeuge, digitale Methoden und der Umgang mit Daten spielen auch in den Geisteswissenschaften eine immer wichtigere Rolle - insbesondere im Bereich der Digital Humanities. In dieser Open Educational Resource (OER) wollten wir erkunden, wie digitale Ansätze sinnvoll für die Bearbeitung einer filmwissenschaftlichen Fragestellung eingesetzt werden können. Grundlage hierfür war eine Fallstudie, die von folgender Frage ausging: Welche Veränderungen sind in den studentischen Filmen der Filmuniversität Babelsberg KONRAD WOLF – bzw. der Hochschule für Film und Fernsehen (HFF) “Konrad Wolf” Potsdam, wie sie bis 2014 hieß – zur Wendezeit erkennbar?

Die OER beginnt mit einen allgemeinen Einführung in den Themenbereich “Digital Humanities und Filmwissenschaft”, auf die die Darstellung einzelner Arbeitsschritte der Fallstudie folgt. Im Rahmen der Fallstudie werden vor allem die Metadaten und filmografischen Angaben zu den studentischen Produktionen im Filmarchiv der Filmuniversität in den Blick genommen, als Untersuchungszeitraum haben wir die Jahre 1985 bis 1999 festgelegt. Wir stellen die grundlegenden Schritte bei einer Materialrecherche vor und setzen uns kritisch mit Metadaten auseinander. Wie kann dieser Begriff definiert werden und was muss beim Umgang mit Metadaten beachtet werden? Bei der Operationalisierung geht es darum, wie verschiedene Aspekte der Fragestellung quantitativ erfassbar gemacht und welche Perspektiven dabei eingenommen werden können.

In einem weiteren Kapitel der OER beschäftigen wir uns mit der Datenerhebung und Datenbereinigung. Als Datensatz für die Fallstudie dient uns ein Auszug aus dem Bibliothekskatalog, der die Einträge zu den studentischen Produktionen des Untersuchungszeitraums im Archiv enthält. Anhand dieses Beispiels klären wir, was unter einem Datenmodell zu verstehen ist und wie eine Datenquelle analysiert wird. Dies bildet die Basis für die Überlegungen, auf welche Weise der Datensatz bereinigt werden muss. Die grundlegenden Schritte einer Datenbereinigung führen wir anhand des Open Source Programms OpenRefine vor, das speziell für diese Zwecke entwickelt wurde.

Für die Auswertung der bereinigten Daten gehen wir zunächst auf einige Grundlagen der Datenvisualisierung ein: Welche Formen existieren? Wie haben sie sich entwickelt? Und wie können Visualisierungen für die Datenauswertung in der Filmwissenschaft und Filmgeschichtsschreibung eingesetzt werden? Es folgt eine Anleitung, wie aus unserem Beispieldatensatz einfache Visualisierungen mit Microsoft Excel erstellt werden können. Durch diese ist eine explorative Auswertung der Daten möglich und es wird z.B. sichtbar, dass rund um die Wendejahre die Anzahl studentischer Produktionen ansteigt. Ebenso scheinen in dieser Zeit mehr dokumentarische Arbeiten entstanden zu sein.

Schließlich befassen wir uns mit der Datenpublikation. Nach einer Einführung in das Forschungsdatenmanagement in der Filmwissenschaft und der Klärung des Begriffs Forschungsdaten werden verschiedene Formen der Datenpublikation vorgestellt (Artikel mit Verweis auf Daten / Daten in einem Repositorium / Data Papers). Bei der Arbeit an der Fallstudie wurde deutlich, dass die rechtlichen Rahmenbedingungen für den Umgang mit Daten und für die Datenpublikation sehr komplex sind. Bei im Datensatz enthaltenen personenbezogenen Daten muss die Datenschutz-Grundverordnung (DSGVO) beachtet werden, ebenso wie Aspekte des Urheberrechts. Für eine Nachnutzung und Wiederveröffentlichung von Daten sind Lizenzen von entscheidender Bedeutung. Es ist daher empfehlenswert, bei der Arbeit mit Daten eine fundierte rechtliche Beratung einzuholen.

7.1. Herausforderungen und Problemfelder#

7.1.1. Datenerhebung#

Im Rahmen Arbeit an der Fallstudie hatten wir es mit einigen Herausforderungen und Problemfeldern zu tun. Dies begann bereits mit der Erhebung der Daten. Wie kann ein Datensatz mit Metadaten in Form von filmografischen Angaben aus einem Bibliothekskatalog erstellt werden? Die Daten sind nur an diesem Ort verzeichnet, da es sich größtenteils um unveröffentlichte filmische Arbeiten handelt. Andere Datenbanken mit filmografische Angaben fielen daher als mögliche Datenquelle aus. Die Erstellung eines Datensatzes mit Web Scraping erfordert Programmierkenntnisse und kann sich als kompliziert erweisen - insbesondere für Anfänger ohne Vorkenntnisse im Bereich der Datenerhebung. Als gangbarer Weg erwies sich schließlich, direkt bei der Bibliothek anzufragen, ob wir einen Auszug aus dem Bibliothekskatalog erhalten können. Auch viele andere Institutionen sind bereit, auf Anfrage Auszüge aus ihren Datenbanken zu erstellen und zur Verfügung zu stellen.

7.1.2. Datenqualität#

Als weitere Herausforderung erwies sich, die Datenqualität des Auszugs zu beurteilen. Inwieweit kann der bereinigte Datensatz für eine Datenauswertung herangezogen werden? Wie vollständig sind die filmografischen Angaben, in welchen Bereichen sind Lücken zu vermuten? So werden die Angaben zu Gattungen wie Spielfilm, Dokumentarfilm oder Animationsfilm nicht immer in die Einträge zu den Filmen übernommen. Auch stellt sich die Frage, wie komplett und korrekt die Angaben zu beteiligten Personen und deren Funktion sind. Dies müsste genauer recherchiert werden. Der bereinigte Datensatz könnte hierbei eine Grundlage für die Überprüfung und Ergänzung der filmografischen Angaben bilden. Auch wenn Angaben im Datensatz fehlen gehen wir davon aus, dass bei einer Auswertung bestimmte Tendenzen und Auffälligkeiten zutage kommen, die als Ausgangspunkt für weitere (Archiv)Recherchen dienen können.

7.1.3. Rechtlicher Rahmen für die Datenpublikation#

Ein besonders komplexes Problemfeld bildet der rechtliche Rahmen, der für eine Arbeit mit Datensätzen und insbesondere bei deren Publikation beachtet werden muss. Wir konnten unseren bereinigten Datensatz nicht veröffentlichen, da er personenbezogene Daten enthält, die nach der Datenschutz-Grundverordnung (DSGVO) nicht ohne Einwilligung der betroffenen Personen veröffentlicht werden können. Diese Einwilligungen liegen bei unseren Datensatz nicht vor. Für die Beachtung des Urheber- und Persönlichkeitsrechts spielt die gerade erwähnte Datenqualität wieder eine Rolle: Alle Urheber:innen haben das Recht, namentlich in ihrer korrekten Funktion in den Metadaten zu den Filmwerken genannt zu werden. Dies kann wie oben dargelegt nicht gewährleistet werden. Daher haben wir für die OER den Weg der Erstellung eines synthetischen Datensatzes gewählt, der aus den Einträgen des Originaldatensatzes entwickelt wurde, sodass bestimmte proportionale Verteilungen innerhalb einzelner Jahre erhalten blieben.

7.1.4. Kombination von quantitativen und qualitativen Ansätzen#

Auf der Grundlage dieses synthetischen Datensatzes fand auch eine erste, sehr begrenzte Auswertung der Daten statt. Aus einfachen Visualisierungen wird z.B. ersichtlich, dass in bestimmten Jahren mehr Filme entstanden sind und auch dass einige Gattungen zu bestimmten Zeitpunkten gehäuft in Erscheinung treten. Im Verlauf der OER haben wir mehrmals darauf hingewiesen, dass quantitative Methoden mit qualitativen kombiniert und ergänzt werden sollen. Auf diese Kombination konnten wir jedoch nur sehr rudimentär eingehen. Gerade für die Klärung der Frage, warum sich zu bestimmten Zeitpunkten bestimmte Arten von Filmen häufen, ist die qualitative Untersuchung des historischen, kulturellen und sozialen Kontexts von großer Bedeutung. Dieser müsste durch weitere Recherchen näher beleuchtet werden. Haben sich etwa das Lehrpersonal oder Lehrpläne verändert und hat dies Auswirkungen auf die entstandenen Filme? Welche technischen Innovationen kamen auf? Nicht zuletzt müssen für diese Kontextbestimmungen auch die Filme selbst, deren Themen, Motive und stilistische Machart analysiert werden. Die Ergebnisse dieser ersten Auswertung können also keineswegs final sein, sondern bilden lediglich einen Ausgangspunkt für die weitere Arbeit.

7.2. Ausblick: Filmanalyse mit digitalen Mitteln#

Nicht zuletzt haben wir uns in dieser OER lediglich mit den Metadaten in Form von filmografischen Angaben beschäftigt. Wie deutlich geworden sein sollte, hat sich dies bereits als Herausforderung und komplexes Unterfangen erwiesen. Die Analyse und Auswertung der Filmwerke selbst mit digitalen Mitteln, z.B. hinsichtlich ihrer formalen Gestaltung, wurde bisher noch nicht thematisiert. Audiovisuelle Werke sind aufgrund ihres multimodalen Charakters sehr komplexer strukturiert: Bild, Text und Ton wirken in ihrer zeitlichen Abfolge zusammen, bilden vielgestaltige Bedeutungsebenen, Sinnstrukturen und Motive. Das Erkennen von Mustern und Regelhaftigkeiten mit digitalen Werkzeugen wird dadurch kompliziert. In einer weiteren OER werden wir uns diesem Problemfeld widmen.