Forschungsdaten

2.3. Forschungsdaten#

../_images/abb_k02_forschungsdaten_visualiserung.png

Was sind Forschungsdaten? Eine einheitliche Definition des Begriffes gibt es bisher nicht, denn von Fachdisziplin zu Fachdisziplin kann sich die Kategorisierung unterscheiden. Grundsätzlich können jedoch Artefakte und Objekte als Forschungsdaten bezeichnet werden, die 1) Gegenstand eines Forschungsprozesses sind, 2) während eines Forschungsprozesses entstehen oder 3) sein Ergebnis sind.

Darunter zählen beispielsweise:

Kategorie Beispiele
1. Messdaten und quantitative Daten
  • Experimentelle Ergebnisse (z.B. Labormessungen, statistische Erhebungen)
  • Simulationsergebnisse (z.B. Computermodelle, Klimasimulationen)
  • Sensorische Daten (z.B. Temperaturmessungen, Licht, chemische Messwerte)
2. Befragungs- und Beobachtungsdaten
  • Interviews, Umfragen, Fragebögen
  • Feldnotizen, ethnografische Beobachtungen
  • Audioaufnahmen oder Videomaterial aus Feldstudien
3. Bild-, Audio- und Videodateien
  • Fotografien, Scans, Filmaufnahmen
  • Mikroskopische und astronomische Bilder
  • Animations- oder Motion-Capture-Dateien
  • Audiospuren
4. Dokumentarische oder textbasierte Dateien
  • Manuskripte, Briefe, historische Dokumente
  • Archivalien, Transkripte
  • Codebücher, Annotationsdateien, Metadaten
5. Computergenerierte Daten / digitale Objekte
  • Softwareoutputs, Logfiles, Datenbanken
  • Statistikoutputs (z.B. aus R oder Python)
  • Linked Data Tripel, Datenvisualisierungen

Diese Daten können bereits von Grund auf, also in ihrem Ursprung, digital sein. Jedoch werden auch jene Materialien als Forschungsdaten betrachtet, die analog vorliegen und in späteren Stufen digital gespeichert und verarbeitet werden, wie beispielsweise handschriftliche Notizen oder Filmrollen. Die digitale “Re-mediatisierung” analogen Forschungsmaterials beschreibt Johanna Drucker als “practice of datafication”, also als computergestützte Prozessierung von analogem Material. Objekte und Artefakte, die bereits digital entstanden sind, bezeichnet sie als “born digital materials”. Diese Unterscheidung spielt hinsichtlich Verarbeitung und Kontextualisierung der Daten eine wichtige Rolle.

2.3.1. Primär- und Sekundärdaten#

Neben der Unterscheidung verschiedener Datentypen werden Forschungsdaten in Primär- oder Sekundärdaten unterteilt. Hier kann allgemein festgehalten werden:

  1. Primärdaten sind “Rohdaten oder Urdaten”, die in direktem Bezug zum Untersuchungsgegenstand erhoben werden und unverarbeitet vorliegen, d.h. noch unprozessiert sind. Beispiele wären Messwerte oder Fotografien aus eigenen Erhebungen.

  1. Sekundärdaten hingegen sind Daten, die auf Basis vorhandener Primärdaten und Quellen analysiert und aggregiert werden, d.h. prozessiert werden. Typische Beispiele sind Transkriptionen von Audio- oder Videomaterial, Film- und Textkorpora oder Metadaten.

Doch wie sieht es mit dieser Unterscheidung in der Film- und Medienwissenschaft aus? Welche fachspezifischen Datentypen und Kategorisierungen können hier ausgemacht werden? Und wie kann die Frage nach der Erhebung oder Nachnutzung bereits bestehender Daten unter kritischen Gesichtspunkten beleuchtet werden?