4. Datenerhebung und Datenbereinigung#
In diesem Kapitel stehen folgende Lernziele im Mittelpunkt:
Prozess der Datenerhebung und Datenbereinigung
Der Begriff Datenmodell kann definiert werden.
Die Fähigkeit zur Beschreibung und Analyse einer Datenquelle wird erworben.
Ein Datensatz kann mithilfe des Tools OpenRefine bereinigt werden.
Wir befinden uns damit beim 2. Schritt unserer Fallstudie, bei dem die Rolle von Datenmodellen und einer guten Datenstruktur genauer beleuchtet wird. Die Datenquelle für die Metadaten des zu untersuchenden Filmkorpus wird analysiert und die Bereinigung eines Datensatzes mit dem Open Source Tool zur Datenbereinigung OpenRefine anhand exemplarischer Schritte dargelegt.
Fig. 4.1 Schritt 2: Datenerhebung und Datenbereinigung#
Bearbeitungszeit
Die geschätzte Bearbeitungszeit dieser Lerneinheit beträgt ca. 90 Minuten. Dies schließt die gekennzeichneten Übungsaufgaben, deren Bearbeitungsdauer individuell variiert, aus.
Die geschätzte Bearbeitungsdauer inklusive der einzelnen Übungsaufgaben beträgt ca. 120 Minuten.
Bitte beachten Sie: Die tatsächliche Bearbeitungsdauer kann je nach Ihren Vorkenntnissen unterschiedlich ausfallen. Die angegebene Zeitangabe dient lediglich als Orientierungshilfe.