4.5. 🏆Selbsttest: Wissen und Praxis#

4.5.1. Aufgabe 1#

4.5.2. Aufgabe 2#

Bewerten Sie folgende Aussagen zu Datenmodellen:

4.5.3. Aufgabe 3#

4.5.4. Aufgabe 4#

Szenario: Sie erhalten einen OPAC-Datenauszug mit folgenden Beispieleinträgen:

ID: 12458
Titel: Stilles Land
Jahr: 1992
sonstige Person: Dresen, Andreas [Regie] ; Höfer, Andreas [Kamera] ; Stieler, Laila [Drehbuch]
Umfang/Format: 35mm, 2690m, 98 Min, 24fps, Farbe, Mono
Schlagwort: Spielfilm ; Drama/A
Stichwörter: Wende, Provinz, Theater, Kleinstadt

Analysieren Sie diese Datenstruktur:

  1. Identifizieren Sie Probleme für die maschinelle Auswertung

  2. Bewerten Sie die Datenqualität des Auszugs

4.5.5. Aufgabe 5#

Szenario: In einem Datensatz finden Sie folgende problematische Jahresangaben:

[1995]
ca. 1997
1990/91
1993-1995
1999

Entwickeln Sie eine systematische Bereinigungsstrategie mit OpenRefine:

  1. Identifizierung der Probleme

  2. Notwendige Bereinigungsschritte

  3. Verwendung geeigneter OpenRefine-Funktionen

4.5.6. Aufgabe 6#

Bewerten Sie folgende Aussagen zu OpenRefine:

4.5.7. Aufgabe 7#

4.5.8. Aufgabe 8#

4.5.9. Aufgabe 9#

4.5.10. Aufgabe 10#

Bewerten Sie folgende Aussagen zu GREL-Methoden: