(learning-outcomes)=
# Lernziele

<!-- START: Fragestellung und Operationalisierung. Einführung in die Fallstudie -->
```{admonition} [Grundlagen korpusbasierter geisteswissenschaftlicher Forschung](research-question_intro)
:class: lernziele
<!-- learning-goal: Grundlagen korpusbasierter geisteswissenschaftlicher Forschung -->

1. Die Entwicklung einer Digital Humanities-Fragestellung kann am Beispiel der Medienwellen-Forschung zur Spanischen Grippe nachvollzogen und erläutert werden. <!-- competency: nicht anwendbar | bloom: 2 Verstehen -->

2. Der Operationalisierungsprozess kann am Beispiel der Spanischen Grippe nachvollzogen und auf andere Forschungsfragen übertragen werden. <!-- competency: 1.1 Identifikation | bloom: 3 Anwenden -->

```
<!-- END: Fragestellung und Operationalisierung. Einführung in die Fallstudie -->

<!-- START: Korpusaufbau. Auswählen, sammeln, dokumentieren -->
```{admonition} [Ansätze des Korpusaufbaus und Erstellung basaler Metadaten](corpus-collection_intro)
:class: lernziele
<!-- learning-goal: Ansätze des Korpusaufbaus und Erstellung basaler Metadaten -->

1. Korpora können als geisteswissenschaftliche Forschungsobjekte definiert und deren wesentliche Merkmale beschrieben werden. <!-- competency: 3.2 Erschließung | bloom: 2 Verstehen -->

2. Die vier Hauptformate digitaler Texte (Bilddigitalisate, Plain Text, XML/TEI, CSV) können anhand ihrer charakteristischen Eigenschaften unterschieden und deren Vor- und Nachteile für spezifische Anwendungsfälle analysiert werden. <!-- competency: 3.2 Erschließung | bloom: 4 Analysieren -->

3. Die grundlegenden Metadatenschemata (Dublin Core, TEI, MODS, METS) und deren charakteristische Elemente für Korpora und Einzeldokumente können beschrieben werden. <!-- competency: 3.2 Erschließung | bloom: 2 Verstehen -->

4. Der schrittweise Prozess des praktischen Korpusaufbaus (Konzeptentwicklung, Metadatenerstellung und Datensammlung) kann am Beispiel eines Zeitungskorpus beschrieben werden. <!-- competency: 3.2 Erschließung | bloom: 2 Verstehen -->

```
<!-- END: Korpusaufbau. Auswählen, sammeln, dokumentieren -->

<!-- START: OCR. Von Bild zu Text -->
```{admonition} [OCR-basierte Korpuserstellung und Qualitätsbewertung](ocr_intro)
:class: lernziele
<!-- learning-goal: OCR-basierte Korpuserstellung und Qualitätsbewertung -->

1. Der Prozess der Optical Character Recognition (OCR) für die Korpuserstellung kann beschrieben und Tools zur Durchführung der OCR aufgezählt werden. <!-- competency: 2.1 Erhebung | bloom: 2 Verstehen -->

2. Die notwendigen Schritte zur Verarbeitung ein- und mehrseitiger PDFs zu Text können aufgezählt und die Unterschiede zwischen Ursprungs- und Zielformat erklärt werden. <!-- competency: 2.1 Erhebung | bloom: 2 Verstehen -->

3. Die grundlegenden Metriken zur OCR-Qualitätsevaluation (Präzision, Recall, F1-Score) können erläutert und deren Bedeutung für die Bewertung von OCR-Systemen beschrieben werden. <!-- competency: 2.1 Erhebung | bloom: 2 Verstehen -->

4. Die Schritte zur Qualitätsmessung eines OCR-Outputs können aufgezählt und die Qualitätsmaße interpretiert werden. <!-- competency: 2.1 Erhebung | bloom: 3 Anwenden -->

```
<!-- END: OCR. Von Bild zu Text -->

<!-- START: OCR-Nachbearbeitung: manuell, automatisch, LLMs -->
```{admonition} [OCR-Nachbearbeitung und Qualitätsverbesserung](post-correcting_intro)
:class: lernziele
<!-- learning-goal: OCR-Nachbearbeitung und Qualitätsverbesserung -->

1. Verschiedene Verfahren der OCR-Nachbearbeitung können beschrieben und deren Einsatzzwecke unterschieden werden. <!-- competency: 2.3 Aufbereitung | bloom: 2 Verstehen -->

2. Regelbasierte Ansätze zur OCR-Nachkorrektur können beschrieben und deren Auswirkungen auf die OCR-Qualität anhand von Metriken erläutert werden. <!-- competency: 2.2 Validierung | bloom: 4 Analysieren -->

3. Die grundlegenden Herausforderungen beim Einsatz von Large Language Models für die OCR-Nachbearbeitung können beschrieben werden. <!-- competency: 2.3 Aufbereitung | bloom: 2 Verstehen -->

```
<!-- END: OCR-Nachbearbeitung: manuell, automatisch, LLMs -->

<!-- START: Korpusverarbeitung. Von Strings zu Token -->
```{admonition} [Korpusverarbeitung mit Natural Language Processing](corpus-processing_intro)
:class: lernziele
<!-- learning-goal: Korpusverarbeitung mit Natural Language Processing -->

1. Die Grundkonzepte des Natural Language Processing können erklärt und die Funktionen von Tokenisierung und Lemmatisierung für die Textanalyse beschrieben werden. <!-- competency: 2.3 Aufbereitung | bloom: 2 Verstehen -->

2. Die notwendigen Schritte zur automatischen Annotation eines Texts können aufgezählt und Vorteile der Tokenisierung gegenüber einfacheren Methoden der Worttrennung genannt werden. <!-- competency: 2.3 Aufbereitung | bloom: 1 Erinnern -->

```
<!-- END: Korpusverarbeitung. Von Strings zu Token -->

<!-- START: Korpusanalyse. Von Häufigkeiten zu Diagrammen -->
```{admonition} [Frequenzanalysen semantischer Felder](corpus-analysis_intro)
:class: lernziele
<!-- learning-goal: Frequenzanalysen semantischer Felder -->

1. Das Konzept des semantischen Feldes kann erklärt, der Unterschied zwischen absoluten und relativen Häufigkeiten beschrieben und die Darstellungsmethoden des Liniendiagramms und der Key Word in Context (KWIC)-Anzeige interpretiert werden. <!-- competency: 4.1 Datenanalyse | bloom: 5 Bewerten -->

2. Die notwendigen Schritte zur Frequenzanalyse eines semantischen Felds können aufgezählt, Unterschiede in der Berechnung der Häufigkeiten benannt und die Ergebnisse reflektiert werden. <!-- competency: 4.1 Datenanalyse | bloom: 5 Bewerten -->

3. Die Darstellungsmethode Keywords in Context kann beschrieben, Wörter zur Anzeige ausgewählt und diese angezeigt werden. <!-- competency: 4.2 Visualisierung | bloom: 3 Anwenden -->

```
<!-- END: Korpusanalyse. Von Häufigkeiten zu Diagrammen -->

<!-- START: Reflexion -->
```{admonition} [Kritische Bewertung der Reichweite und Limitationen](reflection_reflection)
:class: lernziele
<!-- learning-goal: Kritische Bewertung der Reichweite und Limitationen -->

1. Die methodischen Limitationen einer Digital Humanities-Fallstudie können benannt werden. <!-- competency: 4.3 Interpretation | bloom: 5 Bewerten -->

```
<!-- END: Reflexion -->
