4.8. 🏆Selbsttest: Wissen und Praxis#

Hinweis

Diese Übungsaufgaben dienen Ihrer Selbsteinschätzung und helfen Ihnen dabei, das im Kapitel Gelernte zu reflektieren.

Sie können die Fragen in beliebiger Reihenfolge beantworten und jeden Versuch bei Bedarf mehrfach wiederholen.

So funktioniert es:

  • Wählen Sie bei jeder Frage die Antwort(en) aus, die Sie für richtig halten.

  • Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfältig durch.

  • Die Erklärungen helfen Ihnen dabei, Ihr Verständnis zu vertiefen – auch bei korrekten Antworten.

Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um Wissenslücken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.

Geschätzte Zeit: 1h 10min

Viel Erfolg!

4.8.1. Frage 1#

Wählen Sie alle zutreffenden Antworten aus.

4.8.2. Frage 2#

Beantworten Sie die folgenden Aussagen zur OCR-Qualitätskontrolle.

4.8.3. Frage 3#

Ordnen Sie die folgenden Schritte der OCR-Pipeline in die richtige Reihenfolge:
Texterkennung
Hier ablegen
Bildvorverarbeitung
Hier ablegen
Qualitätskontrolle
Hier ablegen
Ziehen Sie die Elemente zu den passenden Beschreibungen.
1
2
3

4.8.4. Frage 4#

Wählen Sie alle zutreffenden Antworten aus.

Frage 4(a)#

Frage 4(b)#

Frage 4(c)#

Frage 4(d)#

4.8.5. Frage 5#

Wählen Sie alle zutreffenden Antworten aus.

4.8.6. Frage 6#

Ordnen Sie die folgenden Schritte bei der OCR-Verarbeitung eines mehrseitigen PDFs in die richtige Reihenfolge:
OCR auf jeder Seite durchführen
Hier ablegen
PDF in Einzelseiten konvertieren
Hier ablegen
Erkannten Text speichern
Hier ablegen
Ziehen Sie die Elemente zu den passenden Beschreibungen.
1
2
3

4.8.7. Frage 7#

Identifizieren Sie mögliche Probleme in den folgenden Aussagen:

4.8.8. Frage 8#

Wählen Sie alle zutreffenden Antworten aus.

4.8.9. Frage 9#

Analysieren Sie die Bedeutung der verschiedenen Metriken in folgenden Szenarien.

Frage 9(a)#

Szenario 1: Digitalisierung historischer Zeitungen für wissenschaftliche Forschung

Frage 9(b)#

Szenario 2: Automatische Erfassung von Formulardaten

4.8.10. Frage 10#

Erklären Sie die Beziehungen zwischen den OCR-Qualitätsmetriken.

Frage 10(a)#

Trade-off zwischen Präzision und Recall

Frage 10(b)#

Rolle des F1-Scores

4.8.11. Frage 11#

Wählen Sie alle zutreffenden Antworten aus.

Frage 11(a)#

Frage 11(b)#

Frage 11(c)#

Frage 11(d)#

4.8.12. Frage 12#

Ordnen Sie die folgenden Schritte zur Messung der OCR-Qualität in die richtige Reihenfolge:
Erstellung der Ground Truth
Hier ablegen
Durchführung der OCR
Hier ablegen
Berechnung der Qualitätsmetriken
Hier ablegen
Ziehen Sie die Elemente zu den passenden Beschreibungen.
1
2
3

4.8.13. Frage 13#

Analysieren Sie die folgenden OCR-Qualitätswerte aus dem Beispiel:

  • Precision: 0.778

  • Recall: 0.7932

  • F1-score: 0.7855

Frage 13(a)#

Was bedeutet die Precision von 0.778 in diesem Kontext?

Frage 13(b)#

Warum ist der Recall (0.7932) höher als die Precision?

4.8.14. Frage 14#

Bewerten Sie die Eignung der gemessenen OCR-Qualität für verschiedene Anwendungsfälle.

Frage 14(a)#

Fall 1: Volltextsuche in digitalisierten Zeitungen

Frage 14(b)#

Fall 2: Exakte Texttranskription für Edition