4.6. 🏆Selbsttest: Wissen und Praxis#

Hinweis

Diese Übungsaufgaben dienen Ihrer SelbsteinschĂ€tzung und helfen Ihnen, das im Kapitel Gelernte zu reflektieren.

Sie können die Fragen in beliebiger Reihenfolge beantworten und auch mehrfach versuchen.

So funktioniert es:

  • WĂ€hlen Sie bei jeder Frage die Antwort(en), die Sie fĂŒr richtig halten

  • Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfĂ€ltig durch

  • Die ErklĂ€rungen helfen Ihnen, Ihr VerstĂ€ndnis zu vertiefen – auch bei korrekten Antworten

Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um WissenslĂŒcken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.

GeschÀtzte Zeit: 1h 10min

Viel Erfolg!

4.6.1. Frage 1#

(WĂ€hlen Sie alle zutreffenden Antworten aus)

4.6.2. Frage 2#

Analysieren Sie die folgenden Aussagen zur OCR-QualitÀtskontrolle.

4.6.3. Frage 3#

Ordnen Sie die folgenden Schritte der OCR-Pipeline in die richtige Reihenfolge:
Texterkennung
Hier ablegen
Bildvorverarbeitung
Hier ablegen
QualitÀtskontrolle
Hier ablegen
Ziehen Sie diese zu den passenden Beschreibungen
1
2
3

4.6.4. Frage 4#

(WĂ€hlen Sie alle zutreffenden Antworten aus)

Frage 4(a)#

Frage 4(b)#

Frage 4(c)#

Frage 4(d)#

4.6.5. Frage 5#

(WĂ€hlen Sie alle zutreffenden Antworten aus)

4.6.6. Frage 6#

Ordnen Sie die folgenden Schritte bei der OCR-Verarbeitung eines mehrseitigen PDFs in die richtige Reihenfolge:
OCR auf jeder Seite durchfĂŒhren
Hier ablegen
PDF in Einzelseiten konvertieren
Hier ablegen
Erkannten Text speichern
Hier ablegen
Ziehen Sie diese zu den passenden Beschreibungen
1
2
3

4.6.7. Frage 7#

Identifizieren Sie mögliche Probleme in den folgenden Aussagen:

4.6.8. Frage 8#

(WĂ€hlen Sie alle zutreffenden Antworten aus)

4.6.9. Frage 9#

Analysieren Sie die Bedeutung der verschiedenen Metriken in folgenden Szenarien.

Frage 9(a)#

Szenario 1: Digitalisierung historischer Zeitungen fĂŒr wissenschaftliche Forschung

Frage 9(b)#

Szenario 2: Automatische Erfassung von Formulardaten

4.6.10. Frage 10#

ErklÀren Sie die Beziehungen zwischen den OCR-QualitÀtsmetriken.

Frage 10(a)#

Trade-off zwischen PrÀzision und Recall

Frage 10(b)#

Rolle des F1-Scores

4.6.11. Frage 11#

(WĂ€hlen Sie alle zutreffenden Antworten aus)

Frage 11(a)#

Frage 11(b)#

Frage 11(c)#

Frage 11(d)#

4.6.12. Frage 12#

Ordnen Sie die folgenden Schritte zur Messung der OCR-QualitÀt in die richtige Reihenfolge:
Erstellung der Ground Truth
Hier ablegen
DurchfĂŒhrung der OCR
Hier ablegen
Berechnung der QualitÀtsmetriken
Hier ablegen
Ziehen Sie diese zu den passenden Beschreibungen
1
2
3

4.6.13. Frage 13#

Analysieren Sie die folgenden OCR-QualitÀtswerte aus dem Beispiel:

  • Precision: 0.778

  • Recall: 0.7932

  • F1-score: 0.7855

Frage 13(a)#

Was bedeutet die Precision von 0.778 in diesem Kontext?

Frage 13(b)#

Warum ist der Recall (0.7932) höher als die Precision?

4.6.14. Frage 14#

Bewerten Sie die Eignung der gemessenen OCR-QualitĂ€t fĂŒr verschiedene AnwendungsfĂ€lle.

Frage 14(a)#

Fall 1: Volltextsuche in digitalisierten Zeitungen

Frage 14(b)#

Fall 2: Exakte Texttranskription fĂŒr Edition