4.6. đSelbsttest: Wissen und Praxis#
Hinweis
Diese Ăbungsaufgaben dienen Ihrer SelbsteinschĂ€tzung und helfen Ihnen, das im Kapitel Gelernte zu reflektieren.
Sie können die Fragen in beliebiger Reihenfolge beantworten und auch mehrfach versuchen.
So funktioniert es:
WĂ€hlen Sie bei jeder Frage die Antwort(en), die Sie fĂŒr richtig halten
Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfÀltig durch
Die ErklĂ€rungen helfen Ihnen, Ihr VerstĂ€ndnis zu vertiefen â auch bei korrekten Antworten
Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um WissenslĂŒcken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.
GeschÀtzte Zeit: 1h 10min
Viel Erfolg!
4.6.1. Frage 1#
(WĂ€hlen Sie alle zutreffenden Antworten aus)
4.6.2. Frage 2#
Analysieren Sie die folgenden Aussagen zur OCR-QualitÀtskontrolle.
4.6.3. Frage 3#
4.6.4. Frage 4#
(WĂ€hlen Sie alle zutreffenden Antworten aus)
Frage 4(a)#
Frage 4(b)#
Frage 4(c)#
Frage 4(d)#
4.6.5. Frage 5#
(WĂ€hlen Sie alle zutreffenden Antworten aus)
4.6.6. Frage 6#
4.6.7. Frage 7#
Identifizieren Sie mögliche Probleme in den folgenden Aussagen:
4.6.8. Frage 8#
(WĂ€hlen Sie alle zutreffenden Antworten aus)
4.6.9. Frage 9#
Analysieren Sie die Bedeutung der verschiedenen Metriken in folgenden Szenarien.
Frage 9(a)#
Szenario 1: Digitalisierung historischer Zeitungen fĂŒr wissenschaftliche Forschung
Frage 9(b)#
Szenario 2: Automatische Erfassung von Formulardaten
4.6.10. Frage 10#
ErklÀren Sie die Beziehungen zwischen den OCR-QualitÀtsmetriken.
Frage 10(a)#
Trade-off zwischen PrÀzision und Recall
Lösungen
Wichtig zu verstehen:
Verbesserung einer Metrik kann andere verschlechtern
Optimierung fĂŒr PrĂ€zision kann Recall reduzieren
Fokus auf Recall kann PrÀzision verringern
F1-Score hilft bei Ausgleich
Beispiel: âStrengere Erkennungsregeln erhöhen PrĂ€zision, können aber Recall senken.â
Frage 10(b)#
Rolle des F1-Scores
Lösungen
Der F1-Score:
Kombiniert beide Metriken ausgewogen
Ermöglicht einzelne Bewertungszahl
Hilft bei Systemvergleichen
BerĂŒcksichtigt beide Aspekte der QualitĂ€t
4.6.11. Frage 11#
(WĂ€hlen Sie alle zutreffenden Antworten aus)
Frage 11(a)#
Frage 11(b)#
Frage 11(c)#
Frage 11(d)#
4.6.12. Frage 12#
4.6.13. Frage 13#
Analysieren Sie die folgenden OCR-QualitÀtswerte aus dem Beispiel:
Precision: 0.778
Recall: 0.7932
F1-score: 0.7855
Frage 13(a)#
Was bedeutet die Precision von 0.778 in diesem Kontext?
Lösungen
77.8% der vom OCR-System erkannten Zeichen sind korrekt.
BegrĂŒndung:
Precision misst den Anteil korrekter Erkennungen
Wert von 0.778 entspricht 77.8%
Zeigt moderate bis gute Erkennungsgenauigkeit
Typisch fĂŒr historische Frakturschrift
Frage 13(b)#
Warum ist der Recall (0.7932) höher als die Precision?
Lösungen
Das System erkennt mehr vorhandene Zeichen, macht dabei aber auch mehr Fehler.
BegrĂŒndung:
Höherer Recall bedeutet bessere VollstÀndigkeit
Kompromiss zwischen Genauigkeit und VollstÀndigkeit
Typisches Muster bei historischen Dokumenten
Balance durch F1-Score (0.7855) ersichtlich
4.6.14. Frage 14#
Bewerten Sie die Eignung der gemessenen OCR-QualitĂ€t fĂŒr verschiedene AnwendungsfĂ€lle.
Frage 14(a)#
Fall 1: Volltextsuche in digitalisierten Zeitungen
Lösungen
Bedingt geeignet, weil:
Recall von 0.79 ermöglicht Auffinden der meisten Begriffe
Precision von 0.78 bedeutet moderate Fehlerrate
F1-Score zeigt akzeptable GesamtqualitÀt
Suchfunktionen tolerieren gewisse Fehler
Empfehlung:
Einsatz von unscharfen Suche (Fuzzy Search), in der die Daten nicht genau mit dem Suchbegriff ĂŒbereinstimmen mĂŒssen
BerĂŒcksichtigung hĂ€ufiger OCR-Fehler
Mögliche manuelle Nachkorrektur wichtiger Passagen
Frage 14(b)#
Fall 2: Exakte Texttranskription fĂŒr Edition
Lösungen
Nicht ausreichend, weil:
Precision unter 80% zu viele Fehler bedeutet
Recall nicht vollstÀndig genug
Editorische Arbeit erfordert höhere Genauigkeit
Manuelle Korrektur notwendig
Empfehlung:
Verwendung als Vorverarbeitung
Systematische manuelle Korrektur
Dokumentation der OCR-QualitÀt
Mehrfache QualitÀtskontrolle