4.5. 🏆Selbsttest: Wissen und Praxis#

Hinweis

Diese Übungsaufgaben dienen Ihrer Selbsteinschätzung und helfen Ihnen, das im Kapitel Gelernte zu reflektieren.

Sie können die Fragen in beliebiger Reihenfolge beantworten und auch mehrfach versuchen.

So funktioniert es:

  • Wählen Sie bei jeder Frage die Antwort(en), die Sie fĂĽr richtig halten

  • Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfältig durch

  • Die Erklärungen helfen Ihnen, Ihr Verständnis zu vertiefen – auch bei korrekten Antworten

Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um WissenslĂĽcken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.

Geschätzte Zeit: XX

Viel Erfolg!

4.5.1. Frage 1#

4.5.2. Frage 2#

Ordnen Sie die Textformate den passenden Beschreibungen zu:
Bewahrt die visuelle Gestalt des Originals, aber nicht direkt maschinenlesbar
Hier ablegen
Einfache, unformatierte Textdatei ohne Stilelemente oder Metadaten
Hier ablegen
Strukturierte Darstellung mit verschachtelten Tags und semantischer Information
Hier ablegen
Tabellarisches Format, ideal fĂĽr annotierte Textdaten mit linguistischen Informationen
Hier ablegen
Ziehen Sie diese zu den passenden Beschreibungen
Bilddigitalisat
Plain Text
HTML
CSV
CSS

4.5.3. Frage 3#

4.5.4. Frage 4#

Ordnen Sie die HTML-Tags ihren Funktionen zu:
Erstellt einen Hyperlink
Hier ablegen
FĂĽgt ein Bild ein
Hier ablegen
Erstellt eine ungeordnete Liste (mit Punkten)
Hier ablegen
Erstellt eine Tabelle
Hier ablegen
Ziehen Sie diese zu den passenden Beschreibungen
a
img
ul
table
div
p

4.5.5. Frage 5#

4.5.6. Frage 6#

4.5.7. Frage 7#

Szenario: Sie sollen folgenden HTML-Code analysieren:

<div class="article">
    <h2>Nachhaltige Mobilität</h2>
    <p>Die Stadt plant den <strong>Ausbau</strong> des Radwegenetzes.</p>
    <ul>
        <li>50 km neue Radwege</li>
        <li><a href="/details">Mehr Informationen</a></li>
    </ul>
</div>

Ihre Aufgabe:

  1. Beschreiben Sie die hierarchische Struktur (welche Elemente sind in welchen enthalten?)

  2. Welche Tags wĂĽrden Sie verwenden, um nur den Haupttext (ohne Liste) zu extrahieren?

  3. Wie wĂĽrden Sie auf das verlinkte Dokument zugreifen?

4.5.8. Frage 8#

4.5.9. Frage 9#

Ordnen Sie die Schritte zur HTML-Extraktion in die richtige Reihenfolge:
Identifikation der HTML-Tags, die den relevanten Text enthalten
Hier ablegen
Analyse der visuellen Struktur der Website
Hier ablegen
Auswahl der Tags mittels CSS-Selektoren oder XPath
Hier ablegen
Extraktion des Textinhalts aus den ausgewählten Tags
Hier ablegen
Ziehen Sie diese zu den passenden Beschreibungen
2
4
1
3

4.5.10. Frage 10#

Vergleichende Analyse: Sie müssen entscheiden, welches Format für folgende Anwendungsfälle am besten geeignet ist:

Szenario A: Ein historisches Archiv möchte 10.000 handschriftliche Briefe aus dem 19. Jahrhundert digitalisieren und online verfügbar machen.

Szenario B: Ein Linguistik-Team möchte 500 Zeitungsartikel mit grammatischen Annotationen (Wortart, Lemma, syntaktische Funktion) versehen.

Szenario C: Eine Forschungsgruppe möchte alle Artikel einer Nachrichtenseite systematisch sammeln und den Haupttext für Textanalysen extrahieren.

Ihre Aufgabe: Empfehlen Sie fĂĽr jedes Szenario das am besten geeignete Format (Bilddigitalisat, Plain Text, HTML, oder CSV) und begrĂĽnden Sie Ihre Entscheidung.