🏆Selbsttest: Wissen und Praxis

6.4. 🏆Selbsttest: Wissen und Praxis#

Hinweis

Diese Übungsaufgaben dienen Ihrer Selbsteinschätzung und helfen Ihnen dabei, das im Kapitel Gelernte zu reflektieren.

Sie können die Fragen in beliebiger Reihenfolge beantworten und jeden Versuch bei Bedarf mehrfach wiederholen.

So funktioniert es:

Wählen Sie bei jeder Frage die Antwort(en) aus, die Sie für richtig halten.
Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfältig durch.
Die Erklärungen helfen Ihnen dabei, Ihr Verständnis zu vertiefen – auch bei korrekten Antworten.

Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um Wissenslücken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.

Geschätzte Zeit: 45min

Viel Erfolg!

6.4.1. Frage 1#

6.4.2. Frage 2#

6.4.3. Frage 3#

6.4.4. Frage 4#

6.4.5. Frage 5#

6.4.6. Frage 6#

Analysieren Sie den folgenden Satz mit NLP-Methoden und beschreiben Sie die Ergebnisse:

Originaltext: “Die Forschenden untersuchten verschiedene Zeitungsartikel zur Spanischen Grippe.”

Führen Sie eine Tokenisierung durch.
Bestimmen Sie die Lemmata der einzelnen Token.
Reflektieren Sie, wie diese Verarbeitung eine quantitative Analyse unterstützen würde.

Lösung

Beispiellösung zur Selbstbewertung:

Tokenisierung: [“Die”, “Forschenden”, “untersuchten”, “verschiedene”, “Zeitungsartikel”, “zur”, “Spanischen”, “Grippe”, “.”]
Lemmatisierung: [“der”, “Forschende”, “untersuchen”, “verschieden”, “Zeitungsartikel”, “zu”, “spanisch”, “Grippe”, “.”]

Reflexion:

Die Tokenisierung ermöglicht die Analyse auf Wortebene und bereitet den Text für weitere Verarbeitung vor
Die Lemmatisierung würde alle Formen von “untersuchen” zusammenfassen, was bei einer Frequenzanalyse hilfreich ist
Durch die Lemmatisierung werden verschiedene Flexionsformen (wie “Spanischen” zu “spanisch”) vereinheitlicht (‘die’ wird standardmäßig zu ‘der’ lemmatisiert).
Bei einer größeren Textsammlung würden verschiedene grammatikalische Formen desselben Wortes nicht als unterschiedliche Begriffe gezählt
Diese Normalisierung verbessert die Qualität von Häufigkeitsanalysen, Keyword-Extraktion und thematischen Analysen
Die Informationen über die ursprüngliche Form bleiben erhalten und können für detailliertere linguistische Analysen genutzt werden

Bewertungskriterien für die Selbsteinschätzung:

Korrekte Tokenisierung mit Berücksichtigung von Satzzeichen als eigene Token
Korrekte Bestimmung der Grundformen bei der Lemmatisierung
Verständnis des Nutzens für quantitative Textanalyse, insbesondere für Häufigkeitsanalysen
Reflexion über die Vor- und Nachteile der Methoden für die spezifische Forschungsfrage

6.4.7. Frage 7#

(Wählen Sie alle zutreffenden Antworten aus)

6.4.8. Frage 8#

(Wählen Sie alle zutreffenden Antworten aus)

6.4.9. Frage 9#

6.4.10. Frage 10#

6.4.11. Frage 11#

6.4.12. Frage 12#

Ordnen Sie die folgenden Schritte zur Textannotation mit spaCy in die richtige Reihenfolge:

Einlesen des Textes

Hier ablegen

Durchführung der Annotation mit nlp(text)

Hier ablegen

Auswahl der Analysekomponenten

Hier ablegen

Laden des Sprachmodells

Hier ablegen

Speichern der Annotation als CSV-Datei

Hier ablegen

Ziehen Sie die Elemente zu den passenden Beschreibungen.

1

2

3

4

5

🏆Selbsttest: Wissen und Praxis

Contents

6.4. 🏆Selbsttest: Wissen und Praxis#

6.4.1. Frage 1#

6.4.2. Frage 2#

6.4.3. Frage 3#

6.4.4. Frage 4#

6.4.5. Frage 5#

6.4.6. Frage 6#

6.4.7. Frage 7#

6.4.8. Frage 8#

6.4.9. Frage 9#

6.4.10. Frage 10#

6.4.11. Frage 11#

6.4.12. Frage 12#