6.4. 🏆Selbsttest: Wissen und Praxis#
Hinweis
Diese Übungsaufgaben dienen Ihrer Selbsteinschätzung und helfen Ihnen dabei, das im Kapitel Gelernte zu reflektieren.
Sie können die Fragen in beliebiger Reihenfolge beantworten und jeden Versuch bei Bedarf mehrfach wiederholen.
So funktioniert es:
Wählen Sie bei jeder Frage die Antwort(en) aus, die Sie für richtig halten.
Lesen Sie das Feedback zu den einzelnen Antwortoptionen sorgfältig durch.
Die Erklärungen helfen Ihnen dabei, Ihr Verständnis zu vertiefen – auch bei korrekten Antworten.
Es erfolgt keine Bewertung oder Speicherung Ihrer Ergebnisse. Nutzen Sie dieses Assessment, um Wissenslücken zu identifizieren und gegebenenfalls die entsprechenden Abschnitte des Kapitels noch einmal zu bearbeiten.
Geschätzte Zeit: 45min
Viel Erfolg!
6.4.1. Frage 1#
6.4.2. Frage 2#
6.4.3. Frage 3#
6.4.4. Frage 4#
6.4.5. Frage 5#
6.4.6. Frage 6#
Analysieren Sie den folgenden Satz mit NLP-Methoden und beschreiben Sie die Ergebnisse:
Originaltext: “Die Forschenden untersuchten verschiedene Zeitungsartikel zur Spanischen Grippe.”
Führen Sie eine Tokenisierung durch.
Bestimmen Sie die Lemmata der einzelnen Token.
Reflektieren Sie, wie diese Verarbeitung eine quantitative Analyse unterstützen würde.
Lösung
Beispiellösung zur Selbstbewertung:
Tokenisierung: [“Die”, “Forschenden”, “untersuchten”, “verschiedene”, “Zeitungsartikel”, “zur”, “Spanischen”, “Grippe”, “.”]
Lemmatisierung: [“der”, “Forschende”, “untersuchen”, “verschieden”, “Zeitungsartikel”, “zu”, “spanisch”, “Grippe”, “.”]
Reflexion:
Die Tokenisierung ermöglicht die Analyse auf Wortebene und bereitet den Text für weitere Verarbeitung vor
Die Lemmatisierung würde alle Formen von “untersuchen” zusammenfassen, was bei einer Frequenzanalyse hilfreich ist
Durch die Lemmatisierung werden verschiedene Flexionsformen (wie “Spanischen” zu “spanisch”) vereinheitlicht (‘die’ wird standardmäßig zu ‘der’ lemmatisiert).
Bei einer größeren Textsammlung würden verschiedene grammatikalische Formen desselben Wortes nicht als unterschiedliche Begriffe gezählt
Diese Normalisierung verbessert die Qualität von Häufigkeitsanalysen, Keyword-Extraktion und thematischen Analysen
Die Informationen über die ursprüngliche Form bleiben erhalten und können für detailliertere linguistische Analysen genutzt werden
Bewertungskriterien für die Selbsteinschätzung:
Korrekte Tokenisierung mit Berücksichtigung von Satzzeichen als eigene Token
Korrekte Bestimmung der Grundformen bei der Lemmatisierung
Verständnis des Nutzens für quantitative Textanalyse, insbesondere für Häufigkeitsanalysen
Reflexion über die Vor- und Nachteile der Methoden für die spezifische Forschungsfrage
6.4.7. Frage 7#
(Wählen Sie alle zutreffenden Antworten aus)
6.4.8. Frage 8#
(Wählen Sie alle zutreffenden Antworten aus)