Korpusanalyse. Von Häufigkeiten zu Diagrammen

5. Korpusanalyse. Von Häufigkeiten zu Diagrammen#

Frequenzanalysen semantischer Felder

  1. Das Konzept des semantischen Feldes sowie die Berechnung von Häufigkeiten des semantischen Felds auf einem Korpus kann erklärt werden.

  2. Der Unterschied zwischen absoluten und relativen Häufigkeiten kann beschrieben und die Darstellungsmethoden des Streudiagramms sowie des Liniendiagramms interpretiert werden.

  3. Das Konzept von syntaktischen n-Grams in Bezug auf Adjektiv-Nomen-Paare kann beschrieben und die notwendigen Schritte zur automatischen Extraktion der syntaktischen n-Grams können aufgezählt werden.

  4. Das Konzept einer Trend-Linie kann beschrieben und die aus einem Streudiagramm erzeugte Trend-Linie interpretiert werden.

Nachdem wir im vorherigen Kapitel zwei Korpora literarischer Texte automatisch mit linguistischen Informationen annotiert haben (siehe Kapitel “Korpusverarbeitung – Von Strings zu Token”)., sind alle Vorverabeitungsschritte durchgeführt und wir wenden uns in diesem Kapitel der Korpusanalyse zu.

../_images/flow-chart_corpus-analysis.png

Fig. 5.1 Flussdiagramm der Fallstudie, das aktuelle Arbeitspaket ist hevorgehoben.#

Wir kehren zur Forschungsfrage zurück und besprechen zuerst konzeptionelle Grundlagen zur Erstellung eines semantischen Felds, zur Extraktion von Häufigkeiten sowie zur Visualisierung der Häufigkeiten in Form eines Streudiagramms und die Errechnung und Darstellung einer Trend-Linie.

Anschließend wird die Analyse des semantischen Felds auf den Korpora ausgeführt und die Ergebnisse werden anhand der Visualisierungen interpretiert.

Im nächsten Schritt werden syntaktische n-Gramme eingeführt und auf dem Korpus analysiert. Die Ergebnisse werden wieder anhand von Visualisierungen interpretiert.