5. Scraping als Methode zum Korpusaufbau#
Groblernziel dieses Kapitels
Sie können HTTP-Abfragen konzeptionell erklären und unterschiedliche Methoden zur automatisierten Abfrage von Websites unterscheiden sowie Vor- und Nachteile benennen.
Nachdem das vorherige Kapitel in HTML eingeführt hat, geht es in diesem Kapitel um die automatisierten Extraktion, dem sogenannten Scraping, von Webinhalten zur Erstellung des Forschungskorpus.
Fig. 5.1 Flussdiagramm der Fallstudie. Wir befinden uns nun im dritten Arbeitspaket.#
Dafür führen wir zuerst die Webkommunikation ein, das heißt, wie mittels HTTP-Abfragen Website-Inhalte auf den eigenen PC gelangen und beschäftigen uns dann mit unterschiedlichen Arten und Weisen, diese Abfragen automatisiert auszuführen.