2.3. Datenbasis#

Amir Weber macht sich Gedanken, welche Daten er braucht und woher er sie beziehen kann… Dabei fällt ihm das Berliner Projekt Gieß den Kiez ein, dass diese Daten bereits erhebt und zur Verfügung stellt. Er prüft zudem, welche Daten noch von Interesse sind und woher er sie beziehen kann.

In diesem Kapitel stellen wir Ihnen die Daten vor, die wir für unser Szenario benötigen und warum sie von Interesse sind.

Die Daten werden für die Datenvisualisierung in RShiny benötigt. Dazu brauchen wir drei zentrale Datensätze:

  • Daten über den Berliner Baumbestand

  • Bewässerungsdaten des Projekts Gieß den Kiez

  • Informationen zu öffentlichen Wasserpumpen, um zu prüfen, ob diese mit dem Bewässerungsverhalten in Verbindung stehen

Diese Datengrundlage ermöglicht eine fundierte Analyse der urbanen Bewässerungsinfrastruktur in Berlin.

2.3.1. Gieß den Kiez – Bewässerungsdaten (Govdata)#

Die Datenplattform “Gieß den Kiez” dokumentiert die freiwillige Bewässerung städtischer Bäume durch Bürger:innen. Wir beziehen die Bewässerungsdaten über das Portal GovData. Der Datensatz enthält Informationen über einzelne Bewässerungsvorgänge. Jeder Eintrag ist einem bestimmten Baum zugeordnet (zu erkennen an der ID) und umfasst unter anderem:

  • Geokoordinaten (Längengrad: lng, Breitengrad: lat)

  • Baumart: art_dtsch und Gattung: gattung_deutsch

  • Pflanzjahr: pflanzjahr, Straßenname: strname und Bezirk: bezirk

  • Zeitpunkt der letzten Bewässerung: timestamp

  • Menge der Bewässerung in Litern: bewaesserungsmenge_in_liter

Diese Daten ermöglichen Rückschlüsse auf Muster im Gießverhalten der Bevölkerung in dem Zeitraum 2020-2024 und versorgen die Visualisierung mit räumlich und zeitlich differenzierten Informationen zur städtischen Baumbewässerung.

Ein Screenshot, der ein comicartiges Bild einer Berlin-Karte zeigt, auf der Bäume von Personen gegossen werden.

Fig. 2.1 Karte mit Personen darauf. (KI generiert)#

2.3.2. Baumbestandsdaten (Berlin Open Data)#

Die Baumbestandsdaten stammen aus dem Berliner Open-Data-Portal und umfassen sowohl Straßenbäume als auch Anlagebäume. Die Daten liegen im WFS-Format vor.

Die Datensätze enthalten unter anderem Informationen zu:

  • Identifikatoren wie gml_id (ermöglicht Unterscheidung zwischen Anlagen- und Straßenbäumen), gisid und pitid

  • Kennzeichen: kennzeichen

  • Botanische Klassifikation, z. B. Baumart: art_dtsch, art_bot, Gattung: gattung_deutsch, gattung und Gruppe: art_gruppe)

  • Standortmerkmale wie Straße: strname, Hausnummer: hausnr, Zusatz: zusatz, Bezirk: bezirk, Geometrie: geom (enthält Längen- und Breitengrad in anderem Format) und Standortnummer: standortnr

  • Baummaße, z. B. Kronendurchmesser: kronedurch, Stammumfang: stammumfg und Höhe: baumhoehe

  • Eigentumsverhältnisse: eigentuemer

  • Pflanzjahr: pflanzjahr

Sie dienen dazu, die Struktur des städtischen Baumbestands besser zu verstehen und mit den Gießdaten in Beziehung zu setzen.

2.3.3. Öffentliche Pumpen (OpenStreetMap via Overpass API)#

Zur Identifikation potenzieller Wasserquellen für die Baumgießung wurden Daten zu öffentlichen Wasserpumpen aus Overpass Turbo extrahiert. Dabei handelt es sich um ein Daten-Filterungs-Werkzeug für OpenStreetMap (OSM). Mithilfe einer Abfrage im OpenStreetMap-Tagging-Schema “man_made”=”water_well”

[out:json][timeout:60];
// Berliner Stadtgrenze (Relation)
{{geocodeArea:Berlin}}->.searchArea;

// Suche nach Wasserpumpen innerhalb Berlins
(
  node["man_made"="water_well"](area.searchArea);
  way["man_made"="water_well"](area.searchArea);
  relation["man_made"="water_well"](area.searchArea);
);
out body;
>;
out skel qt;

wurde eine umfangreiche Sammlung relevanter Pumpenstandorte generiert. Die resultierenden Daten enthalten zahlreiche Attribute, von denen besonders relevant sind:

  • Geolokation (Punktgeometrie: geometry)

  • Zugänglichkeit (access)

  • Pumpentyp und Stil (pump.status, pump.style, Pumpenbedinung: pump)

  • Identifikator(id)

2.3.4. Bezirksgrenzen (Berlin Open Data)#

Zur besseren geografischen Einordnung der Pumpen wurde zusätzlich der Datensatz zu den Berliner Bezirksgrenzen genutzt. Dieser enthält die polygonalen Abgrenzungen aller Berliner Bezirke im GeoJson-Format und ermöglicht damit eine präzise räumliche Zuordnung von Punktdaten und enthalten pro Bezirk unter anderem folgende Attribute:

  • Gemeinde_name: Name des Bezirks (z. B. Reinickendorf)

  • Gemeinde_schluessel: Dreistelliger Schlüssel des Bezirks

  • Land_name und Land_schluessel: Verwaltungszuordnung zu Berlin

  • Schluessel_gesamt: Vollständiger Gebietsschlüssel

  • geometry: Geometrische Beschreibung der Bezirksgrenzen als Multi-Polygon

Konkret wurden die Bezirksgrenzen verwendet, um die Lage der Wasserpumpen innerhalb des Stadtgebiets einzelnen Bezirken zuzuweisen. Dies ist insbesondere für die Analyse lokaler Versorgungsdichten, infrastruktureller Ausstattung oder potenzieller Versorgungslücken von Bedeutung. Ebenso dient die Zuordnung als Grundlage für Visualisierungen und statistische Auswertungen auf Bezirksebene.

2.3.5. Bezirksflächen (Grünflächeninformationssystem (GRIS))#

Um die Verteilung und Dichte öffentlicher Wasserpumpen innerhalb der Berliner Bezirke besser quantifizieren zu können, wurden ergänzend Flächendaten aus dem Grünflächeninformationssystem (GRIS) des Landes Berlin herangezogen. Die Flächenangaben dienen insbesondere dazu, die Pumpendichte pro Hektar (ha) auf Bezirksebene zu berechnen und damit die infrastrukturelle Versorgung vergleichbar darzustellen.

Die Flächendaten wurden aus einer tabellarischen Quelle des GRIS extrahiert und manuell in ein strukturiertes Dataframe überführt. Dieses enthält pro Bezirk folgende Informationen:

  • bezirk: Name des Berliner Bezirks

  • flaeche_ha: Bezirksfläche in Hektar

Ein Screenshot, der eine Tabelle zu den größen der Bezirksflächen in Berlin in Hektar enthält.

Fig. 2.2 Tabelle mit Angaben zu Bezirksflächen#

bezirksflaechen <- data.frame(
  bezirk = c("Mitte", "Friedrichshain-Kreuzberg", "Pankow", "Charlottenburg-Wilmersdorf",
             "Spandau", "Steglitz-Zehlendorf", "Tempelhof-Schöneberg", "Neukölln",
             "Treptow-Köpenick", "Marzahn-Hellersdorf", "Lichtenberg", "Reinickendorf"),
  flaeche_ha = c(3.940, 2.040, 10.322, 6.469, 9.188, 10.256, 5.305, 4.493, 16.773, 6.182, 5.212, 8.932)
)

Diese Daten ermöglichen flächenbezogene Vergleiche der Pumpendichte und bilden eine wichtige Grundlage für die Bewertung der Verteilung öffentlicher Wasserquellen im urbanen Raum.

2.3.6. Lebensweltlich orientierte Räume auswähle (LOR GovData)#

Für eine feinräumigere Analyse des Gießverhaltens in Berlin wurden zusätzlich die Lebensweltlich orientierten Räume (LOR) berücksichtigt. Dabei handelt es sich um ein offizielles kleinräumiges Gebietsgliederungssystem, das vom Amt für Statistik Berlin-Brandenburg bereitgestellt und gepflegt wird. Die Einteilung der Stadt in sogenannte Planungsräume ermöglicht differenzierte sozialräumliche Auswertungen und bietet eine sinnvolle Ergänzung zu den Bezirksgrenzen.

Die LOR-Daten wurden über das Portal GovData bezogen und liegen im Geo-Datenformat mit räumlichen Polygonen vor. Der vollständige Datensatz enthält zahlreiche Attribute – für unsere Analyse relevant sind insbesondere:

  • bzr_id: ID des Bezirksregionsraums

  • bzr_name: Name des Bezirksregionsraums

  • geom: Geometrie (räumliche Abgrenzung als Polygon)

Diese Informationen ermöglichen eine detailliertere geografische Segmentierung der Gießaktivitäten und erlauben den Vergleich zwischen verschiedenen Berliner Stadtteilen jenseits der groben Bezirksebene. Die LOR-Zuordnung wurde insbesondere für kleinräumige Visualisierungen sowie für die Untersuchung sozialräumlicher Unterschiede in der Baumgießbeteiligung herangezogen.