2.3. Datenbasis#
Amir Weber macht sich Gedanken, welche Daten er braucht und woher er sie beziehen kann… Dabei fällt ihm das Berliner Projekt Gieß den Kiez ein, dass diese Daten bereits erhebt und zur Verfügung stellt. Er prüft zudem, welche Daten noch von Interesse sind und woher er sie beziehen kann.
In diesem Kapitel stellen wir Ihnen die Daten vor, die wir für unser Szenario benötigen und warum sie von Interesse sind.
Die Daten werden für die Datenvisualisierung in RShiny benötigt. Dazu brauchen wir drei zentrale Datensätze:
Daten über den Berliner Baumbestand
Bewässerungsdaten des Projekts Gieß den Kiez
Informationen zu öffentlichen Wasserpumpen, um zu prüfen, ob diese mit dem Bewässerungsverhalten in Verbindung stehen
Diese Datengrundlage ermöglicht eine fundierte Analyse der urbanen Bewässerungsinfrastruktur in Berlin.
2.3.1. Gieß den Kiez – Bewässerungsdaten (Govdata)#
Die Datenplattform “Gieß den Kiez” dokumentiert die freiwillige Bewässerung städtischer Bäume durch Bürger:innen. Wir beziehen die Bewässerungsdaten über das Portal GovData. Der Datensatz enthält Informationen über einzelne Bewässerungsvorgänge. Jeder Eintrag ist einem bestimmten Baum zugeordnet (zu erkennen an der ID) und umfasst unter anderem:
Geokoordinaten (Längengrad:
lng
, Breitengrad:lat
)Baumart:
art_dtsch
und Gattung:gattung_deutsch
Pflanzjahr:
pflanzjahr
, Straßenname:strname
und Bezirk:bezirk
Zeitpunkt der letzten Bewässerung:
timestamp
Menge der Bewässerung in Litern:
bewaesserungsmenge_in_liter
Diese Daten ermöglichen Rückschlüsse auf Muster im Gießverhalten der Bevölkerung in dem Zeitraum 2020-2024 und versorgen die Visualisierung mit räumlich und zeitlich differenzierten Informationen zur städtischen Baumbewässerung.

Fig. 2.1 Karte mit Personen darauf. (KI generiert)#
2.3.2. Baumbestandsdaten (Berlin Open Data)#
Die Baumbestandsdaten stammen aus dem Berliner Open-Data-Portal und umfassen sowohl Straßenbäume als auch Anlagebäume. Die Daten liegen im WFS-Format vor.
Die Datensätze enthalten unter anderem Informationen zu:
Identifikatoren wie
gml_id
(ermöglicht Unterscheidung zwischen Anlagen- und Straßenbäumen),gisid
undpitid
Kennzeichen:
kennzeichen
Botanische Klassifikation, z. B. Baumart:
art_dtsch
,art_bot
, Gattung:gattung_deutsch
,gattung
und Gruppe:art_gruppe
)Standortmerkmale wie Straße:
strname
, Hausnummer:hausnr
, Zusatz:zusatz
, Bezirk:bezirk
, Geometrie:geom
(enthält Längen- und Breitengrad in anderem Format) und Standortnummer:standortnr
Baummaße, z. B. Kronendurchmesser:
kronedurch
, Stammumfang:stammumfg
und Höhe:baumhoehe
Eigentumsverhältnisse:
eigentuemer
Pflanzjahr:
pflanzjahr
Sie dienen dazu, die Struktur des städtischen Baumbestands besser zu verstehen und mit den Gießdaten in Beziehung zu setzen.
2.3.3. Öffentliche Pumpen (OpenStreetMap via Overpass API)#
Zur Identifikation potenzieller Wasserquellen für die Baumgießung wurden Daten zu öffentlichen Wasserpumpen aus Overpass Turbo extrahiert. Dabei handelt es sich um ein Daten-Filterungs-Werkzeug für OpenStreetMap (OSM). Mithilfe einer Abfrage im OpenStreetMap-Tagging-Schema “man_made”=”water_well”
[out:json][timeout:60];
// Berliner Stadtgrenze (Relation)
{{geocodeArea:Berlin}}->.searchArea;
// Suche nach Wasserpumpen innerhalb Berlins
(
node["man_made"="water_well"](area.searchArea);
way["man_made"="water_well"](area.searchArea);
relation["man_made"="water_well"](area.searchArea);
);
out body;
>;
out skel qt;
wurde eine umfangreiche Sammlung relevanter Pumpenstandorte generiert. Die resultierenden Daten enthalten zahlreiche Attribute, von denen besonders relevant sind:
Geolokation (Punktgeometrie:
geometry
)Zugänglichkeit (
access
)Pumpentyp und Stil (
pump.status
,pump.style
, Pumpenbedinung:pump
)Identifikator(
id
)
2.3.4. Bezirksgrenzen (Berlin Open Data)#
Zur besseren geografischen Einordnung der Pumpen wurde zusätzlich der Datensatz zu den Berliner Bezirksgrenzen genutzt. Dieser enthält die polygonalen Abgrenzungen aller Berliner Bezirke im GeoJson-Format und ermöglicht damit eine präzise räumliche Zuordnung von Punktdaten und enthalten pro Bezirk unter anderem folgende Attribute:
Gemeinde_name
: Name des Bezirks (z. B. Reinickendorf)Gemeinde_schluessel
: Dreistelliger Schlüssel des BezirksLand_name
undLand_schluessel
: Verwaltungszuordnung zu BerlinSchluessel_gesamt
: Vollständiger Gebietsschlüsselgeometry
: Geometrische Beschreibung der Bezirksgrenzen als Multi-Polygon
Konkret wurden die Bezirksgrenzen verwendet, um die Lage der Wasserpumpen innerhalb des Stadtgebiets einzelnen Bezirken zuzuweisen. Dies ist insbesondere für die Analyse lokaler Versorgungsdichten, infrastruktureller Ausstattung oder potenzieller Versorgungslücken von Bedeutung. Ebenso dient die Zuordnung als Grundlage für Visualisierungen und statistische Auswertungen auf Bezirksebene.
2.3.5. Bezirksflächen (Grünflächeninformationssystem (GRIS))#
Um die Verteilung und Dichte öffentlicher Wasserpumpen innerhalb der Berliner Bezirke besser quantifizieren zu können, wurden ergänzend Flächendaten aus dem Grünflächeninformationssystem (GRIS) des Landes Berlin herangezogen. Die Flächenangaben dienen insbesondere dazu, die Pumpendichte pro Hektar (ha) auf Bezirksebene zu berechnen und damit die infrastrukturelle Versorgung vergleichbar darzustellen.
Die Flächendaten wurden aus einer tabellarischen Quelle des GRIS extrahiert und manuell in ein strukturiertes Dataframe überführt. Dieses enthält pro Bezirk folgende Informationen:
bezirk
: Name des Berliner Bezirksflaeche_ha
: Bezirksfläche in Hektar

Fig. 2.2 Tabelle mit Angaben zu Bezirksflächen#
bezirksflaechen <- data.frame(
bezirk = c("Mitte", "Friedrichshain-Kreuzberg", "Pankow", "Charlottenburg-Wilmersdorf",
"Spandau", "Steglitz-Zehlendorf", "Tempelhof-Schöneberg", "Neukölln",
"Treptow-Köpenick", "Marzahn-Hellersdorf", "Lichtenberg", "Reinickendorf"),
flaeche_ha = c(3.940, 2.040, 10.322, 6.469, 9.188, 10.256, 5.305, 4.493, 16.773, 6.182, 5.212, 8.932)
)
Diese Daten ermöglichen flächenbezogene Vergleiche der Pumpendichte und bilden eine wichtige Grundlage für die Bewertung der Verteilung öffentlicher Wasserquellen im urbanen Raum.
2.3.6. Lebensweltlich orientierte Räume auswähle (LOR GovData)#
Für eine feinräumigere Analyse des Gießverhaltens in Berlin wurden zusätzlich die Lebensweltlich orientierten Räume (LOR) berücksichtigt. Dabei handelt es sich um ein offizielles kleinräumiges Gebietsgliederungssystem, das vom Amt für Statistik Berlin-Brandenburg bereitgestellt und gepflegt wird. Die Einteilung der Stadt in sogenannte Planungsräume ermöglicht differenzierte sozialräumliche Auswertungen und bietet eine sinnvolle Ergänzung zu den Bezirksgrenzen.
Die LOR-Daten wurden über das Portal GovData bezogen und liegen im Geo-Datenformat mit räumlichen Polygonen vor. Der vollständige Datensatz enthält zahlreiche Attribute – für unsere Analyse relevant sind insbesondere:
bzr_id
: ID des Bezirksregionsraumsbzr_name
: Name des Bezirksregionsraumsgeom
: Geometrie (räumliche Abgrenzung als Polygon)
Diese Informationen ermöglichen eine detailliertere geografische Segmentierung der Gießaktivitäten und erlauben den Vergleich zwischen verschiedenen Berliner Stadtteilen jenseits der groben Bezirksebene. Die LOR-Zuordnung wurde insbesondere für kleinräumige Visualisierungen sowie für die Untersuchung sozialräumlicher Unterschiede in der Baumgießbeteiligung herangezogen.