4.7. Einfügen Baumstatistik#

Story

Amir Weber möchte nachvollziehen, inwieweit die Art der Bäume und ihrer Umgebung das freiwillige Engagement beim Gießen beeinflussen. Nachdem er bereits zeitliche Muster analysiert hat, richtet er seinen Blick nun auf räumliche Faktoren (Baumdichte) sowie baumartspezifische Merkmale.

Zweck dieser Übung

In dieser Übung wollen wir herausfinden, ob die Baumart und räumliche Faktoren (Baumdichte) einen Einfluss auf das Engagement beim Gießen haben. Wir üben:

  • Baumarten und deren Verteilung in Bezirken statistisch zu beschreiben,

  • relative Häufigkeiten und Top-Listen (z. B. meistgegossene Arten) zu interpretieren,

  • Baumdichte im Verhältnis zur Bezirksfläche quantitativ zu berechnen,

und einfache Hypothesen über das Engagement – etwa bevorzugte Gattungen oder Nachbarschaftseffekte – mit Daten zu prüfen.

Nachdem zuvor untersucht wurde, wie Pflanzjahr und Zeitverlauf das Gießverhalten beeinflussen, richtet sich der Blick nun auf räumliche und baumartspezifische Unterschiede innerhalb Berlins. Verschiedene Bezirke weisen sehr unterschiedliche Baumstrukturen auf: Manche besitzen eine hohe Dichte, andere sind von wenigen dominanten Gattungen geprägt (Nachweis dazu fehlt - woraus wird das zu diesem Zeitpunkt abgeleitet?).

Amir Weber will also überprüfen:

  • Ob bestimmte Baumgattungen häufiger gegossen werden als andere.

  • Ob die Baumdichte das Gießverhalten beeinflusst. Er vermutet, dass dicht bepflanzte Straßen oder Kieze mehr Interaktionen begünstigen – etwa nach dem Motto: „Wenn ich schon meinen Baum gieße, mache ich den daneben auch gleich mit.“

Die Funktion dieses Reiters besteht also darin, die Baumverteilung nach Bezirken sichtbar zu machen, die am häufigsten gegossenen Baumarten zu identifizieren und die Baumdichte im Verhältnis zur Bezirksfläche zu analysieren, um mögliche Muster im Engagement zu erkennen.

Damit dient der Reiter als Grundlage, um zu verstehen, welche strukturellen Faktoren im Stadtraum das Engagement der Gießenden möglicherweise begünstigen.

4.7.1. Benutzeroberfläche (UI)#

Code
dashboardPage(
  dashboardHeader(title = "Gieß den Kiez Dashboard"),
  dashboardSidebar(
    sidebarMenu(
      menuItem("Baumstatistik", tabName = "engagement", icon = icon("hands-helping"))
Ein Screenshot, der zeigt Dashboard Karte

Fig. 4.7 Baumverteilung nach Bezirken und Baumgattungen. Die Abbildung zeigt die Verteilung der Bäume in den Berliner Bezirken, aufgeschlüsselt nach Baumgattungen. Die Anzahl der Bäume ist für jeden Bezirk als gestapeltes Balkendiagramm dargestellt, wobei die einzelnen Farbsegmente unterschiedliche Baumgattungen repräsentieren. Über einen Schieberegler kann die Anzahl der angezeigten, häufigsten Baumgattungen (Top-N) interaktiv angepasst werden, während weniger häufige Gattungen unter „Sonstige“ zusammengefasst sind. (Quelle: eigene Ausarbeitung)#

Das obenstehende Diagramm ist ein Balkendiagramm, genauer gesagt ein gestapeltes Balkendiagramm, das mehrere Informationsebenen gleichzeitig vermittelt. Der zentrale Mehrwert dieser Darstellungsform liegt darin, sowohl die Gesamtanzahl der Bäume pro Bezirk als auch deren Zusammensetzung nach Gattungen in einer einzigen Visualisierung zu vereinen. Die Balkenlänge zeigt auf einen Blick, welche Bezirke den größten Baumbestand haben, während die farbigen Segmente innerhalb jedes Balkens die Artenvielfalt und deren relative Anteile offenlegen. Dies ermöglicht direkte Vergleiche zwischen Bezirken: Nutzer:innen können nicht nur erkennen, dass Bezirk A mehr Bäume hat als Bezirk B, sondern auch, ob beide eine ähnliche Gattungsverteilung aufweisen oder ob bestimmte Arten in einzelnen Bezirken dominieren. Die Anpassung über den Top-N-Schieberegler reduziert visuelle Komplexität und ermöglicht es, den Fokus je nach Fragestellung auf die häufigsten Gattungen zu legen oder eine detailliertere Aufschlüsselung zu betrachten. Somit verbindet das gestapelte Balkendiagramm quantitative Präzision mit visueller Übersichtlichkeit und macht komplexe, mehrdimensionale Daten intuitiv erfassbar. Balkendiagramme zählen zu den etabliertesten Darstellungswerkzeugen der Datenvisualisierung – ihre breite Anwendung in dieser Fallstudie spiegelt ihre Vielseitigkeit und Lesbarkeit wider.

Code
     tabItem(
       tabName = "engagement",
       
       
       fluidRow(
         box(
           title = tagList(
             "Baumverteilung nach Bezirken (mit Baumgattungen)",
             div(
               actionButton("info_btn_bvnb", label = "", icon = icon("info-circle")),
               style = "position: absolute; right: 15px; top: 5px;"
             )
           ),
           status = "primary",
           solidHeader = TRUE,
           width = 12,
           sliderInput(
             "top_n_species",
             "Top N Baumgattungen anzeigen:",
             min = 3,
             max = 15,
             value = 8,
             step = 1
           ),
           plotOutput("tree_distribution_stacked", height = "500px")
         )
       ),
Ein Screenshot, der zeigt Dashboard Karte

Fig. 4.8 Verteilung der Baumgattungen. Die Abbildung zeigt die prozentuale Verteilung der Baumgattungen im Berliner Baumbestand in Form eines Kreisdiagramms. Über ein Auswahlfeld kann der betrachtete Bezirk festgelegt werden, wodurch sich die dargestellte Verteilung entsprechend anpasst. Die einzelnen Kreissegmente repräsentieren die Anteile der jeweiligen Baumgattungen am Gesamtbestand des ausgewählten Bezirks. (Quelle: eigene Ausarbeitung)#

Das obenstehende Diagramm ist ein Kreisdiagramm (auch Tortendiagramm genannt), das die prozentuale Zusammensetzung der Baumgattungen innerhalb eines Bezirks visualisiert. Der zentrale Mehrwert dieser Darstellungsform liegt in ihrer Fähigkeit, Anteile und Proportionen intuitiv erfassbar zu machen: Nutzer:innen erkennen auf einen Blick, welche Gattungen den Baumbestand dominieren und welche nur eine untergeordnete Rolle spielen. Die Kreisform vermittelt das Konzept des “Ganzen” unmittelbar – alle Segmente zusammen ergeben 100% des Baumbestands im gewählten Bezirk. Dies erleichtert das Verständnis relativer Größenverhältnisse, etwa wenn eine Gattung ein Viertel oder die Hälfte aller Bäume ausmacht. Die interaktive Bezirksauswahl ermöglicht zudem gezielte Vergleiche: Nutzer:innen können erkunden, ob bestimmte Gattungen in verschiedenen Stadtteilen unterschiedlich stark vertreten sind. Im Gegensatz zum Balkendiagramm, das absolute Zahlen und Mengenvergleiche betont, fokussiert das Kreisdiagramm auf die innere Struktur und Diversität des Baumbestands eines einzelnen Bezirks.

Code
       
       fluidRow(
         box(
           title = tagList(
             "Verteilung der Baumgattungen",
             div(
               actionButton("info_btn_vdb", label = "", icon = icon("info-circle")),
               style = "position: absolute; right: 15px; top: 5px;"
             )
           ),
           status = "primary",
           solidHeader = TRUE,
           width = 12,
           selectInput(
             "pie_bezirk",
             "Bezirk auswählen:",
             choices = c("Alle", sort(unique(df_merged$bezirk))),
             selected = "Alle"
           ),
           plotOutput("tree_species_pie", height = "500px")
         ),         
Ein Screenshot, der zeigt Dashboard Karte

Fig. 4.9 Top 10 gegossene Baumgattungen. Die Abbildung zeigt die Top 10 gegossenen Baumgattungen in Berlin in Form eines horizontalen Balkendiagramms. Über ein Auswahlfeld kann der betrachtete Bezirk festgelegt werden, wodurch sich die dargestellten Werte entsprechend anpassen. Die Balken repräsentieren die absolute Anzahl gegossener Bäume je Gattung, wobei die Linde mit deutlichem Abstand an erster Stelle steht, gefolgt von Ahorn (ca. 250.000) und weiteren Gattungen mit jeweils deutlich geringeren Werten. Die x-Achse zeigt die Anzahl gegossener Bäume, die y-Achse die Baumgattungen. (Quelle: eigene Ausarbeitung)#

Code
         box(
           title = tagList(
             "Baumdichte pro km²",
             div(
               actionButton("info_btn_bdpf", label = "", icon = icon("info-circle")),
               style = "position: absolute; right: 15px; top: 5px;"
             )
           ),
           status = "primary",
           solidHeader = TRUE,
           width = 6,
           plotOutput("tree_density_area", height = "500px")
         )
       ),       
Ein Screenshot, der zeigt Dashboard Karte

Fig. 4.10 Baumdichte pro km². Die Abbildung zeigt die Baumdichte pro km² in den verschiedenen Berliner Bezirken in Form eines vertikalen Balkendiagramms. Die Balken repräsentieren die jeweilige Baumdichte, wobei Friedrichshain-Kreuzberg die höchste Dichte aufweist. Die x-Achse zeigt die Bezirke, die y-Achse die Anzahl der Bäume pro km². Die Darstellung ermöglicht einen direkten Vergleich der Baumdichte zwischen den zwölf Berliner Bezirken. (Quelle: eigene Ausarbeitung)#

Code
       fluidRow(
         box(
           title = tagList(
             "Top 10 gegossene Baumgattungen",
             div(
               actionButton("info_btn_hgb", label = "", icon = icon("info-circle")),
               style = "position: absolute; right: 15px; top: 5px;"
             )
           ),
           status = "primary",
           solidHeader = TRUE,
           width = 12,
           selectInput(
             "engagement_bezirk",
             "Bezirk auswählen:",
             choices = c("Alle", sort(unique(df_merged$bezirk))),
             selected = "Alle"
           ),
           plotOutput("top_watered_species", height = "500px")
         )
       )
     ),

4.7.2. Server#

Gestapeltes Balkendiagramm: Baumverteilung nach Bezirken#

Das erste Diagramm soll zeigen, wie viele Bäume in jedem Bezirk stehen und welche Gattungen dort dominieren. Um die Visualisierung übersichtlich zu halten, konzentriert sich Amir auf die häufigsten Baumgattungen – alle anderen werden unter “Sonstige” zusammengefasst.

Code
# 1. Stacked Bar Chart - Baumverteilung mit Gattungen
  output$tree_distribution_stacked <- renderPlot({
    top_genera <- df_merged %>%
      filter(!is.na(gattung_deutsch)) %>%   
      count(gattung_deutsch, sort = TRUE) %>%
      head(input$top_n_species) %>%
      pull(gattung_deutsch)

Daten aggregieren und gruppieren#

Jetzt werden die Daten so aufbereitet, dass für jeden Bezirk gezählt wird, wie viele Bäume jeder Gattungsgruppe dort stehen.

Code
    df_agg <- df_merged %>%
      filter(!is.na(bezirk)) %>%  
      mutate(gattung_grouped = ifelse(gattung_deutsch %in% top_genera, gattung_deutsch, "Sonstige")) %>%
      group_by(bezirk, gattung_grouped) %>%
      summarise(count = n(), .groups = "drop") %>%
      group_by(bezirk) %>%
      mutate(percentage = count / sum(count) * 100) %>%
      ungroup()

Gestapeltes Balkendiagramm erstellen#

Mit den aggregierten Daten erstellt Amir nun das gestapelte Balkendiagramm, das die Baumverteilung nach Bezirken visualisiert.

Code
    df_agg$gattung_grouped <- factor(df_agg$gattung_grouped, 
                                     levels = c(top_genera, "Sonstige"))
    
    ggplot(df_agg, aes(x = reorder(bezirk, count, sum), y = count, fill = gattung_grouped)) +
      geom_bar(stat = "identity", position = "stack", color = "white", size = 0.3) +
      labs(
        title = NULL,
        x = "Bezirk",
        y = "Anzahl Bäume",
        fill = "Baumgattung"
      ) +
      theme_light() +
      theme(
        axis.text.x = element_text(angle = 45, hjust = 1, size = 10),
        legend.position = "right",
        panel.grid.major.x = element_blank()
      ) +
      scale_fill_brewer(palette = "Set3")
  })

Kreisdiagramm: Gattungsverteilung#

Das Kreisdiagramm soll die prozentuale Zusammensetzung der Baumgattungen zeigen – entweder für ganz Berlin oder für einen ausgewählten Bezirk. Diese Darstellung macht auf einen Blick deutlich, welche Gattungen dominieren.

Code
  # 2. Pie Chart - Gattungsverteilung
  output$tree_species_pie <- renderPlot({
    filtered_data <- df_merged
    if (input$pie_bezirk != "Alle") {
      filtered_data <- filtered_data %>%
        filter(bezirk == input$pie_bezirk)
    }
    
    df_agg <- filtered_data %>%
      filter(!is.na(gattung_deutsch)) %>%  
      count(gattung_deutsch, sort = TRUE) %>%
      mutate(
        gattung_grouped = ifelse(row_number() <= 10, gattung_deutsch, "Sonstige")
      ) %>%
      group_by(gattung_grouped) %>%
      summarise(count = sum(n), .groups = "drop") %>%
      arrange(desc(count)) %>%
      mutate(
        percentage = count / sum(count) * 100,
        label = paste0(gattung_grouped, "\n", round(percentage, 1), "%")
      )
    
    ggplot(df_agg, aes(x = "", y = count, fill = gattung_grouped)) +
      geom_bar(stat = "identity", width = 1, color = "white", size = 0.5) +
      coord_polar("y", start = 0) +
      labs(
        title = NULL,
        fill = "Baumgattung"
      ) +
      theme_void() +
      theme(
        legend.position = "right",
        legend.text = element_text(size = 9)
      ) +
      scale_fill_brewer(palette = "Set3") +
      geom_text(aes(label = ifelse(percentage > 3, paste0(round(percentage, 1), "%"), "")),
                position = position_stack(vjust = 0.5),
                size = 3,
                color = "black")
  })

  # Info button
  observeEvent(input$info_btn_vdb, {
    showModal(modalDialog(
      title = "Information: Verteilung der Baumgattungen",
      HTML("
      <p>Diese Grafik zeigt die <strong>prozentuale Verteilung der Baumgattungen</strong>.</p>
      <ul>
        <li>Zeigt die Top 10 häufigsten Baumgattungen (z.B. LINDE, AHORN, EICHE)</li>
        <li>Alle anderen Gattungen werden als 'Sonstige' zusammengefasst</li>
        <li>Kann auf einzelne Bezirke gefiltert werden</li>
        <li>Hilft zu verstehen, welche Gattungen in Berlin dominieren</li>
      </ul>
    "),
      easyClose = TRUE,
      footer = modalButton("Schließen")
    ))
  })

Baumdichte pro Fläche berechnen#

Um Bezirke fair vergleichen zu können, berechnet Amir die Baumdichte – also wie viele Bäume pro Quadratkilometer stehen. Ein großer Bezirk kann viele Bäume haben, aber trotzdem eine niedrige Dichte aufweisen.

Code
  # 3. Baumdichte pro Bezirksfläche
  output$tree_density_area <- renderPlot({
    bezirk_flaeche <- data.frame(
      bezirk = c("Charlottenburg-Wilmersdorf", "Friedrichshain-Kreuzberg", "Lichtenberg",
                 "Marzahn-Hellersdorf", "Mitte", "Neukölln", "Pankow",
                 "Reinickendorf", "Spandau", "Steglitz-Zehlendorf",
                 "Tempelhof-Schöneberg", "Treptow-Köpenick"),
      flaeche_km2 = c(64.72, 20.16, 52.29, 61.74, 39.47, 44.93, 103.07,
                      89.46, 91.91, 102.50, 53.09, 168.42)
    )
    
    df_agg <- df_merged %>%
      filter(!is.na(bezirk)) %>%  
      group_by(bezirk) %>%
      summarise(total_trees = n_distinct(gml_id)) %>%
      ungroup() %>%
      left_join(bezirk_flaeche, by = "bezirk") %>%
      mutate(density = total_trees / flaeche_km2) %>%
      arrange(desc(density))
    
    ggplot(df_agg, aes(x = reorder(bezirk, -density), y = density, fill = bezirk)) +
      geom_bar(stat = "identity", color = "white", alpha = 0.7) +
      labs(
        title = NULL,
        x = "Bezirk",
        y = "Bäume pro km²"
      ) +
      theme_light() +
      theme(
        legend.position = "none",
        axis.text.x = element_text(angle = 45, hjust = 1, size = 10),
        panel.grid.major.x = element_blank()
      ) +
      scale_fill_discrete()
  })

  # Info button
  observeEvent(input$info_btn_bdpf, {
    showModal(modalDialog(
      title = "Information: Baumdichte pro km²",
      HTML("
      <p>Diese Grafik zeigt die <strong>Baumdichte</strong> in jedem Bezirk normalisiert auf die Fläche.</p>
      <ul>
        <li>Berechnung: Anzahl Bäume / Bezirksfläche in km²</li>
        <li>Ermöglicht fairen Vergleich zwischen großen und kleinen Bezirken</li>
        <li>Hohe Dichte = urbaner, mehr Straßenbäume</li>
        <li>Niedrige Dichte = ländlicher, mehr Wald/Parkflächen</li>
      </ul>
    "),
      easyClose = TRUE,
      footer = modalButton("Schließen")
    ))
  })

Baumdichte pro Fläche berechnen#

Diese Visualisierung zeigt, welche Baumgattungen am häufigsten gegossen wurden. Das hilft zu verstehen, ob bestimmte Gattungen mehr Aufmerksamkeit erhalten – möglicherweise weil sie häufiger vorkommen oder als besonders pflegebedürftig wahrgenommen werden.

Code
  # 4. Top 10 gegossene Baumgattungen
  output$top_watered_species <- renderPlot({
    filtered_data <- df_merged %>%
      filter(!is.na(bewaesserungsmenge_in_liter)) 
    
    if (input$engagement_bezirk != "Alle") {
      filtered_data <- filtered_data %>%
        filter(bezirk == input$engagement_bezirk)
    }
    
    df_agg <- filtered_data %>%
      filter(!is.na(gattung_deutsch)) %>%   
      group_by(gattung_deutsch) %>%
      summarise(
        count = n(),
        total_water = sum(bewaesserungsmenge_in_liter, na.rm = TRUE)
      ) %>%
      ungroup() %>%
      arrange(desc(count)) %>%
      head(10)
    
    ggplot(df_agg, aes(x = reorder(gattung_deutsch, count), y = count, fill = gattung_deutsch)) +
      geom_bar(stat = "identity", color = "white", alpha = 0.7) +
      coord_flip() +
      labs(
        title = NULL,
        x = "Baumgattung",
        y = "Anzahl gegossener Bäume"
      ) +
      theme_light() +
      theme(
        legend.position = "none",
        panel.grid.major.y = element_blank()
      ) +
      scale_fill_discrete()
  })

  # Info button
  observeEvent(input$info_btn_hgb, {
    showModal(modalDialog(
      title = "Information: Top 10 gegossene Baumgattungen",
      HTML("
      <p>Diese Grafik zeigt die <strong>am häufigsten gegossenen Baumgattungen</strong>.</p>
      <ul>
        <li>Nur Bäume, die tatsächlich bewässert wurden</li>
        <li>Zeigt, welche Gattungen am meisten Unterstützung erhalten</li>
        <li>Kann auf einzelne Bezirke gefiltert werden</li>
        <li>Hilft zu verstehen, welche Gattungen besondere Aufmerksamkeit bekommen</li>
      </ul>
    "),
      easyClose = TRUE,
      footer = modalButton("Schließen")
    ))
  })

4.7.3. Schlussfolgerung#

Die Analyse zeigt deutlich, dass der Berliner Baumbestand stark von wenigen Gattungen dominiert wird. Linden machen berlinweit rund 55,6 % aller Straßenbäume aus, was bedeutet, dass viele Muster der Verteilung zwangsläufig von dieser einen Gattung geprägt werden. Die Betrachtung der Gattungen ist daher zwar interessant, besitzt jedoch nur begrenzte Aussagekraft, da sie strukturelle Eigenheiten der Berliner Bepflanzung widerspiegelt und weniger das Verhalten der Bürgerinnen und Bürger.

Beim Vergleich der Bezirke treten klare Unterschiede in der räumlichen Verteilung zutage. Friedrichshain-Kreuzberg und Mitte weisen die höchsten Baumdichten pro km² auf, was typisch für kompakte, urbane Bezirke mit vielen Straßenbäumen ist. Gleichzeitig besitzen Mitte, Pankow und Charlottenburg-Wilmersdorf die größten absoluten Baumzahlen, was vor allem auf großflächige Areale mit Mischbeständen und Gehölzflächen zurückzuführen ist.

Setzt man diese Befunde in Bezug zu den Engagement-Daten, deutet sich ein Muster an: Bezirke mit hoher Baumdichte zeigen tendenziell auch mehr Bürgerengagement. Dies ist plausibel, da in dichter bebauten Gebieten mehr Menschen auf engem Raum auf Bäume treffen und häufiger die Möglichkeit haben, einzelne Straßenbäume zu gießen.

Die Baumgattungen selbst liefern hingegen keinen starken Erklärungswert für das Engagement. Es zeigt sich zwar, welche Gattungen besonders häufig gegossen werden, doch dies korreliert in erster Linie damit, wie verbreitet die jeweilige Gattung im Stadtbild ist. Dass Linden oft gegossen werden, liegt also vor allem daran, dass sie fast überall stehen – nicht daran, dass sie besonders pflegebedürftig oder beliebter wären.

Kernbotschaft Die Verteilung des Engagements folgt eher der Dichte und Sichtbarkeit von Bäumen in den Bezirken als der Art der Bäume. Baumgattungen erklären wenig – räumliche Faktoren jedoch deuten auf einiges hin.