🚀 Übung - Metadaten gruppieren & auswerten

5.3. 🚀 Übung - Metadaten gruppieren & auswerten#

Nachdem wir im vorherigen Abschnitt gelernt haben, wie sich offene Datensätze mit Hilfe von SPARQL gezielt durchsuchen und filtern lassen, werden wir SPARQL in dieser Übung nutzen, um Metadaten zu gruppieren und quantitativ auszuwerten.

Story

Um besser einschätzen zu können, welche Datenquellen für seine Analyse relevant sind, genügt es Dr. Amir Weber nicht, nur einzelne Datensätze zu finden. Es interessiert ihn auch, welche Institutionen regelmäßig entsprechende Daten bereitstellen und in welchen Formaten diese verfügbar sind. Dies kann Aufschluss darüber geben, wie verlässlich und zugänglich bestimmte Datenquellen sind.

Wir analysieren, in welchen Datenformaten diese Informationen angeboten werden, um Dr. Weber bei der technischen Einschätzung der Weiterverwendbarkeit zu unterstützen.

Diese aggregierten Informationen geben ihm wertvolle Hinweise auf die Datenqualität, Veröffentlichungsfrequenz und technische Nutzbarkeit – und legen damit die Grundlage für fundierte Entscheidungen im weiteren Verlauf seiner Analyse.

5.3.1. Daten gruppieren#

Im ersten Schritt lassen wir uns anzeigen, welche Datenbereitsteller die meisten Datensätze mit dem Begriff „Baumkataster“ im Titel veröffentlicht haben. Durch diese Gruppierung erhält Dr. Weber einen schnellen Überblick darüber, welche Institutionen oder Verwaltungseinheiten in den letzten Jahren besonders aktiv im Bereich der baumbezogenen offenen Daten waren – ein wichtiger Hinweis auf mögliche Hauptquellen für seine weitere Recherche.

Erklärung des Codes

PREFIX

Zu den bekannten Prefixes kommt nun rdfs dazu, um das RDF Schema, also allgemeine Begriffsdefinitionen einzuschließen.

SELECT

Der COUNT Befehl bei SPARQL wird verwendet, um die Anzahl der Ergebnisse zu zählen, die eine bestimmte Bedingung erfüllen. Der AS Befehl folgt dem COUNT und dient dazu, das Ergebnis der Zählung einer Variablen zuzuweisen, die dann im Ergebnis verwendet werden kann. DISTINCT gibt an, dass nur eindeutige (“distinct”) Werte der Variable ?datasetTitle gezählt werden sollen. AS ?uniqueDatasetTitleCount weist das Ergebnis der Zählung der Variable ?uniqueDatasetTitleCount zu.
Diese Variable kann dann im Ergebnis verwendet werden, um die Anzahl der eindeutigen Titel ?datasetTitle für jede contributorID anzuzeigen.

WHERE

Wir suchen nach Datensätzen die nach dcat als Datensatz bezeichnet sind (?datasetURI a dcat:Dataset), einen Titel nach dct (dct:title ?datasetTitle) und einen Datenbereitsteller nach dcatde (dcatde:contributorID ?contributorID) aufweisen und ein nach dct definiertes Änderungsdatum haben (dct:modified ?modified).

FILTER

Die Bedingung (LANG(?datasetTitle) = "" || LANG(?datasetTitle) = "de") wird verwendet, um sicherzustellen, dass nur Titel (?datasetTitle) ausgewählt werden, die entweder keine Sprachinformation haben (“”) oder explizit als Deutsch (“de”) gekennzeichnet sind. Dies ist wichtig, da nicht alle Datenbereitsteller Information über die Sprache des Datensatzes einschließen. Die Suche nach Datensätzen mit deutscher Sprachinformation mag überflüssig wirken, denn das Wort “Baumkataster” ist bereits ein deutsches Wort. Trotzdem wollen wir diese Funktion an dieser Stelle hervorheben, weil wir später davon Gebrauch machen werden.

Mit GROUP BY ?contributorID werden die Ergebnisse nach dem Datenbereitsteller sortiert.

Code

Output

Show code cell outputs

Hide code cell outputs

Endpoint set to: https://data.europa.eu/sparql

contributorID	uniqueDatasetTitleCount
https://offenedaten.kdvz.nrw/	1
http://dcat-ap.de/def/contributors/schleswigHolstein	2
http://dcat-ap.de/def/contributors/openDataBayern	4
http://dcat-ap.de/def/contributors/openNRW	1
http://dcat-ap.de/def/contributors/mobilithek	2
http://dcat-ap.de/def/contributors/freistaatSachsen	1
http://dcat-ap.de/def/contributors/openGovernmentDataPortalRheinlandPfalz	8
http://dcat-ap.de/def/contributors/openDataBrandenburg	14
http://dcat-ap.de/def/contributors/hessen	1
http://dcat-ap.de/def/contributors/datenBW	1

Total: 10, Shown: 10

Erklärung des Ergebnisses

Wir bekommen eine Liste ausgegeben, die anzeigt welche Datenbereitsteller wie viele Datensätze eingestellt haben.

Auffällig ist, dass ganz verschiedene Institutionen und Verwaltungsebenen offene Daten bereitstellen. Hinter http://dcat-ap.de/def/contributors/mobilithek verbirgt sich beispielsweise die Mobilithek des Bundesverkehrsministeriums und neben Bundesländern finden sich auch kommunale Datenbereitsteller.

5.3.2. Dateiformate#

Story

Im Anschluss interessiert sich Dr. Weber dafür, in welchen Formaten die Baumkataster-Daten vorliegen, da dies direkte Auswirkungen auf deren Wiederverwendbarkeit hat. Während offene Formate wie CSV, GeoJSON oder XML eine einfache Analyse ermöglichen, können proprietäre oder unstrukturierte Formate die Verarbeitung erschweren.

Daher erweitern wir unsere SPARQL-Abfrage, um für jeden Datenbereitsteller zu ermitteln, wie viele unterschiedliche Datenformate dieser im Zusammenhang mit Baumkataster-Daten anbietet. Diese Auswertung hilft Dr. Weber dabei einzuschätzen, bei welchen Anbietern er mit einem breiten und technisch zugänglichen Angebot rechnen kann – ein entscheidender Aspekt für seine geplante Analyse des Baumbestands.

Erklärung des Codes

Statt der Titel, zählen wir nun mit dem Befehl SELECT ?contributorID (COUNT(DISTINCT ?format) AS ?formatCount) die verschiedenen Formate, die mit den Datensätzen verbunden sind.

Mit dem WHERE-Befehl suchen wir nach Datensätzen (dcat:Dataset), die die folgenden Eigenschaften haben:

dct:title: einen Titel.
dcatde:contributorID: eine ID des Datenbereitstellers.
dct:modified: ein Datum der letzten Änderung. sowie mit OPTIONAL nach dem Katalog des Datensatzes, wenn er vorhanden ist.

Dazu filtern wir mit FILTER, dass der Titel entweder keine Sprachangabe hat oder in Deutsch vorliegt, das Wort “baumkataster” enthält (unabhängig von Groß- oder Kleinschreibung) und dass der Datensatz innerhalb des Zeitraums von 2015 bis 2025 veröffentlicht wurde.

?datasetURI dcat:distribution ?distribution. und ?distribution dct:format ?format. geben zudem an, dass der Datensatz eine Distribution und diese ein bestimmtes Format haben muss.

Mit GROUP BY ?contributorID werden die Ergebnisse nach dem Datenbereitsteller sortiert.

Code

Output

Show code cell outputs

Hide code cell outputs

Endpoint set to: https://data.europa.eu/sparql

contributorID	formatCount
https://offenedaten.kdvz.nrw/	3
http://dcat-ap.de/def/contributors/schleswigHolstein	2
http://dcat-ap.de/def/contributors/openDataBayern	7
http://dcat-ap.de/def/contributors/openNRW	3
http://dcat-ap.de/def/contributors/mobilithek	6
http://dcat-ap.de/def/contributors/freistaatSachsen	3
http://dcat-ap.de/def/contributors/openGovernmentDataPortalRheinlandPfalz	1
http://dcat-ap.de/def/contributors/openDataBrandenburg	4
http://dcat-ap.de/def/contributors/hessen	1
http://dcat-ap.de/def/contributors/datenBW	2

Total: 10, Shown: 10

Erklärung des Ergebnisses

Wir erhalten eine einfache Liste mit zwei Spalten: den Datenbereitstellern und der Summe von Formaten der eingestellten Datensätze. Das bedeutet, dass ein bestimmter Bereitsteller mit der Summe seiner eingestellten Dateien beispielsweise auf 21 verschiedene Dateiformate kommt. Das heißt allerdings nicht, dass alle Datensätze in jeweils jedem Format vorhanden sind. Ablesbar ist aus dieser Zusammenstellung lediglich ein gewisses Maß an Flexibilität.

5.3.3. Eingrenzung der Abfrage#

Story

Nachdem Dr. Weber nun einen Überblick darüber erhalten hat, welche Datenbereitsteller aktiv sind und viele Dateiformate anbieten, möchte er sich für einen konkreten Datensatz entscheiden, um seine Analyse zu starten. Dabei ist es ihm wichtig, den regionalen Bezug zum Raum Berlin-Brandenburg zu wahren, da seine bisherigen Untersuchungen vor allem auf diese Region fokussiert waren.

Er entscheidet sich daher, gezielt nach Datensätzen zu suchen, die von der Plattform „Open Data Brandenburg“ bereitgestellt werden und das Stichwort „Baumkataster“ im Titel führen. Durch diese gezielte Einschränkung kann Dr. Weber sicherstellen, dass die Daten sowohl thematisch relevant als auch geographisch passend sind – und damit eine geeignete Grundlage für die weitere Analyse des Baumbestands in der Region darstellen.

Um direkt auf die Daten zugreifen zu können, erweitern wir die Abfrage um die Zugriffs-URL (accessURL). Diese verweist auf die konkrete Stelle, an der der Datensatz heruntergeladen oder weiterverarbeitet werden kann – ein praktischer Schritt, der es Dr. Weber ermöglicht, ohne Umwege mit der Analyse zu beginnen.

Erklärung des Codes

An den PREFIXes ändern wir nichts.

SELECT

Wir wollen uns eine Tabelle anzeigen lassen, die vier Spalten hat: den URI (?datasetURI), den Titel (?datasetTitle), die Beschreibung (?datasetDescription) und die Download-URL (?accessURL) jedes Datensatzes.

WHERE

Wir suchen neben bekannten Elementen zusätzlich nach einem bestimmten Datenbereitsteller - nämlich Open Data Brandenburg (dcatde:contributorID <http://dcat-ap.de/def/contributors/openDataBrandenburg>), einer Beschreibung des Datensatzes (dct:description ?datasetDescription) und einer Distribution (dcat:distribution ?distribution), die als Zugriffs-URL definiert ist (?distribution dcat:accessURL ?accessURL).

Die FILTER sind bekannt und die Ordnung erfolgt nach Titel (ORDER BY ?datasetTitle).

Code

Output

Show code cell outputs

Hide code cell outputs

Endpoint set to: https://www.govdata.de/sparql

datasetURI	datasetTitle	datasetDescription	accessURL
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/c0a5b7f1-82a0-469d-8502-31740ed71755	Baumkataster - Gemeinde Kloster Lehnin	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-klosterlehnin.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/c0a5b7f1-82a0-469d-8502-31740ed71755	Baumkataster - Gemeinde Kloster Lehnin	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-klosterlehnin.de/isk/lehn_baumkataster?REQUEST=GetCapabilities&SERVICE=WFS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/c0a5b7f1-82a0-469d-8502-31740ed71755	Baumkataster - Gemeinde Kloster Lehnin	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-klosterlehnin.de/isk/lehn_baumkataster?REQUEST=GetCapabilities&SERVICE=WMS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/8bd651bb-bc53-4077-89e2-ab276d7ba438	Baumkataster - Gemeinde Kloster Lehnin (WFS)	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-klosterlehnin.de/isk/lehn_baumkataster?REQUEST=GetCapabilities&SERVICE=WFS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/75fe4dcb-91c5-4251-8f0e-5ac8aa3a6bde	Baumkataster - Gemeinde Kloster Lehnin (WMS)	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-klosterlehnin.de/isk/lehn_baumkataster?REQUEST=GetCapabilities&SERVICE=WMS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/4bc9f0c7-4e0b-438d-a4c0-c84637265165	Baumkataster - Gemeinde Nuthetal (GML)	Das digitale Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-nuthetal.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/4bc9f0c7-4e0b-438d-a4c0-c84637265165	Baumkataster - Gemeinde Nuthetal (GML)	Das digitale Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-nuthetal.de/isk/nuth_baumkataster?REQUEST=GetCapabilities&SERVICE=WFS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/4bc9f0c7-4e0b-438d-a4c0-c84637265165	Baumkataster - Gemeinde Nuthetal (GML)	Das digitale Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-nuthetal.de/isk/nuth_baumkataster?REQUEST=GetCapabilities&SERVICE=WMS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/a8b1383e-3f43-4b46-b221-66f1d8f36680	Baumkataster - Gemeinde Nuthetal (WFS)	Das digitale Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-nuthetal.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/5d97237a-4122-4e6d-b78c-8ddb4cb6effd	Baumkataster - Gemeinde Nuthetal (WMS)	Das digitale Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-nuthetal.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/27b8e107-11cb-4f70-a968-9b6405f0c684	Baumkataster - Stadt Beelitz	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-beelitz.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/27b8e107-11cb-4f70-a968-9b6405f0c684	Baumkataster - Stadt Beelitz	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-beelitz.de/isk/beel_baumkataster?REQUEST=GetCapabilities&SERVICE=WFS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/27b8e107-11cb-4f70-a968-9b6405f0c684	Baumkataster - Stadt Beelitz	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-beelitz.de/isk/beel_baumkataster?REQUEST=GetCapabilities&SERVICE=WMS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/bb904bfa-9e65-42f8-a26d-b6112bda60e9	Baumkataster - Stadt Beelitz (WFS)	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-beelitz.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/b80f1c02-e6b1-4a69-9529-9ad495a8b9be	Baumkataster - Stadt Beelitz (WMS)	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Gemeinde. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-beelitz.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/1e5b3b39-2214-4cbc-ba52-f0402a8f68ef	Baumkataster - Stadt Trebbin	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Stadt. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-trebbin.de/
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/1e5b3b39-2214-4cbc-ba52-f0402a8f68ef	Baumkataster - Stadt Trebbin	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Stadt. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-trebbin.de/isk/treb_baumkataster?REQUEST=GetCapabilities&SERVICE=WFS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/1e5b3b39-2214-4cbc-ba52-f0402a8f68ef	Baumkataster - Stadt Trebbin	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Stadt. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	https://www.geoportal-trebbin.de/isk/treb_baumkataster?REQUEST=GetCapabilities&SERVICE=WMS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/d593ff28-4eb0-41ce-a38d-79adef15a365	Baumkataster - Stadt Trebbin (WFS)	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Stadt. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	http://www.geoportal-trebbin.de/isk/treb_baumkataster?REQUEST=GetCapabilities&SERVICE=WFS
https://piveau.offene.daten-brandenburg.de/api/hub/repo/datasets/4b9fecc3-cfd9-43da-991e-b31e3e8e15f3	Baumkataster - Stadt Trebbin (WMS)	Das Baumkataster dient zur Pflege und Verwaltung des Baumbestands der Stadt. Neben der exakten, räumlichen Lage werden weitere Sachinformationen geführt.	http://www.geoportal-trebbin.de/isk/treb_baumkataster?REQUEST=GetCapabilities&SERVICE=WMS

Total: 23, Shown: 20

Erklärung des Ergebnisses

Wir erhalten die Tabelle mit vier Spalten: dem URI des Datensatzes, dem Titel des Datensatzes, der Beschreibung des Datensatzes und einer URL unter der der Datensatz zu finden sien sollte.

Story

Dr. Weber möchte nun einen bestimmten Datensatz genauer unter die Lupe nehmen. Allerdings stellt er bei der Überprüfung fest, dass sich der betreffende Datensatz nicht direkt herunterladen lässt oder die bereitgestellte URL nicht wie erwartet funktioniert.

Das zeigt: Auch wenn Metadaten vielversprechende Informationen liefern, ist es in der Praxis oft notwendig, die tatsächliche Verfügbarkeit und Zugänglichkeit der Daten manuell zu prüfen. Dr. Weber wird seine Suche daher fortsetzen müssen – eventuell mit einer breiteren geografischen Eingrenzung oder indem er nach anderen relevanten Begriffen sucht.

Dr. Weber blickt nun in Richtung Nordrhein-Westfalen (NRW). Bereits bei der vorherigen Auswertung zur Datenverfügbarkeit war ihm aufgefallen, dass NRW eine besonders hohe Anzahl an relevanten Datensätzen bereitstellt – und das in verschiedenen Formaten und mit stabiler Zugriffbarkeit.

Die gute technische Performance und die Vielzahl veröffentlichter Inhalte lassen darauf schließen, dass das Land NRW ein fortschrittliches Open-Data-Angebot betreibt, das möglicherweise besser für eine umfassende Analyse geeignet ist. Aus diesem Grund richtet Dr. Weber nun gezielt seine Suche auf Datensätze, die durch Open Data NRW bereitgestellt werden und thematisch zu seiner Untersuchung rund um Baumkataster und Baumpflanzungen passen.

Einführung in den Code

Wir ändern bei dieser Abfrage nur die Suche nach einem bestimmten Datenbereitsteller - nämlich Open Data NRW (dcatde:contributorID <http://dcat-ap.de/def/contributors/openNRW>)

Code

Output

Show code cell outputs

Hide code cell outputs

Endpoint set to: https://www.govdata.de/sparql

datasetURI	datasetTitle	datasetDescription	accessURL
https://offenedaten.kdvz.nrw/dataset/d30-baumkataster-der-kreisstadt-bergheim	D30 Baumkataster der Kreisstadt Bergheim	<p>Baumkataster der Kreisstadt Bergheim als Shape-, Excel- sowie CSV Datei.</p> <p>Die Dateien enthalten Angaben zu Standort, Baumnummer, Gattung, deutscher Bezeichnung sowie Stammumfang.</p> <p><strong>Hinweis:</strong></p> <p>Es sind noch nicht alle Bäume erfasst, die Erfassung des gesamten städtischen Baumbestandes wird angestrebt. Der Datensatz wird aus diesem Grunde unregelmäßig aktualisiert.</p>	https://offenedaten.kdvz.nrw/dataset/d30-baumkataster-der-kreisstadt-bergheim/resource/3c3bfe9b-40ed-4eb7-95d0-46dafefd7ff8
https://offenedaten.kdvz.nrw/dataset/d30-baumkataster-der-kreisstadt-bergheim	D30 Baumkataster der Kreisstadt Bergheim	<p>Baumkataster der Kreisstadt Bergheim als Shape-, Excel- sowie CSV Datei.</p> <p>Die Dateien enthalten Angaben zu Standort, Baumnummer, Gattung, deutscher Bezeichnung sowie Stammumfang.</p> <p><strong>Hinweis:</strong></p> <p>Es sind noch nicht alle Bäume erfasst, die Erfassung des gesamten städtischen Baumbestandes wird angestrebt. Der Datensatz wird aus diesem Grunde unregelmäßig aktualisiert.</p>	https://offenedaten.kdvz.nrw/dataset/d30-baumkataster-der-kreisstadt-bergheim/resource/521d90f3-85b3-4568-80b9-40eef8e42f3e
https://offenedaten.kdvz.nrw/dataset/d30-baumkataster-der-kreisstadt-bergheim	D30 Baumkataster der Kreisstadt Bergheim	<p>Baumkataster der Kreisstadt Bergheim als Shape-, Excel- sowie CSV Datei.</p> <p>Die Dateien enthalten Angaben zu Standort, Baumnummer, Gattung, deutscher Bezeichnung sowie Stammumfang.</p> <p><strong>Hinweis:</strong></p> <p>Es sind noch nicht alle Bäume erfasst, die Erfassung des gesamten städtischen Baumbestandes wird angestrebt. Der Datensatz wird aus diesem Grunde unregelmäßig aktualisiert.</p>	https://offenedaten.kdvz.nrw/dataset/d30-baumkataster-der-kreisstadt-bergheim/resource/aa6b2af9-4dcc-4caa-9e12-f287870d3daa

Total: 3, Shown: 3

Erklärung des Ergebnisses

Wir bekommen eine Liste ausgegeben, die uns Baumkataster-Datensätze aus NRW mit URI, Titel, Beschreibung und Zugangs-URL anbietet. Bei dieser Suche finden sich Zugangs-URL, die einen direkten Datenabruf ermöglichen.

Fund eines geeigneten Datensatzes

Nach intensiver Recherche entscheidet sich Dr. Weber schließlich für den Datensatz Baumkataster Köln 2017. Dieser bietet eine umfassende Beschreibung des städtischen Baumbestands und enthält nicht nur geografische Informationen, sondern auch detaillierte Angaben zur Baumart, zum Alter, zur Kronenbreite, zur Stammdicke sowie zur Wuchshöhe der Bäume.

Besonders positiv fällt Dr. Weber die gute Zugänglichkeit des Datensatzes auf - die enthaltenen Informationen sind klar strukturiert, verständlich dokumentiert und stehen in einem gängigen Format zur Verfügung. Dadurch lässt sich der Datensatz problemlos in bestehende Analyseumgebungen integrieren – ein wichtiger Vorteil für die praktische Weiterverarbeitung. Auch wenn der Datensatz noch nicht den vollständigen Baumbestand der Stadt Köln abbildet, bietet er bereits jetzt eine solide Datenbasis für eine fundierte Analyse.

Damit verfügt Dr. Weber über eine valide Grundlage, um erste Auswertungen zur Baumverteilung und -struktur in einer Großstadt vorzunehmen und mögliche Modellregionen für seine Untersuchung zu identifizieren.

Was Sie mitnehmen sollten

Die tatsächliche Zugänglichkeit muss oft manuell geprüft werden.

🚀 Übung - Metadaten gruppieren & auswerten

Contents

5.3. 🚀 Übung - Metadaten gruppieren & auswerten#

5.3.1. Daten gruppieren#

5.3.2. Dateiformate#

5.3.3. Eingrenzung der Abfrage#