Persistent Identifier (PID)

5.2. Persistent Identifier (PID)#

In den vorherigen Kapiteln zur Nachnutzung und zur Bewertung von Daten fielen bereits häufiger die Stichworte “Persitent Identifier” (PID) oder auch “URI” (Uniform Resource Identifier), auf die nun eingegangen werden soll.

Ein Persistenter Identifikator (engl. Persistent Identifier, PID) ist eine eindeutige, universelle und dauerhafte (=persistente) digitale Referenz, die aus einer definierten Kombination von Ziffern und/oder alphanumerischen Zeichen besteht [PID, 2024]. Sie können auf ein digitales Objekt (z. B. einen Datensatz), aber auch auf Personen und Organisationen verweisen. Zudem befinden sich momentan PID für Software, Forschungsinstrumente, Datenmanagementpläne, Repositorien oder wissenschaftliche Konferenzen in Entwicklung [TIB, n.d.]. Im Gegensatz zu einer URL (Uniform Resource Locator) verweist ein PID nicht auf einen “Standort” bzw. eine Adresse im Netz, sondern auf das Objekt selbst, sodass es selbst dann noch auffindbar bleibt, wenn sich der Standort ändert. URI kann man als übergeordnetes Konzept verstehen. Alle PID (wie auch URL) sind URI, aber nicht umgekehrt [Berners-Lee, n.d.].

Ein weit verbreiteter Standard für digitale Objekte ist DOI (Digital Object Identifier), ein weiterer wäre URN (Uniform Resource Name). Für Personen hat sich ORCID (Open Researcher Contributor Identifier) etabliert, für Organisationen ROR (Research Organization Registry). Ein weiterer Bezeichner ist der GND-ID ein Identifikator des Dienstes GND (Gemeinsame Normdatei), mit dem Entitäten, also Personen, Körperschaften, Konferenzen, Geografika, Sachbegriffe und Werke repräsentiert werden können.

Warum ist das wichtig?

PID machen wissenschaftliches Arbeiten im digitalen Raum erst möglich. Ebenso wie im physischen Raum eine Akte oder Veröffentlichung genau benannt und lokalisiert werden muss, um sie zu bearbeiten, benötigen digitale Daten eine eindeutige Kennung. So garantieren sie Beständigkeit und Verwertbarkeit. Ziel ist also eine möglichst breite, interdisziplinäre Austauschbarkeit, Vernetzung und sichere Zitierung, was letztlich die Datenqualität erhöht [Büchner, 2015]. Für Forschende liegt der Vorteil darin, dass sich Forschungsdaten schneller und einfacher auffinden lassen und die eigene Forschungsleistung so sichtbarer wird. Die bessere Auffindbarkeit und Kontextualisierung durch PID und Metadaten schafft zudem mehr Transparenz und erleichtert dadurch die Einschätzung der Qualität der Daten und Forschungsergebnisse.

PID sind darüber hinaus im Kontext von Linked Data (s. Abschnitt Linked Data) von Bedeutung, denn so lassen sich schnell und unkompliziert Verweise von einem Datensatz zu verwandten Datensätzen, zu dem/der Autor:in oder anderen Veröffentlichungen darstellen.

Wenn Daten vom Portal GovData, das Ihnen sicherlich ein Begriff ist, geharvestet werden sollen, brauchen sie neben Metadaten nach dem Standard DCAT-AP.de einen persistenten URI. Um selbst Daten einzustellen muss man angemeldet und Mitarbeiter:in einer auf der Webseite gelisteten Institutionen sein [GovData, 2024].

Weitere Informationen

PID werden beim Upload von Daten und in der Regel von Repositorien automatisiert vergeben. Kontaktstellen an der Bibliothek Ihrer Einrichtung können Sie dazu unterstützen. Eine Anleitung findet sich zudem bei der Technischen Informationsbibliothek (TIB) in Hannover. Wenn Sie mehr zum Thema PID erfahren möchten, sei Ihnen das DFG-geförderte Projekt PID-Network Deutschland empfohlen, das sich der Förderung von persistenten Identifikatoren in Wissenschaft und Kultur verpflichtet.

Literatur

[BL]

Tim Berners-Lee. Universal Resource Identifiers. URL: https://www.w3.org/Addressing/URL/uri-spec.html.

[Buc15]

Michael Büchner. Persistente Identifikatoren für unterschiedliche Ressourcen aller Kultursparten. April 2015. URL: https://www.deutsche-digitale-bibliothek.de/content/blog/persistente-identifikatoren-fuer-unterschiedliche-ressourcen-aller-kultursparten.

[GovData24]

GovData. Anleitung zur Datenbereitstellung auf GovData. May 2024. URL: https://www.govdata.de/datenbereitstellungaufgovdata.