Einführung und Installation OpenRefine

Contents

4.3.4. Einführung und Installation OpenRefine#

OpenRefine Logo (2018-heute)

Fig. 4.10 OpenRefine Logo (2018-heute), übernommen von wikimedia.org. “A power tool for working with messy data.”#

OpenRefine ist eine OpenSource Software für die Bereinigung, Formatierung und Anreicherung von Datensätzen. Sie präsentiert die Datensätze in einer grafischen Benutzeroberfläche, die in ihrer tabellarischen Ansicht an Excel erinnert. In OpenRefine stehen jedoch zahlreiche Bearbeitungsfunktionen zur Verfügung, die weit über die Möglichkeiten von Excel hinausgehen und sonst nur durch die Anwendung verschiedener Programmiersprachen umgesetzt werden können. Zudem ist OpenRefine in der Lage, eine Vielzahl von Datei- und Datenformaten (z.B. csv, txt, xls) für die Verarbeitung einzulesen und später zu exportieren.[1]

Zwischen 2010 und 2012 wurde OpenRefine als GoogleRefine von Google entwickelt. Nach dem Ende der Unterstützung durch Google wurde OpenRefine als freie Software veröffentlicht und weiterentwickelt, teilweise finden sich noch Artikel und Tutorials unter dem Namen GoogleRefine. Im Folgenden wird wiederholt auf die OpenRefine Dokumentation verlinkt – in dieser werden Sie bei Fragen bezüglich des Programms schnell fündig.

OpenRefine Versionen

Für diese OER wurde die zum Zeitpunkt derer Erstellung aktuelle OpenRefine Version 3.9.3 vom 17.04.2025 verwendet. Ältere und neuere Versionen weisen ggf. Unterschiede bei der Arbeitsoberfläche und bei den Funktionalitäten auf. Sie finden sämtliche Versionen von OpenRefine im GitHub Repositorium des Projekts.

Installation#

OpenRefine kann von der Website des Projekts heruntergeladen werden. Die Software wird lokal installiert, aber ähnlich wie die Office Produkte von Google über einen Browser ausgeführt. Als lokaler Webserver benötigt das Programm dabei keine aktive Internetverbindung. Unterstützt werden WebKit basierte Browser wie etwa

  • Google Chrome

  • Chromium

  • Opera

  • Microsoft Edge

  • und Safari.

Bei anderen Browsern, wie z.B. Firefox, kann es zu Fehlern in der grafischen Darstellung kommen.

Nach der Installation kann OpenRefine gestartet werden. Es öffnet sich ein Terminal-Fenster (bzw. ein Anwendungsindikator im macOS Dock), das für die eigentliche Arbeit mit dem Programm nicht relevant ist, jedoch geöffnet bleiben muss. Die Benutzeroberfläche von OpenRefine wird über die Server-Adresse http://127.0.0.1:3333/ in einem Tab des Browsers geöffnet, beim Start des Programms geschieht dies in der Regel automatisch.

Zum Beenden von OpenRefine schließen Sie zunächst alle Tabs des Browsers in denen das Programm ausgeführt wird. Anschließen klicken Sie bei Windows auf das geöffnete Terminal-Fenster und schließen dieses mit der Tasenkombibation Strg + C. Unter macOS schließen Sie OpenRefine, indem Sie es im Dock auswählen und mit cmd + Q beenden. Durch diese Art des Beendens des Programms wird gewährleistet, dass alle Änderungen die mit OpenRefine durchgeführt wurden auch sicher abgespeichert werden.

Zusätzliche Informationen zur Installationen und den Systemvoraussetzungen finden Sie auf dieser Seite der OpenRefine Dokumentation.