OpenRefine Einführung

Dieses Tutorial kann als Material für unseren Einführungs-Workshop oder als Selbstlern-Ressource genutzt werden.

OpenRefine ist ein leistungsstarkes Open-Source-Tool zur Datenbereinigung und -transformation, das im GLAM-Bereich (Galleries, Libraries, Archives, Museums) und in Universitätssammlungen wertvolle Dienste leistet. Gerade hier, wo heterogene und historisch gewachsene Datensätze oft inkonsistente Metadaten aufweisen, hilft OpenRefine.

Das Tool kann:

  • praktisch alle Text-Dateiformate und Datenstrukturen wie CSV, XML, JSON importieren
  • einen schnellen Überblick über Dateien mit zehntausenden Zeilen schaffen
  • Bereinigungs- und Sortieraufgaben durchführen, etwa vor dem Import von Daten in ein neues Dokumentationssystem
  • durch Zugriff auf Webseiten und Schnittstellen diese Daten verarbeiten (z. B. für einen Abgleich mit der GND, Wikidata, OpenStreetMap usw.)
  • wiederholbare, komplexe Bearbeitungsschritte mit Hilfe der eigenen Skriptsprache GREL durchführen, die ganze Spalten oder die ganze Tabelle betreffen
  • bei der Transformation in andere Datenformate (Export) unterstützen

Ob zur Vorbereitung digitaler Sammlungen, für Systemmigrationen oder zur besseren Integration in Forschungsinfrastrukturen – OpenRefine erleichtert die Arbeit mit Metadaten erheblich und trägt dazu bei, Sammlungen besser zu erschließen und nachhaltig nutzbar zu machen.

Die Kursdateien können auf unserem SODa Repository gefunden werden.

 

Format
Textdokument
Selbstlern-Kurs
Level
Einsteiger:innen