In dieser Unterichtseinheit wurde das Thema der letzten Lektion, Metadaten modellieren und Schnittstellen nutzen, weiter vertieft, wobei sich in dieser Einheit primär mit der Metadatentransformation beschäftigt wurde.

Dies geschah mithilfe der Software OpenRefine, eines Google-Eigenen Open Source-Tools, welches über eine grafische Oberfläche verfügt, die einer Tabellenverarbeitungssoftware ähnelt, und der Analyse, Bereinigung, Konvertierung und Anreicherung von Daten dient. Die im Jahr 2020 am häufigsten genannten Anwendungen (Abbildung aus dem Kurs) waren dabei die Normalisierung von Daten, etwa das Bereinigen von Schreibfehlern, Format-Konvertierung, Vorbereitung von Daten für den Load in ein anderes System und das Betrachten und Verstehen fremder Daten. Die mit Abstand häufigsten Anwendenden waren Bibliotheksmitarbeitende mit über 35% der befragten Personen. Zusätzlich fiel in dieser Tabelle auf, dass zwar die Nutzung innerhalb einer bibliothekarischen Arbeitswelt kontinuierlich deutlich anstieg, aber in allen anderen Bereichen grob gleichbleibend bis rückläufig war, insbesondere in den Bereichen Research, Business und Open Data, weshalb sich die Frage stellt, ob es neuere und/oder bessere Software gibt und ob OpenRefine in den nächsten Jahren obsolet werden könnte. Ein Hinweis dabei könnte sein, dass OpenRefine auf den lokalen Einsatz ausgelegt ist, was sich für Bibliotheken anbieten mag, aber für den Einsatz auf Webservern und zur Automatisierung Zusatztools nötig sind, was etwas im Gegensatz stehen mag zum in den letzten Jahren im ITC-Bereich beobachtbaren Trend zu Cloud- und SaaS-Lösungen, welche immer weniger mit lokalen Installationen arbeiten (wie bereits im Gastreferat zu Alam ersichtlich). Es wurde im Anschluss an die Unterrichtseinheit noch versucht, diesem Thema in einer kleinen Recherche nachzugehen, diese brachte allerdings keine brauchbaren Antworten hervor.

Um aber auf die Unterrichtseinheit zurückzukommen: Hier wurde OpenRefine anhand einer genauen Schritt-für-Schritt-Anleitung installiert, was auch gut funktionierte, sodass die Software anschliessend unter localhost, Post 3333 aufrufbar war. Anschliessend an die Installation wurden verschiedene Übungen durchgeführt beziehungsweise von den Dozierenden vorgeführt. Dabei wurden zuerst einige Beispieldaten geladen und es wurden einige Fingerübungen durchgeführt, anhand derer man sich mit den Funktionen von OpenRefine vertraut machen konnte. Besonders interessant dabei waren die sogenannten Facetten, mithilfe derer es möglich ist, alle Werte einer Spalte zu gruppieren, Daten nach diesen Werten zu filtern und die Werte mehrerer Datensätze zusammen zu bearbeiten, was im Unterricht etwa anhand der Spalte Sprache betrachtet wurde. Auch interessant was das reconciling, dass es erlaubt anhand von Angaben wie einer ISSN Daten zu ergänzen, etwa zu einer Zeitschrift.

Vorgeführt wurde von den Dozierenden anschliessend noch die Verwendung von OpenRefine zur Erstellung eines Crosswalks, wobei der grosse Unterschied zu den vorherigen Lektionen zu sein scheint, dass in OpenRefine das Template für den Crosswalk selbst angelegt und mit den nötigen Regeln ergänzt werden kann, statt dass es wie etwa bei MARCEdit bereits vorgefertigt vorliegt.