Zu Beginn dieser Unterrichtseinheit wurde noch eine interessante Ergänzung zum Thema Persistent Identifier gegeben, deren wichtigste Punkte hier noch kurz zusammengefasst werden sollen: Ein Persistent Identifier ist eine Dauerhafte Identifizierungsmöglichkeit eines digitalen Objektes. Der bekannteste dieser Persistent Identifiers ist wohl der DOI (Digital Object Identifier). Vergeben werden diese von einer Registraturorganisation, die Verwaltung und Verfügbarkeit liegt jedoch in den Händen derjenigen Organisation, welche den Persistent Identifier beantragt hat. Grosser Vorteil dieser Persistent Identifiers ist dabei, dass sie permanent sind und so von Veränderungen wie etwa dem Verschieben einer Ressource auf einen neuen Server nicht beeinflusst werden.

Da das eigentliche Ziel dieser Unterrichtseinheit aber war, Daten aus den bisher betrachteten Programmen Koha, ArchieSpace und DSpace in einen einheitlichen Metadatenstandard (MARC21-XML) zu überführen, wurde einleitend ein Rückblick über die in diesem Kontext behandelten und oben erwähnten Themen gegeben, was der Übersichtlichkeit der Gesamtthematik klar dienlich war. Dies wurde anhand folgender, bereits zu Beginn des Kurses vorgestellter Abbildung getan, anhand der man gut erkennen kann, welche Themen bereits im Unterricht behandelt wurden und wie es von hier aus weitergehen wird.

grafik

Zur Durchführung der oben angesprochenen Vereinheitlichung wurde zusätzlich das Programm VuFindHarvest genutzt, welches es erlaubt, den in der letzten Übung händisch durchgeführten Prozess des Abgreifens von Metadaten aus verschiedenen Standards über eine OAI-PMH-Schnittstelle zu automatisieren.

Neben OAI-PMH wurden aber während der Unterrichtseinheit auch einige weitere Protokolle angesprochen, namentlich SRU und Z39.50. Z39.50 ist dabei das älteste der Programme und in der Tendenz veraltet, wird aber, da es sich vielerorts noch im Einsatz befindet weiterhin angeboten. SRU biete ebenso wie OAI-PMH den Vorteil, direkt über den Browser abrufbar zu sein, da Adressen als URLs erstellt werden. Besonders für grössere Datenmengen ist aber OAI-PMH der gängige Standard.

Im weiteren Verlauf der Lektion wurden dann die in Koha und ArchieSpace in früheren Unterrichtseinheiten bearbeiteten Daten über die OAI-PMH-Schnittstelle geharvested, das heisst abgegriffen. Dies geschah mittels der VueFindHarvest-Software, die zu diesem Zweck noch installiert werden musste. Grundsätzlich funktionierte dies ganz gut, es gab aber einige kleinere Probleme beim Ausführen des dazu verwendeten Befehles, was allerdings mehr mit der suboptimalen Organisation auf dem Rechner beziehungsweise der virtuellen Maschine des Studierenden zu tun hatte als mit dem Programm selbst.

Ziel im weiteren Verlauf der Lektion war es, die nun in drei unterschiedlichen Datenformaten vorliegenden Daten aus den drei Programmen Koha, ArchiveSpace und DSpace in ein einheitliches Format, in diesem Fall MARC21-XML, zu konvertieren. Dieses Konvertierungsvorgehen wird auch als Crosswalks bezeichnet. Dabei beinhaltet der Crosswalk Regeln, wie Elemente und Werte aus dem einen Metadatenstandard dem anderen zugeordnet werden sollen, was als Mapping bezeichent wird. Im vorliegenden Fall geschah dies mithilfe der Software MarcEdit, was auch funktionierte, wobei es aber nicht möglich war, EAD-Dateien direkt ins MARC21-Format zu überführen, dazu war ein Zwischenschritt über das MARC21-Format nötig. Grundsätzlich funktionierte dies auch recht gut, kleinere Probleme sind aber nur schwer zu verhindern, da die Feld-Aufteilung der einzelnen Ausgangsstandards nicht in allen Fällen mit derjenigen in MARC21-XML übereinstimmt, was auch von den Dozierenden schon so angesprochen worden war.