Wir beginnen mit einem neuen Thema: Metadaten modellieren und Schnittstellen nutzen.

Dieser thematische Block wird in zwei Teilen durchgeführt, in denen wir uns tiefer mit den Metadatenstandards und den Voraussetzungen für die Konvertierung von Metadaten beschäftigen werden. Es kommt auch neue Software dazu, die wir in den kommenden zwei Sitzungen kennenlernen werden. Auf dem Schaubild des Moduls haben wir einen weiteren Punkt erreicht und befinden uns in der rechten Hälfte des Diagramms: Nach der Installation das Bibliothekssystem Koha und das Archivsystem ArchivesSpace und DSpace, stehen wir nun bei VuFindHarvest und marcEdit, also bei der Transformation von Metadaten ins Format MARC21-XML.

Für die heutige Sitzung ist es geplant, die Daten aus unterschiedlichen Formaten (EAD und Dublin Core) einheitlich in das Format MARC21-XML zu übertragen. Für diese Umwandlung wird die Software marcEdit benutzt. Die Umwandlung der Datenformate erfolgt über die Transformationssprache XSLT.

Zunächst wurden die Austauschprotokolle für Metadaten (OAI-PMH, SRU) theoretisch erklärt. Die drei wichtigsten Protokolle werden von den Dozenten näher beschrieben. Hier die wichtigsten Erkenntnisse aus dem Input: Die Protokolle Z39.50 und SRU - Search/Retrieve via URL (beide von der Library of Congress) eignen sich besser für den Einzeldatenabruf oder eine Livesuche. Der OAI-PMH - Open Archives Initiative Protocol for Metadata Harvesting (Open Archives Initiative) passt besser für den gesamten Datenabzug oder für die tägliche Aktualisierung. SRU und OAI-PMH ermöglichen die Zusammenstellung der Anfragen als Internetadresse (URL), die direkt über den Browser ohne Zusatzsoftware aufrufbar sind.

Die unterschiedlich standardisierten Metadaten aus den Systemen Koha (MARC21-XML), ArchivesSpac (EAD) und DSpace (Dublin Core) können mit dem Tool VuFindHarvest über die OAI-PMH-Schnittstellen “geerntet” werden und in einen einheitlichen Standard (MARC21-XML) übertragen werden. Dafür müssen die die OAI-PMH-Schnittstellen von den installierten Systemen Koha und ArchivesSpace abgerufen werden. Die Daten werden anschliessend mit marcEDit bearbeitet.

Die Konvertierung von Metadatenstandards (beispielsweise Dublin Core zu MARC21) wird mit dem Begriff Crosswalks bezeichnet. Der Crosswalk bedeutet eigentlich die Regeln, wie die Elemente und die Werte aus einem in den anderen Datenformat zugeordnet werden können. Dieser Prozess sollt verlustfrei verlaufen, jedoch ist meistens aufgrund der Unterschiede in der Struktur bei den jeweiligen Metadatenstandards keine 1:1-Zuordnung möglich (Beispiel sind die Titelfelder oder Autorenangaben in DC und im Marc21).

MarcEdit ist eine vom Bibliothekaren Terry Reese entwickelte Software, die kostenlos für die Konvertierung der Daten ins Format MARC21 benutzt werden kann. Sie arbeitet mit der XSLT Transformationssprache. In der Übung konnten wir nach der Installation der MarcEdit Software die XSLT Crosswalks anwenden, um die EAD Daten zu MARC21XML zu transformieren. Diese kann leider nicht direkt gemacht werde, sondern in zwei Schritte: EAD zu MARC, MARC21 zu MARC21XML. Während der Konvertierung ist bei diesem Beispiel zu kleinen Verlusten gekommen.

Was habe ich gelernt habe:

  • Die unterschiedlichen Datenformate (EAD, DublinCore) können ins Format MARC21-XML übertragen werden
  • Für den Austausch von Metadaten gibt es viele Übertragungsprotokolle, wovon die Protokolle Z39.50, SRU und OAI-PMH besonders verbreitet sind
  • OAI-PMH Schnittstelle wird an den lokalen Systemen (Koha, ArchivesSpace) abgerufen
  • Wie die Daten via VuFindHarvest aggregiert werden können
  • Wegen der strukturellen Unterschiede zwischen den Metadatenstandards ist meistens keine verlustfreie Transformation der Daten möglich

Was bleibt mir noch unklar:

  • Wie die Schnittstelle mit der Koha reagiert (wegen eines technischen Problems war bei mir die Installation nicht möglich)