Bemerkungen/Nachträge

image Gemäss der Übersichtsdarstellung der Arbeiten in diesem Modul sollen nun, nachdem wir in den drei Systemen Koha, ArchivesSpace und DSpace Beispieldaten erzeugt haben diese mithilfe von VuFindHarvest extrahiert und in das Format MARC21-XML vereinheitlicht werden.

Persistent Identifier

Eine zentrale Registrierungsagentur in diesem Fall DOI, übernimmt die Verwaltung aller Identifier. Der Identifier leitet den Nutzer auf eine von der anmeldenden Institution spezifierten Seite weiter, auf der das digitale Objekt abgelegt ist. Für die Verfügbarkeit der Webseite ist der Anmelder verantwortlich. Er kann Änderungen bei der Registierungsagentur anmelden.

Austauschprotokolle für Metadaten

Link zum SKript

Z39.50/SRU

Z39.50 ist ein altes Protokoll, von der Library of Congress entwickelt. Es setzt Spezialsoftware voraus, um eingesehen werden zu können. Das neuere Protokoll SRU (Search/Retrieve via URL) ergänzt den alten Standard. Die Syntax bleibt die gleiche. Beide eignen sich besonders für Live-Abfragen oder gezeilte Abrufe. SRU wird in vielen Metakatalogen die mit ‘federated search’ arbeiten verwendet. Beispiele sind der Karlsruher Virtueller Katalog oder Archives Online verwendet. Die Nachteile sind, dass die Abfrage je nach Geschwindigkeit der teilnehmenden Kataloge langsam ist, und dass nur sehr eingeschränkt Filtermöglichkeiten für die Resultate möglich sind.

OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting)

Findet Anwendung, wenn gesamte Katalogdaten regelmässig abgerufen werden sollen. Auch für OAI-PMH wird keine spezielle Software benötigt. Anfragen werden als URL zusammengestellt und können direkt im Browser betrachtet werden. Beispiel [swisscollections](

OAI-PMH mit VuFindHarvest

Koha hat eine abrufbare OAI-PMH Schnittstelle im Format marcxml. Unter ‘Sets’ können die verfübaren Katalogdaten angezeigt werden. In unserem Fall zwei Bücher, die ich vorgängig katalogisiert habe. Die Schnittstelle für ArchivesSpace findet sich unter Port 8082. Im Unterschied zu Koha ist sie nicht grafisch aufbereitet sondern zeigt das rohe XML an. Die Installationsdatein von VuFindHarvest find sich auf github.

Nach der Installation von VufindHarvest (siehe Skript) kann mit dem untenstehenden Kommandozeilenbefehl über die Schnittstelle die Daten abgerufen werden. Die Fett markierten Elemente müssen je nach Programm, Format und Zielordner angepasst werden.

Koha: php bin/harvest_oai.php –url=http://bibliothek.meine-schule.org/cgi-bin/koha/oai.pl –metadataPrefix=xml koha_vuharvest

ArchivesSpace: php bin/harvest_oai.php –url=http://localhost:8082 –metadataPrefix=oai_dc archivesspace_vuharvest

In grossem Umfang wird OAI-Harvesting von BASE betrieben, die Daten von über 9000 Institutionen vereint.

XSLT Crosswalk mit MarcEdit

Crosswalk (auch Mapping) meint die Konvertierung in andere Metadatenstandards. Das Mapping beinhaltet Regeln welche Datenelemente des einen Formats Elementen des anderen Formats entsprechen. Eine verlustfreie 1:1 Zuordnung ist meist nicht möglich. Mit marcEdit können Daten in verschiedenen Austauschformat (EAD, MarcXML) in ein einheitliches Datenformat überführt werden. Die nötigen Anpassungen der Felddaten (Bsp. Titel/Untertitel) wird mit der Skriptsprache XSLT (Einführung erreicht. Mit MarcEdit kann diese Umwandlung vollzogen werden. Im Programm sind eine ganze Reihe von Crosswalks hinterlegt. Um jedoch ein lesbares MARC21XML aus einem EAD zu erhalten muss ein Zwischenschritt über MARC21 gemacht werden. Bei der Durchführung der Konversion trat beim Dublincore-Format aus DSpace ein Fehler auf, der die Konversion verunmöglichte.