Bemerkungen

Link zum Skript

Open Refine

Open Refine ist ein Tool zur Transformation von Metdaten und wird zur Analyse, Bereinigung, Konvertierung und Anreicherung von Daten eingesetzt. Die Installationsdateien finden sich auf GitHub.Besonders interessant ist auch die Möglichkeit Normdaten von Wikidata, GND und VIAF zum Abgleich zu verwenden und im gleichen Atemzug eine Verlinkung auf die Normdatensätze mittels in die Tabellendaten zu integrieren. Ist ein Geburts- oder Sterbejahr in den Tabellendaten vorhanden, kann automatisch das fehlende Jahr oder die Geburts- und Sterbeorte ergänzt werden. Strukturierte Metadaten wie EAD können mit Open Refine nur bedingt verarbeitet werden, da Open Refine für unstrukturierte Tabellendaten wie MARC gedacht ist. Lehrmaterial zu Open Refine enthält die Library Carpentry. MIt Open Refine können beispielsweise auch CSV-Dateien in MARC umgewandelt werden. Im Unterschied zu MarcEdit muss das Mapping hier direkt bearbeitet werden. Für unsere Zwecke können wir die exportierten Metdaten aus DSpace damit bearbeiten und in ein taugliches MARC-Format umwandeln. Dazu kann mithilfe von Skripten in Open Refine Tabellendaten, das heisst die einzelnen Spalten, MARC Feldern zugeordnet werden.

#Schlussbemerkung Ich wünschte ich hätte Open Refine schon vor einigen Jahren kennen gelernt. Es hätte mir eine ungeheure Menge an Arbeit und Frustration erspart, lange und fehlerbehaftete Tabellendateien zu Analysieren und zu Bearbeiten. Das Tool hat mich mit seinen Funktionalitäten sehr beeindruckt und ich werde es bestimmt in meinem weiteren Berufsleben immer wieder anwenden können, da sich in der freien Wildbahn immer noch eine grosse Zahl Tabellendateien finden, die es zu Bereinigen gilt.