Commit aab60aec authored by Ronny Gey's avatar Ronny Gey 👾
Browse files

ManuMedImporter finalisiert

parent 2bca7384
# ManuMedImporter
Das Open-Source-Werkzeug ManuMedImporter wird auf der Kommandozeile ausgeführt und überführt die Daten aus dem [HIDA](https://www.startext.de/produkte/hida)-Format in das interne [Kitodo](https://www.kitodo.org/)-Format. Es findet seine Anwendung im Digitalisierungsworkflow der UB Leipzig und wurde in Java implementiert. [Felix Kreißig](https://github.com/fe-kre), der Hauptentwickler von ManuMedInporter,
Das Open-Source-Werkzeug ManuMedImporter überführt Daten aus dem [HIDA](https://www.startext.de/produkte/hida)-Format in das interne [Kitodo](https://www.kitodo.org/)-Format. Die Metadaten im HIDA-Format stammen aus dem Katalog der [Manuscripta Mediaevalia](http://www.manuscripta-mediaevalia.de/). ManuMedImporter wird auf der Kommandozeile ausgeführt, findet seine Anwendung im Digitalisierungsworkflow der UB Leipzig und wurde in Java implementiert. [Felix Kreißig](https://github.com/fe-kre), der Hauptentwickler von ManuMedInporter, hat uns etwas zur Software und zum Anwendungsgebiet erzählt.
## Grundproblem
## Das Grundproblem
Buch-Handschriften sollen digitalisiert werden. Dazu wurde der Entschluss gefasst, auf das Digitalisierungsworkflow-Tool Kitodo zurück zu greifen. Folgende Probleme wurden dabei identifiziert. Zum einen bietet die Kitodo-Eingabemaske für Metadaten nicht die entsprechend benötigten Felder.
Zum anderen wurden die umfangreichen Metadaten bereits im Katalog der Manuscripta Mediaevalia (http://www.manuscripta-mediaevalia.de/) erfasst. Das dahinter liegende Format nennt sich HiDA (https://www.startext.de/produkte/hida). Die Übereinstimmung zwischen Ausgangs- und Zielformat liegt
in einer XML (Extensible Markup Language) Datei. Die jeweils verwendeten Felder sind jedoch vollkommen verschieden voneinader verschieden.
An der UB Leipzig befindet sich [eines](https://www.ub.uni-leipzig.de/forschungsbibliothek/handschriftenzentrum/) der sechs deutschen Handschriftenzentren, weswegen bei uns im Haus häufig Buchhandschriften digitalisiert werden. Für diesen Vorgang verwenden wir [Kitodo](https://www.kitodo.org/), ein Werkzeug für den Digitalisierungsworkflow. Bei der Benutzung von Kitodo gab es jedoch einige Hürden zu überwinden. Zum einen bietet die Kitodo-Eingabemaske nicht die benötigten Felder für Metadaten. Zum anderen wurden die umfangreichen Metadaten bereits im Katalog der Manuscripta Mediaevalia (http://www.manuscripta-mediaevalia.de/) erfasst. Das dahinter liegende Format nennt sich HiDA (https://www.startext.de/produkte/hida). Für die Verwendung mit Kitodo müssten die HIDA-Daten nun in das Kitodo-interne Format umgewandelt werden. Die Übereinstimmung zwischen Ausgangsformat (HIDA) und Zielformat (Kitodo-intern) liegt in einer XML (Extensible Markup Language) Datei. Die jeweils verwendeten Felder sind jedoch vollkommen verschieden voneinander und waren damit nicht ohne weiteres nutzbar für uns.
## Realisierung
## Die Umsetzung
In einer Kooperation zwischen Annika Schroer, welche sich um das Mapping kümmerte, Stefan Freitag, der den Mets-Part implementierte und mir entstand eine erste Version, welche erfolgreich Metadaten überführt und eine weitere Verarbeitung in Kitodo ermöglicht. Aufgrund einer Außer-Haus-Anfrage habe ich eine zweite Version entwickelt, welche nun öffentlich über den UB-Github-Account bezogen werden kann.
In Zusammenarbeit mit zwei Kolleg*innen ([Annika Schroer](https://github.com/a-nnika) kümmerte sich um das Mapping, [Stefan Freitag](https://github.com/sfreitag) implementierte den [METS](http://www.loc.gov/standards/mets/)-Part) entstand eine erste Version, welche erfolgreich Metadaten überführt und eine Weiterverarbeitung in Kitodo ermöglicht. Als dann irgendwann eine Anfrage zur Benutzung des Werkzeugs von außerhalb der UB Leipzig kam, habe ich eine zweite Version entwickelt und [diese](https://github.com/ubleipzig/ManuMedImporter) auf den [Github-Account der UB Leipzig](https://github.com/ubleipzig/) hochgeladen und zur freien Nutzung verfügbar gemacht.
## Ausblick
## Wie geht's weiter?
Aufgrund der aktuellen Entwicklung eines gemeinsamen Handschriftenprotals, an dem unter anderem die UB Leipzig selbst mitwirkt, könnte das Programm entweder überflüssig werden oder an die neuen Gegebenheiten angepasst werden.
Github-Link
Momentan wird an der UB Leipzig in Kooperation mit weiteren Einrichtungen ([Staatsbibliothek zu Berlin (SBB-PK)](https://staatsbibliothek-berlin.de/), [Bayerische Staatsbibliothek München (BSB)](https://www.bsb-muenchen.de/), [Herzog August Bibliothek Wolfenbüttel (HAB)](http://www.hab.de/)) ein [Handschriftenportal für Deutschland](handschriftenportal.de/) entwickelt. Damit ergibt sich natürlich ein potentielles Anwendungsgebiet für die Nachnutzung und Weiterentwicklung von ManuMedImporter. Aber das steht alles noch in den Sternen.
**Github-Link**
https://github.com/ubleipzig/ManuMedImporter
......@@ -36,7 +36,6 @@
- Backlog erstellen:
- Blogbeitrag 'UB Lab' für den UB Blog (in Bearbeitung: [UB Lab - Software für die Wissenschaft](UBLab_Blogbeitrag.md))
- Blogbeitrag 'Mit Open-Source-Software durch die Krise': https://pad.gwdg.de/Hcv_CbNaTO6sIClXqRHpkA#
- Felix: Kitodo-Beitrag; Ronny => Finalisieren
- Martin: Siskin
- Stefan Dombek: Blogbeitrag SRU/Z39.50
- Schnittstellendokumentation
......@@ -47,6 +46,7 @@
## Done
- Backlog erstellen:
- Ronny: [Was ist Forschungssoftware](was-ist-forschungssoftware.md)
- Felix/Ronny: [ManuMedImporter](ManuMedImporter.md)
- Online:
- Martin: [Metha](http://lab.ub.uni-leipzig.de/metha/)
- Stefan/Ronny: IIIF-Producer: https://lab.ub.uni-leipzig.de/iiif-producer/
......
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment