Melden Sie sich hier an, um auf Kommentare und die Whitepaper-Datenbank zugreifen zu können.

Kein Log-In? Dann jetzt kostenlos registrieren.

Falls Sie Ihr Passwort vergessen haben, können Sie es hier per E-Mail anfordern.

Der Zugang zur Reseller Only!-Community ist registrierten Fachhändlern, Systemhäusern und Dienstleistern vorbehalten.

Registrieren Sie sich hier, um Zugang zu diesem Bereich zu beantragen. Die Freigabe Ihres Zugangs erfolgt nach Prüfung Ihrer Anmeldung durch die Redaktion.

24.08.2001 - 

Aus wertvollen Handschriften werden XML-Dateien

Mittelalter digital - Kodizes im Netz

Die Erzbischöfliche Diözesan- und Dombibliothek (DDB) in Köln ist weltweit die erste Bibliothek, die ihre mittelalterlichen Handschriftenbestände vollständig digitalisieren lässt und über das Internet einer breiten Öffentlichkeit zugänglich macht. Dazu wandelt sie die kostbaren Dokumente in XML-Dateien um. Von Clarissa Cordroch*

Andere Bibliotheken wie die British Library in London (http://minos.bl.uk/index.html) oder die Königliche Bibliothek in Kopenhagen (www.kb.dk/elib/mss) haben auch schon alte Handschriften ins Internet gestellt. Sie beschränken sich aber darauf, wenige ausgewählte Stücke zu zeigen. Die DDB hingegen verfolgt andere Ziele: Ihre virtuelle Handschriftenbibliothek (www.dom-bibliothek-koeln.de) soll Wissenschaftlern ihre Forschungsarbeit erleichtern und interessierten Laien den Zugriff auf die Werke ermöglichen. Wegen der Abnutzungsgefahr waren die mittelalterlichen Handschriftenbestände für Privatleute bislang nicht zugänglich.

Die DDB-Bestände (ein Großteil stammt aus dem frühen Mittelalter) sind sehr kostbar. Der Versicherungswert beträgt mehrere Millionen Mark. Der Marktwert dürfte um ein Vielfaches höher liegen - wenn die Handschriften denn verkäuflich wären. Historiker haben selbstredend Zugang zu den mittelalterlichen Manuskripten. Zur Einsichtnahme müssten sie jedoch möglicherweise lange und teure Reisen auf sich nehmen. Das Internet erspart ihnen diese Kosten und Mühen.

"In Deutschland und Europa gibt es derzeit keine Bibliothek, die sich an ein derartig umfangreiches Projekt herantraut. Aus Angst vor Beschädigung bei den Digitalisierungsarbeiten scheuen die Bibliotheken vor diesem Schritt zurück", sagt Torsten Schaßan, wissenschaftlicher Mitarbeiter des Projekts "Codices Electronici Ecclesiae Coloniensis" (CEEC), was frei übersetzt "die elektronischen Kodizes der Kölner Kirche" bedeutet. Das Vorhaben steht unter der Leitung von Manfred Thaller, Professor am Lehrstuhl für Historisch-kulturwissenschaftliche Informationsverarbeitung an der Universität zu Köln, sowie von Heinz Finger, ebenfalls Professor und Direktor der Diözesan- und Dombibliothek; es wird von der Deutschen Forschungsgemeinschaft (DFG) gefördert.

Bevor Thaller vor rund anderthalb Jahren an den neu geschaffenen Lehrstuhl berufen wurde, hatte er bereits andere Digitalisierungsprojekte durchgezogen. Nun wollte er sein Wissen auf eine Manuskriptbibliothek anwenden. Ein Betätigungsfeld fand er in der DDB. Mit 366 mittelalterlichen Kodizes (so lautet die Bezeichnung für Bücher, die aus zusammengenähten Pergamentlagen bestehen und mit der Hand geschrieben wurden) ist die DDB eine vergleichsweise kleine Bibliothek. Die großen Handschriftenbibliotheken Europas in Rom, Paris oder München besitzen Tausende solcher Bände. Das Besondere an der DDB ist die Tatsache, dass ihr Kernbestand auf das frühe Mittelalter zurückdatierbar ist. Etwa 70 Manuskripte stammen aus der Zeit vor 900, das älteste aus der Zeit zwischen 590 und 604.

Hierarchisch angeordnete IconsDas CEEC-Projekt ist auf vier Jahre angelegt. Um die 130000 beschriebenen Seiten in diesem Zeitraum ins Web zu stellen, muss das Projektteam etwa 17 pro Stunde aufnehmen. Bis jetzt liegen die Kölner gut im Rennen. Seit Projektbeginn im September 2000 bis Anfang Juli 2001 wurden 20500 Seiten übertragen.

Neben der Wiedergabe des realen Kodex in elektronischer Form bringt das Team auch die Katalogisate (Beschreibungen der Handschriften) nach einer definierten Gewichtung ins Netz. Zu jeder Handschrift gibt es zahlreiche wissenschaftliche Abhandlungen, die zu teilweise unterschiedlichen Ergebnissen kommen.

Es gibt drei Möglichkeiten, über Icons auf Kataloginformationen zuzugreifen; sie sind hierarchisch angeordnet. Das erste Icon ist primär für den interessierten Laien gedacht. Es besteht sozusagen in einem Kurzkatalogisat, das die wichtigsten Erkennungsmerkmale einer Handschrift, zum Beispiel Alter und Herkunft sowie einen Grundstock an zugehöriger Literatur, enthält. Hinter dem zweiten Icon verbirgt sich ein erweitertes Katalogisat. Hier bieten sich dem Nutzer eine Fülle an Literatur zu den einzelnen Handschriften und eine Art Inhaltsverzeichnis. Das dritte Icon liefert das vollständige Katalogisat; es ist für den Experten gedacht, der hier sämtliche Beschreibungen findet, die das Projektteam für wichtig erachtet.

Am Master-Standard orientiertDie informationstechnische Basis für dieses Projekt bildet die Software "Kleio", ein Datenbankverwaltungssystem, das auf der Idee von neuronalen Netzen basiert. Das System wurde vor 20 Jahren von Thaller entwickelt. Der Projektverantwortliche, ursprünglich Historiker, heute eher Informatiker, arbeitet seit 30 Jahren an der Schnittstelle zwischen Geschichte und Informatik. Mit Kleio wurden bereits andere Projekte realisiert, darunter die Digitalisierung des Stadtarchivs in Duderstadt und des Archivs für Rechtswissenschaften am Max-Planck-Institut in Frankfurt am Main. Ein Stadtarchiv oder eine rechtswissenschaftliche Bibliothek stellen andere Ansprüche an die Informationsaufnahme als die elektronische Bereitstellung von alten Handschriften. Deshalb waren an Kleio einige Anpassungen vorzunehmen.

Die Handschriften werden in XML-Dateien abgebildet. Sie bestehen aus einem "Head"-Teil (im Wesentlichen den Katalogisaten) und einem "Body"-Part (den eigentlichen Transkriptionen). Hier lehnt sich das Projektteam an den internationalen Standard für Handschriftenbeschreibungen (Master) an.

Kalte, UV-arme Lampen nötigDie Kodizes können nicht über einen Scanner ins Netz eingespeist werden, da sie nicht vollständig geöffnet werden dürfen. Um die Buchrücken und Bindungen nicht zu beschädigen, werden die Bücher maximal um 110 Grad aufgeklappt. Deshalb entschied sich das Kölner Team für die Nutzung einer digitalen Kamera. Sie ist direkt an einen Rechner angeschlossen. Über den Monitor können Bildausschnitt und Schärfe kontrolliert werden. Da die Handschriften äußerst empfindlich auf UV-Licht, Wärme und Luftfeuchtigkeit reagieren, gehorchen auch die verwendeten Lampen besonderen Kriterien: Sie sind extrem kalt, und ihr Licht ist fast frei von UV-Strahlen. Die Kodizes werden mit einer Auflösung von rund 4500 mal 3500 Pixeln digitalisiert. Je nach Größe der jeweiligen Handschrift erreichen die Bilder eine Auflösung von 200 bis 600 dpi.

Bislang müssen die Benutzer der digitalen Handschriftenbibliothek gute Lateinkenntnisse mitbringen, wenn sie die alten Schriften entziffern wollen. Zwar strebt das Projektteam die Einbindung von Transkriptionen oder Übersetzungen an, doch gehört dies nicht zur eigentlichen Projektarbeit; der zusätzliche Arbeitsaufwand wäre zu groß. Deshalb hoffen die Kölner, dass sich einzelne Wissenschaftler finden, die ihnen bereits erarbeitete Übersetzungen überlassen, die dann "nur" noch ins Netz gestellt werden müssen.

*Clarissa Cordroch ist freie Journalistin in Köln.