Die Branche am Montag!

Inkjet & Digitaldruck

Höhere Mathematik zur Rettung historischer Bücher

Mittwoch 06. April 2005 - Buchbestände in nahezu allen Bibliotheken verrotten mit hoher Geschwindigkeit. Forscher arbeiten fieberhaft daran, historisch bedeutende Bücher und Druckwerke vor der Zerstörung zu bewahren.

In der Nacht vom 2. auf den 3. September 2004 brach in der Herzogin Anna Amalia Bibliothek in Weimar ein verheerender Großbrand aus. Rund 50.000 historische Bücher und seltene Drucke verbrannten in dieser Nacht und gingen damit der Nachwelt unwiederbringlich verloren. Etwa 66.000 Bände aus den vergangenen 400 Jahren wurden mit teils schweren Brand- und Wasserschäden geborgen. Doch nicht erst seit der Katastrophe von Weimar arbeiten Forscher fieberhaft daran, historisch bedeutende Bücher und Druckwerke vor der Zerstörung zu bewahren. Buchbestände in nahezu allen Bibliotheken verrotten mit hoher Geschwindigkeit. Vor allem die „sauren“ Papiere, die in den vergangenen 100 Jahren in der Buchproduktion verwendet wurden, sind das Sorgenkind der Forscher, da sie in kürzester Zeit buchstäblich zu Staub zerfallen. Neben der Restaurierung angegriffener Originaldokumente zählt die Digitalisierung von Büchern heute als das wichtigste Instrument, um das kulturelle Erbe einer Gesellschaft zu bewahren.
 
Die elektronische Erfassung von Büchern bietet alle Möglichkeiten, um große Buchbestände in relativ kurzer Zeit dauerhaft zu sichern. Zudem benötigen elektronische Archive kaum physischen Platz und gestatten es, historische Dokumente über das Internet einer breiten Öffentlichkeit zur Verfügung zu stellen. Doch gestaltet sich die Digitalisierung alter Folianten alles andere als unproblematisch. Beispielsweise würde kaum jemand auf die Idee kommen, eine Gutenbergbibel auf einen Auflagenscanner zu legen, um den Text einzulesen. Zu diesem Zweck wurden spezielle Aufsichts-Scanner entwickelt, bei denen das aufgeschlagene Buch von oben durch eine spezielle Kamera mit besonderem Licht „abfotografiert“ wird. Ein großes Problem stellt bei allen Scann-Methoden die Breite und Beschaffenheit des Buchrückens dar, genauer gesagt die Krümmung der Buchseiten im aufgeschlagenen Zustand. Alte Folianten und neue Paperbacks haben hier eines gemeinsam: Häufig genug sind die ersten Buchstaben einer Zeile, durch die Bindung bestimmt, nur mit roher Gewalt – also dem weiten Aufbiegen des Buchrückens klar lesbar. Eine Behandlung, die sich bei historischen Büchern schlicht verbietet. Um diese Buchstaben für einen Scanner sicht- und lesbar zu machen, greifen Xerox-Wissenschaftler in die Trickkiste höherer Mathematik. Mit Hilfe eines Algorithmus sind sie in der Lage, die natürliche Krümmung von Buchseiten sowie fehlende Bestandteile von Buchstaben beim Erfassen der Seite auszugleichen. Neben der Schonung der Buchsubstanz lassen sich so kopierte Dokumente deutlich besser zu lesen.
 
Eine Frage der Entfernung
Die Technologie, die am Xerox-Forschungslabor in Webster, im US-Bundesstaat New York entstand, wurde im Rahmen der 5. Internationalen Konferenz für „Imaging Science and Hard Copy“ in Xi’an in China vorgestellt. In der Vergangenheit wurden verschiedene, häufig kostspielige Versuche unternommen, das Problem verzerrter Buchstaben beim Scannen von Büchern mit festem Einband zu umgehen. Bei Aufsichtsscannern beispielsweise messen spezielle Sensoren den Abstand zur Papieroberfläche während der Erfassung. Daneben experimentierte Xerox in der Vergangenheit mit Scannern, deren Scannglas nach oben abgewinkelt war, um die Auflage eines Buchs zu erleichtern. Die jetzt vorgestellte Lösung von Xerox nähert sich der Aufgabe über die Steuersoftware des Scanners. Die Forscher beschäftigten dabei zwei Grundprobleme: Die Helligkeitsverteilung nichtplaner Oberflächen variiert, wobei weiter entfernt liegende Bereiche im Ausdruck als Schatten erscheinen. Zudem werden diese Bereiche unscharf und verzerrt erfasst.
 
Normalerweise erkennen Scanner nur Helligkeitsunterschiede zwischen den einzelnen Pixeln. Die neue Software nutzt diese Unterschiede zugleich auch, um die Entfernung des Dokuments von der Scan-Oberfläche mathematisch zu errechnen. Hellere Bereiche erachtet die Software als näher und dunklere Bereiche als vom Auflagenglas entfernter liegend. Im nächsten Schritt gleicht sie die dunkleren Bereiche in der Nähe der Bindung automatisch dem Helligkeitsdurchschnitt der Seite an. Die Information über die Entfernung der Seite vom Auflagenglas nutzt die Software gleichermaßen, um geometrische Verzerrungen der Buchstaben zu eliminieren. Aus den Entfernungsdaten berechnet die Software den Faktor, um den der einzelne Buchstabe entzerrt werden muss.
 
Die neue Software bietet damit die Möglichkeit, jedes beliebige Dokument über einen handelsüblichen Scanner optimal einzulesen, ohne dass auf die Vorlage ein mechanischer Druck ausgeübt werden muss. Neben der Arbeit mit seltenen Büchern, eröffnet diese patentierte Technologie neue Möglichkeiten im Consumer-Umfeld. So lassen sich mit ihrer Hilfe auch auf einfachen und preisgünstigen Scannern qualitativ hochwertige Scans erzeugen. Die Software selbst wurde so geschrieben, dass sie der Methodik entspricht, die im Consumer-Markt üblich ist. Die Technologie ist in Lizenz erhältlich und könnte in Zukunft auch in Hochgeschwindigkeitsscannern eingesetzt werden, die Xerox herstellt. Xerox sieht seine Investitionen in Forschung und Entwicklung als Basis, das zukünftige technologische Rückgrat des Unternehmens zu festigen und ein kontinuierliches Wachstum des Konzerns sicher zu stellen.

www.xerox.de
Zurück zur Übersicht
Die aktuelle Ausgabe!
Die Branche am Montag!