|
Ralf Thomas Göllner
Zum Aufbau einer digitalen Dokumentensammlung
im Ungarischen Institut München
Der Informationsserver "Quellen und Materialien zur Beziehungs-
und Integrationsgeschichte in Ostmittel- und Südosteuropa im 20.
Jahrhundert unter besonderer Berücksichtigung Ungarns, der
Minderheitenfrage und der europäischen Integration"
Erschienen in Ungarn-Jahrbuch 25 (2000/2001),
S. 277-287.
Vor dem Hintergrund der deutschen und internationalen
Bestrebungen zur Digitalisierung von Bibliotheksbeständen wurde mit
Beginn des Jahres 1997 ein von der Deutschen Forschungsgemeinschaft (DFG)
gefördertes Programm ins Leben gerufen. Sein Ziel ist, »die Nutzung der
neuen Kommunikations- und Publikationstechniken zur Verbesserung der
wissenschaftlichen Arbeitsbedingungen beim Zugriff und bei der
Verarbeitung von Literatur sowie von wissenschaftlichen Daten und
Informationen verstärkt zu fördern«. Dadurch soll gewährleistet
werden, daß elektronische Texte direkt am Arbeitsplatz des
Wissenschaftlers zur Verfügung stehen, so daß »in einem Kernbereich der
Förderung wissenschaftliche Forschungsliteratur aus den Beständen von
Bibliotheken digitalisiert und über Kommunikationsnetze zugänglich
gemacht werden«. Mit diesem »Förderungsprogramm ›Retrospektive
Digitalisierung von Bibliotheksbeständen‹ will die Deutsche
Forschungsgemeinschaft (DFG) den Grundstock für eine ›Verteilte
Digitale Forschungsbibliothek‹ legen«.
In der Zwischenzeit wurde eine beträchtliche Zahl von
Projekten in diesem Kontext genehmigt, die insgesamt eine sehr positive
Resonanz, sowohl in der Wissenschaft als auch in den Öffentlichkeit,
gefunden haben. Dies führte 1998 zur Gründung von zwei DFG-geförderten
Service- und Kompetenzzentren für retrospektive Digitalisierung. Das eine
ist an der Niedersächsischen Staats- und Universitätsbibliothek Göttingen
(Göttinger Digitalisierungszentrum, GDZ), das andere an der Bayerischen
Staatsbibliothek (Münchener Digitalisierungszentrum, MDZ) angesiedelt.
Diese Bestrebungen zur elektronischen Erfassung von Altbeständen sind in
internationale Bemühungen zur computergestützten Bereitstellung
bibliothekarischer Bestände eingebunden.
Im Verlauf der Jahre 1999 und 2000 wurden auch an
einigen Münchener Instituten mit ostwissenschaftlichen Bezügen –
darunter auch am Ungarischen Institut München (UIM) – Überlegungen
angestellt, inwieweit eine einheitliche digitale Plattform zur Kunde Ost-
und Südosteuropas aufgebaut und betrieben werden kann. Anfang 2000
kumulierten diese Überlegungen in dem Plan, einen Server für die
Geschichte Ost- und Südosteuropas zu entwickeln und diesen im Internet
der Forschung und Öffentlichkeit zur Verfügung zu stellen. Laut dem
Konzept-Entwurf vom Februar 2000 sollten insbesondere die Bereiche »Fachinformation
und Fachdienste«, »Fachbibliographien« sowie »Erschließung von
Quellen« mit entsprechenden Teilbereichen erarbeitet werden.
In den folgenden Monaten übernahmen das
Osteuropa-Institut München, die Abteilung für Geschichte Ost- und Südosteuropas
der Ludwig-Maximilians-Universität, die Bayerische Staatsbibliothek und
das Herder-Institut in Marburg die Planungen und Beantragung des Servers.
Der „Osteuropaserver: Virtuelle Fachbibliothek zur Geschichte und
Zeitgeschichte Osteuropas" (im folgenden: „Osteuropaserver")
wurde im Juni 2001 bei der DFG von den vier genannten Institutionen
beantragt und um weitere Projekte – so auch um das hier beschriebene –
ergänzt. Das vorliegende Projekt gilt als eigener Antrag und als
gesondertes Digitalisierungsvorhaben entsprechend dem Konzept der »Verteilten
Digitalen Forschungsbibliothek«, besitzt jedoch Schnittstellen und enge
Verbindungen zum Gesamtprojekt des „Osteuropaservers".
Parallel zu diesen Entwicklungen und Vorhaben beschloß
das Bayerische Staatsministerium für Wissenschaft, Forschung und Kunst,
einen geistes- und sozialwissenschaftlichen Forschungsverbund zu gründen.
Dieser Forschungsverbund Osteuropa (ForOst) reiht sich in die bayerische
Forschungslandschaft als einer von zwei geistes- und
sozialwissenschaftlichen Forschungsverbünden ein und soll »neue
Erkenntnisse über Wandel und Kontinuität in den Ländern Ost- und Südosteuropas
[...] und über die Auswirkungen des Umbruchs in den Staaten des
ehemaligen Ostblocks insbesondere auf Bayern [...] liefern«. Sein Ziel
ist, »Grundlagen für konkrete wirtschafts-, sozial- und kulturpolitische
Empfehlungen zu schaffen«. Der für eine zunächst zweijährige Laufzeit
konzipierte Verbund wurde mit 2,6 Millionen DM ausgestattet, umfaßt 18
Teilprojekte und ist in seiner Ausgestaltung bisher einmalig in der
Bundesrepublik Deutschland.
Im Rahmen dieser Bestrebungen – dem Aufbau eines
Osteuropaservers sowie der Gründung von ForOst – wurde am UIM ein
Projekt entwickelt, das sich in beide Aufgabenbereiche nahtlos integriert.
Im folgenden werden dieses als Teilprojekt von ForOst genehmigte und im März
2001 unter Leitung des Verfassers angelaufene Projekt skizziert und der
Stand der Forschungsarbeiten sowie die Perspektiven dargestellt.
Thematische Überlegungen
Parallel zu den bereits erwähnten Überlegungen zum
Aufbau eines fachbezogenen Internetservers begann am UIM die Konzipierung
eines ähnlich gearteten Projekts, das den veränderten Anforderungen an
wissenschaftliches Arbeiten mittels moderner Kommunikationstechnologien
und zum Zweck der beratenden Dienstleistung für Politik, Wirtschaft und
Öffentlichkeit entsprechen soll. Denn der politisch-ökonomische Wandel
in Ostmittel- und Südosteuropa seit Beginn der 1990er Jahre ließ nicht
nur das wissenschaftliche Interesse an diesen europäischen Regionen
wachsen, sondern auch dasjenige der breiten Öffentlichkeit. Die
politisch-gesellschaftlichen Probleme und Konflikte, die sich im Zuge des
Zusammenbruchs des ehemaligen Ostblocks entwickelten, betrafen zu einem
großen Teil auch den Westen Europas und wirken bis in die Gegenwart nach.
Auch die Schwierigkeiten der wirtschaftlichen Transformation sowie die
unsichere zukünftige Entwicklung einerseits, und das gewachsene Interesse
an den betreffenden Regionen andererseits ließen die Zahl der
wissenschaftlichen Publikationen nicht nur in den Ländern Ost- und Südosteuropas,
sondern auch in den westeuropäischen und nordamerikanischen Staaten
drastisch ansteigen. Dies führte zu einer nahezu unüberschaubaren und
kaum recherchierbaren Flut von Veröffentlichungen über Ost- und Südosteuropa,
die zusammen mit den bereits bestehenden Quellen und Materialien einen
bedeutenden Anteil der historischen Forschung ausmachen.
Auch wenn für Politik, Wirtschaft und Öffentlichkeit
vor allem aktuelle Fragestellungen im Vordergrund stehen, spielt die
Geschichtswissenschaft gerade für diese Regionen eine besondere Rolle, da
hier in kaum zu überschätzendem Maße historische Vorgänge
tagespolitische Entscheidungen beeinflussen und bestimmen. Als Beispiel
hierfür kann die serbische Haltung in der Kosovo-Frage angeführt werden,
die mit dem Mythos von der Schlacht auf dem Amselfeld (Kosovo polje)
Tagespolitik betrieb und durch eine »nationale Erinnerungskultur«
ethnische Spannungen hervorrief. Diese Politiker »prägen, polen und
operationalisieren ›Geschichte‹ also in ihrem Sinne«. Geschichte
spielt aber auch in anderen Staaten des ostmittel- und südosteuropäischen
Raumes eine die Aktualpolitik zumindest mitbestimmende Rolle. So wirkt das
Trianon-Trauma nicht nur in Ungarn nach, sondern auch in einigen
Nachbarstaaten, die Ungarn trotz der mehrfachen Anerkennung bestehender
Grenzen durch Budapest mißtrauen und revisionistische Forderungen befürchten.
Aber auch andere historische Ereignisse, die sich in nationalen Mythen
widerspiegeln, sei es in dem Traum von einem Groß-Serbien, Groß-Griechenland,
Groß-Albanien, Groß-Bulgarien oder einem Vereinigten Makedonien finden
sich in heutigen politischen Handlungen oder Plänen wieder. »Mythisches
Denken [...] impliziert immer auch die aktionelle Umsetzung der Mytheme.«
Zwischenstaatliche sowie interethnische Probleme und Konflikte
unterschiedlicher Ausprägung und Intensität – in der Hauptsache
zwischen Staaten, deren Staatsgrenzen sowie ethnischen Trennlinien im 20.
Jahrhundert geändert wurden – beinhalten ein Spannungspotential, das
die gesamteuropäische Stabilität nachteilig beeinflussen kann und eine
weitergehende europäische Integration erschwert, wenn nicht sogar
verhindert.
In der gegenwärtigen Politik der ostmittel- und südosteuropäischen
Staaten spielt also das historische Argument in der Tagespolitik eine viel
größere Rolle als im Westen Europas. Vor diesem Hintergrund kommt der
historischen Ost-, Ostmittel- und Südosteuropaforschung eine große
Bedeutung zu, da sie die entwicklungsgeschichtlichen Grundlagen für
gegenwärtige Fragestellungen liefern und somit zur Lösung aktueller
Probleme einen bedeutenden Anteil beisteuern kann. Darüber hinaus kann
sie das Bewußtsein westeuropäischer Entscheidungsträger aus Politik und
Wirtschaft schärfen und so auf ein besseres Verständnis dieser Einflußfaktoren,
denen ostmittel- und südosteuropäische Politiker in nicht zu unterschätzendem
Maße unterworfen sind, hinwirken.
Doch nicht nur die Differenzen zwischen den Staaten und
Völkern Ost-, Ostmittel- und Südosteuropas stellen ein
Integrationshindernis dar, sondern auch die Kommunikationsprobleme
einerseits zwischen den Politikern und Nationen Westeuropas, andererseits
zwischen ihren Gegenparts in den betreffenden Regionen. Die seit dem
Beginn der Umwälzungen in diesem Raum vergangenen Jahre haben
verdeutlicht, daß die politische Verständigung zwischen west- und
osteuropäischen Entscheidungsträgern hauptsächlich an einem
beiderseitigen Informationsmangel sowie an unterschiedlichen politischen
Kulturen und verschiedenen Auffassungen von der tagespolitischen
Wichtigkeit historischer Gegebenheiten und Rezeptionen scheitert. Vor
diesem Hintergrund kommt der historischen Ost-, Ostmittel- und Südosteuropaforschung
nicht nur eine Informationen bereitstellende Rolle, sondern vor allem eine
herausragende Vermittlerrolle zu. Dies geschah in der Vergangenheit hauptsächlich
durch herkömmliche Publikationen und wissenschaftliche Veranstaltungen.
Jedoch ist die Reichweite und vor allem die schnelle Verfügbarkeit
derartiger Informationsdienstleistungen begrenzt. Ein frei zugängliches,
wissenschaftlich fundiertes und redaktionell geprüftes
Fachinformationssystem, das zudem in die Neuen Medien integriert ist und
diese als Kommunikations- und Informationskanal nutzt, kann einen ergänzenden
und kaum zu überschätzenden Beitrag zu Annäherung und gegenseitigem
Verständnis in Europa liefern.
Eine sehr wichtige und verläßliche Grundlage zur
Analyse und Integration des historischen Elements in einen westlichen
Deutungs- und Erklärungszusammenhang bieten die Quellen und Materialien
zur Beziehungs- und Integrationsgeschichte Ostmittel- und Südosteuropas
im 20. Jahrhundert. Das UIM, dessen allgemeines Schwerpunktthema „Ungarn
in den Beziehungsgeschichten Ost-, Ostmittel- und Südosteuropas"
ist, beschloß angesichts der Möglichkeiten, die beide
Forschungseinrichtungen – DFG und ForOst – boten, ein
Forschungsprojekt aus dem Bereich der Digitalisierung auf den Weg zu
bringen, das auf die Erfassung maßgeblicher Quellen aus diesem Bereich
der neuesten Geschichte ausgerichtet ist. Der daraufhin konzipierte
„Informationsserver ,Quellen und Materialien zur Beziehungs- und
Integrationsgeschichte in Ostmittel- und Südosteuropa im 20.
Jahrhundert’" wurde im April 2000 beim Bayerischen
Staatsministerium für Wissenschaft, Forschung und Kunst eingereicht. Die
im Dezember 2000 tagende Gutachterkommission, die über die Projektanträge
zur Gründung von ForOst zu entscheiden hatte, genehmigte den
Projektantrag und empfahl zur Erhöhung der Synergieeffekte innerhalb von
ForOst eine thematische Fokussierung des Vorhabens auf ein anderes
Teilprojekt im Forschungsverbund. Es sollte eine enge Kooperation mit dem
Vorhaben „Datenbank zur Minderheitenproblematik und zu den ethnischen
Gruppen Südosteuropas (Ethnodoc Südosteuropa)" unter dem
Projektleiter Gerhard Seewann (Südost-Institut München) und eine stärkere
thematische und konzeptionelle Fokussierung hierauf erfolgen. Infolge der
Umsetzung dieser Empfehlung, die Bestandteil der ministeriellen
Bewilligung war, erhielt das UIM-Projekt den Titel „Quellen und
Materialien zur Beziehungs- und Integrationsgeschichte in Ostmittel- und Südosteuropa
im 20. Jahrhundert unter besonderer Berücksichtigung Ungarns, der
Minderheitenfrage und der europäischen Integration" (im folgenden:
„Informationsserver").
Forschungsziele
Ziel des nunmehr thematisch eingegrenzten Projekts ist
die digitale Volltexterfassung und (text-) strukturierte Aufbereitung
von Quellen und Materialien, denen eine zentrale Bedeutung für die
Beziehungs- und Integrationsgeschichte in Ostmittel- und Südosteuropa im
20. Jahrhundert zukommt. Diese sind vor allem Verträge, Abkommen,
diplomatische Schriftstücke, Memoiren, Ansprachen oder Vorträge
politischer Entscheidungsträger, aber auch Statistiken zu Wirtschaft,
Gesellschaft sowie den nationalen Minderheiten. Besonderes Augenmerk wird
auf diejenigen Quellen und Materialen gelegt, die Ungarn unmittelbar oder
mittelbar betreffen, die Frage der europäischen Integration Ostmittel-
und Südosteuropas behandeln und sich mit der Minderheitenproblematik
dieses Raumes befassen. Gleichzeitig sollen Quellen eine besondere
Beachtung finden, die zum Verständnis gegenwärtiger politischer und
sozialer Probleme und Konflikte beitragen und die Wandel und Kontinuität
– in zeitlicher und räumlicher Dimension – besonders deutlich zum
Ausdruck bringen. Aufschlußreiche Quellen in diesem Sinne bilden
beispielsweise die Friedensverträge nach den beiden Weltkriegen,
internationale und bilaterale Minderheitenschutzverträge, innerstaatliche
Minderheitenschutzbestimmungen, Wirtschafts- und Handelsabkommen mit außen-
und/oder minderheitenpolitischen Implikationen, Verträge der Europäischen
Gemeinschaft beziehungsweise Europäischen Union mit den
Transformationsstaaten der untersuchten Region, Protokolle über Grenzveränderungen,
national- oder minderheitenpolitisch aussagekräftige Denkschriften und
Memoiren sowie Bevölkerungs- und Wirtschaftsstatistiken.
Insbesondere im Bereich der Minderheitenthematik
ergeben sich seit Projektbeginn hohe Synergieeffekte durch eine enge
Kooperation mit dem Projekt „Ethnodoc Südosteuropa". Diese
manifestieren sich zum einen in der Vermeidung einer Doppelbearbeitung von
Quellen und Materialen durch eine frühzeitige Absprache und Koordinierung
der Arbeitsschritte. Zum anderen bringt die dauerhaft vernetzte
Vorgehensweise in diesem thematischen Teilbereich eine wechselseitige
Arbeitserleichterung und ermöglicht die Bearbeitung einer weitaus größeren
Zahl von Quellen, als es ohne die enge Kooperation möglich wäre. Durch
einen gegenseitigen Austausch der bearbeiteten Volltextdokumente steht
beiden Projekten die größtmögliche Anzahl von Quellen zur Verfügung.
Die koordinierende Funktion des beantragten „Osteuropaservers" und
der institutionalisierte Datenaustausch innerhalb dieses Gesamtprojekts
legt für den Fall seiner Bewilligung auch die Grundlage für eine
kontinuierliche und längerfristige Kooperation, die den zukünftigen
Anwendernutzen gewährleistet.
Der „Informationsserver" soll im Rahmen des
„Osteuropaservers" die Nachfrage nach aussagekräftigen und für
Forschung und Öffentlichkeit herausragenden Quellen und Materialien
befriedigen. Mit der Volltexterfassung zahlreicher Dokumente soll der
„Informationsserver" als wichtiges Nachschlagemedium für den
vorliegenden Themenbereich etabliert werden und durch ein vielfältiges,
redaktionell geprüftes und beständiges Informationsangebot den
Anforderungen an eine digitale Forschungsbibliothek entsprechen. Die
Hauptunterschiede zu den meisten bestehenden digitalen Quellensammlungen
im Internet bestehen darin, daß hier eine punktuelle Sammlung für eine
bestimmte Forschungsfrage in einem definierten Zeitraum herausgegriffen
wird und so durch eine größere Anzahl von Dokumenten ein umfassenderes
Bild gezeichnet werden kann.
Das digital aufbereitete Informationsangebot geht durch
die Volltexterfassung der Texte und die Volltextrecherche weit über die Möglichkeiten
eines herkömmlichen Bibliothekskatalogs und einer Quellenedition hinaus.
Erstens ist die Erreichbarkeit der Quellen unabhängig von Zeit und Ort
und lediglich durch geringe technische Anforderungen – notwendig sind
nur ein moderner Computer und ein Internetzugang – beschränkt. Zweitens
bietet das angestrebte System die Möglichkeit einer dokumentübergreifenden,
wortbezogenen Volltextrecherche und beschleunigt so die Suche nach
geeigneten Dokumenten. Drittens ermöglicht die wissenschaftliche
Aufbereitung und Strukturierung der Materialien inhaltlich sowie fachlich
spezifizierte Auswahlkriterien. Diese genügen allen
Rechercheanforderungen und sind zugleich offen, so daß mögliche
technische Weiterentwicklungen nachträglich implementiert werden können.
Dies verspricht eine dauerhafte Verfügbarkeit des Dienstes, sofern die
weitere Finanzierung gesichert wird. Neben den unterschiedlichen
Recherche- und Erschließungsmöglichkeiten soll das Projekt auch die
redaktionelle Qualität des „Informationsservers" auf hohem Niveau
etablieren, um dessen Zitierfähigkeit zu gewährleisten. Zudem muß das
System den sprachlichen wie orthographisch-satztechnischen Anforderungen
entsprechen, die sich bei der Erforschung des Zielraumes ergeben. Die Einführung
der korrekten Schreibweisen, die nicht nur bei Quellen und grundlegenden
Materialien aus juristisch relevanten Bereichen eine Rolle spielen darf,
ist ein Novum in der digitalen Volltextwiedergabe quellenartiger
Dokumente.
Methode
Die zu bearbeitenden Quellen liegen in der Regel nur in
gedruckter Form – beispielsweise in Gesetzblättern oder Periodika –
vor, während digitalisierte Dokumente eher die Ausnahme sind. Das
gedruckte Ausgangsmaterial muß zur Weiterverwendung im
„Informationsserver" zuerst digitalisiert werden. Bei dieser
Computererfassung sind prinzipiell zwei Methoden beziehungsweise Stufen möglich,
nämlich die Erfassung eines Dokuments als Bild sowie als Text, wobei
letztere noch weiter unterteilt werden kann. Die erste Stufe der digitalen
Konversion ist die reine Bilderfassung mittels eines Scanners – das
manuelle Abschreiben der Texte kommt in diesem Fall aus zeitlichen,
finanziellen und personellen Gründen nicht in Betracht. In dieser
Bearbeitungsphase wird der gedruckte Text in ein in Pixel (Bildpunkte)
zerlegtes Bild (Image) umgewandelt und stellt Dokumente in graphischer
Form als Bilddatei – dem sogenannten digitalen Master – oder in dem
Austauschformat PDF dar.
In dieser Bearbeitungsstufe können die Texte bereits
der Öffentlichkeit zugänglich gemacht werden, genügend aber nicht den
Ansprüchen eines Informationsservers. Diese Formate können nicht oder
nur unter größten Schwierigkeiten und mit einer hohen Fehlerquote
durchsucht werden, so daß zu ihrer Verwaltung und Strukturierung zusätzlich
eine Datenbank sowie deren redaktionelle und inhaltliche Betreuung
notwendig wäre. Die Alternative einer Linkliste, die auf die
entsprechenden Bilddateien verweist, ist angesichts der Vielzahl von
Dokumenten ebenso umständlich in der Benutzung wie in der
Weiterbearbeitung und Datenpflege. Aus diesen Gründen implementiert das
Forschungsprojekt des UIM auch die zweite Stufe der digitalen Konversion,
nämlich die Volltexterfassung. Da das manuelle Erfassen aus den genannten
Gründen nicht möglich ist, müssen die erfaßten Bilddateien mit einem
Texterkennungsprogramm – einem sogenannten OCR-Programm (Optical
Character Recognition) – weiterbearbeitet werden. Hierbei liest und
analysiert das Programm die vom Scanner gelieferten Bildinformationen und
sucht in ihnen wesentliche Merkmale – das sind Bögen, Kreise, Punkte
– die es den Buchstabenzeichen zuordnen kann. Die im Projekt verwendete
OCR-Software beinhaltet 121 Erkennungssprachen, so daß auch die für die
vorliegende Fragestellung relevanten Dokumente korrekt erfaßt werden können.
Die Erkennungsgenauigkeit der Software liegt bei einer guten Vorlage bei
etwa 98 bis 99 Prozent, was jedoch bei einem Dokument mit 10.000 Zeichen
immer noch eine Fehlerquote von 100 bis 200 Zeichen bedeutet. Bei älteren
und schlechteren Vorlagen liegt die Fehlerquote deutlich höher. Um jedoch
dem Anspruch der Zitierfähigkeit der Dokumente zu genügen, müssen die
eingescannten und mittels OCR erkannten Dokumente mehrfach nachbearbeitet
und mit dem Original abgeglichen werden.
Die derart bearbeiteten Dokumente müssen anschließend
in einem Unicode-Format abgespeichert werden, um die eventuell vorhandenen
diakritischen Zeichen zu erhalten und die Weiterbearbeitung in einem
Textverarbeitungsprogramm zu ermöglichen. Der Text liegt dann zwar in
redaktionell bearbeiteter Form vor, die Suchfunktionen können jedoch noch
nicht in der beabsichtigten Form implementiert werden. Die Erweiterung
dieser Digitalisierungsstufe ist die Strukturbeschreibung, die auf den
Volltext aufsetzt. »Unter Strukturbeschreibung von Dokumenten versteht
man die formatunabhängige Kennzeichnung bzw. Markierung von distinktiven
strukturellen Elementen eines Textes, wie Überschrift, Absatz etc.
Beschrieben wird somit die logische Struktur eines Dokumentes, weniger
sein Layout«. Hierfür werden verschiedene Beschreibungssprachen
eingesetzt, von denen die bekannteste das HTML (Hypertext Markup Language)
ist. Für die hier gestellten Anforderungen ist HTML – das auf SGML
(Standard Generalized Markup Language) aufbaut – jedoch nicht
ausreichend, da es nur bedingt Strukturen wiedergibt, sich nur eingeschränkt
für den Datenaustausch eignet und keinen robusten Link-Mechanismus hat.
Im Unterschied hierzu hat die Metasprache SGML ein wesentlich
differenzierteres Beschreibungsinstrumentarium, eignet sich aber für das
Projekt ebenfalls nicht, da es zu teuer und zu kompliziert für den
Einsatz im World Wide Web ist. So fiel die Wahl auf XML (Extensible Markup
Language), eine Meta-Auszeichnungssprache zur Beschreibung strukturierter
Daten, die auch ein Unterprofil von SGML ist. Ihr Vorteil besteht darin,
daß diese Meta-Sprache auf verschiedenen Betriebssystemplattformen und in
verschiedenen Anwendungen eingesetzt werden kann. »XML beschreibt eine
Klasse von Datenobjekten, genannt XML-Dokumente, und beschreibt teilweise
das Verhalten von Computer-Programmen, die solche Dokumente verarbeiten.
[…] Ein Software-Modul, genannt XML-Prozessor, dient dazu, XML-Dokumente
zu lesen und den Zugriff auf ihren Inhalt und ihre Struktur zu erlauben.«
Mit Hilfe dieses Zugriffs auf die Struktur und den Text der Dokumente
werden die bearbeiteten Quellen des Informationsservers umfassend
recherchierbar und erfüllen die Anforderungen an einen
Informationsserver.
Mit der Strukturierung der Dokumente sind die Arbeiten
im Rahmen des bei ForOst beantragten UIM-Projektes beendet. Zur Veröffentlichung
der aufbereiteten Dokumente sind jedoch noch einige Schritte notwendig,
die mit den bisher bewilligten Projektmitteln nicht vorgenommen werden können.
Diese sind erst nach Bewilligung der Mittel durch die DFG sowohl für
dieses Projekt als auch für das Oberprojekt „Osteuropaserver" möglich.
Die Publizierung der Dokumente ist nämlich abhängig von der
Bereitstellung eines Internetservers beziehungsweise dem benötigten
Speicherplatz auf einem Internetserver, auf dem die Daten abgelegt werden
können. Darüber hinaus ist die Installation eines Suchprogramms sowie
die Programmierung der entsprechenden Suchfunktionen notwendig, die in den
Aufgabenbereich des „Osteuropaservers" fallen. Somit ist die Verfügbarkeit
und Benutzbarkeit des „Informationsservers" von dem Gesamtvorhaben
„Osteuropaserver" abhängig.
Stand der Arbeiten und Ausblick
Mit den über ForOst bewilligten Mitteln konnte eine
– vorläufig auf zwei Jahre befristete – halbe wissenschaftliche
Mitarbeiterstelle am UIM eingerichtet werden. Darüber hinaus stehen –
angesichts der Arbeitsziele – relativ geringe Mittel für
wissenschaftliche Hilfskräfte sowie für technische Ausrüstung und
laufende Sachausgaben zur Verfügung.
Der Projektbearbeiter (Andreas Schmidt-Schweizer) hat
mit Beginn der Bearbeitungszeit im März 2001 eine Vorauswahl der zu
digitalisierenden Quellen getroffen und eine umfangreiche Liste wichtiger
Dokumente erstellt. Seither sind auch zwei wissenschaftliche Hilfskräfte
für die Quellenbeschaffung aufgrund der eben erwähnten Liste sowie die
ersten beiden Stufen der Digitalisierung verantwortlich. Sie scannen die
Vorlagen ein und wandeln das Bild mittels OCR-Software in einen Text um.
Dieser wird von den Hilfskräften anhand des Originals auf Übereinstimmung
verglichen, um die redaktionelle Zuverlässigkeit zu gewährleisten, wobei
insbesondere auf die korrekte Wiedergabe der diakritischen Zeichen
geachtet wird. Der Projektbearbeiter übernimmt den dritten
Korrekturdurchgang ebenfalls anhand der Originalquelle und strukturiert
die Texte für eine spätere Veröffentlichung auf dem
„Osteuropaserver". Unter den gegenwärtigen finanziellen
Bedingungen ist zu erwarten, daß bis zum Projektende (voraussichtlich im
Februar 2003) eine aussagekräftige Auswahl von Dokumenten digitalisiert
werden kann, die jedoch keineswegs einen umfassenden Anspruch erheben
kann. Sollten die beantragten zusätzlichen Mittel durch die DFG genehmigt
werden, kann diese Grundauswahl erheblich erweitert werden, zumal keine
großen zusätzlichen Investitionen notwendig sind und die Einarbeitungs-
und Orientierungsphase weitgehend abgeschlossen ist.
Das am UIM eingespielte Team hat seit Beginn der
Projektlaufzeit zahlreiche Dokumente des 20. Jahrhunderts erfaßt und enge
Verbindungen zu anderen Projekten innerhalb von ForOst geknüpft. Zudem
werden mit anderen Instituten und Bibliotheken Gespräche über weitere
Arten der Kooperation geführt. Denn der „Informationsserver"
versteht sich nicht als isoliertes Vorhaben, sondern ist dankbar für jede
Art der Unterstützung und offen für eine Zusammenarbeit, die der Erfüllung
des Forschungsvorhabens dient. Institutionen oder Personen, denen
digitalisierte oder fotokopierte Quellen vorliegen, werden gebeten, diese
dem Projekt in Kopie zur Verfügung zu stellen, damit sie durch den
„Informationsserver" des UIM bearbeitet, strukturiert und veröffentlicht
werden können. Sein Ziel, eine möglichst umfassende Quellensammlung zur
Beziehungs- und Integrationsgeschichte im 20. Jahrhundert in Ostmittel-
und Südosteuropa zu sein, kann dieser Server um so eher erreichen, je
mehr Fachleute und Interessierte mit ihm kooperieren. Schließlich werden
auch diese Gruppen von einem solchen umfassenden, zuverlässigen und
zitierfähigen Medium profitieren und die Bedeutung der
Geschichtswissenschaft für die Entscheidungsträger in Politik und
Wirtschaft, aber auch für die interessierte Öffentlichkeit nachhaltig
verdeutlichen können.
|