Ungarisches Institut München / Müncheni Magyar Intézet

 

 

Erschienen in: Ungarn-Jahrbuch 27 (2004), S. 483-492.

(Zitierfähige PDF-Version)

Der Informationsserver des Ungarischen Instituts München geht online

 

»Nur ein gelehrtes Publicum, das von seinem Anfange an bis zu uns ununterbrochen fortgedauert hat, kann die alte Geschichte beglaubigen. Über dasselbe hinaus ist alles terra incognita; und die Geschichte der Völker, die außer demselben lebten, kann nur von der Zeit angefangen werden, da sie darin eintraten. Dies geschah mit dem jüdischen Volk zur Zeit der Ptolemäer durch die griechische Bibelübersetzung, ohne welche man ihren isolierten Nachrichten wenig Glauben beimessen würde. Von da (wenn dieser Anfang vorerst gehörig ausgemittelt worden) kann man aufwärts ihren Erzählungen nachgehen. Und so mit allen übrigen Völkern. Das erste Blatt im Thukydides (sagt Hume) ist der einzige Anfang aller wahren Geschichte.«1

 

In diesen Worten Immanuel Kants spiegelt sich eines der Hauptthemen der Wissenschaften wider, wenn auch in moderneren Ausprägungen. Das »erste Blatt im Thukydides« als Sinnbild für das gedruckte und gesammelte Denken und Wissen der Menschheit wird in den Wissenschaften, Bibliotheken, Museen und Archiven aufbewahrt beziehungsweise gepflegt. Diese Aufbewahrung ist eine vornehme und wichtige Aufgabe, denn sie umfaßt nicht nur das materielle Rückgrat der Vergangenheit, also die Quellen und Dokumente als zeitgenössische oder zeitnahe Zeugen oder auch Urheber von Entwicklungen und Ereignissen. Sondern sie umfaßt auch das Material, das dieses hohe Gut vermittelt, also die Arbeiten des gelehrten Publikums, die dieses Wissen über die Geschichte nicht nur an Zeitgenossen, sondern auch an die Nachwelt vermitteln. Beides, sowohl die Sammlung des zeitgenössischen Primärmaterials als auch des zeitunabhängigen Sekundärmaterials, erfolgte bereits früh in originärer und einzigartiger schriftlicher Form. In größerer Menge reproduzierbar wurde Schrift, als die Erfindung des Papiers gelang. Während der römische Kaiser Marc Aurel seine philosophischen Gedanken auf Papyrusrollen festhielt und für die Vervielfältigung auf Schreiber angewiesen war, schnitt man in China seit dem Jahr 175 n. Chr. die Hauptwerke der klassischen chinesischen Literatur in Steinplatten, von denen Tausende Kopien in Form von Abklatschen hergestellt wurden. Jedoch erst Gutenbergs Erfindung ebnete den Weg zum schnellen und kostengünstigen Druckvorgang. Sie sorgte damit für die Verbreitung des Wissens und aus dem ersten Blatt im Thukydides wurde das Buch, das dafür sorgte, daß die terra incognita allmählich immer kleiner, die Bibliotheken und Archive jedoch immer größer und nicht nur für Außenstehende zunehmend unüberschaubarer und komplizierter wurden.

Vor etwa 20 Jahren begann sich mit der massentauglichen digitalen Informationstechnologie ein Medium zu entwickeln, das nicht nur eine ähnliche Wissensvervielfachung und Wissensverbreitung mit sich brachte wie Gutenbergs Druckerpresse, sondern sich auch als prädestiniert erwies, die Unüberschaubarkeit von Sammlungen und Wissen auch für Laien zu entwirren. Mit Internet, Datenbanken, Informationsdiensten und ähnlichen Angeboten stehen heute Hilfsmittel der Kommunikation, Recherche und Verwaltung zur Verfügung, die alles bisher Gekannte zumindest in puncto Geschwindigkeit, Verfügbarkeit und Ortsunabhängigkeit in den Schatten stellen. Entstanden ist die neue Industrie der Wissens- und Informationsgesellschaft des 21. Jahrhunderts, in dessen Gefolge kommerzielle Anbieter wie Google, Yahoo und andere Informationsvermittlung anbieten, aber nicht als Bewahrer auftreten – das ist auch nicht ihr Ziel. Dies ist nach wie vor die prominente Aufgabe von Wissenschaft, Bibliothek, Archiv oder Museum, womit aber auch die Wissensvermittlung, sozusagen die Beglaubigung unauflösbar verbunden ist. Diese Vermittlung kann sich nicht dem Stand der Technik und Entwicklung verweigern, sonst droht der Informationsgesellschaft eine Wikipediaisierung und Vergoogelung mit großer Breite, aber geringer Tiefe und wissenschaftlicher Zuverlässigkeit. Ohne diesen unter bestimmten Gesichtspunkten brauchbaren Angeboten einen Nutzwert absprechen zu wollen, sind sie kein adäquater Ersatz für eine wissenschaftliche Aufarbeitung und Vermittlung und können keinesfalls Geschichte sowie Geschichtsprozesse im Sinne Kants beglaubigen. Hier müssen moderne wissenschaftliche Dienste und Angebote ansetzen, deren Basis fachliche Maßstäbe und Fachwissen sind, sich aber zeitgemäßer Mittel und Methoden bedienen, um die Informationen und vor allem die Kenntnisse zu verbreiten.

Vor diesem Hintergrund wurde 1997 von der Deutschen Forschungsgemeinschaft (DFG) ein Programm zur Digitalisierung von Bibliotheksbeständen ins Leben gerufen. Sein Ziel ist, »die Nutzung der neuen Kommunikations- und Publikationstechniken zur Verbesserung der wissenschaftlichen Arbeitsbedingungen beim Zugriff und bei der Verarbeitung von Literatur sowie von wissenschaftlichen Daten und Informationen verstärkt zu fördern«.2 Dadurch sollte die Bereitstellung elektronischer Texte direkt am Arbeitsplatz des Wissenschaftlers gewährleistet und wissenschaftliche Forschungsliteratur digitalisiert und über Kommunikationsnetze zugänglich gemacht werden. Mit diesem »Förderprogramm ›Retrospektive Digitalisierung von Bibliotheksbeständen‹ will« die DFG »den Grundstock für eine ›Verteilte Digitale Forschungsbibliothek‹ legen«.3

In etwa zur gleichen Zeit begann am Ungarischen Institut München (UIM) unter der Leitung des Verfassers die Konzipierung eines methodisch ähnlich gearteten Projekts, das den veränderten Anforderungen an wissenschaftliches Arbeiten mittels moderner Kommunikationstechnologien und zum Zweck der beratenden Dienstleistung für Politik, Wirtschaft und Öffentlichkeit entsprechen sollte. Da der politisch-ökonomische Wandel in Ostmittel- und Südosteuropa seit Beginn der 1990er Jahre nicht nur das wissenschaftliche Interesse an diesen europäischen Regionen wachsen ließ, sondern auch das der breiten Öffentlichkeit, besteht ein erheblicher Informationsbedarf. Auch wenn für Politik, Wirtschaft und Öffentlichkeit vor allem aktuelle Fragestellungen im Vordergrund stehen, spielt die Geschichtswissenschaft gerade für diese Regionen eine besondere Rolle, da sie die entwicklungsgeschichtlichen Grundlagen für gegenwärtige Fragestellungen liefern kann. Damit trägt sie zur Lösung aktueller Probleme einen bedeutenden Anteil bei. Darüber hinaus kann sie das Bewußtsein westeuropäischer Entscheidungsträger aus Politik und Wirtschaft schärfen und so auf ein besseres Verständnis jener Einflußfaktoren hinwirken, denen ostmittel- und südosteuropäische Politiker in nicht zu unterschätzendem Maße unterworfen sind. Dabei kommt der Geschichtswissenschaft nicht nur eine Informationen bereitstellende Rolle, sondern vor allem eine herausragende Vermittlerfunktion zu. Dies geschah in der Vergangenheit hauptsächlich durch herkömmliche Publikationen und wissenschaftliche Veranstaltungen, deren Reichweite und schnelle Verfügbarkeit begrenzt sind. Notwendig wurde daher ein frei zugängliches, wissenschaftlich fundiertes und redaktionell geprüftes Fachinformationssystem, das in die Neuen Medien integriert ist und diese als Kommunikations- und Informationskanal nutzt. Eine Geschichtswissenschaft, die sich dieser Methoden und Mittel bedient, liefert einen kaum zu überschätzenden Beitrag zum gegenseitigen Verständnis und Informationsaustausch in Europa.

Eine wichtige und verläßliche Grundlage zur Analyse des historischen Elements bieten die Quellen und Materialien zur Beziehungs- und Integrationsgeschichte Ostmittel- und Südosteuropas im 20. Jahrhundert. Das UIM, dessen allgemeines Schwerpunktthema „Ungarn in den Beziehungsgeschichten Ost-, Ostmittel- und Südosteuropas" ist, konzipierte angesichts dieser neuen Anforderungen und Möglichkeiten ein Forschungsprojekt aus dem Bereich der Digitalisierung im Kontext eines Schwerpunktthemas. Mit der Gründung des bayerischen Forschungsverbundes forost4 im Jahr 2000 ergab sich ein wissenschaftlicher und finanzieller Rahmen, der die Umsetzung des Forschungsvorhabens unter dem Titel „Informationsserver ,Quellen und Materialien zur Beziehungs- und Integrationsgeschichte in Ostmittel- und Südosteuropa im 20. Jahrhundert’" ermöglichte. Das Projekt wurde dann im April 2000 beim Bayerischen Staatsministerium für Wissenschaft, Forschung und Kunst zur Förderung eingereicht und im Dezember 2000 durch die Gutachterkommission genehmigt. Bewilligt wurde zunächst eine auf zwei Jahre befristete halbe wissenschaftliche Mitarbeiterstelle am UIM sowie vergleichsweise geringe Mittel für wissenschaftliche Hilfskräfte, technische Ausrüstung und laufende Sachausgaben. Zudem wurde eine enge Kooperation mit dem Vorhaben „Ethnodoc – Datenbank zur Minderheitenforschung" unter dem Projektleiter Gerhard Seewann vom Münchener Südost-Institut und eine stärkere thematische und konzeptionelle Fokussierung empfohlen. Die Umsetzung dieser Empfehlung, die Bestandteil der ministeriellen Bewilligung war, erbrachte den sperrigen Titel „Quellen und Materialien zur Beziehungs- und Integrationsgeschichte in Ostmittel- und Südosteuropa im 20. Jahrhundert unter besonderer Berücksichtigung Ungarns, der Minderheitenfrage und der europäischen Integration".5

Ziel des nunmehr thematisch eingegrenzten Projekts war die digitale Volltexterfassung und strukturierte Aufbereitung von Quellen und Materialien zur Beziehungs- und Integrationsgeschichte. Diese sind vor allem Verträge, Abkommen, diplomatische Schriftstücke, Memoranden, Ansprachen oder Vorträge politischer Entscheidungsträger, aber auch Statistiken zu Wirtschaft, Gesellschaft sowie dem Schwerpunkt der nationalen Minderheiten. Besonderes Augenmerk wurde natürlich auf jene Quellen und Materialen gelegt, die Ungarn unmittelbar oder mittelbar betreffen, die Frage der europäischen Integration Ostmittel- und Südosteuropas behandeln oder sich mit der Minderheitenproblematik dieses Raumes befassen. Gleichzeitig fanden Quellen Beachtung, die zum Verständnis gegenwärtiger politischer und sozialer Probleme und Konflikte beitragen und die Wandel und Kontinuität – in zeitlicher und räumlicher Dimension – besonders deutlich zum Ausdruck bringen. Im Mittelpunkt standen somit fachliche Fragestellungen und Aufgaben, die durch moderne Methoden der Sammlung, Verwaltung und Präsentation ergänzt werden sollten. Eine historisch valide und zugleich technisch adäquate Aufbereitung beziehungsgeschichtlich relevanter Fakten beantworteten die manchmal gestellte Frage nach dem cui bono: Jedem, der sich mit Geschichte und soziopolitischer Gegenwart des ostmittel- und südosteuropäischen Raumes wissenschaftlich oder publizistisch oder vielleicht auch nur interessengeleitet beschäftigt. Diese allgemeine Feststellung trifft zwar auch auf alles Gedruckte zu, beachtet jedoch nicht den Aspekt der Präsentation und Bereitstellung – und gerade diese Aspekte lagen den methodischen Überlegungen des Projekts zugrunde. Ein digital aufbereitetes Informationsangebot geht durch die Volltexterfassung der Dokumente und die Recherchefähigkeit weit über die Möglichkeiten eines herkömmlichen Bibliothekskatalogs und einer Quellenedition hinaus und bietet mehrere Vorteile: Erstens ist die Erreichbarkeit der Quellen unabhängig von Zeit und Ort und lediglich durch geringe technische Anforderungen eingeschränkt. Notwendig sind nur ein moderner Computer mit einem Internetzugang. Dadurch wird ein Hemmnis, Quellen zu benutzen, beseitigt, da sie schnell und unkompliziert zur Verfügung stehen. Zweitens bietet das System mehrfache Recherchemöglichkeiten, die auch Laien einen raschen Einstieg in die Materie ermöglichen. Drittens bietet die wissenschaftliche Aufbereitung und Strukturierung der Materialien inhaltlich sowie fachlich spezifizierte Auswahlkriterien. Dies wiederum erleichtert den Zugang zu einem neuen Thema. Viertens genügen die im Rahmen des Projekts implementierbaren Möglichkeiten allen Rechercheanforderungen und sind zugleich offen, so daß technische Weiterentwicklungen nachträglich eingearbeitet werden können.

Ausgehend von diesen Überlegungen begann im März 2001 die Forschungsarbeit mit dem Projektbearbeiter Andreas Schmidt-Schweizer und den wissenschaftlichen Hilfskräften Angelika Kiss und Hans Hedrich. Die wissenschaftlichen Kriterien der Quellenauswahl standen zunächst im Vordergrund der Überlegungen. Die thematische Eingrenzung durch die selbstgestellte Aufgabe erforderte eine weitergehende Strukturierung des umfangreichen Quellenmaterials, um von Anfang an eine angemessene Sammlungslogik zu etablieren. Zunächst traf der Bearbeiter in Absprache mit dem Projektleiter eine Vorauswahl der zu digitalisierenden Quellen und erstellte eine umfangreiche Liste wichtiger Dokumente. Im Fokus standen die Verträge nach den beiden Weltkriegen, Dokumente zur Minderheitenfrage, Materialien zu europäischen Integrationen – wie RGW, Warschauer Pakt, NATO oder Europäische Union. Von diesen thematischen Grundanforderungen ausgehend wurden aber auch verwandte Themen beachtet, so daß sich eine relativ homogene und dennoch breit gestreute Quellenstruktur ergab. Diese Vorgehensweise bei der Sammlungstätigkeit behielt stets die spätere wissenschaftliche Strukturierung im Auge und folgte strengen fachlichen Kriterien. Um Doppelbearbeitungen zu vermeiden, alle nachfolgenden Arbeitsschritte dokumentieren zu können und zugleich eine technische Basis für die Veröffentlichung im Internet zu haben, wurde jede Quelle in einer hausinternen Datenbank erfaßt.

Anhand der Quellenliste und der Datenbankeinträge beschafften die wissenschaftlichen Hilfskräfte die Materialien als Fotokopie, die nach Abschluß der Arbeiten im Archiv des UIM eingelagert wurden. Soweit möglich, wurde auf amtliche Publikationen zurückgegriffen, um die Authentizität der Quelle zu gewährleisten.6 Gekürzte Dokumente aus Quelleneditionen wurden nicht verwendet, um von Anbeginn einen vollständigen Informationsserver aufzubauen. Für gegenwartskundliche Fragestellungen – wie zum Beispiel der EU-Integration7 oder der Osterweiterung der NATO8 – wurde in Einzelfällen auch auf elektronisch bereitgestelltes Material zurückgegriffen, wenn es urheberrechtlich möglich war. Der oberste Grundsatz bei dieser Quellenauswahl war die Zuverlässigkeit der Einrichtung, die die Dokumente bereitstellte. Nach eingehender Prüfung der im Internet verfügbaren Angebote wurde die Auswahl auf valide Quellen, wie jene internationaler Organisationen und amtlicher Seiten beschränkt.

In einem nächsten Arbeitsschritt wurde das fotokopierte Material mit einem Scanner9 erfaßt und zunächst als Bild10 abgespeichert, so daß es für eventuelle spätere Bearbeitungsschritte oder Aufgaben zur Verfügung steht. Anschließend wurde das als Bild vorliegende Dokument mit einer Texterkennungssoftware11 in einen Text umgewandelt, der mit einer Textverarbeitungssoftware weiterbearbeitet werden konnte. Dieser wurde anschließend von den Hilfskräften anhand des Originals doppelt auf Übereinstimmung verglichen, um die redaktionelle Zuverlässigkeit zu gewährleisten. Vor dem Hintergrund der angestrebten Zitierfähigkeit des Informationsservers ist die Korrektheit des bereitgestellten Materials eine unabdingbare Voraussetzung. Dies betrifft insbesondere auch die richtige Wiedergabe der diakritischen Zeichen. Als problematisch erwiesen sich aber auch deutsche Quellen mit einem Erscheinungsjahr bis 1942, da diese oftmals in Frakturschrift gedruckt wurden. Diese Vorlagen konnte keine verfügbare OCR-Software erkennen, so daß zahlreiche Dokumente manuell abgeschrieben werden mußten. Diese Beschränkung verlangsamte zwar den Arbeitsfortschritt erheblich, war aber aufgrund der wichtigen Quellen unerläßlich. Der Projektbearbeiter übernahm schließlich den dritten und letzten Korrekturdurchgang, wiederum anhand der Originalvorlage, strukturierte die Texte für eine spätere Veröffentlichung entsprechend einer vorab erstellen Formatvorlage und speicherte sie als RTF-Text.12 Dieses Format stellt eine plattform- und softwareübergreifende Weiterverarbeitung des Materials sicher und bietet die Unabhängigkeit von einer Softwarelösung. In einem letzten Schritt wurden die Dokumente zusätzlich in das PDF-Format13 umgewandelt, um eine Bereitstellung im Internet zu ermöglichen. Dieses Format ist nicht nur für die Langzeitarchivierung geeignet, sondern gewährleistet auch die plattformübergreifende Lesbarkeit ohne Formatierungsverluste.

Alle genannten Arbeitsschritte wurden in der hausinternen Datenbank verzeichnet, so daß zu jedem Zeitpunkt der Bearbeitungsstand der Dokumente nachvollzogen werden konnte. Diese abgestufte Arbeitsweise mit mehreren Prüfinstanzen etablierte ein hohes Kontrollniveau und ein Qualitätsmanagement, das angesichts der großen Dokumentenzahl sowie der verschiedenen koordinationsbedürftigen Arbeitsschritte unerläßlich war. Der komplexe, auf mehrere Bearbeiter verteilte Arbeitsablauf erforderte die Nachprüfbarkeit und Reproduzierbarkeit jedes Arbeitsschrittes, um etwaige Fehler frühzeitig erkennen und lokalisieren zu können. Diese Vorgehensweise ermöglichte ein Höchstmaß an Effizienz und bewährte sich während der gesamten Projektarbeit auch im Hinblick auf die Koordination mit dem Projekt „Ethnodoc". Zudem bildete diese interne Datenbank die Ausgangsbasis und für die spätere SQL-Datenbank, die sich ihrer Daten, Einträge und Struktur bediente.

Das Statusseminar am 14. März 2002, auf dem der Forschungsverbund und die Einzelprojekte evaluiert wurden, erbrachte für das vorliegende Projekt eine positive Bewertung durch die Gutachterkommission. Auch die weiteren Arbeitsfortschritte im Verlauf des Jahres 2002 wurden als Erfolg rezipiert, so daß noch vor Ablauf der zweijährigen Förderungsphase im Oktober 2002 ein Antrag auf Verlängerung des Forschungsvorhabens gestellt werden konnte. Eine Weiterförderung war auch notwendig, da die Datenbank während der ersten beiden Jahre aus fachlichen und finanziellen Gründen nicht im Internet publiziert werden konnte. Die erste Phase des Projekts endete Februar 2003 und wurde auf der Sitzung des Gutachtergremiums am 18. März 2003 abschließend positiv beurteilt. Im Anschluß an die Evaluierung der ersten Förderungsphase fand am darauffolgenden Tag die Begutachtung der Neu- beziehungsweise Verlängerungsanträge der zweiten Förderphase des Forschungsverbundes statt, die für das hier beschriebene Projekt eine Weiterförderung für erneut zwei Jahre erbrachte. Im Mai 2003 begann die zweite Arbeitsphase mit dem neuen Projektbearbeiter Meinolf Arens. Die wissenschaftlichen Hilfskräfte Angelika Kiss und Hans Hedrich wurden um Dieter Jäckel ergänzt, wobei die Arbeit nicht intensiviert werden konnte, da für die Beschäftigung der Hilfskräfte nunmehr ein um etwa 30 Prozent geringeres Finanzvolumen zur Verfügung stand.

Die Neubesetzung der halben wissenschaftlichen Mitarbeiterstelle brachte auch geringfügig erweiterte Themenbereiche mit sich, die den allgemeinen Forschungsschwerpunkten des Projektbearbeiters entsprachen. Ergänzt wurde der bisherige Fokus um das Sammelgebiet zu kirchenpolitischen Fragen sowie interkonfessionellen Dialogen und Konfliktfelder, die hinsichtlich der Integrationsfähigkeit des östlichen Europa in gesamteuropäische politische Strukturen aussagekräftig sind. Die im Projekt bereits etablierten und bewährten Arbeitsmethoden konnten fortgeführt werden, so daß der personelle und thematische Übergang ohne Bruch erfolgte. Anders verhielt es sich jedoch mit der Digitalisierung der Quellen. Während in den vorangegangenen zwei Jahren das Quellenmaterial in guter Qualität vorhanden und damit relativ problemlos digitalisierbar war, zeigte es sich fortan, daß mit zunehmendem Arbeitsfortschritt die Dokumentenerfassung aufwendiger wurde. Das deutlich schlechter erhaltene oder vorliegende Ausgangsmaterial machte in vielen Fällen das Einscannen unmöglich, so daß zahlreiche Dokumente manuell erfaßt werden mußten. Gerade diese waren aber von besonderer Wichtigkeit, da derartige Dokumente häufig nicht ediert waren und somit im digitalen Kontext besondere Raritäten darstellten, die nun einer breiten Öffentlichkeit zugänglich gemacht wurden. Dies betraf insbesondere die Materialien des Instituts für Zeitgeschichte, die auf Mikrofiche zur Verfügung gestellt wurden und ein manuelles Abschreiben erforderlich machten. Dennoch konnten zahlreiche Dokumente erfaßt werden und die Vorbereitungen für die Veröffentlichung der Datenbank getroffen werden.

Das ursprüngliche Vorhaben, die Quellen mittels SGML/XML (Standard Generalized Markup Language/eXtensible Markup Language) logisch zu strukturieren und zu beschreiben, mußte aus Kostengründen und hinsichtlich einer möglichen technischen Kooperation mit dem Projekt „Ethnodoc" aufgegeben werden. Statt dessen wurde auf die kostengünstige Alternative einer relationalen SQL-Datenbank (Standard Query Language) ausgewichen, auf der auch das Projekt „Ethnodoc" basierte. Dennoch wurde während des Arbeitsprozesses darauf geachtet, daß das digitalisierte Material in allen Bearbeitungsstadien vorlag, so daß die Daten gegebenenfalls auch auf ein XML-basiertes System transferiert werden können. Die Entscheidung für ein SQL-basiertes System erforderte die Einführung neuer wissenschaftlicher Arbeitsschritte, die auf die vorhandenen Strukturen aufbauten. Da nunmehr keine textstrukturierte Bearbeitung im Mittelpunkt der wissenschaftlichen Kategorisierung stand, mußte eine Strukturierung entsprechend den Kriterien einer relationalen Datenbank erfolgen. In diesem ersten wissenschaftlichen Aufgabenfeld analysierte der Projektbearbeiter alle bearbeiteten und in der hausinternen Datenbank vorhandenen Dokumente inhaltlich und wies ihnen Schlagworte zu. Aus Umfangs- und Kostengründen konnte dabei nicht auf die normierte Schlagwortdatei zurückgegriffen werden, sondern es wurden vor dem Hintergrund der eigenen Themenstellung und des vorhandenen Materials eigene Schlagworte zur Beschreibung der Quellen vergeben. Diese Schlagworte dienen auch der thematischen Recherche in der publizierten Datenbank.

Die zweite wissenschaftliche Anforderung des Projekts bestand in der Zusammenstellung virtueller Quellensammlungen aus dem vorhandenen Material. Hierfür wies der Bearbeiter den meisten Dokumenten eine oder mehrere Schlüsselnummern zu, anhand derer eine automatisierte Suchfunktion die Sammlungen online zusammenstellen sollte. Dadurch war gewährleistet, daß jedes Dokument – obwohl es physikalisch nur einmal in der Datenbank vorhanden war – gleichzeitig mehreren Sammlungen zugeordnet werden konnte. Da die Grundlage der virtuellen Editionen eine technische Datenbankfunktion war, waren die Sammlungen zudem nicht statisch, sondern flexibel: Durch die Aufnahme neuer Dokumente in die Datenbank und Zuordnung zu einer oder mehreren Sammlungen wuchsen diese kontinuierlich, und auch die Zahl der einzelnen Sammlungen vergrößerte sich mit der Digitalisierung weiterer Quellen. Nach dem vorläufigen Abschluß des Projekts im Juli 2005 waren vierzehn virtuelle Sammlungen vorhanden, die einen Großteil der bearbeiteten Quellen repräsentierten.14

Nach umfangreichen Programmierarbeiten konnte am 4. Mai 2005 der MySQL-basierte Informationsserver15 mit einer öffentlichen Vorstellung und Präsentation in Betrieb genommen werden. In der heute16 vorliegenden Form bietet die Datenbank drei unterschiedliche Zugangs- und Recherchemöglichkeiten. Das erste Modul besteht aus den erwähnten virtuellen Sammlungen, die eine thematische Strukturierung ausgewählter Materialien bietet. Dieses Modul richtet sich vor allem an jene, die schnell einen Überblick über eine bestimmte Fragestellung suchen. Das zweite Modul bietet umfangreiche Suchfunktionen im Dokumententitel, erlaubt zeitliche Einschränkungen oder Präzisierungen sowie eine Recherche nach Schlagworten. Eine Kombination aller Suchfelder ist ebenso möglich wie die Verwendung der Operatoren AND, OR, ANDNOT sowie ORNOT. Als drittes Modul wurde eine kostenfreie Volltextrecherche eingebunden, die alle Dokumente umfaßt und sich der Google-Suchmaschine bedient. Diese Funktion wertet alle mit der Datenbank verknüpften Dokumente inhaltlich aus und erstellt einen maschinellen Sachindex, der sich auf im Text vorkommende Stichworte bezieht. Diese Suchfunktion ist wenig spezifisch und erfordert die Verwendung von Booleschen Operatoren, um die Ergebnisliste einzuschränken. Zudem ist die Reindexierung der Seiten nicht steuerbar, so daß neu hinzugefügte Dokumente erst nach einiger Zeit in diesem Volltextindex aufscheinen. Durch diese Dreiteilung bleibt die Übersichtlichkeit erhalten und der Nutzer kann selbst über den gewünschten Zugangsweg entscheiden, wodurch das System allen Rechercheanforderungen entspricht. Die Datenbank richtet sich entsprechend den Leitideen des Forschungsverbunds forost ganz bewußt an einen breiten und heterogen strukturierten Benutzerkreis und soll allen Nutzern unabhängig vom Kenntnisstand einen Zugang gewährleisten. Neben der wissenschaftlichen Zielgruppe sollen vor allem auch Schüler, Studenten, Publizisten oder politische und wirtschaftliche Akteure angesprochen werden. Der modulare Aufbau, der sowohl die freie Suche als auch wissenschaftlich aufbereitete Zugänge bereitstellt, genügt diesen Anforderungen.

Mit der Bereitstellung dieses Informationsangebots im Internet hat das Projekt das vom Forschungsverbund forost formulierte Ziel der Wissenschaftlichkeit und Praxisrelevanz erreicht. Durch die weltweite und kontinuierliche Verfügbarkeit des Dienstes wurde ein Medium etabliert, das zeit- und ortsunabhängig jedem Interessierten redaktionell zuverlässige und damit zitierfähige Quellenmaterialien zur Verfügung stellt. Dadurch wird nicht nur die wissenschaftliche Arbeit mit diesen Dokumenten beschleunigt und erleichtert, sondern auch Laien ein Zugang zu dieser Gattung ermöglicht. Dadurch kann eine Zielgruppe erreicht und für die Thematik interessiert werden, die den Weg in die Archive und Bibliothek aus unterschiedlichen Gründen nicht antritt. Damit wird ein aktiver Beitrag zur Wissens-, Politik- und Geschichtsvermittlung geleistet, der den gewandelten Anforderungen an die Geistes- und Sozialwissenschaften entspricht. Zudem rückt diese Art der Publikation wissenschaftlicher Ergebnisse immer mehr in das Zentrum der Wissensvermittlung. Dies verdeutlichen die zahlreichen Bestrebungen zu Entwicklung und Ausbau von e-learning-Strukturen, durch das eine vernetzte Form des zeit- und ortsunabhängigen Lernens und Lehrens entsteht. Um so wichtiger ist aus diesem Grund die frühzeitige Bereitstellung wissenschaftlich fundierter Dienste, um die Ergebnisse der Forschung vermitteln und verbreiten zu können. Dies setzt aber eine Fortführung der Arbeiten voraus, die zum gegenwärtigen Zeitpunkt nicht gesichert ist. Insofern ist das UIM dankbar für jede Art der Unterstützung und offen für eine Zusammenarbeit, die einer Fortsetzung des Forschungsvorhabens dient. Institutionen oder Personen, denen digitalisierte oder fotokopierte Quellen vorliegen, werden gebeten, diese dem Projekt in Kopie zur Verfügung zu stellen, damit sie durch den „Informationsserver" des UIM bearbeitet, strukturiert und veröffentlicht werden können.17 Sein Ziel, eine möglichst umfassende Quellensammlung zur Beziehungs- und Integrationsgeschichte im 20. Jahrhundert in Ostmittel- und Südosteuropa zu sein, kann dieser Server um so eher erreichen, je mehr Fachleute und Interessierte mit ihm kooperieren. Schließlich werden auch diese Gruppen von einem solchen umfassenden, zuverlässigen und zitierfähigen Medium profitieren und die Bedeutung der Geschichtswissenschaft für die Entscheidungsträger in Politik und Wirtschaft, aber auch für die interessierte Öffentlichkeit nachhaltig verdeutlichen können.

 

Ralf Thomas Göllner, München

 

Fußnoten

1  Immanuel Kant: Idee zu einer allgemeinen Geschichte in weltbürgerlicher Absicht. In: Ders.: Was ist Aufklärung? Ausgewählte kleine Schriften. Hg. Horst D. Brandt. Hamburg 1999, 17.
zurück zum Text

2  Bericht der Arbeitsgruppe Technik zur Vorbereitung des Programms „Retrospektive Digitalisie­rung von Bibliotheksbeständen“ im Förderbereich „Verteilte Digitale Forschungsbibliothek“ [im weiteren: Bericht]. DFG. http://www.sub.uni-goettingen.de/ebene_2/vdf/endfas.pdf (8. September 2005).
zurück zum Text

3  Praktische Hinweise zur retrospektiven Digitalisierung von Bibliotheksbeständen. DFG. http://www.dfg.de/foerder/formulare/1_521.htm (26. Oktober 2000).
zurück zum Text

4  Nähere Informationen unter http://www.forost.de.
zurück zum Text

5  Ausführlich zu den Forschungszielen und Methoden Ralf Thomas Göllner: Zum Aufbau einer digitalen Dokumentensammlung im Ungarischen Institut München. Der Informationsserver „Quellen und Materialien zur Beziehungs- und Integrationsgeschichte in Ostmittel- und Südosteuropa im 20. Jahrhundert unter besonderer Berücksichtigung Ungarns, der Minderheitenfrage und der europäischen Integration“. In: Ungarn-Jahrbuch 25 (2000/2001) 277-287.
zurück zum Text

6  Z. B. The Consolidated Treaty Series. Hg. Clive Parry. 1.1648/49 bis 226.1919. Dobbs Ferry 1969-1981; United Nations Treaty Series. Treaties and international agreements registered or filed and recorded with the Secretariat of the United Nations. Washington ab 1 (1946/1947).
zurück zum Text

7  So zur Osterweiterung der EU unter http://www.europa.eu.int/pol/enlarg/index_de.htm (8. September 2005). Allgemeine Dokumente unter http://europa.eu.int/documents/index_de.htm (8. September 2005).
zurück zum Text

8  Grundlegende Texte der NATO: http://www.nato.int/docu/basics.htm (8. September 2005).
zurück zum Text

9  »Der Scanner ist ein Lesegerät, das über eine geeignete Software (gedruckte) Vorlagen für die Weiterverarbeitung mit einem Computer in maschinenlesbare Form umwandelt. Er wird als Peripheriegerät an den Computer angeschlossen.« Bericht 7.
zurück zum Text

10  Für bitonale Vorlagen wie reine Textquellen werden in der Regel Bildformate wie TIFF (Tagged Image File Format) mit einer verlustfreien Komprimierung der Gruppe 4 oder PNG (Portable Network Graphics) verwendet. »Aus Sicht der Arbeitsgruppe kommen beide genann­ten Formate für Digitalisierungsvorhaben in Frage, wobei TIFF bei abgeschlossenen und der­zeit laufenden Digitalisierungsvorhaben mit Abstand am häufigsten eingesetzt wird.« Bericht 14. Im vorliegenden Projekt wurde das TIFF-Format benutzt, da es weit verbreitet ist und – im Gegensatz zu den meisten anderen Bildformaten – mehrere Seiten in einer einzigen Datei abspeichern kann.
zurück zum Text

11  Eine Texterkennungs- oder OCR-Software (Optical Character Recognition) erfaßt das Ausgangsmaterial mit Hilfe eines Scanners als Bild. Dieses Bild wird anschließend von der Software erkannt, das heißt den graphischen Darstellungen auf dem Bild werden Buchstaben zugeordnet.
zurück zum Text

12  »The Rich Text Format (RTF) Specification provides a format for text and graphics in­terchange that can be used with different output devices, operating environments, and oper­ating systems. RTF uses the American National Standards Institute (ANSI), PC-8, Macintosh, or IBM PC character set to control the representation and formatting of a document, both on the screen and in print. With the RTF Specification, documents created under different operating systems and with different software applications can be transferred between those op­erating systems and applications.« Rich Text Format (RTF) Specification, version 1. 6. Microsoft Corporation, May 1999, Summary.
zurück zum Text

13  Das PDF-Format (Portable Document Format) ist ein plattformunabhängiges Format für den Dokumentenaustausch, in das das Bitmap-Image – also das Bild des Textes – eingebun­den wird. Dieses Format wird als geeignet für die Langzeitarchivierung von Dokumenten an­gesehen. ISO 19005-1. Document management – Electronic document file format for long-term preservation. Part 1: Use of PDF (PDF/A). Library of Congress, National Digital Information Infrastructure and Preservation Program, unter http://www.digitalpreservation.gov/formats/fdd/ fdd000125.shtml (8. September 2005).
zurück zum Text

14  Die aktuellen virtuellen Sammlungen des Forschungsprojekts sind abrufbar unter http://www.forost.ungarisches-institut.de/sammlungen.htm (8. September 2005).
zurück zum Text

15  Die Internetadresse des Informationsservers: http://www.forost.ungarisches-institut.de.
zurück zum Text

16  Dieser Beitrag wurde Ende Juli 2005 abgeschlossen.
zurück zum Text

17  Nähere Informationen und Kontakt über http://www.ungarisches-institut.de.
zurück zum Text

  

Seiten zuletzt aktualisiert am: 20.12.2005

Technische Hinweise | Kontakt | Impressum