![]() |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Ralf Thomas Göllner20. századi kapcsolattörténeti szöveggyűjtemény az MMI adatbankjában
Eredeti változata elhangzott 2008. március 26-án a budapesti Közép-európai Kulturális Intézet „Magyarország Bajorországból nézve. 45 éves a Müncheni Magyar Intézet” című rendezvényén. Megjelent: Hungarológiai Évköny 10 (2009), 87-92.
A nyolcvanas évek táján elindult egy olyan digitális, informatikai és technológiai forradalom, amelynek eredménye a tudás Gutenberg óta nem tapasztalt mértékű megsokszorozódása és elterjedése. De ez a forradalom nemcsak a tudás megsokszorozódásának egyengette az útját, hanem új kutatási, oktatási és tanulási módszereknek is. Az internet, az adatbázisok és az információs szolgáltatások napjainkban fontos és a kommunikáció, a kutatás és a könyvtárak ma már nélkülözhetetlen eszközei. Ezek a lehetőségek gyorsan, majdnem mindig és mindenhonnan rendelkezésre állnak és nemcsak a tudományos munkát gyorsítják fel. Ezen fejlődés során létrejött a huszonegyedik századi információs társadalom és a hozzátartózó ipar, amelyik mint Google, Yahoo és más nemzetközi, és pénzügyi szempontból kiválóan működő cég információkat közvetít, de nem mindig biztosít. Jelenleg ezek a cégek, főleg Google és Wikipedia, nemcsak arra készülnek, hogy öncélúan, az eredeti tudományos, könyvtári és levéltári szakértelmet megkerülve orvvadász módra közvetítsenek információkat, hanem hogy feldolgozott és strukturált ismeretanyagot kínáljanak a használóknak. Jó példa erre a Google könyvtári digitalizációs kezdeményezése. E rövid helyzetfelmérés rámutat arra, hogy a tudományos, könyvtári, levéltári és múzeumi szakértelem éppúgy mint a tudás-közvetítés, amely sokkal összetettebb mint az információ-közvetítés és a tudás-hitelesítés nagy intellektuális, technikai és persze finanszírozási kihívások előtt áll. Ha a könyvtári vagy más tudományos célú gyűjtemények nem akarják ezeket a főkompetenciákat és feladatokat a technológiai fölénnyel bíró, profitorientált cégeknek átengedni, akkor az új technikákat és az új lehetőségeket mindenképpen fel kell használni tudományos célokra. Másképpen elveszítik a versenyt még akkor is, ha a tudományos eredmények jobbak, alaposabbak mint például a Wikipedia cikkek, amelyek újabban még egyetemi munkákban is szerepelnek. Nem akarom azt állítani, hogy ezek a kommerciális ajánlatok haszontalanok. Bizonyos fokú hasznuk van, de a tudományos feldolgozást és a tudományos közvetítést nem tudják pótolni – ez még a tudomány világához tartozik. Néha az a benyomásom, hogy két világról van szó, egy a technikai lehetőségeket felhasználó és mozgékony szféráról és egy tudományos, de lassú és a technikával szemben szkeptikus szféráról a: németül az úgynevezett Elfenbeinturm-ról (elefántcsonttorony). Pedig a tudomány nagyon jól fel tudja vagy fel tudná használni a modern technológiát saját céljaira, de oktatási és könyvtári célokra is; akárcsak a saját tevékenységének hatékonyabb bemutatására és a tudomány hasznának minden lehetséges fórumon való bizonyítására. Ez a mindenütt zsugorodó finanszírozási bázis miatt is fontos szempont. Ezen gondolatok kapcsán kezdte meg 1996/1997-ben a Müncheni Magyar Intézet a koncepcionális munkát a digitális adatbázisok terén, az intézet „Magyarország a Kárpát-medence kapcsolattörténeteiben” című főtémáját illetően. Ezek a digitális szolgáltatások céljuk szerint kiemelik a tudományos kutatást a technológiai sötétségből, de nem asszimilálják a felületes nem-tudományos és profitorientált módszerhez, hanem a tudományos módszert és eredményeket gazdasági és technikai eszközökkel terjesztik. Persze számos módszer, anyag és lehetőség létezik a Kárpát-medence kapcsolattörténetének feldolgozásához, mégis az egyik legfontosabb alapot a dokumentumok és a források adják. Ezért az intézeti digitális projekt ebben az irányban fejlődött, bár kezdetben csak mint egy belső koncepció. Egy digitális könyvtári katalógus, amely a német mellett diakritikus és cirill betűs tételeket is tartalmaz, valószínűleg az első Münchenben, hozzácsatolva egy Bogyay Tamás hagyatékának egy részét felölelő dokumentumtár, egy cikk és egy recenzió adatbázis, mindegyik keresőfunkcióval is ellátva – ezek voltak az első, először csak az intézetben használható eredmények. 1999 végén és 2000 elején tárgyalások kezdődtek az intézet részvételével, amelyek eredménye a bajor Kelet-Európai Kutatási Hálózat forost létrehozása volt. 2000 áprilisában a Magyar Intézet és más bajor egyetemi és kutatóintézetek bemutatták a Bajor Tudományügyi, Kutatási és Művészeti Minisztériumnak az egyes projektterveket finanszírozásra. Decemberben a minisztérium által kinevezett szakértőcsoport pozitívan értékelte az intézeti projekttervet, amelyet a minisztérium jóvá is hagyott, úgyhogy a projekt 2001-ben el is indult a következő hosszú név alatt: „Quellen und Materialien zur Beziehungs- und Integrationsgeschichte in Ostmittel- und Südosteuropa im 20. Jahrhundert unter besonderer Berücksichtigung Ungarns, der Minderheitenfrage und der europäischen Integration." A projekt célja dokumentumok és más anyagok digitális és teljes szövegű feldolgozása volt, olyan forrásoké, amelyek fontosak a kapcsolattörténet ismeretéhez: például törvények, szerződések, ügyiratok, politikai előadások, emlékiratok, statisztikai adatok és – mint külön súlypont – kisebbségtörténeti anyagok. A módszer és a feladat tudományos volt, de a gyűjtés, adminisztráció és prezentáció modern technikai alapokra épült. De mi a különbség egy hagyományos dokumentum-könyvkiadvány, egy tradicionális adatbázis, valamint az intézeti információs szerver között?
A harmadik, tudományos szempontból legfontosabb és ebben a kombinációban valószínűleg első ajánlat az úgynevezet virtuális gyűjtemények illetve virtuális forrásgyűjtemények, németül: die virtuellen Sammlungen oder virtuelle Quellensammlungen. Jelenleg 14 virtuális gyűjtemény létezik. Ez a rész nem csak a kutatókhoz szól, hanem diákokhoz és más érdeklődőkhöz is. Ezért mindegyik virtuális gyűjtemény előtt nagyon rövid bevezetés szerepel, amelyet még bővíteni lehetne. De ez miért virtuális gyűjtemény? Az adatbázisban sok dokumentum kóddal van ellátva, és ez a kód az egyes dokumentumot egy virtuális gyűjteményhoz csatolja. Ahogy növekszik az adatbázis és a dokumentumok száma, úgy nőnek a virtuális gyűjtemények is. A gyűjtemények számát is nagyon egyszerű bővíteni. Ehhez csak új dokumentumok vagy új gyűjteményi témák kellenek, egy új kód és egy új kereső parancs a honlapon. Így akár csak pár nap alatt is jelentősen kiépíthető és bővíthető az információs ajánlat. Ez a három felhasználói módszer – a sima cím-keresés, a szó-keresés és a tudományos feldolgozás a virtuális gyűjtemények alapján – tudományos szempontból valoszínűleg a legalaposabb digitális forrásgyűjtemény Münchenben. A technikai és szakmai kérdések mellett szerkesztési és koncepcionális kérdések vártak megoldásra. Egy ilyen ajánlat csak akkor hasznos a tudományos szférában, ha az idézhetősége biztosított, és megbízhatóan prezentálja az anyagot. Ezért a digitalizációs folyamatban a minőségre és nem a mennyiségre helyeztük a hangsúlyt, és biztos és kötelező munkalépéseket dolgoztunk ki. Az első lépésben a munkatársak megbízható publikációkban vagy eredeti lelőhelyeken megtalálható, tudományos szempontból fontos forrásokat és dokumentumokat választottak ki. Ebben a lépésben egy első szakmai strukturálás is megtörtént. A második lépésben a dokumentumok digitalizációja, illetve a beszkennelés és az optikai karakterfelismerés következett. A beszkennelés után az anyagot elmentettük JPG-formátumban, majd az optikai karakterfelismerés után RTF-formátumban, úgyhogy a dokumentumok most két típusban állnak rendelkezésre. Azt kell mondani, hogy mind a két formátumnak van előnye és hátránya. A JPG-formátum előnye, hogy az eredeti dokumentumot mint fényképet mutatja, de hátránya, hogy a tartalom nem kereshető. Az RTF-formátum a Google kereső-funkcióval elérhető, de nem mutatja az eredeti anyagot, az eredeti forma – nem az eredeti tartalom! – elveszett. Az optikai karakterfelismerés pontossága körülbelül 95 százalékos, ha elég jó az eredeti beszkennelt dokumentumkép. Ahhoz, hogy az RTF-formátum megbízhatóan idézhető legyen, egy harmadik munkaszakaszban három korrektúra következett három munkatárssal. Ez fontos volt, mert csak így tudtuk az anyag idézhetőségét biztosítani. Fontos volt ebben a lépésben a hivatalos helyesírás, a diakritikus betűk korrekt megjelenítése, amelyek sok más digitális dokumentumgyűjteményben főleg angolnyelvű országokban elvesznek. A korrekturák után az anyag PDF-formátumba került, amely az utolsó és most elérhető formátum. A dokumentumtár adminisztrációja egy saját Microsoft Access-adatbázisban történik, amely a duplamunkákat is ellenőrzi. Ez az adatbázis a végleges MySQL alapja is. 2005. május 4-én az intézeti információs szerver az internethez kapcsolódott és azóta egy elég sokszor használt ajánlattá fejlődött. A következő rövid statisztikai adatok jól mutatják a szerver elfogadottságát.
Statisztikai adatok: 2005. május – 2008. március
|
| Látógatók 2005-ben: | 22.688 |
| Látógatók 2006-ban: | 30.849 |
| Látógatók 2007-ben: | 58.322 |
| Látógatók 2008 március 12-ig: | 12.417 |
| Összesen: | 124.276 |
| Oldalnézettség 2005-ben | 41.182 |
| Oldalnézettség 2006-ban: | 49.311 |
| Oldalnézettség 2007-ben: | 82.695 |
| Oldalnézettség 2008 március 12-ig: | 18.723 |
| Összesen: | 191.911 |
| .net oldalak: | 11.834 | 26,69% |
| .com oldalak: | 25.962 | 43,60% |
| .de oldalak: | 6.314 | 15,81% |
| .at oldalak: | 1.439 | 3,76% |
| .ch oldalak: | 879 | 1,99% |
| .pl oldalak: | 794 | 1,79% |
| .hu oldalak: | 450 | 1,38% |
Argentína, Brazília, Chile, Kína, Dél-Afrika, Fidzsi-szigetek, Japán, Kolumbia, Malájzia, Marokkó, Mexikó, Nicaragua, Pakisztán, Peru, Singapur, Tajvan, Togo, Tuvalu
| google.de | 51,87% |
| google.com | 11,54% |
| google.at | 5,61% |
| google.pl | 2,26% |
| wikipedia.org | 1,65% |
| herder-institut.de | 0,86% |
|
Dokumentumok: |
Megnyitott: |
| 1. Friedensvertrag von Brest-Litowsk vom 3. März 1918 | 1.463 |
| 2. Österreichisch-ungarisches Ultimatum an Serbien vom 22. Juli 1914 | 1.343 |
| 3. Armistice Convention with Austria-Hungary. Protocol of Conditions of the Armistice between the Allied and Associated Powers and Austria-Hungary. Signed at Villa Giusti, November 3, 1918) | 1.337 |
| 4. Beneš-Memoranden zur Pariser Friedenskonferenz 1919/1920. Memorandum Nr. 10: Probleme der Berichtigung der Tschechoslowakischen und deutsch-österreichischen Grenzen | 1.074 |
| 4. Treaty of Peace between Poland, Russia and the Ukraine, signed at Riga, March 18th, 1921 | 1.074 |
Seiten zuletzt aktualisiert am: 23.10.2008