A bölcsészinformatika s azon belül a digitális
filológia világviszonylatban is korán, már az 1990-es években fontos
szerepet játszott a magyar tudományban (hálózati szövegkiadások,
adatbázisok létrehozásával). Az e tudományágnak szentelt első
központ az ELTE-n 1997-ben Horváth Iván vezetésével megalakított
BIÖP (Bölcsészettudományi Informatika Önálló Program) műhelye volt,
amely több hálózati kritikai kiadást, digitális formában elérhető
tananyagot és tudományos cikket készített, valamint konferenciákat
szervezett a digitális átalakulás következtében a filológiára váró
kihívásokról és az ennek következtében elkerülhetetlenné váló
szemlélet- és paradigmaváltásról az irodalmi szövegek
értelmezésében. Ebből a műhelyből indult el az itt ismertetendő
versrepertórium-építő kezdeményezés is, mely túlélte a BIÖP-öt.
Az első papíralapú versleltárak, főleg a nemzeti
irodalomtörténetek segédleteiként, a filológia hőskorában, a 19.
században készültek: céljuk egy-egy költészeti hagyomány
számbavétele, rendszerezése volt több-kevesebb kritérium
(szereztetés adatai, műfajiság, metrikai és ritkábban
retorikai-poétikai jellemzők) leírásával. Az alaposabb
kidolgozottságú metrikai repertóriumok készítése az 1960-as években
indult – elsőként a provanszál trubadúrok műveinek feldolgozásával
(Frank, 1962), s különös módon még a 2000-es években is jelent meg
nyomtatott formában ilyen kézikönyv. Természetesen az újlatin és a
germán nyelvek gazdag irodalmai kívánták meg leginkább az ilyesfajta
számvetést; a csekélyebb mennyiségű fennmaradt szöveg alapján ismert
költői hagyományok nem szorultak rá feltétlenül hasonló
segédeszközre. Az első digitális versrepertórium mégsem az említett
irodalmakhoz köthető: Magyarországon az 1601 előtti magyar versek
anyagából készítette el a szegedi egyetem kutatócsoportja 1976 és
1992 között Horváth Iván vezetésével az RPHA-t (Répertoire de la
poésie hongroise ancienne). Ez már a nyomtatott repertóriumok
tanulságainak a figyelembevételével készült, nagyon gazdag
szempontrendszer alapján dolgozta fel a verseket, és komplex
keresésekre is alkalmas volt.
Egy versrepertórium legnagyobb jelentősége
valójában ebben rejlik. Ha jó, akkor nemcsak leltároz, hanem a
versek sok paraméterét rögzítve statisztikai alapú mélyelemzéseket
és összehasonlításokat is lehetővé tesz, és segíthet a máskülönben
nehezen kezelhető, aránylag nagy mennyiségű adat elemzésének
segítségével újraírni az irodalomtörténetet, meghatározni egy adott
forma, műfaj megjelenésének, elterjedésének állomásait. Például a
régi magyar vers történetét is sokkal pontosabban, lényeglátóbban
lehet megírni az RPHA segítségével, és sokkal jobban lehet
értelmezni Pesti Gábor, Balassi Bálint, Tinódi Sebestyén, Szenczi
Molnár Albert költői teljesítményeit, elemezni más nyelvű irodalmak
hatását a magyarra a fordítások és formaátvételek szisztematikus
katalógusa alapján (például Horváth, 2006). A versrepertóriumoknak
köszönhetően nemcsak az egyes verselési, poétikai rendszerek fő
szabályai határozhatók meg, hanem az atipikus, újító vagy éppen
hibásnak látszó, esetleg más hagyományhoz illeszkedő költemények is
értelmezhetővé válnak. Az egyes irodalmi hagyományok kutatási
segédeszközeit összekapcsolva pedig lehetőség nyílik arra, hogy az
irodalmak közötti kapcsolatokat pontosan feltérképezzük, az areális
vagy strukturális alapú hasonlóságokat feltárjuk. A digitális
fejlődésnek köszönhetően már nem utópisztikus az elképzelés, hogy a
világ minden költői művét sikerülhet egy platformon hozzáférhetővé
tenni és azonos kritériumok alapján meghatározni. Ennek a gigantikus
vállalkozásnak a laboratóriumi előtanulmányát jelenti a
versrepertóriumok összehangolásának kísérlete (Horváth, 1991; Billy
et al., 1999; Seláf, 2008).
A Nouveau Naetebus nevet viselő adatbázis
előmunkálatai 2003 végén kezdődtek egy posztdoktori kutatás
keretében a hollandiai Wassenaarban található Netherlands Institute
for Advanced Study ösztöndíjával. Posztdoktori kutatásom témája a
középkori francia versek egy csoportjának érdekes sajátossága volt:
a hím- és nőrímek ekvivalenciája a versszakok fölötti strukturális
szinten (Seláf, 2008). Alapesetben a középkori francia verselésben a
nőrímek egy plusz szótagnak számítanak az azonos szótagszámú, de
hímrímes verssorokhoz képest, így a több strófából álló énekelt
versekben az udvari költészet szigorú metrikai megkötései szerint az
egymást követő versszakok azonos pozícióiban álló sorai mindig vagy
hím- vagy nőríműek lehetnek. Például ha egy ababcddc rímképletű
strófa c ríme az első versszakban nőrím, akkor az összes strófában
nőrímet kell találnunk. Ez a homogónia szabálya. A munka során arra
kerestem választ, mi magyarázza azt, hogy a nagyon szigorú formai
szabályok alapján felépülő ófrancia trouvère-költészetben aránylag
sok olyan vers van, mely ezt a szabályt megszegi.
A magyarázat természetesen többrétű, és még ma
sem lehet egyértelműen meghatározni az okokat. A legáltalánosabban
elfogadott vélemény a gyűjtemény magját kitevő versekkel
kapcsolatban az, hogy a heterogóniájuk nem a szerzők ügyetlenségének
következménye: azért nem kellett a homogónia szabályát alkalmazniuk,
mert ezek a költemények nem éneklésre, hanem recitálásra és
olvasásra készültek. A 19. század végén a szabályszegő,
heterogonikus versekből Gotthold Naetebus német romanista készített
egy repertóriumot (Naetebus, 1891). Ez a különös gyűjtemény minden
„hibás” metrikájú verset magába foglalt, nem véve figyelembe, hogy a
trouvère-költészet szigorú formai szabályainak kialakítása előtt
vagy esetleg azoktól függetlenül készültek. Ez a vegyes anyag
tulajdonképpen egy „szemétdomb”, a tökéletlen verseket hordták itt
össze egy repertóriumba a filológusok, de ahogy a régészek számára
egy régi kultúra szemétlerakója, úgy az irodalomtörténésznek is
igazi kincsesbánya lehet egy ilyen gyűjtemény.
Emiatt merült fel, hogy új, elektronikus
változatot kell készíteni Naetebus repertóriumából, kiegészítve új
szempontokkal és az általa nem ismert, az elmúlt 125 évben feltárt
több száz verssel, kézirattal. Miután a versek szabálytalanságának
egyik legkézenfekvőbb magyarázata az, hogy szándékosan más poétikai
konvenciókat követtek, s ezért más nyelvű vagy szintén ófrancia, de
más verselésű költeményekhez igazodtak, olyan új repertóriumban
kellett gondolkodni, amely illeszkedhet a többi versrepertóriumhoz
is: ugyanolyan szempontrendszer alapján vannak leírva a verstani,
poétikai jellemzők. A Nouveau Naetebus eredetileg is úgy készült,
hogy könnyen összekapcsolható legyen más elektronikus
versrepertóriumokkal, s ezáltal a heterogén korpusz egyes részeinek
külső kapcsolódási pontjait is fel lehessen tárni például a
középangol, latin, héber vagy flamand nyelvű középkori költészettel.
A versadatbázis fejlesztési fázisa az OTKA
hároméves egyéni posztdoktori ösztöndíjával kezdődött 2004-ben. Ezt
bővítette kétszer fél évvel (2005, 2006) a Humboldt-alapítvány
ösztöndíja, melynek során a frankfurti Johann-Wolfgang Goethe
Egyetemen Friedrich Wolfzettel professzor, a trouvère-ek metrikai
repertóriumának (Mölk et al., 1972) társszerzője segítette a
kutatómunkámat. Az adatbázis tesztverziója 2009-ben készült el. Bár
nincs szó óriási korpuszról, az autopszián (a források és nem modern
kiadásaik kézbevételén, elemzésén) alapuló, aprólékos és igényes
leírás követelménye és az elapadt pénzügyi források miatt – a
folyamatos adatfeltöltés és adatgyűjtés ellenére – máig sem sikerült
a végleges változatot elkészíteni. Remélhetőleg erre a következő
években sikerül megfelelő támogatást szerezni. Jelenleg 367 vers
adatai érhetők el nyilvánosan, ebből 248 vers Naetebusnál is
szerepelt (de nincs benne minden Naetebus repertóriumában meglévő
költemény). Az adatbázisban hetvenhét különféle jellemző rögzíthető
minden vers minden egyes változatáról: a koncepció szerint rögzíteni
kell a középkori versek kéziratokban tükröződő alapvető
variabilitását – ahogy az RPHA is teszi. Az adatbázis a PostgreSQL
adatbázis-kezelő segítségével készült. Garas Péter, akkor másodéves
programozó matematika szakos hallgató fejlesztette 2007-től, akinek
munkáját Gyenese Péter, a BME és az ELTE BTK volt hallgatója
korrigálta és folytatta az elmúlt években.
A Nouveau Naetebus célja az volt, hogy mintául
szolgáljon más hálózati versrepertóriumok számára is, és a lehető
legkönnyebben össze lehessen kötni azokkal, illetve egyéb
adatbázisokkal. Az interoperabilitást és az egyszemélyes kutatás
lehető legszélesebb nemzetközi recepcióját megcélzó koncepciónak
csak egy eleme volt a szabadon |
|
hozzáférhető, mindenki számára nyitott,
többnyelvű adatbázis. Ez kiegészült az együttműködés több gyakorlati
fórumával. Külföldi kollégákkal létrehoztuk az Ars metrica című
hálózati verstani folyóiratot (URL1),
melynek tudományos tanácsában vezető irodalomtudósok, metrikusok
kaptak helyet. Már 2005-ben elkezdődött a repertóriumok
összehangolását megalapozó nemzetközi konferenciasorozat: az
Összehasonlító metrikai és poétikai napok (Journées d’études
métriques et poétiques comparées) megrendezése az ELTE-n. Eddig hat
eseményre került sor ebben a keretben – anyaguk jórészt megtalálható
a folyóirat honlapján. A tematikus konferenciák előadásainak anyaga
a Poetica et Metrica könysorozatban olvasható, melynek első kötetét
az Akadémiai Kiadó adta ki (Noel et al., 2010), a következőket pedig
a Cambridge Scholars Publishing jelenteti meg (a másodikat The
Poetics of Multilingualism címmel 2016-ban). Az ELTE-n létrejött, a
BIÖP örökségét felvállaló Reneszánsz mesterszak hallgatói szerepet
vállalnak a karunkon készülő digitális szövegkiadásokban,
adatbázis-építésben, s igyekszünk őket a versek digitális
feldolgozásának munkálataiba is bevonni. A digitális
versrepertóriumok összekapcsolásának első kísérletére is a
műhelyünkben került sor: a Király Péter könyvtár-informatikussal
közösen kidolgozott, az Open Search kereső és lekérdezési módszeren
alapuló Megarep fantázianevű projekttel a Nouveau Naetebus-t és az
RPHA-t kötöttük össze. Valószínű, hogy a technikai fejlődés és az új
bölcsészinformatikai trendek nem ezt a megoldást, hanem inkább a
Linked Data modell alkalmazását fogják megkívánni abban az esetben,
ha kettőnél több adatbázist akarunk összekapcsolni – de a kísérlet
mindenképpen hasznos volt: egy közös európai verstani és poétikai
terminológia kidolgozását is meg tudtuk vele alapozni.
A nemzetközi együttműködés új formáját és
lehetőségét jelentette az Európai Unió 2011-ben indult COST IS1005
Medioevo Europeo nevű kutatási és technológiai együttműködési
fóruma, melynek célja a középkortudomány digitális kutatási
segédleteit készítő műhelyek munkájának összehangolása volt, s a
tagok közt számos repertóriumépítő kutató is helyet kapott. A
COST-program támogatásával lehetőség nyílt arra, hogy megszervezzük
tucatnyi különféle versrepertórium készítőjének két
műhelykonferenciáját (Budapest 2013, Madrid 2014), ahol az
adatbázisok összekapcsolásának módozatairól egyeztettünk, illetve
előkészítettünk egy Horizon 2020 pályázatot. A repertóriumok
mindegyike eltérő informatikai és filológiai sztenderdek alapján
készült, s a más-más készültségi állapotú adatbázisok összehangolása
nagyon bonyolult és meglehetősen költséges feladat. Nem elegendő a
nemzetközi sztenderd jelölőnyelvek felhasználását elvárni az
egységesítéshez, hiszen a metrikai és poétikai elemzések nagyon
aprólékosak némelyik adatbázisban, s ilyen mélységű leírásokra
egyelőre még a TEI (Text Encoding Initiative) kódrendszere sem
alkalmas. A szervezet legutóbbi útmutatója ugyan már javasol
megoldásokat a lírai szövegekre is (P5: Guidelines for Electronic
Text Encoding and Interchange, Version 2.9.1,
URL2), így a rím- és a metrikai
szerkezetek leírására, de még nem megfelelően kidolgozott. Ezért van
szükség folyamatos egyeztetésre, közös fejlesztőmunkára az
együttműködésre nyitott kutatócsoportok között. Ugyan a 2015-ben
spanyol vezetéssel benyújtott első EU-s pályázatunk nem nyert, a
pályázó konzorcium angol, francia, német, magyar stb. tagjai bíznak
benne, hogy hamarosan sikerül elnyerni egy olyan támogatást, amely
lehetővé teszi az adatbázisok összehangolását. Komoly eredmény, hogy
az integráció alacsonyabb szintjét elősegítendő már sikerült
elnyerni a csoport egyik spanyol tagjának, Elena González Blancónak
egy ERC-ösztöndíjat: a projekt célja az Ibériai-félsziget középkori
költői hagyományainak közös adatbázisba rendezése.
A Nouveau Naetebus-nak nem csupán az a funkciója,
hogy a többi versrepertóriummal összekapcsolva segítse az általános
metrikai kutatást, hanem a saját korpuszát is megfelelő mélységben
kell szolgáltatnia. Lehetővé kell tennie minden vers kéziratos (mely
művekkel szerepel egy kódexben) és műfaji (mely, esetleg más formájú
művek tartoznak ugyanebbe a műfajba) kontextusának megismerését,
összefoglalni a recepciójára vonatkozó ismereteket, s emiatt az
adatbázist össze kell kötni a középkori francia irodalom más
kutatási segédleteivel is. Első lépésként a nyilvánosan még nem
elérhető szakirodalmi anyagot össze kell kapcsolni a heidelbergi
ófrancia etimológiai szótár kitűnő, naprakész bibliográfiájával,
majd ezt követően két másik, a középkori francia irodalom teljes
körű szövegfeltárására törekvő adatbázissal, az Arlimá-val (URL3)
és a JONAS-val (URL4).
Az első nonprofit magánvállalkozás, a másik pedig a francia CNRS
által bőkezűen szponzorált, egy sok évtizeden át készített
cédulakatalógus feldolgozásán alapuló, több kutató munkájával
jelenleg is fejlesztett adatbázis. Mindkettő azzal a céllal készült:
hogy bibliográfiai (és a JONAS esetében ráadásul kodikológiai)
adatokat szolgáltasson a kutatók számára a középkori francia és
provanszál művekről: ez a legfőbb ok, ami miatt a Nouveau Naetebus-t
is érdemes hozzájuk kapcsolni.
Utolsó lépésként az elemzett művek teljes
szövegét tartalmazó adatbázisokhoz történő csatlakozás a cél.
Általában sajnos fordított irányú a fejlesztés: jellemző, hogy
tömegesen digitalizálnak kéziratokat, régi nyomtatványokat vagy
esetleg későbbi (kritikai, tudományos igénnyel készült vagy
népszerűsítő) kiadásokat, s utána kezdenek el keresőprogramokat, más
szövegelemző módszereket felhasználva egy komplexebb adatbázis
kiépítésébe, ami az adatok megbízhatóságát nagyban csökkenti.
Szeretném a Nouveau Naetebus-t az elemzett ófrancia szövegek
digitalizált kéziratait szolgáltató adatbázisokkal (a legjobb és
leggazdagabb közülük a párizsi nemzeti könyvtár [BNF] Gallica nevű
portálja), illetve kritikai kiadásokat szolgáltató más
adatbázisokkal is összekötni. Ezek jelentik, a leltározó munka
befejezése és teljes közzététele mellett, a repertórium
fejlesztésének főbb feladatait.
Az adatbázis-építések, a kritikai kiadások
gyakran hosszú, több pályázati cikluson átnyúló feladatot
jelentenek, és az informatikai eszközöknek a digitális fejlődés
következtében gyors az elavulása. A könyvvel ellentétben az
adatbázist meg lehet változtatni, ki lehet javítani, viszont karban
is kell tartani, ezért (csekély) finanszírozást igényel még egy
sikeresen befejezett kutatómunka után is. A Nouveau Naetebus
legutóbb 2009-ben részesült kutatási támogatásban, s a nagyszabású
terv befejezéséhez további forrásokra lesz szükség. Remélem, hogy a
magyar digitális tartalomipar egyre dinamikusabban fog fejlődni, és
lehetővé válik az ilyen jellegű kutatások folytatása és fenntartása.
Sokat jelentene, ha Magyarország csatlakozna az Európai Unió Dariah
(Digital Research Infrastructure for the Arts and Humanities)
hálózatához: ez garantálhatná a közpénzből finanszírozott kutatások
eredményeinek fennmaradását és az ingyenes hozzáférést, valamint a
magyar kutatási eredmények komolyabb nemzetközi visszhangját, és
optimális esetben a Dariah-hálózat külföldi tagjaival közösen
benyújtott sikeres európai pályázatokat. Ebben bizakodom.
Kulcsszavak: középkori irodalom, költészet, adatbázis, metrika,
poétika, adatbázisok összekapcsolása, versrepertórium
IRODALOM
Billy, Dominique – Glon, Thierry (1999):
Vers un répertoire métrique général des strophes du moyen âge. In:
Billy, Dominique (éd.): Métriques du moyen âge et de la Renaissance.
L’Harmattan, Párizs, 305–15.
Frank István (1966): Répertoire métrique
de la poésie des troubadours. 1–2, Champion, Paris
Horváth Iván (1991): A vers: három
megközelítés. Gondolat, Budapest
Horváth Iván (2006): Gépeskönyv.
Balassi, Budapest
Mölk, Ulrich – Wolfzettel, Friedrich
(1972): Répertoire métrique de la poésie lyrique française des
origines à 1350. Wilhelm Fink Verlag, München
Naetebus, Gotthold (1891): Die
nicht-lyrischen Strophenformen des Altfranzösischen. Hirzel, Leipzig
•
WEBCÍM
Seláf Levente (2008): Chanter plus haut.
La chanson religieuse vernaculaire au Moyen Âge (essai de
contextualisation). Honoré Champion, Paris
Seláf Levente – Noel Aziz Hanna,
Patrizia – Driel, Joost van (2010): Simple Strophic Patterns –
Formes strophiques simples, Akadémiai, Budapest
|
|