Magyar Tudomány • 2016 11 • Seláf Levente

A bölcsészinformatika s azon belül a digitális filológia világviszonylatban is korán, már az 1990-es években fontos szerepet játszott a magyar tudományban (hálózati szövegkiadások, adatbázisok létrehozásával). Az e tudományágnak szentelt első központ az ELTE-n 1997-ben Horváth Iván vezetésével megalakított BIÖP (Bölcsészettudományi Informatika Önálló Program) műhelye volt, amely több hálózati kritikai kiadást, digitális formában elérhető tananyagot és tudományos cikket készített, valamint konferenciákat szervezett a digitális átalakulás következtében a filológiára váró kihívásokról és az ennek következtében elkerülhetetlenné váló szemlélet- és paradigmaváltásról az irodalmi szövegek értelmezésében. Ebből a műhelyből indult el az itt ismertetendő versrepertórium-építő kezdeményezés is, mely túlélte a BIÖP-öt.

Az első papíralapú versleltárak, főleg a nemzeti irodalomtörténetek segédleteiként, a filológia hőskorában, a 19. században készültek: céljuk egy-egy költészeti hagyomány számbavétele, rendszerezése volt több-kevesebb kritérium (szereztetés adatai, műfajiság, metrikai és ritkábban retorikai-poétikai jellemzők) leírásával. Az alaposabb kidolgozottságú metrikai repertóriumok készítése az 1960-as években indult – elsőként a provanszál trubadúrok műveinek feldolgozásával (Frank, 1962), s különös módon még a 2000-es években is jelent meg nyomtatott formában ilyen kézikönyv. Természetesen az újlatin és a germán nyelvek gazdag irodalmai kívánták meg leginkább az ilyesfajta számvetést; a csekélyebb mennyiségű fennmaradt szöveg alapján ismert költői hagyományok nem szorultak rá feltétlenül hasonló segédeszközre. Az első digitális versrepertórium mégsem az említett irodalmakhoz köthető: Magyarországon az 1601 előtti magyar versek anyagából készítette el a szegedi egyetem kutatócsoportja 1976 és 1992 között Horváth Iván vezetésével az RPHA-t (Répertoire de la poésie hongroise ancienne). Ez már a nyomtatott repertóriumok tanulságainak a figyelembevételével készült, nagyon gazdag szempontrendszer alapján dolgozta fel a verseket, és komplex keresésekre is alkalmas volt.

Egy versrepertórium legnagyobb jelentősége valójában ebben rejlik. Ha jó, akkor nemcsak leltároz, hanem a versek sok paraméterét rögzítve statisztikai alapú mélyelemzéseket és összehasonlításokat is lehetővé tesz, és segíthet a máskülönben nehezen kezelhető, aránylag nagy mennyiségű adat elemzésének segítségével újraírni az irodalomtörténetet, meghatározni egy adott forma, műfaj megjelenésének, elterjedésének állomásait. Például a régi magyar vers történetét is sokkal pontosabban, lényeglátóbban lehet megírni az RPHA segítségével, és sokkal jobban lehet értelmezni Pesti Gábor, Balassi Bálint, Tinódi Sebestyén, Szenczi Molnár Albert költői teljesítményeit, elemezni más nyelvű irodalmak hatását a magyarra a fordítások és formaátvételek szisztematikus katalógusa alapján (például Horváth, 2006). A versrepertóriumoknak köszönhetően nemcsak az egyes verselési, poétikai rendszerek fő szabályai határozhatók meg, hanem az atipikus, újító vagy éppen hibásnak látszó, esetleg más hagyományhoz illeszkedő költemények is értelmezhetővé válnak. Az egyes irodalmi hagyományok kutatási segédeszközeit összekapcsolva pedig lehetőség nyílik arra, hogy az irodalmak közötti kapcsolatokat pontosan feltérképezzük, az areális vagy strukturális alapú hasonlóságokat feltárjuk. A digitális fejlődésnek köszönhetően már nem utópisztikus az elképzelés, hogy a világ minden költői művét sikerülhet egy platformon hozzáférhetővé tenni és azonos kritériumok alapján meghatározni. Ennek a gigantikus vállalkozásnak a laboratóriumi előtanulmányát jelenti a versrepertóriumok összehangolásának kísérlete (Horváth, 1991; Billy et al., 1999; Seláf, 2008).

A Nouveau Naetebus nevet viselő adatbázis előmunkálatai 2003 végén kezdődtek egy posztdoktori kutatás keretében a hollandiai Wassenaarban található Netherlands Institute for Advanced Study ösztöndíjával. Posztdoktori kutatásom témája a középkori francia versek egy csoportjának érdekes sajátossága volt: a hím- és nőrímek ekvivalenciája a versszakok fölötti strukturális szinten (Seláf, 2008). Alapesetben a középkori francia verselésben a nőrímek egy plusz szótagnak számítanak az azonos szótagszámú, de hímrímes verssorokhoz képest, így a több strófából álló énekelt versekben az udvari költészet szigorú metrikai megkötései szerint az egymást követő versszakok azonos pozícióiban álló sorai mindig vagy hím- vagy nőríműek lehetnek. Például ha egy ababcddc rímképletű strófa c ríme az első versszakban nőrím, akkor az összes strófában nőrímet kell találnunk. Ez a homogónia szabálya. A munka során arra kerestem választ, mi magyarázza azt, hogy a nagyon szigorú formai szabályok alapján felépülő ófrancia trouvère-költészetben aránylag sok olyan vers van, mely ezt a szabályt megszegi.

A magyarázat természetesen többrétű, és még ma sem lehet egyértelműen meghatározni az okokat. A legáltalánosabban elfogadott vélemény a gyűjtemény magját kitevő versekkel kapcsolatban az, hogy a heterogóniájuk nem a szerzők ügyetlenségének következménye: azért nem kellett a homogónia szabályát alkalmazniuk, mert ezek a költemények nem éneklésre, hanem recitálásra és olvasásra készültek. A 19. század végén a szabályszegő, heterogonikus versekből Gotthold Naetebus német romanista készített egy repertóriumot (Naetebus, 1891). Ez a különös gyűjtemény minden „hibás” metrikájú verset magába foglalt, nem véve figyelembe, hogy a trouvère-költészet szigorú formai szabályainak kialakítása előtt vagy esetleg azoktól függetlenül készültek. Ez a vegyes anyag tulajdonképpen egy „szemétdomb”, a tökéletlen verseket hordták itt össze egy repertóriumba a filológusok, de ahogy a régészek számára egy régi kultúra szemétlerakója, úgy az irodalomtörténésznek is igazi kincsesbánya lehet egy ilyen gyűjtemény.

Emiatt merült fel, hogy új, elektronikus változatot kell készíteni Naetebus repertóriumából, kiegészítve új szempontokkal és az általa nem ismert, az elmúlt 125 évben feltárt több száz verssel, kézirattal. Miután a versek szabálytalanságának egyik legkézenfekvőbb magyarázata az, hogy szándékosan más poétikai konvenciókat követtek, s ezért más nyelvű vagy szintén ófrancia, de más verselésű költeményekhez igazodtak, olyan új repertóriumban kellett gondolkodni, amely illeszkedhet a többi versrepertóriumhoz is: ugyanolyan szempontrendszer alapján vannak leírva a verstani, poétikai jellemzők. A Nouveau Naetebus eredetileg is úgy készült, hogy könnyen összekapcsolható legyen más elektronikus versrepertóriumokkal, s ezáltal a heterogén korpusz egyes részeinek külső kapcsolódási pontjait is fel lehessen tárni például a középangol, latin, héber vagy flamand nyelvű középkori költészettel.

A versadatbázis fejlesztési fázisa az OTKA hároméves egyéni posztdoktori ösztöndíjával kezdődött 2004-ben. Ezt bővítette kétszer fél évvel (2005, 2006) a Humboldt-alapítvány ösztöndíja, melynek során a frankfurti Johann-Wolfgang Goethe Egyetemen Friedrich Wolfzettel professzor, a trouvère-ek metrikai repertóriumának (Mölk et al., 1972) társszerzője segítette a kutatómunkámat. Az adatbázis tesztverziója 2009-ben készült el. Bár nincs szó óriási korpuszról, az autopszián (a források és nem modern kiadásaik kézbevételén, elemzésén) alapuló, aprólékos és igényes leírás követelménye és az elapadt pénzügyi források miatt – a folyamatos adatfeltöltés és adatgyűjtés ellenére – máig sem sikerült a végleges változatot elkészíteni. Remélhetőleg erre a következő években sikerül megfelelő támogatást szerezni. Jelenleg 367 vers adatai érhetők el nyilvánosan, ebből 248 vers Naetebusnál is szerepelt (de nincs benne minden Naetebus repertóriumában meglévő költemény). Az adatbázisban hetvenhét különféle jellemző rögzíthető minden vers minden egyes változatáról: a koncepció szerint rögzíteni kell a középkori versek kéziratokban tükröződő alapvető variabilitását – ahogy az RPHA is teszi. Az adatbázis a PostgreSQL adatbázis-kezelő segítségével készült. Garas Péter, akkor másodéves programozó matematika szakos hallgató fejlesztette 2007-től, akinek munkáját Gyenese Péter, a BME és az ELTE BTK volt hallgatója korrigálta és folytatta az elmúlt években.

A Nouveau Naetebus célja az volt, hogy mintául szolgáljon más hálózati versrepertóriumok számára is, és a lehető legkönnyebben össze lehessen kötni azokkal, illetve egyéb adatbázisokkal. Az interoperabilitást és az egyszemélyes kutatás lehető legszélesebb nemzetközi recepcióját megcélzó koncepciónak csak egy eleme volt a szabadon

hozzáférhető, mindenki számára nyitott, többnyelvű adatbázis. Ez kiegészült az együttműködés több gyakorlati fórumával. Külföldi kollégákkal létrehoztuk az Ars metrica című hálózati verstani folyóiratot (URL1), melynek tudományos tanácsában vezető irodalomtudósok, metrikusok kaptak helyet. Már 2005-ben elkezdődött a repertóriumok összehangolását megalapozó nemzetközi konferenciasorozat: az Összehasonlító metrikai és poétikai napok (Journées d’études métriques et poétiques comparées) megrendezése az ELTE-n. Eddig hat eseményre került sor ebben a keretben – anyaguk jórészt megtalálható a folyóirat honlapján. A tematikus konferenciák előadásainak anyaga a Poetica et Metrica könysorozatban olvasható, melynek első kötetét az Akadémiai Kiadó adta ki (Noel et al., 2010), a következőket pedig a Cambridge Scholars Publishing jelenteti meg (a másodikat The Poetics of Multilingualism címmel 2016-ban). Az ELTE-n létrejött, a BIÖP örökségét felvállaló Reneszánsz mesterszak hallgatói szerepet vállalnak a karunkon készülő digitális szövegkiadásokban, adatbázis-építésben, s igyekszünk őket a versek digitális feldolgozásának munkálataiba is bevonni. A digitális versrepertóriumok összekapcsolásának első kísérletére is a műhelyünkben került sor: a Király Péter könyvtár-informatikussal közösen kidolgozott, az Open Search kereső és lekérdezési módszeren alapuló Megarep fantázianevű projekttel a Nouveau Naetebus-t és az RPHA-t kötöttük össze. Valószínű, hogy a technikai fejlődés és az új bölcsészinformatikai trendek nem ezt a megoldást, hanem inkább a Linked Data modell alkalmazását fogják megkívánni abban az esetben, ha kettőnél több adatbázist akarunk összekapcsolni – de a kísérlet mindenképpen hasznos volt: egy közös európai verstani és poétikai terminológia kidolgozását is meg tudtuk vele alapozni.

A nemzetközi együttműködés új formáját és lehetőségét jelentette az Európai Unió 2011-ben indult COST IS1005 Medioevo Europeo nevű kutatási és technológiai együttműködési fóruma, melynek célja a középkortudomány digitális kutatási segédleteit készítő műhelyek munkájának összehangolása volt, s a tagok közt számos repertóriumépítő kutató is helyet kapott. A COST-program támogatásával lehetőség nyílt arra, hogy megszervezzük tucatnyi különféle versrepertórium készítőjének két műhelykonferenciáját (Budapest 2013, Madrid 2014), ahol az adatbázisok összekapcsolásának módozatairól egyeztettünk, illetve előkészítettünk egy Horizon 2020 pályázatot. A repertóriumok mindegyike eltérő informatikai és filológiai sztenderdek alapján készült, s a más-más készültségi állapotú adatbázisok összehangolása nagyon bonyolult és meglehetősen költséges feladat. Nem elegendő a nemzetközi sztenderd jelölőnyelvek felhasználását elvárni az egységesítéshez, hiszen a metrikai és poétikai elemzések nagyon aprólékosak némelyik adatbázisban, s ilyen mélységű leírásokra egyelőre még a TEI (Text Encoding Initiative) kódrendszere sem alkalmas. A szervezet legutóbbi útmutatója ugyan már javasol megoldásokat a lírai szövegekre is (P5: Guidelines for Electronic Text Encoding and Interchange, Version 2.9.1, URL2), így a rím- és a metrikai szerkezetek leírására, de még nem megfelelően kidolgozott. Ezért van szükség folyamatos egyeztetésre, közös fejlesztőmunkára az együttműködésre nyitott kutatócsoportok között. Ugyan a 2015-ben spanyol vezetéssel benyújtott első EU-s pályázatunk nem nyert, a pályázó konzorcium angol, francia, német, magyar stb. tagjai bíznak benne, hogy hamarosan sikerül elnyerni egy olyan támogatást, amely lehetővé teszi az adatbázisok összehangolását. Komoly eredmény, hogy az integráció alacsonyabb szintjét elősegítendő már sikerült elnyerni a csoport egyik spanyol tagjának, Elena González Blancónak egy ERC-ösztöndíjat: a projekt célja az Ibériai-félsziget középkori költői hagyományainak közös adatbázisba rendezése.

A Nouveau Naetebus-nak nem csupán az a funkciója, hogy a többi versrepertóriummal összekapcsolva segítse az általános metrikai kutatást, hanem a saját korpuszát is megfelelő mélységben kell szolgáltatnia. Lehetővé kell tennie minden vers kéziratos (mely művekkel szerepel egy kódexben) és műfaji (mely, esetleg más formájú művek tartoznak ugyanebbe a műfajba) kontextusának megismerését, összefoglalni a recepciójára vonatkozó ismereteket, s emiatt az adatbázist össze kell kötni a középkori francia irodalom más kutatási segédleteivel is. Első lépésként a nyilvánosan még nem elérhető szakirodalmi anyagot össze kell kapcsolni a heidelbergi ófrancia etimológiai szótár kitűnő, naprakész bibliográfiájával, majd ezt követően két másik, a középkori francia irodalom teljes körű szövegfeltárására törekvő adatbázissal, az Arlimá-val (URL3) és a JONAS-val (URL4). Az első nonprofit magánvállalkozás, a másik pedig a francia CNRS által bőkezűen szponzorált, egy sok évtizeden át készített cédulakatalógus feldolgozásán alapuló, több kutató munkájával jelenleg is fejlesztett adatbázis. Mindkettő azzal a céllal készült: hogy bibliográfiai (és a JONAS esetében ráadásul kodikológiai) adatokat szolgáltasson a kutatók számára a középkori francia és provanszál művekről: ez a legfőbb ok, ami miatt a Nouveau Naetebus-t is érdemes hozzájuk kapcsolni.

Utolsó lépésként az elemzett művek teljes szövegét tartalmazó adatbázisokhoz történő csatlakozás a cél. Általában sajnos fordított irányú a fejlesztés: jellemző, hogy tömegesen digitalizálnak kéziratokat, régi nyomtatványokat vagy esetleg későbbi (kritikai, tudományos igénnyel készült vagy népszerűsítő) kiadásokat, s utána kezdenek el keresőprogramokat, más szövegelemző módszereket felhasználva egy komplexebb adatbázis kiépítésébe, ami az adatok megbízhatóságát nagyban csökkenti. Szeretném a Nouveau Naetebus-t az elemzett ófrancia szövegek digitalizált kéziratait szolgáltató adatbázisokkal (a legjobb és leggazdagabb közülük a párizsi nemzeti könyvtár [BNF] Gallica nevű portálja), illetve kritikai kiadásokat szolgáltató más adatbázisokkal is összekötni. Ezek jelentik, a leltározó munka befejezése és teljes közzététele mellett, a repertórium fejlesztésének főbb feladatait.

Az adatbázis-építések, a kritikai kiadások gyakran hosszú, több pályázati cikluson átnyúló feladatot jelentenek, és az informatikai eszközöknek a digitális fejlődés következtében gyors az elavulása. A könyvvel ellentétben az adatbázist meg lehet változtatni, ki lehet javítani, viszont karban is kell tartani, ezért (csekély) finanszírozást igényel még egy sikeresen befejezett kutatómunka után is. A Nouveau Naetebus legutóbb 2009-ben részesült kutatási támogatásban, s a nagyszabású terv befejezéséhez további forrásokra lesz szükség. Remélem, hogy a magyar digitális tartalomipar egyre dinamikusabban fog fejlődni, és lehetővé válik az ilyen jellegű kutatások folytatása és fenntartása. Sokat jelentene, ha Magyarország csatlakozna az Európai Unió Dariah (Digital Research Infrastructure for the Arts and Humanities) hálózatához: ez garantálhatná a közpénzből finanszírozott kutatások eredményeinek fennmaradását és az ingyenes hozzáférést, valamint a magyar kutatási eredmények komolyabb nemzetközi visszhangját, és optimális esetben a Dariah-hálózat külföldi tagjaival közösen benyújtott sikeres európai pályázatokat. Ebben bizakodom.

Kulcsszavak: középkori irodalom, költészet, adatbázis, metrika, poétika, adatbázisok összekapcsolása, versrepertórium

IRODALOM

Billy, Dominique – Glon, Thierry (1999): Vers un répertoire métrique général des strophes du moyen âge. In: Billy, Dominique (éd.): Métriques du moyen âge et de la Renaissance. L’Harmattan, Párizs, 305–15.

Frank István (1966): Répertoire métrique de la poésie des troubadours. 1–2, Champion, Paris

Horváth Iván (1991): A vers: három megközelítés. Gondolat, Budapest

Horváth Iván (2006): Gépeskönyv. Balassi, Budapest

Mölk, Ulrich – Wolfzettel, Friedrich (1972): Répertoire métrique de la poésie lyrique française des origines à 1350. Wilhelm Fink Verlag, München

Naetebus, Gotthold (1891): Die nicht-lyrischen Strophenformen des Altfranzösischen. Hirzel, Leipzig • WEBCÍM

Seláf Levente (2008): Chanter plus haut. La chanson religieuse vernaculaire au Moyen Âge (essai de contextualisation). Honoré Champion, Paris

Seláf Levente – Noel Aziz Hanna, Patrizia – Driel, Joost van (2010): Simple Strophic Patterns – Formes strophiques simples, Akadémiai, Budapest