A Magyar Tudományos Akadémia folyóirata. Alapítva: 1840
 

KEZDŐLAP    ARCHÍVUM    IMPRESSZUM    KERESÉS


 EGY XVIII. SZÁZADI ÍRÓI KORPUSZ MODERN FELDOLGOZÁSA

X

Kiss Margit

PhD, tudományos munkatárs, MTA Bölcsészettudományi Kutatóközpont Irodalomtudományi Intézete

kiss.margit(kukac)btk.mta.hu

 

A digitális Mikes-szótár


A digitális Mikes-szótár projekt (OTKA K 81 337, témavezetője Tüskés Gábor) indulásakor két alapvető célt tűzött ki maga elé: egyfelől a hazai írói szótárirodalom hiánypótló művének elkészítését, másfelől a digitális szótárkészítés módszerének kialakítását ebben a speciális műfajban. Ezzel a vállalkozással az első teljes életművet feldolgozó magyar elektronikus írói szótár készítése vette kezdetét, eredményeiben azonban jóval tovább mutat a vállaltaknál.

Az írói szótár fő célja, hogy egy-egy szerző életművének meghatározó részét vagy akár a teljes szókincs alapján az egészét bemutatva láttassa a nyelvhasználat, a stílus, a szó- és kifejezéskészlet elemeit. Mivel a papíralapú szótárakban lényegében egy-egy szócikkre fókuszálunk, a kereshetőség meglehetősen redukált, ami többnyire egy-egy szó, egy-egy adott szöveghely értelmezésére koncentrálódik. A digitális szótár segítségével az adatok rendszerezése és megtalálhatósága több szempontból is kedvezőbbé válik a papíralapú kötetekkel szemben. A kötetbeni megjelenés számos korlátozó funkció alkalmazását teszi szükségessé, így például a példaanyag szűkítését, bonyolult utalórendszer, terjedelmi megszorítások kialakítását. Ezzel szemben a digitális szótárakban nem indokoltak a használhatóságot megnehezítő, sokszor bonyolult korlátozások; a terjedelmi korlátok megszűnnek, sőt az adatok közti kapcsolatrendszer kialakításának az informatikai környezet kedvez igazán. A keresések gyorssá, pontossá és hatékonnyá válnak. A kutatásokban a digitális szótár egyfajta módszertani szemléletváltást is eredményez: itt azoknak az adatoknak a lekérdezésére is lehetőség nyílik, amelyekre ezidáig a papíralapú szótárak használatával egyáltalán nem vagy csak igen jelentős energiaráfordítással lehetett esély. Ezáltal új összefüggések megfogalmazására is mód nyílik. E módszertani váltás eredményeképpen a szótár hozzáadott értéke jóval több lesz, mint a hagyományos értelemben vett szótáré. Segítségével nemcsak korábbi megállapításokat vizsgálhatunk, hanem új kutatási irányokat is kijelölhetünk, amelyek még feltáratlanok, vagy nem volt mód, eszköz, lehetőség a vizsgálatukra. Ha nemcsak a nagy terjedelmű szövegek tárolási kapacitását látjuk egyedüli lehetőségként az informatika nyújtotta előnyök között, hanem olyan számítógép támogatta módszereket is alkalmazunk, amelyekkel más perspektívából vizsgálhatjuk, elemezhetjük és értelmezhetjüük a szövegeket, a digitális írói szótár új eredmények elérésében nyújt segítséget irodalomtörténeti, nyelvészeti, filológiai szempontból egyaránt.

Mikes életműve hatezer oldalnyi terjedelmével, összesen másfél millió szavával önmagában is kiemelkedik a hazai írói életművek sorából: ez a mennyiség háromszor több Petőfi és ötször több József Attila írásainál, de A magyar irodalmi és köznyelv szótárának – közismertebb nevén a Nagyszótárnak – elektronikus szövegkorpusza, amely 1772-től napjainkig tartalmaz szövegeket, jelenleg mindössze tizennyolcszorosa a Mikes-korpusznak. Az életmű szótári feldolgozása (URL1) a terjedelem miatt aligha képzelhető el informatikai támogatás nélkül, de nem nélkülözhető a manuális munka sem. (A szótári munkafolyamatokról részletesebben lásd Kiss, 2012). Az elmúlt századok szövegei nem szabályozottak, sokszor még ugyanannak a szerzőnek különböző műveiben is ingadozik az írásmód, így a központozás hiánya, a szavak, szerkezetek szegmentálási anomáliái jelentős mértékben nehezítették és lassították a gyors és automatikus elemzést. Az előzetes kézi feldolgozás a későbbi gépi eljárásokat támogatja, hiszen a mai címszavakhoz történő rendezés a gépi kereshetőség alapfeltétele. A szótárszerkesztésben kulcsfontosságú, hogy a lehető legoptimálisabban segítsük a számtalan eltérő változatú és régies írásmódú szó keresését. Nemcsak az a Mikes-szótár előnye, hogy a teljes kritikai kiadás szöveganyagát dolgozza fel, hanem az is, hogy jelentősen megkönnyíti a szavak kereshetőségét: akár a mai alak alapján, akár bármely régies alakváltozat alapján, akár ragozott alakokkal végzünk lekérdezéseket, minden esetben eljuthatunk a vonatkozó szócikkhez. A szavak megtalálhatóságát optimalizáltuk a különböző címszóvariánsok felvételével és a más címszavakkal fennálló kapcsolódások láttatásával. A keresési spektrum szélesítésével a szótárhasználó megtalálja a keresett szót akkor is, ha több variánsa van, s az általa keresett variáns eltér a szövegből meghatározható címszóváltozattól. Ezenkívül egyéb – különböző szavak közti – összefüggésekre is rávilágítunk. Minderre azért fektettünk hangsúlyt, mert ha a tökéletlen keresések miatt pontatlan eredményeket kapunk, az erre támaszkodó kutatások is tévútra vihetnek. Választ kaphatunk azokra a kérdésekre is, hogy Mikes mely szavakat használt és melyeket nem, így például megvan-e nála a csoda, kanál szó – függetlenül attól, hogy leírta-e ebben a mai formájában vagy sem. Megtudhatjuk azt is, hogy melyek azok a szavak, amelyek az író önálló szóalkotásai, és más szótárban nem találjuk meg őket, mint például a halálszolgálat, varrótűeső stb. Az utalások segítségével eljuthatunk más, vonatkozó címszavakhoz akár szótáron belül, akár más szótárak állományához, de listázhatjuk a török eredetű szavakat és a tulajdonneveket is (Kiss, 2014). A kialakított eljárások más hasonló munkálatokban is eredményesen alkalmazhatók. A szűkebb értelemben vett szótári, de általában véve az informatikai támogatású feldolgozási módszerek lehetővé teszik, hogy a korábbiaktól eltérő módon vizsgálhassunk terjedelmes szövegeket (1. ábra).


Új módszerek a filológiai vizsgálatokhoz


A Mikes-filológiában az új módszerek alkalmazási területeinek feltérképezéseinél járunk, de már ebben a korai fázisban is figyelemre méltó eredmények születtek irodalomtörténeti, stilisztikai, grammatikatörténeti és az írói alkotófolyamatok alaposabb megismerése szempontjából. A digitális szótár szerepe az írói életmű vizsgálatában túllép a kizárólagos szótári funkciókon. A számadatok, statisztikák és a tetszőlegesen szűrt, különféle szempontok szerint rendezett szólisták új összefüggések láttatására alkalmasak. A Törökországi levelek mellett a tizenhétszer nagyobb mennyiségű, franciából átültetett Mikes-fordítások kevésbé kerültek ezidáig a figyelem középpontjába: a saját szerzőségű művel szemben az irodalmi kánonban nem töltöttek be jelentős szerepet. A mintegy tízezer elkészült szócikk alapján végzett vizsgálat cáfolni látszik a korábbi megállapításokat. A Leveleskönyv és a fordítások címszavainak összevetéséből arra következtethetünk, hogy a szókészlet markáns elkülönülése miatt nemcsak a Mikes-kutatásokból, de a kortörténeti szintézisekből sem mellőzhetők a fordítások szavai. Az előremutató nyelvi, stilisztikai változásokat valójában a fordítások szókészletállományában fedezhetjük fel. Eszerint – szemben az eddigi vélekedésekkel – fordításaiban Mikes nemcsak a koránál, hanem a saját szerzőségű műveinél is modernebb szemléletet képviselt. A XVIII. században a szóösszetétel mint szóalkotási forma meghatározó volt a még csak kialakulóban lévő szaknyelvi műszavak létrehozásában. A fordításokban találni jelentősebb mennyiségű összetételt, és itt látszanak a XIX. századot megelőlegező, újító jegyek.

Ahogy a maga idejében a Petőfi-szótár a -ság, -ség képző speciális használatára irányította a figyelmet, úgy a Mikes-szótárban a konkordancialista feldolgozása során is kirajzolódtak azok a grammatikai kérdések,

 

 

amelyek részint a szerzői nyelvhasználatot (például a való sajátos szerepe, kötőszói funkciók, igeidők, egyeztetés, bővítmények tanulmányozása), részint a korszak nyelvi állapotát (például az ikes paradigma fellazulásának a folyamata, a mondván idéző szerepben és grammatikalizációs jelenségek) láttatják új perspektívából (Kiss – T. Somogyi, 2014). A különféle szólisták előállítása teremti meg az alapot ezekhez az elemzésekhez. A mondván esetében a határozói igenévből a mára már a kötőszóvá válás határára jutott folyamatnak a középmagyar kor az egyik jelentős állomása (Dömötör, 2013). Ennek a vizsgálatnak a Mikes-korpusz is része volt, amelyet tovább elemeztünk művek szerinti eloszlásban is. Azt tapasztaltuk, hogy Mikes funkcionálisan, vélhetően tudatosan használta a kétféle idézési mód (egyenes és függő) kifejezésére és elkülönítésére a mondván-t: a folyamatos, gördülékeny, az élőbeszéd jegyeit mutató függő beszéd beépítésére, valamint a biblikus, archaikus hangnemet sugalló egyenes idézés bevezetésére. Mindez részletkérdésnek tűnhet, ám távolabbi perspektívából nézve az írói szövegalkotási folyamatokra is tudunk az ehhez hasonló adatokból következtetni. A vizsgálat ráirányította a figyelmet arra is, hogy a saját szerzőségű művein kívül Mikes fordítói módszere szintén elismerésre méltó stilisztikai teljesítmény. A szókincsvizsgálat mellett a grammatikai elemzések szintén azt támasztották alá, hogy az életmű eddig kevéssé feldolgozott és értékelt részének, a fordításoknak a mellőzése vagy háttérbe szorítása revideálandó.

A kritikai kiadásban az életmű papíralapú feldolgozása korábban nem tett lehetővé ilyen típusú szókeresésekre, statisztikai vizsgálatokra is támaszkodó kutatásokat, de a szónál nagyobb egységeket érintő vizsgálatokra is korszerűbb lehetőségünk van már. Az informatikai támogatású szövegelemzések új eredményekkel szolgáltak. A Törökországi levelek kollokviális előadásmódja, közvetlen, társalkodó hangvétele sokáig központi eleme volt a Mikes-elemzéseknek, és kevesebb figyelem jutott arra, hogy a levélírói alkotófolyamatban meghatározó szerephez jutott az azzal párhuzamosan végzett fordítói munka. Hopp Lajos a kritikai kiadás elkészítését követően megállapította, hogy a Leveleskönyv szövegének mintegy 23%-a a levelekbe szőtt fordításbetét (Hopp, 2002). A szótári munka során a konkordancialista feldolgozásakor kiderült, hogy az életmű különböző, olykor távoli pontjai között szövegszerű összefüggések rajzolódnak ki; vannak súlyozott és kevésbé érintett területei e tekintetben. A részletes összefüggések feltárására ezidáig a nagy szövegterjedelem és a technológia hiánya miatt nem volt mód. Olyan szöveghasonlóságokról és -párhuzamokról van szó, amelyeknél ugyan nem áll fenn a teljes szövegegyezés, de kisebb variánsokat találni a szövegrészletek között, és manuális eszközökkel nincs lehetőség kigyűjteni ezeket. Emiatt automatizáltuk a szövegvándorlások számítógépes támogatással történő listázását a történeti szövegkorpuszból. Nemcsak a szóról szóra meglévő egyezést tudjuk már lajstromozni a korpuszban, hanem azokat a variánsokat is meg tudjuk találni, amelyeknél valamiféle eltérés (például írásmódbeli különbség, kisebb alaki variációk, közbetoldások) mutatkozik a szövegben, de fennáll a tágabb értelemben vett szövegazonosság vagy szöveghasonlóság. E módszer jelentősége abban áll, hogy mindezt célzott szókeresés nélkül érhetjük el XVIII. századi szövegben. A szövegkritikai vizsgálatok következő lépése a számítógép által készített gyűjtés módszeres feldolgozása. Már a részletes elemzés és alapos feldolgozás előtt is látszik, hogy jelentős mennyiségű szöveg vándorol a művekben; esetenként akár hét különböző helyen is előfordul ugyanaz a (tag)mondatnyi részlet. Ezzel a módszerrel összehasonlíthatatlanul többet fogunk tudni az írói alkotófolyamatokról, szerzői módszerekről az egész életmű alapján.


Összegzés, jövőbeni feladatok


Az alkalmazott módszereket, néhány részterületet és kutatási irányt felvázolva arra szerettem volna felhívni a figyelmet, hogy a digitális szótár teremtette új módszerek alkalmazásával jóval közelebb kerültünk a Mikes-filológia nyitott kérdéseinek megválaszolásához. Tisztázásra vár, hogy a különböző fordításaiban a szerző miért kezelte eltérő módon a bibliai idézeteket; a Káldi-féle Biblia hatása mellett Károli fordításának a nyomai hol, milyen mértékben érhetők tetten. Az új módszerekkel könnyebbé válhat mindezek pontosítása, a további rokonszövegek feltárása és a szövegek továbbélésének felderítése. További feladat, hogy kiderítsük, bizonyos fordítások esetében az adott műnek mely kiadása szolgált forrásul, és elvégezzük az alkotófolyamatok mélyrehatóbb tanulmányozását. A teljes életművet aprólékosabban, hatékonyabban és új perspektívából tudjuk vizsgálni.

Terveink között szerepel a szóértelmezések rendszerének kialakítása. A kontextuális jelentések definícióinak megadása a hagyományos módszerekkel számos szubjektív megoldást rejt, és az egyes szöveghelyhez történő kötődésük miatt izoláltan nem lennének alkalmasak összefüggéseiben és egészében láttatni a szerzői világképet. Ezért a jelentések megadását meghatározott fogalomkörökhöz történő besorolással végeznénk el egyfajta ontológiát létrehozva, amely lehetőséget teremtene informatikai feldolgozások számára is.

A digitális Mikes-szótár készítése korszerű alapokra helyezte a lexikográfiai munkákat. Új kutatási területek körvonalazódnak, amelyek túlmutatnak a szűkebb értelemben vett szótári tevékenységen. Az informatika alkalmazásának és a megváltozott eszköztárnak köszönhetően Mikes életművének feldolgozásával a kutatási módszertant is szeretnénk továbbfejleszteni és kiegészíteni a szövegek összehasonlításának különféle módozataival. Az MTA Bölcsészettudományi Kutatóközpont Irodalomtudományi Intézete és a Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Méréstechnika és Információs Rendszerek Tanszékének együttműködése megteremtette a megfelelő alapot ehhez: első lépésben megkezdtük a kritikai jegyzetanyag korszerű feldolgozását egy kibővített szótár létrehozásának érdekében. Csak úgy érhetők el jelentős eredmények, ha a bölcsészet és az informatika közös célok megfogalmazására válik képessé.
 



Kulcsszavak: digitális írói szótár, Mikes, korpusz
 


 

IRODALOM

Dömötör Adrienne (2013): Idéző szerkezetből diskurzusjelölő elem: a mondván szerepei és története. In: Csepregi Márta – Kubínyi K. – Jari Sivonen (szerk.): Grammatika és kontextus. Új szempontok az uráli nyelvek kutatásában III. ELTE, Budapest, 20–30. • WEBCÍM

Hopp Lajos (2002): A fordító Mikes Kelemen. (Tüskés Gábor szerk.) (Historia Litteraria 12) Universitas, Budapest
Kiss Margit (2012): A digitális Mikes-szótár. Magyar Tudomány. 173, 3, 279–284. • WEBCÍM

Kiss Margit (2014): Mit tészen ez a szó? – Az elektronikus Mikes-szótár. In: Korompay Klára – Stemler Á. – Terbe E. – C. Vladár Zs. (szerk): Forráskutatás, forráskiadás, tudománytörténet II. Magyar Nyelvtudományi Társaság, Budapest, 48–56. • WEBCÍM

Kiss Margit – T. Somogyi Magda (2014): A digitális Mikes-szótár: nyelvtörténet és számítógépes lexikográfia találkozása. In: Ladányi Mária – Vladár Zs. – Hrenek É. (szerk.): Nyelv – társadalom – kultúra. Interkulturális és multikulturális perspektívák I–II. (MANYE XXIII) Tinta, Budapest, 651–657. 

 


 

 

1. ábra <