Magyar Tudomány • 2015 4 • Zólyomi Gábor

Az asszíriológia az ókori Közel-Kelet ékírással lejegyzett, sumer és akkád nyelvű szövegeinek filológiai, nyelvészeti és történeti vizsgálatával foglalkozó tudományág. Ókori szövegekkel foglalkozó tudományként a 80-as évek közepén az asszíriológusok legfontosabb kutatási eszközei a nyomtatott könyvek és folyóiratok voltak. Ezekben publikálták a szerencsésebb, nagy múzeumi ékírásos gyűjteményekhez hozzáférő kutatók az ékírásos szövegek átírásait, másolatait vagy a kor színvonalának megfelelő fényképeit. A legnagyobb gyűjtemények Londonban, Párizsban, Berlinben, Philadelphiában, Chicagóban, New Havenben és Isztambulban találhatók. Az itt lévő táblák egy része a 19. század végi és 20. századi angol, német, francia és amerikai ásatásokból származik, másik része rablóásatásokból.

A 80-as években az ékírásos szövegekhez való hozzáférés szigorúan szabályozott és ellenőrzött volt. A szakma vezető kutatóinak, professzorainak előjogai voltak: lehetőségük volt szövegek, szövegcsoportok „lefoglalására”, ami azt jelentette, hogy akár évtizedekig senki másnak nem volt módja a kiválasztott szövegek tanulmányozására; és ha már végképp nem jutott idejük rá, akkor a professzorok megengedték, hogy nekik kedves tanítványaik foglalkozzanak a szövegekkel. Előadásomban azt szeretném bemutatni, hogy több mint harminc év elteltével, miként változott meg gyökeresen az imént vázolt állapot, elsősorban az asszíriológiában végbement digitális fordulat révén.
Mielőtt azonban a részletekre térnék, szeretnék két, jelenleg a University College Londonban dolgozó asszíriológust bemutatni. Nem lényegtelen körülmény, hogy mindkettőjük nő, ez a tény már maga is változásokat jelez a harminc évvel ezelőtti állapotokhoz képest. Az első közülük Prof. Eleanor Robson, aki bemutatkozó honlapján tevékenysége egyik fő súlypontjaként a sztenderdizált online források használatát nevezi meg, az ókori Közel-Kelettel kapcsolatos ismeretek hozzáférésének demokratizálása érdekében (URL1).

A másik asszíriológusról, Karen Radnerről a müncheni Ludwig-Maximilians-Universität honlapján jelent meg az elmúlt hetekben egy hosszabb bejegyzés annak kapcsán, hogy Prof. Radner egyike az idei Humboldt-professzoroknak. Ez a kutatóprofesszori cím ötmillió euróval jár, és egyébként az idei hat professzor mindegyike nő. Az „Új perspektívák a történelemtudományban” címet viselő bekezdésben Radnerről elmondják, hogy a digitális humántudományok egyik képviselője, aki munkáit és szövegkiadásait részben az interneten publikálja (URL2).

Ez a két példa is jelzi az online asszíriológiai tartalmak jelentőségét napjainkban. Az internet azonban nem csupán mint technikai eszköz játszik szerepet. Radner és különösen Robson számára a tudomány már nem a beavatottak szentélye, hanem források és ismeretek halmaza, melyhez mindenkinek egyenlő joga van hozzáférni. Az internet pedig ennek a demokratikus hozzáférésnek a legmegfelelőbb eszköze.

Az első jelentős hatású online asszíriológiai korpusz az oxfordi Electronic Text Corpus of Sumerian Literature volt (URL3 = ETCSL). Az 1998-ban indult projekt célja az i. e. II. évezred eleji ékírásos táblákon fennmaradt sumer irodalmi szövegek online publikálása volt. A projekt 2006-ig működött, ezalatt az idő alatt mintegy négyszáz irodalmi szöveget tett online elérhetővé sumerül, latin betűs átírásban és angol fordításban. További fejlesztésének a projektet vezető Jeremy Black hirtelen és váratlan halála vetett véget.

Az ETCSL célja egy olyan kereshető korpusz létrehozása volt, melyen stilisztikai, irodalmi és nyelvtani kutatások végezhetők. A korpusz valamennyi szövegszava lemmatizált,¹ ezért az egyszerű keresésnél bonyolultabb kutatásokra is alkalmas. Hatását jól összegzik Diana Katz szavai a projekt fordításaiból összeállított antológiáról (Black et al., 2004) írt recenziójában:

„Az eredmények megváltoztatták a sumerológia arculatát: elérhetővé vált az eddig nehezen hozzáférhető, elavult vagy egyszerűen csak publikálatlan szöveganyag, valamennyi ismert töredékes maradványaival együtt. Mindez a gazdagság bármelyik számítógépen rendelkezésre áll. Így nem csak az átlagérdeklődő, hanem a sumer nyelv kutatói és tanulói is mindenfajta technikai kötöttség nélkül ténylegesen a sumer szövegek tanulmányozására koncentrálhatnak.” (Katz, 2006, 552.)

Két dolog is fontos Katz értékelésében. Az egyik, hogy a projekt által publikált szövegek bárhol, bármikor, bárki számára elérhetők. A másik, hogy ez nem egy ismeretterjesztő vállalkozás, hanem egy olyan korpusz, melyet az asszíriológusok ugyanolyan kutatási eszközként használnak, mint korábban a nyomtatott publikációkat. Napjainkban nehéz olyan sumer irodalmi szöveggel foglalkozó munkát találni, amely ne hivatkozna az ETCSL-re, és a hivatkozások jelentős része a társtudományok, például a vallástörténet, irodalomtudomány művelőitől származik.

Az előadás hátralevő részében a két legnagyobb, a szakmát napjainkban leginkább meghatározó digitális asszíriológiai projektről fogok beszélni. Az első a Cuneiform Digital Library Initiative (URL4 = CDLI). A CDLI egy digitális kereshető katalógus, mely célja szerint valamennyi ékírásos szöveghordozót online elérhetővé szeretne tenni. A CDLI honlapján az ékírásos szövegek ásatási és múzeumi adatai mellett megtalálható (legtöbb esetben) a szöveg átírása és a szöveg valamilyen reprodukciója: rajzolt másolata és/vagy fényképe. Az átírásos szövegek nem lemmatizáltak.

A CDLI igazi jelentősége a kutatók számára a szövegek reprodukciójának elérhetővé tétele. A fényképes reprodukcióban hatalmas minőségi ugrást jelent a led-megvilágításos kupola megjelenése, mely az ún. 2D+ technológiát alkalmazza.² Ez az eszköz gyors egymásutánban különböző megvilágításban készít fényképeket az alapvetően háromdimenziós ékírásos szöveghordozókról, melyeket azután egyetlen digitálisan manipulálható fényképpé alakít a kutató céljainak megfelelően. A technológia tehát nem háromdimenziós képet hoz létre, de a létrejövő kétdimenziós kép jóval több részletet képes rögzíteni, mint a hagyományos fényképezés. Ennek a technológiának kettős jelentősége van. Egyrészt feleslegessé teheti a kutató pénz- és időigényes utazását a távoli múzeumi gyűjteményekhez, másrészt rendkívüli mértékben lerövidíti az ékírásos szöveg reprodukciója elkészítésének folyamatát. Egy hosszabb tábla rajzolt másolatának elkészítése hetekbe telhet, és ez a művelet jelentős gyakorlatot és szakértelmet kíván. A led-megvilágításos kupola segítségével a fényképezés mintegy öt perc alatt elvégezhető.

A CDLI katalógusa 2014 decemberében több mint négyszázezer szöveget tartalmazott. A projekt hosszú távú célja a világ valamennyi ékírásos gyűjteményének tervszerű digitalizálása. Honlapja nemcsak online katalógust, hanem kutatási segédeszközöket is tartalmaz, valamint három referált online folyóiratot.

A másik jelentős online asszíriológiai projekt a The Open Richly Annotated Cuneiform Corpus (URL5 = ORACC), melynek Steve Tinney és Niek Veldhuis mellett a korábban említett Eleanor Robson az irányítója. A CDLI és az ORACC több szállal kapcsolódik egymáshoz, például a két projekt közös katalógusszámokat használ.³ Az ORACC célja azonban nem szövegek elérhetővé tétele a világhálón, hanem olyan sztenderdizált digitális eszközkészlet megteremtése, melynek segítségével a kutatók online korpuszokat hozhatnak létre meghatározott kutatási célok elérése érdekében. Az ORACC-korpuszok ennek megfelelően „gazdagon annotáltak”, azaz a kutatók céljainak megfelelően a szövegszavak különböző szempontok szerinti elemzésükkel együtt szerepelnek a korpuszban, és a korpusz az átírásos szöveg mellett az elemzések szerint is kereshető.

Az ORACC 2014 decemberében mintegy negyven alprojektből, vagyis korpuszból áll, melyek közös sztenderdizált formátumot használnak, és ugyanarra a programra épülnek. A számos projekt közül kettőt mutatnék be.

Az első projekt a Digital Corpus of Cuneiform Lexical Texts (URL6 = DCCLT). A mezopotámai lexikális szövegek az írnoki képzésben használt jellisták vagy szólisták, melyek mindenhol megtalálhatóak, ahol az ékírást használták. Ezeknek a listáknak az első évezredi változatai tették lehetővé az ékírás megfejtését, illetve a sumer és az akkád nyelv megismerését. Szinte minden lexikális szöveget publikáltak már nyomtatott formában a Materials for Sumerian Lexicon elnevezésű sorozatban, mely jelenleg 17 kötetből áll. A nyomtatott kötetek, de még kereshető pdf-es változataik is lényegesen kevesebbet nyújtanak, mint a Niek Veldhuis által irányított projekt portálja.

A projekt honlapján publikált szövegek valamennyi szövegszava lemmatizált. A szövegek lemmáit egy kereshető glosszárium tartalmazza, melyben a szavakra kattintva a lemma minden előfordulását kilistázza a honlap. A glosszárium természetesen úgy is elérhető, hogy egy adott szövegben a szövegszóra kattintunk. A lexikális szövegek más mezopotámiai szövegekhez hasonlóan több kéziratban maradtak fenn. A DCCLT honlapján nemcsak a szövegek kéziratok alapján összeállított szerkesztett változatai, hanem maguk a kéziratok is elérhetőek két formában: átírásban, illetve a CDLI-hez vezető linkek segítségével fényképes vagy rajzolt reprodukcióban. A szövegek annotált publikálása mellett a DCCLT honlapján rövid tanulmányok is találhatók a mezopotámiai lexikális korpuszról.
A másik bemutatandó ORACC-projekt az Electronic Text Corpus of Sumerian Royal Inscriptions (URL7 = ETCSRI). Az online korpusz A sumer ige történeti morfológiája elnevezésű, az OTKA által 2008 és 2013 között támogatott kutatási projekt (K75104) kutatási céljait figyelembe véve jött létre e cikk írójának vezetésével.

Az ETCSRI egy nyelvtani kutatás keretében készült, ennek megfelelően a szövegek annotálása eltér a többi ORACC-projekt által alkalmazott annotálástól. A többi ORACC-projekt minden szövegszóhoz csak egy lemmát kapcsol, az ETCSRI azonban minden szövegszóhoz egy morfológiai elemzést is rendel. A morfológiai elemzés kétféleképpen is megjelenik: rekonstruált morfémák soraként és a morfológiai elemzést leíró morfológiai glosszaként. Az alábbi táblázat azt mutatja be, hogy, például, egy lugal-a-ni átírású szövegszónak összesen négyféle megjelenítését tartalmazza a korpusz: a tudományos átírását, a szövegszónak megfeleltethető lemmát, a morfológia elemzését és az elemzés glosszált változatát.

tudományos átírás	lugal-a-ni
lemmatizáció	lugal = king
morfológiai elemzés	N1=lugal.N3=ani.N5=ra
morfológiai glossza	N1=STEM.N3=3-SG-H-POSS.N5=DAT-H

1. táblázat

A morfológiai elemzés szintjén minden morfémát egy összetett címke reprezentál. Egy összetett címke két részből áll: egy ún. pozíciócímkéből, és, az egyenlőségjel után, a rekonstruált morfémából. A pozíciócímkék a morfémák helyét azonosítják a főnévi vagy igei szerkezetekben. A táblázatban látható szövegszó esetében a morfológia megjelenítés olvasata a következő: az első főnévi szerkezeti pozíció, N1, a főnév fejének pozíciója, tartalmazza a lugal szótövet, 3. főnévi szerkezeti pozíció, N3, tartalmazza az /ani/ birtokos névmási enklitikumot, az 5. főnévi szerkezeti pozíció, N5, pedig a humán datívuszi /ra/ esetjelölőt. A projekt öt főnévi és tizenhat igei szerkezeti pozíciót különböztet meg, a szerkezeti pozíciók és a bennük megjelenő morfémák részletes leírása megtalálható a projekt honlapján.

A korpusz valamennyi megjelenítési szinten kereshető. A kereső és a glosszárium segítségével olyan kifinomult keresésekre van lehetőség, melyek egy, csak a szövegek átírását tartalmazó korpuszban elképzelhetetlenek.⁴ Egyetlen kereséssel például kilistázható az összes olyan főnév, mely birtokos névmási enklitikumot tartalmaz, függetlenül a névmás személyétől és számától. A kereső segítségével statisztikailag vizsgálható az igei prefixlánc morfémáinak disztribúciója.⁵

A DCCLT-hez hasonlóan az ETCSRI-ben is linkeken keresztül juthatunk el a szövegek kézirataihoz a CDLI katalógusában.

A jelenleg is bővülő korpusz 2014 decemberében 1420 királyfeliratot tartalmazott, a feliratok angol és magyar fordításával. A korpusz 24 801 szövegszót tartalmaz, melyhez 5814 lemma tartozik.

Ebben az előadásban az asszíriológiai digitális univerzumnak csak a szövegekkel kapcsolatos oldaláról beszéltem. Megemlítendő lehetne azonban az is, hogy szinte valamennyi asszíriológia folyóirat ma már online is elérhető. Az asszíriológiával foglalkozó intézetek egy része pedig, mint például a chicagói Oriental Institute, valamennyi publikációját nyolcvan évre visszamenőleg digitalizálta, és online ingyen elérhetővé tette.

Mindezen fejlemények eredménye, hogy bár az asszíriológia az emberiség írott történetének legrégebbi szakaszával foglalkozik, kutatóeszközeit tekintve mégis a legmodernebb humántudományok egyikének tekinthető.⁶

Kulcsszavak: asszíriológia, ékírás, sumer nyelv, akkád nyelv, lexikális szövegek, online szövegkorpusz, 2D+ technológia

IRODALOM

Black, Jeremy – Cunningham, G. – Robson. E. – Zólyomi, G. (2004): The Literature of Ancient Sumer. Oxford University Press, Oxford–New York

Charpin, Dominique (2014): Ressources assyriologiques sur internet. Bibliotheca Orientalis. 71, 331–358. • WEBCÍM

Hameeuw, H. – Willems, G. (2011): New Visualization Techniques for Cuneiform Texts and Sealings. Akkadica. 132, 2, 163–178. Preprint változat: • WEBCÍM

Katz, Diana (2006): [Review of Black at el. 2004]. Bibliotheca Orientalis. 56, 552–554.

Robson, Eleanor (2014): Tracing Networks of Cuneiform Scholarship with Oracc, GKAB, and Google Earth. In: Rutz, Matthew T. – Kersel, Morag M. (eds.): Archaeologies of Text. Archaeology, Technology, and Ethics. (Joukowsky Institute Publication 6). Oxbow Books, Oxford–Philadelphia, 142–163. • WEBCÍM

URL1: Professor Eleanor Robson, utolsó megtekintés: 2015. január 29

URL2: Neue Alexander von Humboldt-Professorin für LMU, utolsó megtekintés: 2015. január 29

URL3: Electronic Text Corpus of Sumerian Literature

URL4:Cuneiform Digital Library Initiative http://cdli.ucla.edu WEBCÍM

URL5: The Open Richly Annotated Cuneiform Corpus

URL6: Digital Corpus of Cuneiform Lexical Texts

URL7: Electronic Text Corpus of Sumerian Royal Inscriptions

URL8: Hogyan tanítsunk meg sumerül egy honlapot, és minek?

URL9: The Co-occurrences of the Dimensional Verbal Prefixes in Sumerian

LÁBJEGYZETEK

1 A lemmatizálás a különböző szóalakok (szövegszavak) szótári címszavakhoz (lemmákhoz) rendelését jelenti. Egy lemmatizált korpuszban egy számítógépes program egy adott lemma minden előfordulását képes megtalálni, függetlenül attól, hogy milyen toldalékokat visel. <

2 Az eszköz leírásához és a vele készíthető fényképes reprodukciók lehetőségeihez lásd Hameeuw–Willems, 2011. <

3 A CDLI és az ORACC kapcsolatáról részletesebben lásd Robson, 2014, 142–144. <

4 A korpuszról mint kutatási eszközről lásd a Hogyan tanítsunk meg sumerül egy honlapot, és minek? című előadásom szövegét: (URL8). <

5 Ennek a vizsgálatnak a leírása és előzetes eredményei megtalálhatók a projekt honlapján: The Co-occurrences of the Dimensional Verbal Prefixes in Sumerian (URL9). <

6 Az internet asszíriológiai portáljainak legfrissebb áttekintéséhez lásd Charpin, 2014. <