Az első projekt a Digital Corpus of Cuneiform
Lexical Texts (URL6 = DCCLT). A mezopotámai lexikális szövegek az
írnoki képzésben használt jellisták vagy szólisták, melyek mindenhol
megtalálhatóak, ahol az ékírást használták. Ezeknek a listáknak az
első évezredi változatai tették lehetővé az ékírás megfejtését,
illetve a sumer és az akkád nyelv megismerését. Szinte minden
lexikális szöveget publikáltak már nyomtatott formában a Materials
for Sumerian Lexicon elnevezésű sorozatban, mely jelenleg 17
kötetből áll. A nyomtatott kötetek, de még kereshető pdf-es
változataik is lényegesen kevesebbet nyújtanak, mint a Niek Veldhuis
által irányított projekt portálja.
A projekt honlapján publikált szövegek valamennyi
szövegszava lemmatizált. A szövegek lemmáit egy kereshető
glosszárium tartalmazza, melyben a szavakra kattintva a lemma minden
előfordulását kilistázza a honlap. A glosszárium természetesen úgy
is elérhető, hogy egy adott szövegben a szövegszóra kattintunk. A
lexikális szövegek más mezopotámiai szövegekhez hasonlóan több
kéziratban maradtak fenn. A DCCLT honlapján nemcsak a szövegek
kéziratok alapján összeállított szerkesztett változatai, hanem maguk
a kéziratok is elérhetőek két formában: átírásban, illetve a
CDLI-hez vezető linkek segítségével fényképes vagy rajzolt
reprodukcióban. A szövegek annotált publikálása mellett a DCCLT
honlapján rövid tanulmányok is találhatók a mezopotámiai lexikális
korpuszról.
A másik bemutatandó ORACC-projekt az Electronic Text Corpus of
Sumerian Royal Inscriptions (URL7 = ETCSRI). Az online korpusz A
sumer ige történeti morfológiája elnevezésű, az OTKA által 2008 és
2013 között támogatott kutatási projekt (K75104) kutatási céljait
figyelembe véve jött létre e cikk írójának vezetésével.
Az ETCSRI egy nyelvtani kutatás keretében készült,
ennek megfelelően a szövegek annotálása eltér a többi ORACC-projekt
által alkalmazott annotálástól. A többi ORACC-projekt minden
szövegszóhoz csak egy lemmát kapcsol, az ETCSRI azonban minden
szövegszóhoz egy morfológiai elemzést is rendel. A morfológiai
elemzés kétféleképpen is megjelenik: rekonstruált morfémák soraként
és a morfológiai elemzést leíró morfológiai glosszaként. Az alábbi
táblázat azt mutatja be, hogy, például, egy lugal-a-ni átírású
szövegszónak összesen négyféle megjelenítését tartalmazza a korpusz:
a tudományos átírását, a szövegszónak megfeleltethető lemmát, a
morfológia elemzését és az elemzés glosszált változatát.
tudományos átírás |
lugal-a-ni |
lemmatizáció |
lugal =
king |
morfológiai elemzés |
N1=lugal.N3=ani.N5=ra |
morfológiai glossza |
N1=STEM.N3=3-SG-H-POSS.N5=DAT-H |
1. táblázat
A morfológiai elemzés szintjén minden morfémát egy
összetett címke reprezentál. Egy összetett címke két részből áll:
egy ún. pozíciócímkéből, és, az egyenlőségjel után, a rekonstruált
morfémából. A pozíciócímkék a morfémák helyét azonosítják a főnévi
vagy igei szerkezetekben. A táblázatban látható szövegszó esetében a
morfológia megjelenítés olvasata a következő: az első főnévi
szerkezeti pozíció, N1, a főnév fejének pozíciója, tartalmazza a
lugal szótövet, 3. főnévi szerkezeti pozíció, N3, tartalmazza az
/ani/ birtokos névmási enklitikumot, az 5. főnévi szerkezeti
pozíció, N5, pedig a humán datívuszi /ra/ esetjelölőt. A projekt öt
főnévi és tizenhat igei szerkezeti pozíciót különböztet meg, a
szerkezeti pozíciók és a bennük megjelenő morfémák részletes leírása
megtalálható a projekt honlapján.
A korpusz valamennyi megjelenítési szinten
kereshető. A kereső és a glosszárium segítségével olyan kifinomult
keresésekre van lehetőség, melyek egy, csak a szövegek átírását
tartalmazó korpuszban elképzelhetetlenek.4
Egyetlen kereséssel például kilistázható az összes olyan főnév, mely
birtokos névmási enklitikumot tartalmaz, függetlenül a névmás
személyétől és számától. A kereső segítségével statisztikailag
vizsgálható az igei prefixlánc morfémáinak disztribúciója.5
A DCCLT-hez hasonlóan az ETCSRI-ben is linkeken
keresztül juthatunk el a szövegek kézirataihoz a CDLI katalógusában.
A jelenleg is bővülő korpusz 2014 decemberében 1420
királyfeliratot tartalmazott, a feliratok angol és magyar
fordításával. A korpusz 24 801 szövegszót tartalmaz, melyhez 5814
lemma tartozik.
Ebben az előadásban az asszíriológiai digitális
univerzumnak csak a szövegekkel kapcsolatos oldaláról beszéltem.
Megemlítendő lehetne azonban az is, hogy szinte valamennyi
asszíriológia folyóirat ma már online is elérhető. Az
asszíriológiával foglalkozó intézetek egy része pedig, mint például
a chicagói Oriental Institute, valamennyi publikációját nyolcvan
évre visszamenőleg digitalizálta, és online ingyen elérhetővé tette.
Mindezen fejlemények eredménye, hogy bár az
asszíriológia az emberiség írott történetének legrégebbi szakaszával
foglalkozik, kutatóeszközeit tekintve mégis a legmodernebb
humántudományok egyikének tekinthető.6
Kulcsszavak: asszíriológia, ékírás, sumer nyelv, akkád nyelv,
lexikális szövegek, online szövegkorpusz, 2D+ technológia
IRODALOM
Black, Jeremy – Cunningham, G. – Robson.
E. – Zólyomi, G. (2004): The Literature of Ancient Sumer. Oxford
University Press, Oxford–New York
Charpin, Dominique (2014): Ressources
assyriologiques sur internet. Bibliotheca Orientalis. 71, 331–358. •
WEBCÍM
Hameeuw, H. – Willems, G. (2011): New
Visualization Techniques for Cuneiform Texts and Sealings. Akkadica.
132, 2, 163–178. Preprint változat: •
WEBCÍM
Katz, Diana (2006): [Review of Black at
el. 2004]. Bibliotheca Orientalis. 56, 552–554.
Robson, Eleanor (2014): Tracing Networks
of Cuneiform Scholarship with Oracc, GKAB, and Google Earth. In:
Rutz, Matthew T. – Kersel, Morag M. (eds.): Archaeologies of Text.
Archaeology, Technology, and Ethics. (Joukowsky Institute
Publication 6). Oxbow Books, Oxford–Philadelphia, 142–163. •
WEBCÍM
URL1: Professor Eleanor Robson,
utolsó megtekintés: 2015. január 29
URL2: Neue Alexander von
Humboldt-Professorin für LMU, utolsó megtekintés: 2015. január 29
URL3: Electronic Text Corpus of
Sumerian Literature
URL4:Cuneiform Digital Library Initiative
http://cdli.ucla.edu WEBCÍM
URL5: The Open Richly Annotated
Cuneiform Corpus
URL6: Digital Corpus of Cuneiform Lexical
Texts
URL7: Electronic Text Corpus of
Sumerian Royal Inscriptions
URL8: Hogyan tanítsunk meg
sumerül egy honlapot, és minek?
URL9: The Co-occurrences of the
Dimensional Verbal Prefixes in Sumerian
LÁBJEGYZETEK
1 A lemmatizálás a
különböző szóalakok (szövegszavak) szótári címszavakhoz (lemmákhoz)
rendelését jelenti. Egy lemmatizált korpuszban egy számítógépes
program egy adott lemma minden előfordulását képes megtalálni,
függetlenül attól, hogy milyen toldalékokat visel.
<
2 Az eszköz leírásához és
a vele készíthető fényképes reprodukciók lehetőségeihez lásd
Hameeuw–Willems, 2011.
<
3 A CDLI és az ORACC
kapcsolatáról részletesebben lásd Robson, 2014, 142–144.
<
4 A korpuszról mint
kutatási eszközről lásd a Hogyan tanítsunk meg sumerül egy honlapot,
és minek? című előadásom szövegét: (URL8).
<
5 Ennek a vizsgálatnak a
leírása és előzetes eredményei megtalálhatók a projekt honlapján:
The Co-occurrences of the Dimensional Verbal Prefixes in Sumerian
(URL9).
<
6 Az internet
asszíriológiai portáljainak legfrissebb áttekintéséhez lásd Charpin,
2014.
<
|