példányszámmal rendelkező újságok alapján
vizsgáltuk, mint például a Public Advertiser vagy Gazetteer and New
Daily Advertiser. Ezeknél a függvényeknél szintén 1781-nél találjuk
az abszolút maximum értékeket. De mi történt ekkor a brit
szabadkőművesség történetében? Az 1780. december 29-én először
bemutatott Harlequin Free-mason című pantomimjátékot a következő
évben hatvanhárom alkalommal játszották a londoni Theatre Royalban.
A nagysikerű színdarabbal kapcsolatban nagy számban jelentek meg
hirdetések és beszámolók az angol sajtóban. Eleddig sem a
színháztörténet, sem pedig a szabadkőműves történetírás nem
foglalkozott e darab elemzésével és kontextualizálásával, pedig az
előadások és az újságcikkek nagy száma alapján minden bizonnyal
jelentős hatással volt a szabadkőművességről kialakított korabeli
társadalmi képre.3 A
színdarab egy eddig javarészt feltérképezetlen kutatási területre
irányította figyelmünket. Az erre épülő alapkutatás számos új
aspektusból világította meg a 18. századi férfitársaságok, köztük a
szabadkőművesség, és a brit színházi élet szoros és élénk
kapcsolatát (Péter, 2016).
Az újságszerkesztőknek és -tulajdonosoknak
kulcsfontosságú szerepük volt és van abban, hogy miről és hogyan
tudósít egy adott sajtóorgánum. Ebből a szempontból sem mellékes
megvizsgálni azt, hogy a szabadkőművességet említő cikkek mely
újságokban milyen számban és milyen gyakorisággal jelentek meg.
Mindkét listán a Morning Chronicle áll a második helyen 1791 és 1813
között. Nem véletlenül, hiszen James Perry, aki az újság tulajdonosa
és szerkesztője ebben az időszakban, az Ősiek Nagypáholyának
helyettes nagymestere volt 1787 és 1790 között. Személyét a
szabadkőműves történetírás mindeddig ignorálta. Annyira nem
tartották korábban fontosnak őt, hogy a 121 történész
közreműködésével létrejött háromkötetes, közel háromezer oldalas, a
jeles 18. századi szabadkőművesek életrajzát tartalmazó Le monde
maçonnique des Lumières: Europe-Amériques & colonies:
dictionnaire prosopographique (Porset – Révauge, 2013) című
kiadványban Perry nevét még csak meg sem említik, jóllehet ő volt az
egyik aláírója annak az Articles of Union (1813) címet viselő
dokumentumnak is, amely az előtte évtizedekig rivalizáló Ősiek és
Modernek Nagypáholyainak egyesítését deklarálta, létrehozván az
azóta is működő Egyesült Angol Nagypáholyt.
A távoli olvasás korlátai és veszélyei
A distant reading módszere ugyan minden korpuszra és
(meta)adatbázisra alkalmazható, ám eredményessége, a használatával
szerezhető ismeretek relevanciája adatbázisonként változó.
Általánosságban elmondható, hogy minél teljesebb, átfogóbb és
metaadatokkal minél gazdagabban és pontosabban ellátott egy
adatbázis, annál precízebb és megbízhatóbb eredményeket kapunk
lekérdezéseink során, feltéve ha szakmailag releváns és az adatbázis
lehetőségeit figyelembe vevő kérdést teszünk fel. Ha például
kulcsszavak előfordulását szeretnénk modellezni címekben vagy
cikkekben egy olyan adatbázisban, ahol a személynevek nincsenek
külön megjelölve vagy felcímkézve, akkor torz eredményekhez vezet,
ha a Christian (‚keresztény’) szó előfordulást ábrázoljuk, mivel a
keresési eredmények között nem csak a keresztény vallásra vonatkozó
találatok szerepelnek, hanem azok is, amelyekben szerepel a
Christian (‚Krisztián’) név. Fontos kritérium az is, hogy a keresési
kifejezés jelentése az idő múlásával csak minimális változáson
menjen keresztül (például: helynevek, tárgyak pontos megnevezései) –
vagy legalábbis az adatok értékelésénél számoljunk ezzel is. Minél
kevésbé kontextusfüggő egy szó jelentése, annál értékelhetőbb
eredményeket kapunk. A távoli olvasás sokszor jól ismert
folyamatokat és eseményeket igazol vissza: miután elkészítettük a
17. századi angol sajtóban a magyar vonatkozású cikkek adatait
tartalmazó adatbázist, nem lepődtünk meg, hogy hazánkról a legtöbb
cikk Buda 1686-os visszafoglalásakor jelent meg (Péter, 2015).
Összegzés és kitekintés
A humán tudományokban zajló digitális fordulat új lehetőségeket és
irányokat kínál a kutatásban. A digitális adatbázisokban korszerű
eljárásokkal rögzített és metaadatokkal ellátott szövegekkel
kapcsolatban eddig nem alkalmazott módszerekkel új kérdéseket
tehetünk fel. Ezek megválaszolása feltáratlan bizonyítékokhoz és
ismeretekhez juttathat el, melyek a szoros olvasáson alapuló
módszerekkel sokszor nem kimutathatók. Így régóta elfogadott
téziseket tudunk tesztelni és újraértékelni, valamint új kutatási
csomópontokat tudunk megrajzolni. Bár legtöbbször egyszerű
kérdéseket teszünk fel az új digitalizált anyaggal és az ehhez
rendelt adatokkal kapcsolatban, ezek megválaszolása bonyolult
szakproblémákhoz vezethet. Néhány évvel ezelőtt még e tanulmányban
említett kérdések feltevése sem volt lehetséges. Az emberiség
történetében most van először lehetőség ilyen típusú elemzések
elvégzésére, mivel a 21. század előtt nem álltak rendelkezésünkre
ilyen volumenű digitális archívumok.
A digitális fordulat nem ássa alá a hagyományos
kutatási formákat és módszereket, inkább erősíti azokat. Moretti
néhány provokatív kijelentésével vitázva úgy gondolom, hogy a távoli
olvasás nem helyettesíti a szövegközeli olvasást, melynek
használatát az említett szerző elavult „teológiai gyakorlatnak”
nevezi. A szövegközeli olvasás módszertanának megszületésekor a
módszer képviselői sokat profitáltak a statisztikai elemzések
kínálta lehetőségekből (Igarashi, 2015). A kvantifikációt megvető
kritikusokkal ellentétben úgy véljük, hogy a kvantitatív és
kvalitatív módszerek a bölcsészettudományok területén is kiegészítik
egymást. Nem a pozitivista szemlélet újbóli térhódítását tükrözi a
statisztikai módszerek használata a digitális bölcsészettudományban.
A kutató – és nem a számítógép – dönti el, milyen változókat mérünk
és hogyan. A digitális és módszertani forradalom új kutatási
eszközöket ad a tudósok kezébe, de ezek eszközök, és nem célok. Az
új eredmények értelmezése és elemzése mindig is a szakavatott
bölcsész feladata marad.
Mind a módszerek, mind pedig az eddig
digitalizált szövegállomány mennyisége és minősége tekintetében a
digitális bölcsészet még gyermekcipőben jár. Olyan kifinomult
kutatási eszközökre és szoftverekre van szükségünk, amelyek úgy
képesek megbirkózni hatalmas mennyiségű szöveggel és metaadattal,
hogy az elemzésnél a bölcsészettudományi kutatásban hangsúlyos
részletek és nüanszok nem vesznek el. Az ilyen innovatív inter-,
multi- és transzdiszciplináris projektek különböző tudományterületek
képviselői közötti együttműködést kívánnak. Kivitelezésük ideális
feltétele az lenne, hogy az elemezni kívánt adatbázis teljes
egészében nyílt hozzáférésű legyen. Manapság az utóbbi részleges
vagy teljes hiánya világszerte súlyos feszültségeket és problémákat
okoz a bölcsészettudományi kutatások területén. A nemzeti és
egyetemi könyvtárak és nem profitorientált magáncégek (például:
ProQuest, Cengage Learning) feladata lenne a nemzeti kultúrkincs
digitális feldolgozása és tárolása.4
A hatalmas digitális és financiális szakadék miatt alapvető
tudományos adatbázisok ráadásul csak vagyonos egyetemeken oktatók
számára érhetők el, így a kevésbé tehetős egyetemeken kutatók fel
sem tehetik azokat a kérdéseket, mint a jómódú egyetemeken
tevékenykedő kollégáik.
Kulcsszavak: digitális bölcsészet, statisztika, adatábrázolás,
big data, távoli olvasás, szabadkőművesség
IRODALOM
Ascari, Maurizio (2014): The Dangers of
Distant Reading: Reassessing Moretti’s Approach to Literary Genres.
Genre, 47, 1, 1–19. DOI: 10.1215/00166928-2392348
Bátori Anna – Labádi Gergely (2015): Egy
regényadatbázis felépítése – kérdések és lehetőségek. Előadás A
számítógép az irodalomtudományban c. workshopon (Budapest, 2015.
november 24). •
WEBCÍM
Eder, Maciej – M. Kestemont – J. Rybicki
(2013): Stylometry with R: A Suite of Tools. In: Digital Humanities
2013: Conference Abstracts. Lincoln: University of Nebraska
Lincoln,), 487–489. •
WEBCÍM
Igarashi, Yohei (2015): Statistical
Analysis at the Birth of Close Reading. New Literary History, 46, 3,
485–504. DOI: 10.1353/nlh.2015.0023
Jannidis, Fotis – Lauer, Gerhard (2014):
Burrows’s Delta and Its Use in German Literary History. In: Erlinn,
Matt –Tatlock, Lynne (eds.): Distant Readings: Topologies of German
Culture in the Long Nineteenth Century. Camden House, Rochester, NY,
29–54. •
WEBCÍM
Jockers, M. L. (2013): Macroanalysis:
Digital Methods and Literary History. Univ. of Illinois Press,
Urbana
Jockers, Matthew L. (2014): Text
Analysis with R for Students of Literature (Quantitative Methods in
the Humanities and Social Sciences). Springer-Verlag, Cham
Juola, Patrick (2013): Using the Google
N-Gram Corpus to Measure Cultural Complexity. Literary and
Linguistic Computing, 28, 4, 668–675. DOI: 10.1093/llc/fqt017
Labádi Gergely (2014): Franco Moretti,
Distant Reading. [könyvismertető] Irodalomtörténet. 95, 4, 561–564.
•
WEBCÍM
Labádi Gergely – Bátori Anna (2015): A
magyar regény adatbázisa. kézirat
Michel, Jean-Baptiste et al. (2011):
Quantitative Analysis of Culture Using Millions of Digitized Books.
Science, 331, 6014, 176–182. DOI: 10.1126/science.1199644 •
WEBCÍM
Moretti, Franco (2005): Graphs, Maps,
Trees: Abstract Models for a Literary History. Verso, London
Péter Róbert (2011): Researching
(British Digital) Press Archives with New Quantitative Methods.
Hungarian Journal for English and American Studies. 17, 2, 283–300.
•
WEBCÍM
Péter Róbert (2015): Digitális és
módszertani fordulat a sajtókutatásban: A 17–18. századi magyar
vonatkozású angol újságcikkek „távolságtartó olvasása”. AETAS 30.1,
5–30. •
WEBCÍM
Péter Róbert (ed.) (2016): British
Freemasonry, 1717–1813. I–V. Routledge, New York, (Vol. 5.)
Phillips, Murray G. – Osmond, G.–
Townsend, S. (2015): A Bird’s-eye View of the Past: Digital History,
Distant Reading and Sport History. International Journal of the
History of Sport. Published online 28 October 2015. DOI:
10.1080/09523367.2015.1090976 •
WEBCÍM
Porset, Charles – Révauger,
Marie-Cécile (2013): Le monde maçonnique des Lumières:
Europe-Amériques & colonies: dictionnaire prosopographique. H.
Champion, Paris
Roivainen, Eka (2014): Changes in Word
Usage Frequency May Hamper Intergenerational Comparisons of
Vocabulary Skills: An Ngram Analysis of Wordsum, WAIS, and WISC Test
Items. Journal of Psychoeducational Assessment. 32, 1, 83–87. DOI:
10.1177/0734282913485542
Roth, Steffen (2013): The Fairly Good
Economy: Testing the Economization of Society Hypothesis Against a
Google Ngram view of Trends in Functional Differentiation
(1800–2000). Journal of Applied Business Research. 29, 5, 1495–1500.
•
WEBCÍM
Schwartz, Tim (2011): Culturomics:
Periodicals Gauge Culture’s Pulse. Science. 332, 6025, 36. DOI:
10.1126/science.332.6025.35-c •
WEBCÍM
LÁBJEGYZETEK
1 Kokas Károly, Labádi
Gergely, Péter Róbert, Digitális bölcsészet Szegeden –
konferenciafelhívás (2015. október 12)
URL1. Ezúton mondok köszönetet
Labádi Gergely kollégámnak e tanulmány korábbi verziójához fűzött
építő és értékes megjegyzéseiért, valamint azért, hogy utalhattam A
magyar regény adatbázisa című projekt eddig publikálatlan
eredményeire.
<
2 Stephen Ramsay
algorithmic criticism, Matthew Jockers macroanalysis fogalmai és
módszerei számos hasonlóságot mutatnak a Moretti-féle distant
reading-gel.
<
3 A színdarabot még
huszonnégyszer játszották 1789-ben és 1793-ban.
<
4 Óriási veszélyeket
hordoz magában, hogy a digitalizált kultúrkincseket magáncégek
tárolják. Gondoljunk itt a több milliárd dolláros adósságot
felhalmozó Cengage Learning által 2013 júliusában bejelentett
csődeljárásra. Az akkoriban több mint száz adatbázist birtokló céget
végül az átstrukturálás megmentette.
<
|