említett online szolgáltatás segítségével ez a
dinamika is tanulmányozható animált térképeken.
Mindhárom intézményi térképtől különbözik az MTA
kibocsátásának szerkezete. Mint az várható, lévén az MTA egyfajta
„szuperintézmény”, vagyis az egyes tagintézetek profiljának
aggregációjával keletkezett vizsgálati egység, az Akadémia a tudomány
minden területén jelentős (sőt, az itt nem szereplő intézményekkel
végzett összehasonlítás alapján: többnyire országosan a
legjelentősebb) részesedéssel bír a hazai össztermésből. A széles
skála és a nagy átlagos csomópontméret (vagyis szakterületi
részesedés) mellett azonban ez a kép sem teljesen egyöntetű. A
kibocsátási oldalon itt is megkülönböztethetőek kisebb súlyú, közepes
méretű, illetve „húzóágazatok”. Az utóbbiakat a térkép
természettudományi régiójában
egyértelműen az egymással viszonylag szoros
kapcsolatban álló fizika, anyagtudomány, illetve, valamivel ezek
mögött, a kémia és mérnöki tudományok képviselik. Ez a megállapítás a
térképek tanúsága szerint nem csupán az MTA belső viszonyaira, de a
többi intézménnyel való összevetésre is vonatkoztatható. Főként a
többi térképhez mérten jelentős a számítástudomány mérete (a vizsgált
intézmények közül egyedül a BME teljesítménye múlja felül.) Intenzív,
az említett egyetemekével összemérhető (illetve azt meghaladó)
kibocsátás jellemzi az élet- és földtudományi területeket. A térkép
belső viszonyait tekintve a klinikai orvostudomány részterületei a
legkevésbé súlyosak, de további összehasonlításokban mégis
összemérhetők az SZTE vagy a DE hozzájárulásával.
Az MTA térképén figyelemreméltó a
társadalomtudományi térfél is, itt is látunk húzóágazatot (sőt nem
csupán a társadalomtudomány, hanem a teljes rendszer vonatkozásában).
A pszichológiai–nyelvészeti terület számos tárgykategóriája ugyanis
szembeötlő módon a fizika és anyagtudomány csomópontjainak
mérettartományában van. Hasonlóan kiemelkedő az üzleti és
szervezéstudományok egy részterülete. Kisebb átlagos mérettel, számos
aktív részterülettel képviselteti magát a
közgazdasági-politikatudományi-földrajztudományi rendszer, amely a
Corvinushoz hasonló eloszlást tükröz (és amelyet csak a CEU ide
vonatkozó kibocsátása múl felül a kérdéses intézményi körön belül).
Az intézményi teljesítmények
tárgykategóriánkénti felbontása
Az említett 221 különböző tárgykategória (SC) alkalmas arra is, hogy
segítségükkel az egyes intézmények aktivitását és idézettségét az
intézmények belső viszonyaira lebontva is elemezzük
(az előző térképek csak az erőforrásmegoszlást mutatták, de azt
országos, nem pedig intézményen belüli összehasonlításban).
Elkészítettük ezért a 27 vezető intézmény olyan „sugárdiagramját”,
ahol az egyes tárgyterületek a tudománytérképek kategóriái szerinti
nagyobb tudományterületekbe vannak szervezve, és egy kör kerületén
helyezkednek el (5. ábra). Ezek a tudományterületek megegyeznek
az SC-kategóriák korábban már látott hivatkozási klasztereivel, tehát
nem feltétlenül követik a hagyományos tudományterületi besorolásokat –
néhány, gyakran önállónak tekintett területet hiába keresünk az ábrán
(a matematika például e klaszterezés szerint a mérnöki tudományokhoz
tartozik). A részletes sugárdiagramok a tudományterületekhez tartozó
részletes tématerületeket (SC-kategóriákat) ábrázolják, helyük a
tudományterületi klaszterbe sorolásnak megfelelően kötött.
A középpontból kiinduló „sugarak” az aktivitást,
valamint az idézettséget mutatják be minden egyes tárgyterületre, úgy,
hogy a sugarak hossza a megfelelő értékekkel arányos. Mindez
elméletileg 221 sugarat jelent külön-külön az aktivitási és idézési
adatokra intézményenként, ami első intuícióként jócskán megnehezíti az
ábrázolást. Csakhogy nincs intézmény, amely minden
tárgykategórában egyaránt aktív lenne, és ehhez járul a már látott
nagyfokú egyenlőtlenség (az intézményeken belül is megtapasztalható
hatványfüggvény-szerű eloszlás). Megfelelő küszöb megválasztásával
végülis intézményenként csupán néhány kiemelkedő tárgyterületet
szükséges feltüntetni.
A 6. ábrán azok a tárgykategóriák
szerepelnek, amelyek az adott intézmény kibocsátásának felső 80%-át
adják. A tárgykategórák egymás közti viszonyai, a legaktívabb és a
legtöbbet idézett területek így intézményközi módon összehasonlíthatók
maradnak, ugyanakkor maguknak a sugaraknak a hossza most nem hordoz
összevethető információt: ezek csupán az adott intézményen belüli
relatív mennyiségeket jelölik. (Más szóval: az ábrák skálája eltérő
lesz – a különböző intézményeket, mivel nagyságrendben különböznek,
nem is lehetne egyazon skálán arányosan ábrázolni.)
Fontos figyelembe venni továbbá, hogy ezek a
diagramok – a fentiek szerint – azt állapítják meg, hogy mennyire
eredményesek azon területek, amelyeket az adott intézmény a leginkább
művel, vagyis amelyekre a kutatási (illetve ennek egy aspektusaként, a
publikációs) erőforrásait összpontosítja. Ez azt jelenti, hogy az
alább feltérképezett struktúrák alapja nem az általában vett relatív
eredményesség, hanem a publikációs aktivitáshoz képest vett relatív
eredményesség. Az intézményen belül kis publikációs hangsúlyt kapó
területek tehát a bemutatásba nem kerülnek bele, még akkor sem, ha
(bár ez nem gyakori) az idézettség szempontjából netán eredményesebbek
volnának az intézmény kibocsátását arányaiban leginkább jellemző
területeknél. Ez ismét összecseng azzal a szándékunkkal, hogy ezen a
helyen az intézmények ráfordítási, „termelési” oldaláról közelítjük
meg az adatokat, az e szempontból jelentős területekre koncentrálva.
Néhány kiválasztott intézmény tárgykategóriánkénti
adatait a többkomponensű 6. ábra közli. Az egyes ábrákon
azonosítottuk, és felsoroltuk az intézményre jellemző legfontosabb
területeket, mellettük zárójelben feltüntettük az adott
tárgykategórában készült publikációk és a kapott idézések abszolút
számát. A sugárdiagramokon szürkével a publikációkat, feketével az
idézéseket mutatjuk (a jobb ábrázolhatóság érdekében utóbbiak skálája
azonban az előbbiek ötöde). Az ábrákat mind a 27 kiválasztott
intézményre ismét a
WEBCÍM >
közli .
Első kvalitatív megállapításként feltűnik, hogy
intézményenként mindössze néhány (kettő-négy) terület „uralja” az
ábrát, a belső arányok is (az idézettségnek a közlemények számához
való viszonyszámai) nagyjából hasonlóak. Emlékezhetünk rá, hogyan
helyezkednek el ugyanezek az intézmények a 3. ábrán. A jelentős
pozícióbeli eltérést tehát nem a kiemelkedő területek eltérő száma
adja – hiszen ezek nagyjából hasonlónak mutatkoznak. A meghatározó
különbség a kiemelt területek bizonyos fokig eltérő sikeressége
mellett azok nyers mérete: végső soron a „csúcsterületeken” mutatott
aktivitás foka. (Ez a megállapítás finomabb eszközökkel pontosítható,
lásd Soós – Kampis, 2011).
Érdekes összehasonlításra adnak alkalmat például a
DE (Debreceni Egyetem) és a PTE (Pécsi Tudományegyetem) bemutatott
adatai. Mind Pécs, mind Debrecen két-három rokon területen (a
biokémiában, az idegtudományban és a farmakológiában, illetve a
biokémia és molekuláris biológia mellett a sejtbiológiában és az
immunológiában) kiemelkedő. Ezt azonban Debrecen a fizikával és a
matematikával egészíti ki, ennek fényében a DE erőfeszítéseinek
diverzitása nagyobb, de (mivel abszolút számai jelentősen nagyobbak)
ez mégsem jelent szétforgácsoltságot.
Nagyobb belső koncentráltság figyelhető meg az egymással gyakran
összehasonlított másik két egyetem, az SZTE és az ELTE esetén.
Előbbinek belső allokációja a biokémia mellett a farmakológiában, a
kémiában és az idegtudományokban a legerősebb, utóbbinak a biokémia és
a kémia mellett a fizikában és a matematikában. Mindkettőre jellemző,
hogy ezek a leginkább művelt területek „elhúzzák” az arányokat:
mellettük a felső 80%-ba nem kerül be annyiféle tevékenység, mint a
kisebb kibocsátási aktivitású DE vagy PTE esetén. (Fontos azonban
ismét megjegyezni, hogy ez önmagában nem jelenti azt, hogy a kimaradt
területek biztosan nem eredményesek: ismét csak a „súlyhatásról” van
szó, arról, hogy a vizsgált mutatókban legsikeresebb intézmények
ráfordítása egy-egy területen annyira meghatározó, hogy e területek
hozzájárulása minden egyebet leárnyékol).
Az MTA helyzete ebből a szempontból ismét rendkívül
érdekes. A korábbiak alapján azt várnánk, hogy különleges helyzetben
van a számos intézetével, a tudatosan felkarolt nagyszámú eltérő
kutatási profil támogatásával. Annál meglepőbb lehet, hogy mégis az
ELTE-hez és SZTE-hez hasonlóak a belső viszonyai: az ábrázolási
küszöböt csak kevés számú terület éri el, melyek néhány „vezető” téma
körül csoportosulnak: ezek megint a biokémia, kémia, idegtudomány,
fizika, és matematika. Különösen feltűnő ez a SOTE-val való
összehasonlításban, mely (a fizika és matematika érthető kivételével)
lényegében ugyanazon néhány kiemelt terület dominanciáját mutatja.
Általánosságban is megállapítható tehát egyrészt,
hogy (a 2. ábra szerinti értelemben) minél sikeresebb egy
intézmény, annál „letisztultabbnak” mutatkoznak a profiljának belső
arányai – mégpedig, mint az MTA példája különösen jól illusztrálja,
anélkül is, hogy az intézmény erre alapkoncepciójában törekedne, sőt
annak ellenére, hogy (mint a kompetenciatérképek mutatják) szándékosan
diverzifikálni próbál. Másik tanulság (most már a várakozásokkal
egybeesően), hogy a magyar intézmények belső „sikerágazatai” a fentebb
minduntalan visszatérő területek: a biológia, fizika, a kémia
különféle formái, valamint a matematika.
Mindkét jelenség okaival kapcsolatban többféle
felvetés lehetséges, sőt, közöttük összefüggés is elképzelhető,
például az egyes szakterületek eltérő „sikerképessége”, vagy a
mintavétel sajátos jellege. Szokás hivatkozni például arra, hogy a WOS
ISI adatbázisa különösen bizonyos területeket favorizál, közte az
élettudományt, de elképzelhető, hogy ez fordítva van: ezeken a
területeken olyanok a közlési és hivatkozási szokások, ami a
publikációs és citációs sikeresség záloga. Önmagában azonban, mint a
fentiekben láttuk, pusztán az, ha egy intézmény ezekre összpontosít,
még nem teszi sikeressé (hiszen, mint láttuk, a 2. ábrán átlag
alatti intézmények publikációs és idézési profilja számos vonásában
hasonló az átlag fölöttiekéhez). A fentiekből következően úgy
gondoljuk: a bemutatott többoldalú elemzések alkalmasak lehetnek arra,
hogy belőlük az egyes intézmények struktúrája mellett a működésük
hatékonyságára vonatkozóan is levonhatók legyenek következtetések.
TexTrend: újszerű eszközök
az elemzés szolgálatában
A közölt eredmények a TexTrend eszközeivel készültek. A TexTrend
NKPF-nagypályázat (WEBCÍM
>) célja kormányzati és gazdasági
döntéshozatal támogatása szöveg- és adatbányászati módszerekkel. Ennek
részeként olyan adat- és trendelemző eljárásokat fejlesztünk, amelyek
segítségével a felhasználó (ha adatokkal rendelkezik) önállóan is
végezhet a fentihez hasonló elemzéseket. Az eszköztár segítségével
intuitív, menüvezérelt módon, interaktívan hajtható végre egy-egy
olyan munkafolyamat, amelyek korábban több napi, esetleg heti munkát
jelentettek. Ehhez nagy mennyiségű adat áttekinthető kezelésére és
tárolására is szükség van: ez azonban a mostani, „petabyte-kornak” is
nevezett időszakban nem jelent különálló kihívást. Egyre inkább
fordított a kérdés: a mindenki által birtokolható nagy tömegű adatban
„mi van”. A TexTrend-keretrendszer épp ezért alapvetőnek tekinti a
digitális adatok elemzésének igényét: nyílt forráskódú, plug-in
szerkezetű, grafikus felhasználói felületről vezérelhető, szabadon
bővíthető eljárások gyűjteményét alkotta meg, amelyek (köztük a
tanulmány eredményeit szolgáltató algoritmusok is) szabadon
letölthetők, és flexibilisen alkalmazhatók. (Ennek részeként az R
statisztikai környezet illetve az SQL-alapú adatbázis-lekérdezések
számára olyan csomagoló „varázslót” is tartalmaz, mellyel a
felhasználó minimális ismeretekkel a saját statisztikai eljárásait,
illetve lekérdezéseit is a rendszer részévé teheti.) A fent bemutatott
elemzések és a hozzájuk tartozó eszközök csak egy kis részét képezik a
megvalósított funkcióknak, ezek egy része például teljes szövegű
adatok (nagy tömegű blog, cikk vagy könyv) feldolgozására vonatkozik.
Visszatérve: első, áttekintő eredménynek
tekinthetők az itt mutatott elemzések abban az értelemben is, hogy
következő lépésként számos újabb kérdésre kell választ keresni. Adott
intézményben valóban jobb-e a biológia a fizikánál, vagy a
mindkettőtől eltérő közlési és idézési hagyományokkal rendelkező
művészettörténetnél (Radicchi et al., 2008)? A TexTrend folyamatban
lévő bibliometriai és tudománymetriai fejlesztései a szakterületi
közlemény- és idézetszámra vonatkozó normálással jobban
összehasonlíthatóvá teszik a „kis” és „nagy” területeket és az eltérő
„sikerképességű” témákat (ezek ilyetén feldolgozását éppen magyar
kutatók, Schubert András és Braun Tibor [1996] javasolták elsőként).
Az általunk már megvalósított és a tervezett újszerű eszközök más
hasonlók sorába illeszkednek funkcionálisan. A TexTrend-eszköztár az
Indiana Egyetem CIShell es Sci2 rendszerének továbbfejlesztésével
készült, a pályázati konzorcium tagja az ELTE, a SZTAKI, az SZTE, a
magánszektorból az Universitas Press, a GVI (a Magyar Kereskedelmi és
Iparkamara Gazdaság- és Vállakozáskutató Intézete), valamint a Glia
Kft.
Jelen tanulmány az NKFP_07_A2_TEXTREND Jedlik Ányos pályázat, a
DyaNets FP7 FET Open projekt (EC #233847), valamint A tudomány
társadalmi szerkezetének változásai című OTKA-pályázat (K84145)
támogatásával készült. A támogatásokat a szerzők köszönik. Ugyancsak
köszönet illeti Gulyásné Goldperger Anitát az SQL-lekérdezésekben való
közreműködéséért.
Kulcsszavak: tudománymetria, bibliometria, adatbányászat,
szövegbányászat, kompetenciatérképek
Függelék
A tudománytérképek készítése
Miképpen alkalmazhatók a tudománytérképek a szakterületi profil
jellemzésére? Az eljárás váza három lépést tartalmaz:
(1) Elkészítjük a tudomány aktuális térképét. A
térkép elemi szakterületeknek az ISI-adatbázisokban szereplő
tárgykategóriákat (Subject Categories, a továbbiakban: SC) tekinti.
Ezek a tárgykategóriák az egyes folyóiratok besorolására definiált
osztályok, amelyek meghatározása részben szakértői ítéletre, részben
pedig a hivatkozási adatok „automatizált” elemzésére épül. Lévén, hogy
az ISI WOS-adatbázis elsősorban folyóiratcikkek feldolgozására
szolgál, a tárgykategóriák az egyes publikációk besorolását is
elvégzik. A tárgykategóriák hálózata, vagyis a tulajdonképpeni
tudománytérkép az SC-k (vagyis a hozzájuk rendelt publikációk)
hivatkozási kapcsolatát ragadja meg: két SC között annál szorosabb a
viszony, minél több tárgykategóriára hivatkoznak közösen (ami annak a
megfontolásnak az operacionalizált változata, hogy a területek
tudásbázisának átfedése a rokonságukat jellemzi). Fontos megjegyezni:
az így nyert térkép igen nagy felbontású: a szűkebb szakterületek
kapcsolatrendszerét ábrázolja, nem pedig közvetlenül az ezekből
felépülő nagy tudományterületekét. Ahhoz, hogy az utóbbi is
leolvasható legyen, a térképen rögzített kapcsolatrendszer
statisztikai elemzésével csoportosítjuk a tárgykategóriákat, vagyis a
szoros kapcsolatban álló tárgykategóriákat (például faktoranalízis
segítségével) nagy tudományterületekké, diszciplínákká aggregáljuk (és
az egyazon diszciplínához tartozó SC-ket azonos színnel jelezzük a
térképen).
(2) Vesszük ezek után az elemezni kívánt,
kutatóhoz, országhoz, intézményhez stb. tartozó publikációs listát, és
előállítjuk a lista elemeinek megoszlását az ISI-tárgykategóriák
között. Ennek előfeltétele, hogy a publikációs lista maga is az ISI
adatbázisaiban indexelt közleményeket tartalmazzon. Az eredmény a
lista által képviselt szakterületi arányokat jelző gyakorisági
eloszlás lesz, ami lényegében megegyezik a kutatási profil korábban
leírt fogalmával.
(3) Az eljárás kulcsmozzanata végül a
tudománytérképet a kutatási profillal összekapcsoló harmadik lépés,
amelyben a tárgykategóriák gyakorisági eloszlását leképezzük az átfogó
tudománytérképre (vagyis alaptérképre). A leképezés annyit tesz, hogy
az egyes csomópontok, vagyis tárgykategóriák a kutatási profilban mért
gyakoriságukkal arányos méretben jelennek meg a térképen. Ennek révén
az átfogó tudománytérképből a vizsgált tudományos szereplő
kibocsátásának szerkezetét jellemző konkrét, specifikus térkép lesz
(előbbit ezért is nevezik alaptérképnek), amely tehát három kérdésre
ad választ: a) melyek azok a területek, ahol az adott szereplő aktív,
b) milyen ezeknek a területeknek a súlya és c) egymáshoz viszonyított
helyzete a tudományrendszerben. Az eljárás előnye mindenekelőtt a c)
pontban pillantható meg.
IRODALOM
Balogh Tamás (2002): Hol állunk Európában?
(A magyarországi kutatás-fejlesztés helyzete az EU összehasonlító
mutatói alapján). Magyar Tudomány. 108, 3, 361–370. •
WEBCÍM >
Braun Tibor (2010): Egyetemek a
világrangsorok bűvöletében. Magyar Tudomány. 171, 7, 816–824. •
WEBCÍM >
Braun Tibor - Glänzel, W. - Némethné
Kovács É. - Pereszteginé Szabadi Zs. (2002): Magyarország helyzete a
természettudományi alapkutatás világában - tudománymetriai tájkép a
második évezred végén. Magyar Tudomány. 108, 7, 935–945. •
WEBCÍM >
Glänzel, Wolfgang (2001): National
Characteristics in International Scientific Co-authorship Relations.
Scientometrics. 51, 1, 69–115.
Kampis György (2010): •
WEBCÍM >
Leydesdorff, Loet – Rafols, Ismael (2009):
A Global Map of Science Based on the ISI Subject Categories. Journal
of the American Society for Information Science and Technology. 60, 2,
348–362. •
WEBCÍM >
Radicchi, Filippo – Fortunato, S. –
Castellano C. (2008): Universality of Citation Distributions: Toward
an Objective Measure of Scientific Impact. Proceedings of the National
Academy of Sciences of the USA. 105, 45, 17268–17272. •
WEBCÍM >
Rafols, Ismael – Porter, A. – Leydesdorff,
L. (2009): Science Overlay Maps: A New Tool for Research Policy and
Library Management. Arxiv preprint arXiv:0912.3882. •
WEBCÍM >
Rafols, Ismael – Meyer, M. (2010):
Diversity and Network Coherence as Indicators of Interdisciplinarity:
Case Studies in Bionanoscience. Scientometrics. 82, 2, 263–287. •
WEBCÍM >
Schubert András (2009): A magyar
tudományos kutatás helyzete a világban. Tudománymetriai elemzés a
Scopus adatbázis adatai alapján. KSZI Akták. 2, •
WEBCÍM >
Schubert András – Braun Tibor (1981): Some
Scientometric Measures of Publishing Performance for 85 Hungarian
Research Institutes. Scientometrics. 3, 5, 379–388.
Schubert András – Braun Tibor (1996):
Cross-field Normalization of Scientometric Indicators. Scientometrics.
36, 311–324.
Schubert András – Vasas Lívia (2010):
Magyarország és a szomszédos országok publikációs és idézettségi
mutatószámai nemzetközi összehasonlításban a National Science
Indicators (Thomson-Reuters) és a SCImago (Elsevier) adatbázisok
alapján, 1996–2007. Magyar Tudomány. 171, 7, 825–830. •
WEBCÍM >
Soós Sándor – Kampis György (2011):
Towards a Typology of Research Performance Diversity: The Case of top
Hungarian Players. Scientometrics. 87, 2, 357–371. DOI
10.1007/s11192-011-0351-8
Tolnai Márton – Schubert A. – Wolf Gy.
(2008): Tudományunk mérhető teljesítménye az Essential Science
Indicators mutatószámainak tükrében. Magyar Tudomány. 169, 8, 989–997.
•
WEBCÍM >
Thijs, Bart – Glänzel, Wolfgang (2008): A
Structural Analysis of Publication Profiles for the Classification of
European Research Institutes. Scientometrics. 74, 2, 223--236.
Thijs, B. – Gänzel, Wolfgang (2009): A
Structural Analysis of Benchmarks on Different Bibliometrical
Indicators for European Research Institutes Based on Their Research
Profile. Scientometrics. 79, 2, 377–388. DOI:
10.1007/s11192-008-0214-0
Vinkler Péter (1998): General Performance
Indexes Calculated for Research Institutes of the Hungarian Academy of
Sciences Based on Scientometric Indicators. Scientometrics. 41, 1,
185–200. DOI: 10.1007/BF02457977
LÁBJGYZETEK
1 A hazai tudománymetria
behatóan foglalkozott ezzel a szinttel, elsősorban módszertani
vonatkozásban (például Thijs–Glänzel, 2008, 2009).
<
2 Jellegzetes példái ennek
Wolfgang Glänzel és Schubert András (vö. Glänzel, 2001) elemzései,
akik bizonyos országokat vizsgálva a profil jellege szerint tipológiát
állítanak föl a publikácós kibocsátás szakterületi szerkezetére
vonatkozóan. Ehhez az ún. aktivitási indexet alkalmazzák: ez a mutató
az adott szakterület és az összes szakterület együttes kibocsátásának
hazai és nemzetközi arányát viszonyítja egymáshoz.
<
|