Magyar Tudomány • 2011 8 • Kampis Gy. – Soós S.

Bevezetés

A magyar tudomány teljesítményének kvantitatív és kvalitatív jellemzése minduntalan visszatérő, aktuális feladat. A kiemelkedő hazai tudósok csúcsteljesítménye sokak előtt ismert, az ország produkcióját azonban nem (vagy nem csupán) néhány egyén határozza meg, a ritka egyéni csúcsok a „mainstream” összefüggésében nyerhetnek értelmet. A vezető kutatási intézmények (közte az MTA és az egyetemek) helyzetét, tevékenységük jellegét és színvonaluknak egymáshoz való viszonyát, így az intézmények társadalmi finanszírozásának hatékonyságát összetettebb mutatók segítségével próbálhatjuk megérteni. A közelmúlt érdeklődése a kutatóegyetemi pályázatok kapcsán mind élesebben vetette fel a hasonló elemzések igényét. Ezért szemügyre vesszük a legutóbbi évtized teljesítményét.

További motivációt adhat az 1. ábra; ez olyan adatokat mutat be, amelyeket különösebb szakértelem nélkül is bárki megszerezhet (szabadon lekérdezhetők például az interneten a SCOPUS adatbázisra épülő Scimago, vagy további bibliometriai és K+F mutatókkal kombinált módon a KSZI Infotár szolgáltatás révén, lásd WEBCÍM >, ill. WEBCÍM >. Az ábra mutatja, hogy Magyarország forrásoldali tudományos teljesítményének tendenciaadatai a vizsgált időszakban elmaradnak a régió több országához képest. Akikkel tíz éve együtt indultunk (pl. Csehország), mára jelentősen lehagytak bennünket, akik előttünk jártak (pl. Lengyelország vagy Ausztria), nálunk gyorsabban fejlődtek – kivételt jelent Ukrajna, mely hozzánk hasonló előzményekből hozzánk hasonló helyzetig jutott. A távoli lemaradás pozíciójából indult Románia viszont mára beérte, sőt jócskán meg is előzte Magyarországot a nyilvántartott tudományos közlemények számában. Az adatok ezenfelül azt is mutatják, hogy Magyarország (legalábbis a szóban forgó dimenzióban) folyamatosan veszít az egész világhoz viszonyított nemzetközi pozíciójából: az elmúlt évtizedben 10%-os a relatív veszteség, 1979 óta pedig már több mint 20%-os (Kampis, 2010). Mindez még akkor is nyugtalanító, ha okait illetően sokféle találgatás képzelhető el: felmerülhet többek között a feldolgozott folyóiratok összetételének számunkra előnytelen megváltozása is. Valami kedvezőtlen azonban mindenképpen zajlik, megértéséhez fontos lenne közelebbről látni, hogy mit, milyen szerkezetben, milyen eredményességgel hoz létre a magyar tudomány.

Tanulmányunkban a TexTrend NKTH-nagypályázat (WEBCÍM >) keretében létrehozott trendelemző eszközök felhasználásával fordulunk e kérdések felé. A tanulmány a 2001–2010. évek magyar tudományos publikációnak analízisével foglalkozik, a Reuters-Thomson ISI Web of Science adatbázisának anyagai alapján. Folyamatban van az 1975–2010 közötti időszak, vagyis a teljes WOS ISI magyar anyag feldolgozása is. Ahol a következőkben e forrásra hivatkozunk, ezt nem tesszük minden esetben hozzá.

A tudomány- és bibliometria módszerei

Elemezni csak azt lehet, ami rendelkezésre áll. E kézenfekvő igazság a tudománymetriai vizsgálatokra is vonatkozik. Számos hasznos mutató volna kigondolható, amely a tudományos kutatás egyéni, intézményi vagy éppen országos szintű szerkezetét és teljesítményét részleteiben, objektíve, hitelesen ragadhatná meg, ám ehhez, mint könnyen belátható, igen sokféle adatra volna szükség. Egy-egy adott pillanatban azonban ennek a töredéke áll csak rendelkezésre, ezért szűkebb lehetőségekkel, az éppen elérhető legjobb adatokkal kell beérni. Ilyen értelemben kiemelkedő jelentőségű, ám mégis korlátozott adatforrást jelent a WOS ISI adatbázis, mely a tudományos dokumentumok (elsősorban publikációk) forrás- és idézettségi adatait tartalmazza az adatbázisba felvett folyóiratok esetén.

A publikált tudományos dokumentumok száma és idézettsége természetesen csak egyetlen adat, de mindenképpen egy adat. Döntés vagy értékelés esetén adatokkal rendelkezni előbbre való annál, mint nem rendelkezni velük, és ez akkor is igaz, ha az adatok önmagukban nem adhatnak választ számos kérdésre – sőt, önmagukban, mint arra többször rámutattak, akár félrevezetőek lehetnek. A tudománymetriai adatok és eredmények értelmezése például szakmai és politikai-tudománypolitikai szempontokat közösen igényel. Az értelmezés kérdése ezért általában véve túlmegy a jelen tanulmány keretein (néhány megjegyzést azonban megkockáztatunk). A TexTrend-eszköztár és jelen tanulmány célja nem az értelmezés vagy a sugalmazás, hanem a döntéshozás előkészítésének támogatása fejlett eszközökkel történő információszolgáltatás révén.

A publikácós adatok alapján történő teljesítménymérésre rendszerint a két legközvetlenebb változót, (1) a nemzetközi referált folyóiratokban megjelent publikációk számát, és (2) az ezekre jutó hivatkozások mennyiségét használják. Előbbi a tudomány kibocsátását, utóbbi pedig a hatását hivatott tükrözni. Az alkalmazott mutatók terén gyakran a fenti két alapjellemző normalizált változataival dolgoznak, ilyen a publikációs aktivitás, amely a hazai kibocsátásnak a teljes nemzetközi kibocsátásból való részesedését méri, vagy a hazai idézettségi hatás, amely az egyazon évben publikált hazai és össznemzetközi közleményekre jutó hivatkozások egymáshoz viszonyított arányát mutatja.

A mutatók alkalmasságának kérdése, mindenekelőtt pedig az összehasonlíthatóságot célzó adatnormalizálás–sztenderdizálás problémája különösen érdekes egy kiemelt aggregációs szinten: az intézmények vonatkozásában. A tudományos produkció intézményrendszerének, az egyetemeknek és más kutatóhelyeknek a bibliometriai értékelése jóval részletesebb képet szolgáltat a tudomány állapotáról, mint az országos szinten összevont adatok.¹ Alapvető probléma ilyenkor természetesen az eltérő kutatási profillal jellemezhető intézmények bibliometriai értékelése, vagyis az, hogy a szakterületek különböző viselkedése, eltérő hivatkozási szokásai következtében az intézmények összevetésének érzékenynek kell lennie a szerkezeti különbségekre. Az összehasonlíthatóság igénye mindenekelőtt a teljesítménymutatók szakterületi normalizálásán keresztül juthat érvényre.

Az elemzés kontextusa

Említettük, hogy kiindulási alapunk a WOS ISI 2001–2010 közötti teljes magyar kibocsátási anyaga. A lekérdezés azon tudományos közlemények adatait foglalta magában, amelyek legalább egy magyar kutatási címmel rendelkeznek. A bemutatandó elemzés tárgyai a magyar kutatási intézmények. Ez összhangban áll azzal a törekvésünkkel, hogy a hazai tudományos kutatás átfogó, szerkezeti jellemzőivel foglalkozzunk, és azzal a módszertani céllal, hogy ezek újszerű elemzéséhez készítsünk eszközöket. Az intézményi szint és a vizsgált időszakra vetített aggregált adatok használata egy olyan makrokontextust hoz létre, amely további lépésekben finomítható: a rendelkezésre álló anyag és módszerek a későbbiekben természetesen lehetővé tesznek tudományszaki, regionális, sőt egyéni összehasonlításokat is.

Az alábbiak szempontjából intézménynek azt tekintjük, ami a kutatási címből szerzői munkahelyként egyértelműen azonosítható. Jelen célra például az MTA egyetlen intézményként szerepel. Ez a választás többféleképpen is indokolható (például az intézmények nagyságsorrendje így megfelel a hasonló elemzésekben gyakran tapasztaltnak, az MTA-t elemzési részekre bontva ez már nem lenne így), de a legfőbb oka az MTA különféle intézeteinek és kutatóhelyeinek problémás azonosíthatósága – az ezeket egybefoglaló „MTA” mint legfelső szintű intézmény már egyedül is több mint 200 (!) különböző névalakban fordult elő az anyagban a tisztítás és normalizálás előtt.

Intézményi alapadatok

Kiinduló tájékozódásként néhány kvantitatív jellemzőt mutatunk be. Az anyag főbb számszaki mutatói a következők (1. táblázat):

Intézménynek a fenti adatban az számít, ami egyedi intézményi nevet hordoz. Az intézménynevekre vonatkozó normalizálást annál a mindössze 27 magyar intézménynél végeztük el, amely a vizsgált tízéves időszak alatt intézményenként mindösszesen legalább száz publikációt jegyzett, azaz éves átlagban legalább tizet (2. ábra). A megoszlásra jellemző továbbá, hogy országosan kilenc olyan intézmény akad, amely legalább ezer dokumentummal szerepel az anyagban (vagyis, amely éves átlagban legalább száz publikációhoz adott szerzőt vagy társszerzőt), a 10. intézmény (a CEU) már csupán évenkénti hatvanas átlagot mutat fel. Az adatoknak ez a nagymérvű „széthúzottsága”, vagyis, hogy a dokumentumok nagy száma (majdnem hatvanezer publikáció) ellenére mindössze néhány erőteljes kibocsátó van, és ezek mellett az igen alacsony teljesítményű kibocsátók nagy száma jellemző, indokolja, hogy további elemzésünkben elsősorban a legnagyobb néhány intézménnyel foglalkozzunk. (Ez bizonyos fokig egyensúlyt is teremt a különböző szakterületek eltérő publikációs és idézési szokásai között, azt várhatjuk ugyanis, hogy a legnagyobb intézmények többnyire széles szakmai spektrumban teljesítenek – ezt a képet részben alátámasztják, részben árnyalják a bemutatásra kerülő kompetenciatérképek).

Először a tíz legnagyobb kibocsátó elemzésére összpontosítunk. Ezek összesített kibocsátási és idézettségi adatokkal, a publikációk számának erősorrendjében a következők (2. táblázat) (a betűszavak közül SZIE = Szent István Egyetem, PANN= Pannon Egyetem, a többit az általánosan elterjedt rövidítésével jelöltük).

A kibocsátási és idézettségi adatokat kétdimenziós ábrán összesítve, az itt bemutatott képet nyerjük (3. ábra). Az ábra viszonyítási alapként jelöli az országos átlagot, vagyis a teljes magyar publikációs anyag egy dokumentumra eső idézettségét. Mit jelent ez az országos átlag, és mennyire stabil? Hiszen az átlagot a néhány vezető intézmény a túlsúlyánál fogva maga is jelentősen befolyásolja. Elképzelhető-e, hogy mindez az átlag körüli viselkedést is „elhúzza”: vagyis, hogy az átlag főleg ezek átlaga? A hasonló, meredek ferde eloszlásoknál az is törvényszerű, hogy a legtöbb elem az átlag alatt található meg. Mit jelent ezek után, amit a 3. ábrán látunk? Elvégeztünk egy tanulságos ellenpróbát. Az átlag alatt elhelyezkedő öt intézmény idézési teljesítményét kísérletképpen felemeltük – ez annak a hipotetikus helyzetnek felel meg, amikor minden további magyar intézmény összes mutatóját változatlannak feltételezve, ez az öt kiszemelt intézmény csak több idézést kapna a saját megjelent publikációira. Nos, a számok ilyen manipulálásával könnyen elérhető volt, hogy mind a tíz vizsgált intézmény az újonnan definiált országos átlag fölé kerüljön. Az országos átlag tehát ezek szerint valójában igen stabil – az derül ki, hogy az ábrán átlag alatti intézmények helyzete nem magából az átlagolás tényéből fakad, nem abból a megtévesztő intuícióból, hogy az átlag „valahol középen van, tehát törvényszerű, hogy alatta is kell legyen valaki”.

A fentiek egy további meglepő olvasata az, hogy az ábrán nem szerepeltetett összes többi intézmény, a „kis” kibocsátók együttesen átlagban mégis eredményesebbek az összesített (szakterülettől független) idézettség tekintetében, mint a tíz legnagyobb kibocsátó közül kevésbé idézett 5. (Talán érthető lesz ez, ha arra gondolunk, hogy egy kis intézmény könnyebben lehet tematikailag és minőségileg szelektív, fókuszáltan kutatásorientált, illetve könnyebben fordíthatja egész erejét egyes kiválasztott, „jól idézett” kutatási területekre. Alább az intézményi kompetenciatérképek csakugyan mutatják majd ezzel szembeállítva a nagyobb intézmények tematikai diverzitását, és ezzel olyan területek felvállalását, amelyek létét általában nem az idézettség igazolja.)

Kompetenciatérképek

A publikációs teljesítmény természetesen nem csupán mennyiségi szempontból értékelhető, sőt a valóban érdekesek a minőségi információt is nyújtó elemzések. A tudománymetria a bibliográfiai tételek metaadatai, a szerzők, kulcsszavak, forrásmegnevezések és – leginkább – a különféle kategorizációk szűrőjén keresztül fér hozzá e kvalitatív jellemzőkhöz.

Az országos, intézményi vagy kutatói teljesítmény vizsgálatának kézenfekvő kérdése a szakterületi besorolások felhasználásával a tudományos profil jellemzése. A kibocsátási „portfólió” felvázolása révén láthatóvá válik, hogy a tudomány szóban forgó szereplője mely területeken aktív, mely más szereplőkkel hasonlítható össze, illetve hogy a tudományos piac perspektívájából szemlélve milyenek a kapacitásai, mik az erősségei. Az ilyen típusú vizsgálat klasszikus metódusa az egyes publikációs tételek szakterületi besorolásából, esetünkben az ISI-ben nyilvántartott tudományterületi kategorizációjából indul ki. A megközelítés célja, hogy meghatározza és jellemezze egy publikációs lista tételeinek gyakorisági megoszlását a szakterületi kategóriák között.²

Az utóbbi években az elemzési eszköztár fejlődése, a számítási és vizualizációs kapacitás intenzív megnövekedése a publikációs adatbázisok szerkezeti elemzésének újszerű megoldásait tette lehetővé. Egy ilyen, az ún. tudománytérképezés (science mapping) területéhez tartozó módszer alkalmazása áll jelen vizsgálatunk középpontjában, melynek alapjait Alan Porter, Ismael Rafols, Loet Leydesdorff és Martin Meyer dolgozta ki (Leydesdorff – Rafols, 2009; Rafols et al., 2009; Rafols – Meyer, 2010). Erénye, hogy részletesebb és informatívabb képet nyújt a kutatási portfólió szerkezetéről, mint a tudományterületi kategóriák feletti eloszlások, noha nyersanyagát nagyrészt ugyanaz a kategóriarendszer alkotja. A fő különbség, hogy ebben az esetben a portfólió egy ún. átfogó tudománytérkép (global science map) segítségével reprezentálható.

A tudománytérkép a tudomány változó rendszerének megragadására kidolgozott eszköz, a gyakorlatban a szakterületek hálózatát jelenti, olyan gráfot, amelynek csomópontjai a tudományban azonosítható szakterületek, élei pedig az ezek között lévő szakmai vagy diszciplináris kapcsolatok. Amennyiben létezik ilyen él két szakterület között, úgy azok valamilyen mértékben rokon vagy egymást befolyásoló területek; az él erőssége („súlya”) pedig a köztük lévő „közelséget”, vagyis a kapcsolat erősségét jellemzi (lásd Függelék). A tudománytérképek felhasználásával a kutatási profil az egyes tématerületek (tárgykategórák) gyakorisági eloszlásának a tudománytérkép csomópontjaira illesztésével jeleníthető meg. Az aktív területek hálózatban elfoglalt helye és relatív pozíciója arról is tájékoztat, hogy a kutatási profil mennyire diverzifikált, hiszen egészen más potenciál jellemzi a tudományos piacon azokat a szereplőket, amelyeknek a kibocsátása közeli, egymással rokon szakterületeken jelentős, illetve azokat, amelyek számos egymástól távoli területen egyaránt aktívak (lásd Soós–Kampis, 2011).

A következőkben a vizsgált hazai intézmények (illetve publikációs teljesítményük) olyan szerkezeti diagnózisát adjuk, amely a fenti tudománytérképészeti módszerre épül. Ebből a célból a TexTrend-rendszer felhasználásával elkészítettük a 27 magyar intézmény kompetenciatérképét. E szerkezeti diagramok egy előre adott globális tudománytérképen rajzolódnak ki, amelyhez egy nyilvánosan elérhető alaptérképet alkalmaztunk (WEBCÍM >). A kapott diagramok az egyes intézmények (egy évtizedet lefedő) publikációs teljesítményének szakterületi viszonyait ábrázolják. Az egyes szakterületeken így mért aktivitás számos mutatóval fejezhető ki. A normalizálásra – amely az összehasonlíthatóság és értékelhetőség szempontjából alapvető – két eltérő módszert alkalmaztunk. A térképek egyik sorozatában a szakterületek mérete ezek intézményen belüli százalékos megoszlását jelzi: a százalékalap az intézményi publikációk összmennyisége, a térkép elemei a szakterület intézményi súlyát ragadják meg. Egy második sorozatban az intézmény által egy-egy adott szakterületen közölt publikációk számát az adott területen megjelent összes hazai publikáció számára vetítettük, ilyen módon az arány az intézmény hazai súlyát jellemzi a szóban forgó szűkebb szakterületen.

Valójában tehát minden intézményre kétféle kompetenciatérképet állítottunk elő: az első fajtát aktivitástérképnek, a másodikat pedig erőforrástérképnek nevezhetjük. Az alábbiakban négy kiválasztott intézmény erőforrástérképének példáján szemléltetjük az eljárást és az eredményeket. Mivel az erőforrástérképek minden szakterület és intézmény esetében a hazai publikációs aktivitásból való részesedést mutatják (vagyis az intézményi kibocsátás a hazai összkibocsátásra van vetítve), ezért a csomópontméretek a térképeken belül és azok között is abszolút értelemben összehasonlíthatók. A teljes anyag, a korábban említett 27 intézmény színkódolt kompetenciatérképeinek együttese (mind az erőforrástérképek, mind pedig a belső arányokat ábrázoló aktivitástérképek) egy szabad online szolgáltatás keretében érhetőek el (WEBCÍM >). A négy kiválasztott intézmény, három egyetem: az ELTE, az SZTE és a Corvinus, valamint az MTA kutatóhálózatának (mint aggregált vizsgálati egységnek) erőforrástérképét a 4. ábrán hasonlítjuk össze. Emlékeztetünk rá, hogy a hálózatok csomópontjai szakterületeket (ISI-tárgykategóriákat) képviselnek, méretük pedig azok súlyát jelenti; az egyforma színű (árnyalatú) tárgykategóriák pedig együttesen egy-egy tudományterületet képviselnek: utóbbiakat a jelmagyarázat szövegesen is azonosítja.

Az erőforrástérképeken jól érzékelhető, hogy a két, hagyományosan széles képzési spektrumú tudományegyetem, az ELTE és az SZTE hasonlóan széles skálájú publikációs tevékenységgel jellemezhető. Mindkét profil lefedi a tudománytérkép egészét, vagyis a természet-, társadalom- és bölcsészettudományi területeket: ez azt jelenti, hogy a hazai összkibocsátáshoz e két egyetem mindhárom nagy területen hozzájárul. A térképeken belüli viszonyok tanúsága szerint a két intézmény közül az ELTE hozzájárulása a szimmetrikusabb: a társadalomtudományi régióban (főként közgazdaság-tudományi, szociológiai, pszichológiai és nyelvészeti tárgykategóriák), a térkép jobb oldalán hasonló sűrűséggel helyezkednek el az aktív területek, mint a térkép bal oldalán látható természettudományi térfélen. A tárgykategóriák nagysága, vagyis a kibocsátás a két nagy területen összemérhető. Az ELTE portfóliójától eltérően az SZTE tízéves profilja a térképen ábrázolva határozott súlyponttal rendelkezik: a térkép „déli” pólusán, a klinikai orvostudományok és a biomedicina területén mutat kifejezett sűrűsödést. A társadalomtudományi területek fedése ehhez képest ritka: ebben a régióban csak a pszichológia és nyelvészet több részterületének aktivitása kiugró. Mindez a profil egészét természettudományi (és főként orvostudományi) karakterrel ruházza fel. A két térképet összehasonlítva sajátos komplementaritást tapasztalunk: az SZTE-re jellemző klinikai orvostudományi rendszer az ELTE térképén kis súllyal jelenik meg, a biomedicinának pedig egy kisebb, koncentráltabb szakterületi csoportja mutat hasonló, illetve az SZTE-nél valamivel nagyobb aktivitást. A természettudományi térfél további régióiban ugyanakkor megfordul a helyzet: mindenekelőtt az „ökológiai tudományok”, „földtudomány” és a „fizika” gyűjtőnév alá tartozó területeken az ELTE kibocsátása szembeötlő. Ez a komplementaritás bizonyos fokig a társadalom- és bölcsészettudományi régiókban is látható: a pszichológiai-nyelvészeti, és a szociológiai területeken (social studies) más-más specialitások aktívak a két egyetem viszonylatában.

A szakterületi szerkezetnek a fentiektől radikálisan különböző típusát képviseli a Corvinus Egyetem tíz évre aggregált erőforrástérképe. Nyilvánvaló különbség, hogy a térkép súlypontja a társadalomtudományi térfélre rendeződik át, ez a publikációs aktivitás jól tükrözi az intézmény hagyományos képzési struktúráját. A konfiguráció a „közgazdasági, politikatudományi és földrajzi”, valamint az „üzleti és szervezéstudományok” részterületein meghatározó hazai szereplőként ábrázolja az intézményt. Ugyanakkor a térkép meglehetősen „fedett”: kisebb hozzájárulású területekkel ugyan, de a természettudomány is képviselteti magát. Közelebbről, a társadalomtudományi régióval átellenes póluson látható összefüggő sűrűsödés a biomedicina-ökológia-környezettudomány-kémia-agrártudomány rendszerben (ami az egyetem kertészeti szakokkal való bővítésének indikátora): itt sok, de egyenletesen szerény súlyú területet találunk . Az ilyen típusú térképeket mint a diverzifikáció egy sajátos típusát „polarizált profilnak” nevezhetjük, amennyiben a kibocsátás távoli szakterületeket fed le (lásd Soós – Kampis, 2011). A Corvinus jellemzően poláris kibocsátásának kialakulását jól illusztrálják a profil évenkénti változásai (feltehetően nem kis mértékben az időközben lezajlott intézményi összevonások dinamikájának megfelelően). A fent

említett online szolgáltatás segítségével ez a dinamika is tanulmányozható animált térképeken.

Mindhárom intézményi térképtől különbözik az MTA kibocsátásának szerkezete. Mint az várható, lévén az MTA egyfajta „szuperintézmény”, vagyis az egyes tagintézetek profiljának aggregációjával keletkezett vizsgálati egység, az Akadémia a tudomány minden területén jelentős (sőt, az itt nem szereplő intézményekkel végzett összehasonlítás alapján: többnyire országosan a legjelentősebb) részesedéssel bír a hazai össztermésből. A széles skála és a nagy átlagos csomópontméret (vagyis szakterületi részesedés) mellett azonban ez a kép sem teljesen egyöntetű. A kibocsátási oldalon itt is megkülönböztethetőek kisebb súlyú, közepes méretű, illetve „húzóágazatok”. Az utóbbiakat a térkép természettudományi régiójában egyértelműen az egymással viszonylag szoros kapcsolatban álló fizika, anyagtudomány, illetve, valamivel ezek mögött, a kémia és mérnöki tudományok képviselik. Ez a megállapítás a térképek tanúsága szerint nem csupán az MTA belső viszonyaira, de a többi intézménnyel való összevetésre is vonatkoztatható. Főként a többi térképhez mérten jelentős a számítástudomány mérete (a vizsgált intézmények közül egyedül a BME teljesítménye múlja felül.) Intenzív, az említett egyetemekével összemérhető (illetve azt meghaladó) kibocsátás jellemzi az élet- és földtudományi területeket. A térkép belső viszonyait tekintve a klinikai orvostudomány részterületei a legkevésbé súlyosak, de további összehasonlításokban mégis összemérhetők az SZTE vagy a DE hozzájárulásával.

Az MTA térképén figyelemreméltó a társadalomtudományi térfél is, itt is látunk húzóágazatot (sőt nem csupán a társadalomtudomány, hanem a teljes rendszer vonatkozásában). A pszichológiai–nyelvészeti terület számos tárgykategóriája ugyanis szembeötlő módon a fizika és anyagtudomány csomópontjainak mérettartományában van. Hasonlóan kiemelkedő az üzleti és szervezéstudományok egy részterülete. Kisebb átlagos mérettel, számos aktív részterülettel képviselteti magát a közgazdasági-politikatudományi-földrajztudományi rendszer, amely a Corvinushoz hasonló eloszlást tükröz (és amelyet csak a CEU ide vonatkozó kibocsátása múl felül a kérdéses intézményi körön belül).

Az intézményi teljesítmények
tárgykategóriánkénti felbontása

Az említett 221 különböző tárgykategória (SC) alkalmas arra is, hogy segítségükkel az egyes intézmények aktivitását és idézettségét az intézmények belső viszonyaira lebontva is elemezzük (az előző térképek csak az erőforrásmegoszlást mutatták, de azt országos, nem pedig intézményen belüli összehasonlításban). Elkészítettük ezért a 27 vezető intézmény olyan „sugárdiagramját”, ahol az egyes tárgyterületek a tudománytérképek kategóriái szerinti nagyobb tudományterületekbe vannak szervezve, és egy kör kerületén helyezkednek el (5. ábra). Ezek a tudományterületek megegyeznek az SC-kategóriák korábban már látott hivatkozási klasztereivel, tehát nem feltétlenül követik a hagyományos tudományterületi besorolásokat – néhány, gyakran önállónak tekintett területet hiába keresünk az ábrán (a matematika például e klaszterezés szerint a mérnöki tudományokhoz tartozik). A részletes sugárdiagramok a tudományterületekhez tartozó részletes tématerületeket (SC-kategóriákat) ábrázolják, helyük a tudományterületi klaszterbe sorolásnak megfelelően kötött.

A középpontból kiinduló „sugarak” az aktivitást, valamint az idézettséget mutatják be minden egyes tárgyterületre, úgy, hogy a sugarak hossza a megfelelő értékekkel arányos. Mindez elméletileg 221 sugarat jelent külön-külön az aktivitási és idézési adatokra intézményenként, ami első intuícióként jócskán megnehezíti az ábrázolást. Csakhogy nincs intézmény, amely minden tárgykategórában egyaránt aktív lenne, és ehhez járul a már látott nagyfokú egyenlőtlenség (az intézményeken belül is megtapasztalható hatványfüggvény-szerű eloszlás). Megfelelő küszöb megválasztásával végülis intézményenként csupán néhány kiemelkedő tárgyterületet szükséges feltüntetni.

A 6. ábrán azok a tárgykategóriák szerepelnek, amelyek az adott intézmény kibocsátásának felső 80%-át adják. A tárgykategórák egymás közti viszonyai, a legaktívabb és a legtöbbet idézett területek így intézményközi módon összehasonlíthatók maradnak, ugyanakkor maguknak a sugaraknak a hossza most nem hordoz összevethető információt: ezek csupán az adott intézményen belüli relatív mennyiségeket jelölik. (Más szóval: az ábrák skálája eltérő lesz – a különböző intézményeket, mivel nagyságrendben különböznek, nem is lehetne egyazon skálán arányosan ábrázolni.)

Fontos figyelembe venni továbbá, hogy ezek a diagramok – a fentiek szerint – azt állapítják meg, hogy mennyire eredményesek azon területek, amelyeket az adott intézmény a leginkább művel, vagyis amelyekre a kutatási (illetve ennek egy aspektusaként, a publikációs) erőforrásait összpontosítja. Ez azt jelenti, hogy az alább feltérképezett struktúrák alapja nem az általában vett relatív eredményesség, hanem a publikációs aktivitáshoz képest vett relatív eredményesség. Az intézményen belül kis publikációs hangsúlyt kapó területek tehát a bemutatásba nem kerülnek bele, még akkor sem, ha (bár ez nem gyakori) az idézettség szempontjából netán eredményesebbek volnának az intézmény kibocsátását arányaiban leginkább jellemző területeknél. Ez ismét összecseng azzal a szándékunkkal, hogy ezen a helyen az intézmények ráfordítási, „termelési” oldaláról közelítjük meg az adatokat, az e szempontból jelentős területekre koncentrálva.

Néhány kiválasztott intézmény tárgykategóriánkénti adatait a többkomponensű 6. ábra közli. Az egyes ábrákon azonosítottuk, és felsoroltuk az intézményre jellemző legfontosabb területeket, mellettük zárójelben feltüntettük az adott tárgykategórában készült publikációk és a kapott idézések abszolút számát. A sugárdiagramokon szürkével a publikációkat, feketével az idézéseket mutatjuk (a jobb ábrázolhatóság érdekében utóbbiak skálája azonban az előbbiek ötöde). Az ábrákat mind a 27 kiválasztott intézményre ismét a WEBCÍM > közli .

Első kvalitatív megállapításként feltűnik, hogy intézményenként mindössze néhány (kettő-négy) terület „uralja” az ábrát, a belső arányok is (az idézettségnek a közlemények számához való viszonyszámai) nagyjából hasonlóak. Emlékezhetünk rá, hogyan helyezkednek el ugyanezek az intézmények a 3. ábrán. A jelentős pozícióbeli eltérést tehát nem a kiemelkedő területek eltérő száma adja – hiszen ezek nagyjából hasonlónak mutatkoznak. A meghatározó különbség a kiemelt területek bizonyos fokig eltérő sikeressége mellett azok nyers mérete: végső soron a „csúcsterületeken” mutatott aktivitás foka. (Ez a megállapítás finomabb eszközökkel pontosítható, lásd Soós – Kampis, 2011).

Érdekes összehasonlításra adnak alkalmat például a DE (Debreceni Egyetem) és a PTE (Pécsi Tudományegyetem) bemutatott adatai. Mind Pécs, mind Debrecen két-három rokon területen (a biokémiában, az idegtudományban és a farmakológiában, illetve a biokémia és molekuláris biológia mellett a sejtbiológiában és az immunológiában) kiemelkedő. Ezt azonban Debrecen a fizikával és a matematikával egészíti ki, ennek fényében a DE erőfeszítéseinek diverzitása nagyobb, de (mivel abszolút számai jelentősen nagyobbak) ez mégsem jelent szétforgácsoltságot.
Nagyobb belső koncentráltság figyelhető meg az egymással gyakran összehasonlított másik két egyetem, az SZTE és az ELTE esetén. Előbbinek belső allokációja a biokémia mellett a farmakológiában, a kémiában és az idegtudományokban a legerősebb, utóbbinak a biokémia és a kémia mellett a fizikában és a matematikában. Mindkettőre jellemző, hogy ezek a leginkább művelt területek „elhúzzák” az arányokat: mellettük a felső 80%-ba nem kerül be annyiféle tevékenység, mint a kisebb kibocsátási aktivitású DE vagy PTE esetén. (Fontos azonban ismét megjegyezni, hogy ez önmagában nem jelenti azt, hogy a kimaradt területek biztosan nem eredményesek: ismét csak a „súlyhatásról” van szó, arról, hogy a vizsgált mutatókban legsikeresebb intézmények ráfordítása egy-egy területen annyira meghatározó, hogy e területek hozzájárulása minden egyebet leárnyékol).

Az MTA helyzete ebből a szempontból ismét rendkívül érdekes. A korábbiak alapján azt várnánk, hogy különleges helyzetben van a számos intézetével, a tudatosan felkarolt nagyszámú eltérő kutatási profil támogatásával. Annál meglepőbb lehet, hogy mégis az ELTE-hez és SZTE-hez hasonlóak a belső viszonyai: az ábrázolási küszöböt csak kevés számú terület éri el, melyek néhány „vezető” téma körül csoportosulnak: ezek megint a biokémia, kémia, idegtudomány, fizika, és matematika. Különösen feltűnő ez a SOTE-val való összehasonlításban, mely (a fizika és matematika érthető kivételével) lényegében ugyanazon néhány kiemelt terület dominanciáját mutatja.

Általánosságban is megállapítható tehát egyrészt, hogy (a 2. ábra szerinti értelemben) minél sikeresebb egy intézmény, annál „letisztultabbnak” mutatkoznak a profiljának belső arányai – mégpedig, mint az MTA példája különösen jól illusztrálja, anélkül is, hogy az intézmény erre alapkoncepciójában törekedne, sőt annak ellenére, hogy (mint a kompetenciatérképek mutatják) szándékosan diverzifikálni próbál. Másik tanulság (most már a várakozásokkal egybeesően), hogy a magyar intézmények belső „sikerágazatai” a fentebb minduntalan visszatérő területek: a biológia, fizika, a kémia különféle formái, valamint a matematika.

Mindkét jelenség okaival kapcsolatban többféle felvetés lehetséges, sőt, közöttük összefüggés is elképzelhető, például az egyes szakterületek eltérő „sikerképessége”, vagy a mintavétel sajátos jellege. Szokás hivatkozni például arra, hogy a WOS ISI adatbázisa különösen bizonyos területeket favorizál, közte az élettudományt, de elképzelhető, hogy ez fordítva van: ezeken a területeken olyanok a közlési és hivatkozási szokások, ami a publikációs és citációs sikeresség záloga. Önmagában azonban, mint a fentiekben láttuk, pusztán az, ha egy intézmény ezekre összpontosít, még nem teszi sikeressé (hiszen, mint láttuk, a 2. ábrán átlag alatti intézmények publikációs és idézési profilja számos vonásában hasonló az átlag fölöttiekéhez). A fentiekből következően úgy gondoljuk: a bemutatott többoldalú elemzések alkalmasak lehetnek arra, hogy belőlük az egyes intézmények struktúrája mellett a működésük hatékonyságára vonatkozóan is levonhatók legyenek következtetések.

TexTrend: újszerű eszközök
az elemzés szolgálatában

A közölt eredmények a TexTrend eszközeivel készültek. A TexTrend NKPF-nagypályázat (WEBCÍM >) célja kormányzati és gazdasági döntéshozatal támogatása szöveg- és adatbányászati módszerekkel. Ennek részeként olyan adat- és trendelemző eljárásokat fejlesztünk, amelyek segítségével a felhasználó (ha adatokkal rendelkezik) önállóan is végezhet a fentihez hasonló elemzéseket. Az eszköztár segítségével intuitív, menüvezérelt módon, interaktívan hajtható végre egy-egy olyan munkafolyamat, amelyek korábban több napi, esetleg heti munkát jelentettek. Ehhez nagy mennyiségű adat áttekinthető kezelésére és tárolására is szükség van: ez azonban a mostani, „petabyte-kornak” is nevezett időszakban nem jelent különálló kihívást. Egyre inkább fordított a kérdés: a mindenki által birtokolható nagy tömegű adatban „mi van”. A TexTrend-keretrendszer épp ezért alapvetőnek tekinti a digitális adatok elemzésének igényét: nyílt forráskódú, plug-in szerkezetű, grafikus felhasználói felületről vezérelhető, szabadon bővíthető eljárások gyűjteményét alkotta meg, amelyek (köztük a tanulmány eredményeit szolgáltató algoritmusok is) szabadon letölthetők, és flexibilisen alkalmazhatók. (Ennek részeként az R statisztikai környezet illetve az SQL-alapú adatbázis-lekérdezések számára olyan csomagoló „varázslót” is tartalmaz, mellyel a felhasználó minimális ismeretekkel a saját statisztikai eljárásait, illetve lekérdezéseit is a rendszer részévé teheti.) A fent bemutatott elemzések és a hozzájuk tartozó eszközök csak egy kis részét képezik a megvalósított funkcióknak, ezek egy része például teljes szövegű adatok (nagy tömegű blog, cikk vagy könyv) feldolgozására vonatkozik.

Visszatérve: első, áttekintő eredménynek tekinthetők az itt mutatott elemzések abban az értelemben is, hogy következő lépésként számos újabb kérdésre kell választ keresni. Adott intézményben valóban jobb-e a biológia a fizikánál, vagy a mindkettőtől eltérő közlési és idézési hagyományokkal rendelkező művészettörténetnél (Radicchi et al., 2008)? A TexTrend folyamatban lévő bibliometriai és tudománymetriai fejlesztései a szakterületi közlemény- és idézetszámra vonatkozó normálással jobban összehasonlíthatóvá teszik a „kis” és „nagy” területeket és az eltérő „sikerképességű” témákat (ezek ilyetén feldolgozását éppen magyar kutatók, Schubert András és Braun Tibor [1996] javasolták elsőként).
Az általunk már megvalósított és a tervezett újszerű eszközök más hasonlók sorába illeszkednek funkcionálisan. A TexTrend-eszköztár az Indiana Egyetem CIShell es Sci2 rendszerének továbbfejlesztésével készült, a pályázati konzorcium tagja az ELTE, a SZTAKI, az SZTE, a magánszektorból az Universitas Press, a GVI (a Magyar Kereskedelmi és Iparkamara Gazdaság- és Vállakozáskutató Intézete), valamint a Glia Kft.

Jelen tanulmány az NKFP_07_A2_TEXTREND Jedlik Ányos pályázat, a DyaNets FP7 FET Open projekt (EC #233847), valamint A tudomány társadalmi szerkezetének változásai című OTKA-pályázat (K84145) támogatásával készült. A támogatásokat a szerzők köszönik. Ugyancsak köszönet illeti Gulyásné Goldperger Anitát az SQL-lekérdezésekben való közreműködéséért.

Kulcsszavak: tudománymetria, bibliometria, adatbányászat, szövegbányászat, kompetenciatérképek

Függelék
A tudománytérképek készítése

Miképpen alkalmazhatók a tudománytérképek a szakterületi profil jellemzésére? Az eljárás váza három lépést tartalmaz:

(1) Elkészítjük a tudomány aktuális térképét. A térkép elemi szakterületeknek az ISI-adatbázisokban szereplő tárgykategóriákat (Subject Categories, a továbbiakban: SC) tekinti. Ezek a tárgykategóriák az egyes folyóiratok besorolására definiált osztályok, amelyek meghatározása részben szakértői ítéletre, részben pedig a hivatkozási adatok „automatizált” elemzésére épül. Lévén, hogy az ISI WOS-adatbázis elsősorban folyóiratcikkek feldolgozására szolgál, a tárgykategóriák az egyes publikációk besorolását is elvégzik. A tárgykategóriák hálózata, vagyis a tulajdonképpeni tudománytérkép az SC-k (vagyis a hozzájuk rendelt publikációk) hivatkozási kapcsolatát ragadja meg: két SC között annál szorosabb a viszony, minél több tárgykategóriára hivatkoznak közösen (ami annak a megfontolásnak az operacionalizált változata, hogy a területek tudásbázisának átfedése a rokonságukat jellemzi). Fontos megjegyezni: az így nyert térkép igen nagy felbontású: a szűkebb szakterületek kapcsolatrendszerét ábrázolja, nem pedig közvetlenül az ezekből felépülő nagy tudományterületekét. Ahhoz, hogy az utóbbi is leolvasható legyen, a térképen rögzített kapcsolatrendszer statisztikai elemzésével csoportosítjuk a tárgykategóriákat, vagyis a szoros kapcsolatban álló tárgykategóriákat (például faktoranalízis segítségével) nagy tudományterületekké, diszciplínákká aggregáljuk (és az egyazon diszciplínához tartozó SC-ket azonos színnel jelezzük a térképen).

(2) Vesszük ezek után az elemezni kívánt, kutatóhoz, országhoz, intézményhez stb. tartozó publikációs listát, és előállítjuk a lista elemeinek megoszlását az ISI-tárgykategóriák között. Ennek előfeltétele, hogy a publikációs lista maga is az ISI adatbázisaiban indexelt közleményeket tartalmazzon. Az eredmény a lista által képviselt szakterületi arányokat jelző gyakorisági eloszlás lesz, ami lényegében megegyezik a kutatási profil korábban leírt fogalmával.

(3) Az eljárás kulcsmozzanata végül a tudománytérképet a kutatási profillal összekapcsoló harmadik lépés, amelyben a tárgykategóriák gyakorisági eloszlását leképezzük az átfogó tudománytérképre (vagyis alaptérképre). A leképezés annyit tesz, hogy az egyes csomópontok, vagyis tárgykategóriák a kutatási profilban mért gyakoriságukkal arányos méretben jelennek meg a térképen. Ennek révén az átfogó tudománytérképből a vizsgált tudományos szereplő kibocsátásának szerkezetét jellemző konkrét, specifikus térkép lesz (előbbit ezért is nevezik alaptérképnek), amely tehát három kérdésre ad választ: a) melyek azok a területek, ahol az adott szereplő aktív, b) milyen ezeknek a területeknek a súlya és c) egymáshoz viszonyított helyzete a tudományrendszerben. Az eljárás előnye mindenekelőtt a c) pontban pillantható meg.

IRODALOM

Balogh Tamás (2002): Hol állunk Európában? (A magyarországi kutatás-fejlesztés helyzete az EU összehasonlító mutatói alapján). Magyar Tudomány. 108, 3, 361–370. • WEBCÍM >

Braun Tibor (2010): Egyetemek a világrangsorok bűvöletében. Magyar Tudomány. 171, 7, 816–824. • WEBCÍM >

Braun Tibor - Glänzel, W. - Némethné Kovács É. - Pereszteginé Szabadi Zs. (2002): Magyarország helyzete a természettudományi alapkutatás világában - tudománymetriai tájkép a második évezred végén. Magyar Tudomány. 108, 7, 935–945. • WEBCÍM >

Glänzel, Wolfgang (2001): National Characteristics in International Scientific Co-authorship Relations. Scientometrics. 51, 1, 69–115.

Kampis György (2010): • WEBCÍM >

Leydesdorff, Loet – Rafols, Ismael (2009): A Global Map of Science Based on the ISI Subject Categories. Journal of the American Society for Information Science and Technology. 60, 2, 348–362. • WEBCÍM >

Radicchi, Filippo – Fortunato, S. – Castellano C. (2008): Universality of Citation Distributions: Toward an Objective Measure of Scientific Impact. Proceedings of the National Academy of Sciences of the USA. 105, 45, 17268–17272. • WEBCÍM >

Rafols, Ismael – Porter, A. – Leydesdorff, L. (2009): Science Overlay Maps: A New Tool for Research Policy and Library Management. Arxiv preprint arXiv:0912.3882. • WEBCÍM >

Rafols, Ismael – Meyer, M. (2010): Diversity and Network Coherence as Indicators of Interdisciplinarity: Case Studies in Bionanoscience. Scientometrics. 82, 2, 263–287. • WEBCÍM >

Schubert András (2009): A magyar tudományos kutatás helyzete a világban. Tudománymetriai elemzés a Scopus adatbázis adatai alapján. KSZI Akták. 2, • WEBCÍM >

Schubert András – Braun Tibor (1981): Some Scientometric Measures of Publishing Performance for 85 Hungarian Research Institutes. Scientometrics. 3, 5, 379–388.

Schubert András – Braun Tibor (1996): Cross-field Normalization of Scientometric Indicators. Scientometrics. 36, 311–324.

Schubert András – Vasas Lívia (2010): Magyarország és a szomszédos országok publikációs és idézettségi mutatószámai nemzetközi összehasonlításban a National Science Indicators (Thomson-Reuters) és a SCImago (Elsevier) adatbázisok alapján, 1996–2007. Magyar Tudomány. 171, 7, 825–830. • WEBCÍM >

Soós Sándor – Kampis György (2011): Towards a Typology of Research Performance Diversity: The Case of top Hungarian Players. Scientometrics. 87, 2, 357–371. DOI 10.1007/s11192-011-0351-8

Tolnai Márton – Schubert A. – Wolf Gy. (2008): Tudományunk mérhető teljesítménye az Essential Science Indicators mutatószámainak tükrében. Magyar Tudomány. 169, 8, 989–997. • WEBCÍM >

Thijs, Bart – Glänzel, Wolfgang (2008): A Structural Analysis of Publication Profiles for the Classification of European Research Institutes. Scientometrics. 74, 2, 223--236.

Thijs, B. – Gänzel, Wolfgang (2009): A Structural Analysis of Benchmarks on Different Bibliometrical Indicators for European Research Institutes Based on Their Research Profile. Scientometrics. 79, 2, 377–388. DOI: 10.1007/s11192-008-0214-0

Vinkler Péter (1998): General Performance Indexes Calculated for Research Institutes of the Hungarian Academy of Sciences Based on Scientometric Indicators. Scientometrics. 41, 1, 185–200. DOI: 10.1007/BF02457977

LÁBJGYZETEK

1 A hazai tudománymetria behatóan foglalkozott ezzel a szinttel, elsősorban módszertani vonatkozásban (például Thijs–Glänzel, 2008, 2009). <

2 Jellegzetes példái ennek Wolfgang Glänzel és Schubert András (vö. Glänzel, 2001) elemzései, akik bizonyos országokat vizsgálva a profil jellege szerint tipológiát állítanak föl a publikácós kibocsátás szakterületi szerkezetére vonatkozóan. Ehhez az ún. aktivitási indexet alkalmazzák: ez a mutató az adott szakterület és az összes szakterület együttes kibocsátásának hazai és nemzetközi arányát viszonyítja egymáshoz. <