Magyar Tudomány • 2015 11 • Vinkler Péter

Bevezetés

A tudományos kutatás célja: új tudományos ismeretek létrehozása. Az új tudományos eredményeknek tudományos közlemények formájában történő nyilvánosságra hozatala a kutatás elengedhetetlen része. Annak megállapítását, hogy a közlésre szánt ismeret valóban új, tudományos és megfelelő színvonalú, a tudományos kiadványok szerkesztői és a közlésre szánt írás bírálói végzik. Természettudományokban a közlés elsődleges formája a tudományos folyóiratcikk. A közöltek szakterületén nem járatos személyek és szervezetek részére annak megítéléséhez, hogy adott közlemények milyen hatást gyakoroltak a tudományra, a legtöbbször csak az illető terület kutatói által készített bírálatok (peer reviews) vagy a tudománymetriai értékelés mutatószámai adhatnak támpontot. Igen sok esetben hasznos vagy éppen nélkülözhetetlen annak legalább közelítőleges megállapítása, hogy egyének, csoportok, intézmények, országok közleményei milyen mértékben járultak hozzá a világ tudományos ismereteinek kiszélesítéséhez és elmélyítéséhez. A közlemények értékelése akár tudományos címek, fokozatok odaítélésekor, egyetemi tanári kinevezéskor, akár témapályázatok elbírálásakor vagy intézményi és országos szintű tudománypolitikai intézkedések meghozatalakor játszik, játszhat fontos szerepet.

Az értékelő tudománymetria elmélete és gyakorlata arra a paradigmára épül, amely szerint az ismerettermelés mértékének és hatásának vannak olyan számszerűsíthető vonatkozásai, amelyek összefüggésben állnak az értékelt publikációknak a tudományhoz és a tudományos kutatáshoz való hozzájárulásával. A publikációk értékelési módszerei tudománymetriai mutatók kidolgozásán és alkalmazásán alapulnak.

A létrehozott és a tudományos közösség rendelkezésére bocsátott ismeretek mennyiségének tudománymetriai mértékegységéül a természettudományokban a tudományos folyóiratcikket tekinthetjük. A közölt ismeretek hatásának mértékegységéül az idézetet fogadhatjuk el. Ismeretes, hogy mind a közölt ismeretek megjelenési helyének az ismerethordozók (folyóirat, konferenciakiadvány, könyv stb.) közötti megoszlása, mind az adott hivatkozások és a kapott idézetek száma erősen függ az egyes szakterületek (sőt: témák) bibliometriai tulajdonságaitól. Ennélfogva értékelés céljából történő összehasonlításokat a legtöbb tudománymetriai mutatószám alapján csak azonos (hasonló) bibliometriai sajátosságú területek kutatói, csoportjai között tehetünk. A tudományos összteljesítmény megítélésekor érdemes azokat a mutatószámokat előnyben részesítenünk, amelyek mind a mennyiséget, mind a hatást egyaránt figyelembe veszik (Vinkler, 2010).

A közlemények tudománymetriai mutatószámait korábban elsősorban az értékelendő publikációs halmaz egészéből számították ki. Ilyen mutató például az egy adott kutatócsoport által közölt összes cikk és kapott idézet száma vagy a cikkek átlagos idézettsége, továbbá az egy cikkre jutó hatástényező. Ha az összes cikk száma: P, amelyekre összesen C számú idézet érkezett, akkor az átlagos idézettség: C/P. Ha a folyóiratoknak, amelyekben az illető egyén vagy csoport cikkei megjelentek, összeadjuk a Garfield-(hatás)tényezőit (impact factor) és a kapott számot elosztjuk a közölt cikkek számával, akkor megkapjuk az egyén vagy csoport átlagos Közlési stratégiájának mutatószámát, vagyis az átlagosan egy cikkre jutó folyóirat-hatástényező adatát.

Megjegyzendő, helyes lenne figyelembe venni, hogy Garfield-értelemben véve hatástényezőjük (impaktfaktoruk) csak folyóiratoknak van, minden egyéb publikációs halmazra vonatkozó C/P adatot (átlagos) „idézettségnek” (citedness) vagy „idézetgyakoriságnak” (citation frequency) nevezhetünk. Furcsa, hogy többen még ma is citációt emlegetnek a helyes magyar szavak: idézet vagy hivatkozás helyett. Egyébként célszerű, ha az említett szavakat nem azonos értelműként használjuk. A hivatkozás ugyanis az az utalás, amelyet egy szerző a közleményében más szerző munkájára vonatkoztatva ad. Az idézet pedig az az utalás, amelyet egy közlemény szerzőjétől egy másik szerző kap.

Az élet minden területén kulcskérdés a személyekre, szervezetekre és dolgokra vonatkozó adatok eloszlásának ismerete. Így például a javak és képességek eloszlása az emberek, bizonyos témájú ismeretek (pl. cikkek) eloszlása az ismerethordozók (pl. folyóiratok), az ásványi kincsek eloszlása az országok vagy akár a megjelent publikációk eloszlása a közlő szerzők között (lásd Lotka-törvény).

Több szerző véleménye szerint (például Cole – Cole, 1973; Aksnes, 2003) jelentős tudományos hatást csak az illető szakterületen az átlagosnál lényegesen erősebben idézett közleményekben lévő ismeretek érhetnek el. (Itt most nem tárgyalom a ritkán, de előforduló eseteket, amelyek a jó szándékú tévedés vagy a szándékos megtévesztés, csalás tárgykörébe esnek.) Ezért lényeges, hogy egy adott közleményhalmazból ki tudjuk választani a legnagyobb hatású cikkeket, a legidézettebbeket, amelyek a leghatásosabb, ún. elit részhalmazt alkotják. A leghatásosabb közlemények részhalmazából kiszámított tudománymetriai mutatókat elit mutatószámoknak nevezzük.

Az elit mutatók kiszámításának első lépése csaknem minden esetben az, hogy az értékelendő teljes közleményhalmaz elemeit az idézetek csökkenő sorrendjébe állítjuk. Ezek után a leghatásosabb részhalmazt a halmaz többi részétől elválasztó határ kijelölése a cél, ami azonban minden esetben önkényes választás kérdése. Helyesen tesszük, ha az önkényesen megállapított határokat gyakorlati tapasztalatokra építjük. Vagy megfordítva: az elméleti megfontolások alapján kijelölt határértékek (idézetszám, közleményszám) helyességét más (nem tudománymetriai) adatokkal, elemzésekkel támasztjuk alá.

Közismert, hogy a közleményekre érkezett idézetek eloszlása torz. Ez azt jelenti, hogy kevés cikk kap viszonylag sok, míg sok cikk kap viszonylag kevés idézetet. A torz eloszlást Sune Lehmann és munkatársai (2003) a SLAC SPIRES- (fizikai tárgyú) adatbázis segítségével vizsgálták. Azt találták, hogy az adattár 1962–2002 között megjelentetett 281 717 folyóiratcikkének 26,7%-át az említett évek alatt nem hivatkozták egyszer sem („ismeretlen cikkek”). A „kevésbé ismert” cikkek (1–9 idézet/cikk) 44,4%-ot, míg az „ismert” cikkek (10–49 idézet/cikk) 22,4%-ot, a „jól ismert” cikkek (50–99 idézet/cikk) 3,8%-ot, a „nevezetes” cikkek (100–499 idézet/cikk) 2,5%-ot és az „elismert” cikkek (több mint 500 idézet) 0,2%-ot tettek ki. A szerzők szerint kevés igazán érdekes és jelentős cikk „úszik a döglött cikkek tengerében”.

Egy közleményhalmaz leghatásosabb részhalmazának meghatározására többféle módszer használható. A legkorábban önkényesen kijelölt idézettségi határokat adtak meg. Így például Paul Bourke és Linda Butler (1996) többféle természettudományi terület közleményeit tanulmányozva, a következő idézetségi osztályokat alkalmazta: 0, 1, 2–4, 5–9, 10–16, 17–25, 26–50, 51–100, több mint 100 idézet cikkenként. A Web of Knowledge, Thomson Reuters által alkalmazott módszer szerint a halmaz méretétől, az alkalmazott közlési és idézési időhatároktól, továbbá a kiválóság mértékétől függően az összes közlemény közül a legidézettebb 0,01; 0,1; 1,0 vagy 10%-ot tekinthetjük a leghatásosabb részhalmazhoz tartozónak. Az említett adattár egy tízéves időszakban megjelent cikkeket vizsgál, és az idézetek számát ugyancsak ebben az időben veszi figyelembe. Az említetteknél függetlenebb módszert kínál a „jellemző számok és mértékek” („characteristic scores and scales”) módszere (Glänzel, 2007), amely szerint egy közleményhalmazban az átlagos idézettségnél (C/P) például kétszer, háromszor, ötször vagy tízszer nagyobb idézettségű közleményeket tekinthetjük kiemelkedően idézetteknek.

Egy nagyobb közleményhalmazból a leghatásosabb cikkek részhalmazának kiszámítására alkalmas például a Jorge E. Hirsch (2005) által javasolt h-mutató és az Egghe-féle (2006) g-mutató is. Az általam javasolt π-index (Vinkler, 2009) és PRP-mutató (Vinkler, 2013) kiszámításához a P(π) halmazt mint a leghatásosabb cikkek halmazát alkalmazzuk, amely a teljes halmazba tartozó elemek (pl. folyóiratcikkek) számának (P) négyzetgyöke.

A publikációk leghatásosabb részhalmazának értékelésén alapuló tudománymetriai mutatók előtérbe kerülését mutatja az irodalomban közölt, illetve a gyakorlatban is alkalmazott elit mutatószámok időbeni gyarapodása. Az általam 1988-ban megjelentetett áttekintő közlemény (Vinkler, 1988) tudománymetriai mérőszámai közül mindössze hét (14,6%) köthető a leghatásosabb részhalmaz koncepcióhoz. Lorna Wildgaard és munkatársai (2014) viszont 108 mutatót osztályoznak, amelyek közül 48 (44,4%) származtatható a leghatásosabb cikkeket tartalmazó részhalmazokból.

Néhány elit mutató

A leghatásosabb cikkek részhalmazának mutatószámai közül jelenleg a h-index a legelterjedtebb. A Hirsch-index nem más, mint a h-statisztika szerint kiválasztott leghatásosabb cikkek száma. A h-index értéke megegyezik azzal a legnagyobb sorszámmal, amellyel egyenlő vagy még éppen nagyobb az illető cikkre kapott idézetek száma (1. táblázat). A cikkek az idézetek csökkenő sorrendjében állnak. Ha tehát a h-index például 22, akkor az értékelt cikkhalmazban van 22 olyan cikk, amely legalább 22 idézetet (vagy ennél többet) kapott. Ha a rangsorban következő cikk (a 23.) szintén csak 22 idézetet vagy ennél kevesebbet ért el, akkor a h-index értéke nem változik, marad 22. Az index legnagyobb hátránya, hogy csaknem teljesen figyelmen kívül hagyja éppen a legnagyobb hatású cikk vagy cikkek által kapott idézetek számát. Ha például a cikkekre érkezett idézetek száma egyenként a következő: 10, 5, 5, 4, 3, 2, 1, 0, akkor a h-index = 4, hiszen 4 olyan cikk van, amely 4 vagy ennél több idézetet kapott. Ha egy másik cikkhalmaz tagjaira 100, 50, 50, 4, 3, 2, 1, 0 idézetet találunk, akkor ennek a halmaznak is csak 4 lehet a h-indexe, mert csak 4 cikk kapott 4 vagy ennél több idézetet.

Nem értékeli h-index azt sem, ha a halmazban lévő legidézettebb közlemények újabb idézeteket kapnak. A h-index értéke csak akkor nő, ha nő a legidézettebb részhalmaz mérete, azaz éppen akkor, ha a leghatásosabb cikkek halmazán kívüli cikkekre érkeznek újabb idézetek. Megjegyzendő: különleges esetekben a h-mutató értékének eggyel való növeléséhez elegendő egyetlen új idézet.

A h-mutató további hátránya a szakterületek bibliometriai sajátosságaitól való erős függés. (Bibliometriai sajátosság például a közlésre használt kiadványok, mint folyóiratcikkek, könyvek, konferenciaanyagok stb. számának aránya, a közleményekben lévő hivatkozások átlagos száma, a szakterület publikációs sebessége stb.) Nyilvánvaló, hogy az olyan tudományterületeken működő kutatók, mint például a matematika, ahol átlagosan kevesebb a hivatkozások száma a cikkekben, lényegesen kisebb h-indexet mutathatnak fel, mint azok, akik az élettudományok egyes területein dolgoznak.

Számos mutatót vezettek be a tudománymetriába, amelyek meghatározása a h-statisztikán alapul. Ilyen például az R-mutató, amely a h-cikkekre kapott összes idézet (C) négyzetgyöke. Több tanulmány igazolja azonban, hogy az említett és az itt nem említett, származtatott mutatók érdemleges változást nem eredményeznek az értékelésekben (lásd például Bornmann et al., 2011)

A g-mutató másféle statisztikán alapul, s részben kiküszöböli a h-index hátrányait. Értékét úgy számítjuk ki, hogy a cikkek idézettségi sorszámait (r) négyzetre (r²) emeljük, és megnézzük, hogy a rangsorba állított cikkek idézeteinek (ci) halmozott idézetszáma (Σci) melyik sorszám négyzetével egyezik, illetve melyiknél még éppen nagyobb (1. táblázat). A g-index a leghatásosabb halmaz (g-számú cikk) időben növekvő idézetszámát, a h-mutatóval ellentétben figyelembe veszi. A mutató a leghatásosabb cikkek halmazára érkezett, viszonylag nagyobb számú idézetet is érzékeli (1. táblázat). Értéke erősen függ az egyes szakterületek bibliometriai sajátságaitól. Sajátos hátránya, hogy esetenként nem létező cikkeket is figyelembe kell venni (lásd később). A g-mutató általában jelentősen nagyobb, mint a h-mutató.

2009-ben javasoltam (Vinkler, 2009), hogy egy közleményhalmaz leghatásosabb cikkeinek részhalmazát, P(π) a halmazban lévő összes közlemény (P) négyzetgyökével fejezzük ki. A P(π) = √P arány alkalmazása Genagyij Dobrov (1970) írásaira vezethető vissza, de rokonítható a fiziológiából ismert Fechner-törvénnyel is. Az említett törvény szerint az érzékelés mértéke az azt kiváltó hatás nagyságának logaritmusával arányos.

A (kerekített) P(π)-adat például egy 5, 10, 50, 70, illetve 100 cikkből álló halmaz esetében: 2, 3, 7, 8, illetve 10, amely adatok a halmaz cikkei 40, 30, 14, 11, illetve 10%-ának felelnek meg. Megjegyzendő, hogy a P(π)-adat csaknem kivétel nélkül kisebb, illetve lényegesen kisebb, mint a h-index értéke.

A π-mutató a P(π)-halmaz cikkeire érkezett idézetek számának, C(π) századrésze: π-index = 0,01C(π).

A h-index és a π-index kiszámításának módját és néhány tulajdonságát egy egyszerű modell segítségével az 1. táblázat adatai mutatják.

Legyen mind A/, mind B/ esetben a halmazban lévő összes közlemény száma P = 10, a közleményekre kapott idézetek száma A/ esetben összesen: C = 100, B/ esetben pedig C = 50. Mind az A/, mind a B/ esetben legyen az idézetek eloszlása a cikkek között először egyenletes (e) (vagyis kapjon mind a 10 cikk egyenként 10, illetve 5 idézetet, másodszor pedig súlyozott (s), ami jelentse azt, hogy a 10 cikk mintegy 30%-a (azaz kerekítve: 3 cikk) kapja az összes idézet 80%-át. Ez az A/s esetben 80 idézetet jelent, a B/s esetben pedig 40 idézetet.

Az A/e példában a h-mutató = 10, mivel a halmazban van olyan 10 cikk, amely 10 idézetet kapott. Az adatok alapján megállapítható, hogy a h-mutató hátrányos az idézetek súlyozott eloszlása szempontjából, hiszen A/s példában a mutató értéke 5-re csökken. Tehát a h-index (ebben a modellben) az idézetek egyenletes eloszlását részesíti előnyben, és hátrányos, ha csak néhány kiemelkedően idézett közlemény van a halmazban. A C = 50 esetben (B/e vs B/s) hasonló a helyzet (h = 5 vs 3). Érdemes felfigyelni arra, hogy az A/s példában, ahol az összes idézet, C = 100 és a legidézettebb (ún. „h-core”) cikkek 50, 20, 10, 7, 7 idézetet kaptak, a h-index értéke ugyanakkora (h = 5), mint a B/e példában, ahol C = 50, és a legidézettebb cikkek csupán: 5, 5, 5, 5, 5 hivatkozást értek el.

A g-mutató kiszámítását mutatja az 1. táblázat B/s példája. Itt a g-index értéke azért 6, mert az r = 6 cikknél: Σci = 47, ami nagyobb, mint r² = 36, de a mutató nem lehet 7, mert r = 7 esetében: Σci = 48, amely érték kisebb, mint r² = 49.

A g-index = 10 az A/e példában, hasonlóan a h-indexhez. Az 1. táblázat mutatja, hogy az elit cikkekre érkezett viszonylag több idézet a g-mutató értékét nem csökkenti, hiszen A/s esetben g = 10. Sőt, a B/e és B/s esetek g-adatainak összevetése alátámasztja, hogy a g-index előnyös a kiemelten idézett közleményeket tartalmazó halmazok értékelésénél.

Az A/s eset szemlélteti azt a furcsaságot, hogy a g-index kiszámításánál egészen addig a sorszámig (illetve annak négyzetéig) kell haladnunk, amíg el nem érjük az idézetek halmozott összegét. Ha ugyanis vannak cikkek a halmazban, amelyek nem kaptak egyetlen idézetet sem (mint például itt az r = 9-es és az r = 10-es cikk), vagy a halmaz összesen csak 8 cikket tartalmazna, a rangszámokkal (r) akkor is tovább kell haladnunk r = 10-ig, nem létező cikkeket feltételezve, hogy elérjük a már az r = 8-nál kiszámított halmozott idézetszámot (azaz: Σci = 100 = r² = 100).

Az A/ és B/ esetben is P = 10, így a π-statisztika szerint a halmazok leghatásosabb cikkeinek részhalmazába π(P) = √10 = 3,33, kerekítve: 3 cikk tartozik. A model A/e példájában az első 3 cikk idézeteinek száma összesen: 30, így a π-index = 0,30. Az A/s példában viszont jelentősen megnőtt a leghatásosabb részhalmazban lévő cikkek idézeteinek száma: Σci = 80, ezért a π-index = 0,80. Hasonlóképpen változik a B/e és a B/s példában szereplő cikkek π-indexe: 0,15 vs 0,40.

A bemutatott példák alapján levonható a következtetés, amely szerint a π-mutató jelentős mértékben függ az idézeteknek a leghatásosabb cikkek részhalmazában lévő és a halmaz fennmaradó részében található cikkekre jutó idézetek számának arányától, továbbá, hogy előnyben részesíti a kiemelkedően nagy hatású cikkekre érkező idézeteket.

A π-mutató hátránya, hogy a h és a g-mutatóhoz hasonlóan erős szakterületi függőséget mutat. Minden olyan bibliometriai hatás, amely befolyásolja a közlemények által kapott idézetek számát, erre a mutatószámra is hatással van.

A százalékos idézettségi rangszám

Tekintve, hogy az előzőekben említett mutatószámok erősen függnek az értékelt közlemények szakterületétől, megkíséreltem egy viszonyítási alapot alkalmazó, de „nem paraméteres”, a szakterületek bibliometriai sajátosságaitól független mutatószám bevezetését. A százalékos idézettségi rangszám (PRP – Percentage Rank Position Index) elnevezésű mutató (Vinkler, 2013) a vizsgált cikk viszonylagos tudománymetriai hatását az ugyanabban az évben a vizsgált cikket közlő folyóiratban megjelent cikkek idézetek szerinti sorrendjében elfoglalt hely szerint határozza meg. Ha az adott évben a folyóiratban összesen P számú cikk jelent meg, és ezeknek idézetek szerinti rangsorában az általunk értékelt cikk az r-edik helyet foglalja el, akkor a PRP-index a következőképpen számolható:

PRP = 100 [ 1 – ( ( r – 1 ) / P ) ]

A PRP-mutató szerint a sorrendben az első, a legidézettebb közlemény 100 ponttal szerepel, függetlenül a megjelent cikkek számától (P). Természetesen a további helyezések mutatószáma erősen függ P-től. Így például a P = 10, 100, 1000 méretű halmazokban az idézetek szerint rangsorban a 2. helyen lévő cikkek PRP-mutatója rendre: 90,0; 99,0; 99,9, az 5. cikkek mutatói: 60,0; 96,0; 99,6, míg a 10. helyezetteké: 10,0; 91,0; 99,1.

Kétségtelenül jogos, hogy egy nagyobb közleményhalmazban elért ugyanaz a helyezés sokkal értékesebb legyen, mint egy kisebben. Ugyanakkor a mutató hátránya, hogy a kevés cikket közlő folyóiratokban elért viszonylag jobb helyezés esetenként indokolatlanul nagy mutatószámot ad.

A leghatásosabb részhalmazok mutatói
és a szakmai rangsor

Hogy a mutatószámok és a kutatóknak a szakmai rangsorban elfoglalt helye közötti összefüggéseket feltárhassam, meghatároztam öt, egyenként 10 kutatóból álló csoport közleményei leghatásosabb halmazainak néhány tudománymetriai mutatóját. A csoportok a következők:

• PhDj: PhD-fokozattal rendelkező, fiatal kutatók, akiknek átlagos publikációs élettartama (PLT): 11,20 év (SD = 3,64 év). A PLT-adat kiszámítása a következőképpen történt: PLT = 2014 – (a Web of Science-ben elsőként referált folyóirat-publikáció megjelenésének éve).

• PhDs: PhD-fokozatot szerzett, idősebb, de nem vezető beosztású kutatók, akiknek nincs MTA doktori címük (PLT = 29,80 év, SD = 7,02 év).

• DSc: MTA doktora címmel rendelkező kutatók (PLT = 34,40 év, SD = 2,84 év).

• MbA: az MTA Kémiai osztályának jelenleg is aktív tagjai vagy levelező tagjai (PLT = 38,00 év, SD = 1,25 év), akiknek 2013-ban is jelent meg publikációjuk.

• Nobel: A 2008–2013. között kémiai Nobel-díjjal kitüntetettek közül kiválasztott 10 személy (PLT = 38,90 év, SD = 0,32 év).

A kiválasztott kutatók a következők: Simomura Oszamu (Osamu Shimomura), Thomas A. Steitz, Ada E. Yonath, Richard F. Heck, Negisi Ei-icsi (Ei-ichi Negishi), Dan Shechtman, Robert J. Lefkowitz, Brian K. Kobilka, Martin Karplus, Arieh Warshel. Megjegyzendő: a PhDj-, PhDs- és a DSc-csoportokhoz tartozó kutatók mind kémikusok, és 2014-ben az MTA TTK-ban dolgoztak.

Feltételezhető, hogy a fiatalabb kutatók (PhDj), lévén pályájuk elején, átlagosan kevesebb cikket jelentetnek meg, kevesebb idézetet kapnak, s többi mutatójuk is gyengébb, mint idősebb kollégáiké. Feltételezhető az is, hogy a PhDs- és a DSc-csoport tagjai különböző helyet foglalnak el a szakmai rangsorban, s ezért mutatószámaik is különböznek az utóbbi csoport javára. A DSc-csoportból nyolcan kutatócsoport-vezetők voltak, vagy jelenleg is azok. Várható az is, hogy az illető hazai szakmai rangsor csúcsán álló kémikus akadémikusok (MbA) közleményeinek tudománymetriai mutatói felülmúlják az előzőekben említett csoportok átlagait. Nyilvánvaló, hogy a világ tudósainak a közleménymutatók területén folyó versengésében a legelőkelőbb helyezéseket átlagban a Nobel-díjasok érik el. Számos közlemény igazolja, hogy a Nobel-díjjal kitüntetettek idézeteinek száma jelentősen (akár nagyságrendekkel is) nagyobb, mint az adott szakterület kutatóinak átlaga (Garfield – Welljams-Dorof, 1992).

A tárgyalt elit mutatószámok (h, g, π, PRP) mindegyike függ a nyilvánosságra hozott információ mennyiségétől (a cikkek számától), ami nyilvánvalóan az illető kutatók szakmai pályafutásának hosszával arányos. Azért, hogy a különböző hosszúságú életpályát bejárt kutatókat közleményeik alapján összehasonlíthassák, a mutatószámokat normálni szokták. Ennek megfelelően képzik az egy évre jutó idézetek (C/y) vagy publikációk számát (P/y), az egy cikkre jutó idézetek számát (C/P), az egy cikkre eső folyóirat-hatástényezők adatát (FHT/P). Ez utóbbi képletben FHT az illető cikkeket közlő folyóiratok hatástényezőinek súlyozott összegét jelenti (természetesen, ha egy folyóiratban három cikk jelent meg, akkor annak hatástényezőjét háromszorosan kell figyelembe venni).

Megjegyzendő, hogy a C, C/P, FHT/P mutatók erősen függnek az illető szakterületek bibliometriai sajátosságaitól. Az utóbbi években különösen elterjedt az összimpakt, impaktfaktor kifejezések használata egyének mutatóinak kiszámításánál. Érdemes megjegyezni, hogy a közlő folyóiratok hatástényezőinek átlaga (FHT/P) az illető kutató közlési stratégiájára, de semmiképpen sem az illető által közölt információk szakmai hatására jellemző. Ismeretes, hogy a folyóiratok cikkei idézettségének eloszlása torz, esetenként nagyon torz. Éppen ezért helytelen a közlő folyóiratok cikkeinek átlagos idézettségét mint az abban a folyóiratban publikációt megjelentető kutató impaktfaktorát, mint a kutató eredményeinek hatására, kiválóságára vonatkozó mutatószámot értékelni. Nyilvánvaló, hogy a „jobb” folyóiratokban megjelent cikkek arra utalnak, hogy az illető szerző „jó” helyeken tudja elfogadtatni a cikkeit, ami kétségtelenül szakmai érdem. Ámde ettől még nem biztos, hogy az illető adott cikke eléri az illető folyóirat cikkeinek átlagos színvonalát. Ezt csak az értékelt cikkekre érkezett idézetek tudják megmutatni, legalábbis tudománymetriai értelemben.

A jelen közleményben a kutatók teljes publikációs teljesítményét (az információ mennyiségét és hatását) jellemző mutatószámokat vizsgáltam. Emiatt az említett fajlagos (normált) mutatószámok nem játszanak szerepet. Nem vettem figyelembe a különben releváns szerzői részesedés mértékét sem.

A 2. táblázatból kitűnik, hogy az a feltevés, amely szerint a vizsgált tudománymetriai mutatóknak a szakmai rangsorban elfoglalt tekintélyesebb hely szerint növekedniük kell, helyes. Ez a következő egyenlőtlenséget jelenti: PhDj < PhDs < DSc < MTA < Nobel.

A Nobel-díjjal kitüntetett kutatók tudománymetriai mutatói jelentősen meghaladják a többi kutatóét. Az átlagok leginkább az idézetek számában (C) különböznek (például Nobel-átlag/PhDj-átlag = 144,97). Az említett két csoport átlagai közötti arányszám a többi mutató esetében a következő: h = 11,20; g = 10,08; π = 81,20 és PRP = 5,54. A Nobel-díjasok (Nobel) és az MTA-tagok (MTA) közötti arányszámok a következők: P = 2,37; C = 10,93; h = 2,81; g = 3,18; π = 10,02; PRP = 1,61. Mivel a h-, g- és π-mutatók közül a legutóbbi függése a legerősebb az idézetek számától, ezért olyan nagy az erre a mutatóra vonatkozó arányszám. Az arányokat és az illető kutatók szakterületeit áttekintve feltehető, hogy a szakterületi bibliometriai sajátosságokat figyelembe vevő százalékos idézetségi rangszám (PRP) nyújtja a leginkább valóságos képet.

A többi csoport átlagai közötti arányok is kiszámíthatóak a 2. táblázat adataiból. Így például az MTA-tagok (MTA) és az MTA doktora (DSc) címet elért kutatók arányszámai rendre a következők: P = 1,81; C = 1,59; h = 1,33; g = 1,28; π = 1,38; PRP = 1,41. A DSc- és a PhDs-kutatók csoportjainak arányszámai pedig: P = 1,68; C = 3,54; h = 1,71; g = 1,78; π = 3,40; PRP = 1,40.

Megemlítendő, hogy az egyes csoportok átlagai a P, h és a PRP-mutatónál minden esetben szignifikánsan (p ≤ 0,03) különböznek. A C, g és π-átlagok is szignifikánsan különböznek egymástól minden esetben, kivéve a DSc- és az MTA-csoport átlagai közötti különbséget. Ez a tény azt jelenti, hogy például a C-mutatónál öten, a g-mutatónál ketten, a π-mutató esetében pedig hatan a DSc-csoport kutatói közül elérik (illetve meghaladják) az akadémikusok (MTA) mutatóinak átlagát.

Következtetés

A vázlatosan összefoglalt elemzés alátámasztja azt a feltételezést, hogy a szakmai rangsorban elfoglalt hely függvényében vizsgált tudománymetriai mutatószámok a várakozásnak megfelelő sorrendben növekednek. Ez a tény hozzájárul a mutatók használhatóságának igazolásához. Bár a szakmai rangsor különböző szintjein lévő kutatók csoportjai publikációinak leghatásosabb halmazára vonatkozó mutatószámok átlagai a legtöbb esetben szignifikánsan különböznek, egyének esetében azonban vannak eltérések. Vagyis akadnak olyan kutatók, akiknek mutatói meghaladják, esetleg lényegesen meghaladják a szakmai rangsoruknak megfelelő csoport átlagát, s elérik a magasabb szinten lévő csoportét. Éppen ezért elengedhetetlen, hogy az egyének szakmai előremenetelét, kutatási pályázatait elbírálók ne csak az illetők korábban kapott címeit, elért tudományos fokozatát vagy beosztását vegyék figyelembe, hanem komolyan mérlegeljék az értékelendő kutatók tudománymetriai mutatóit és ezeknek a különböző szakmai szintekhez mért arányait.

A mutatószámok részletes tanulmányozása rámutat arra is, milyen fontos a bibliometriai sajátosságaikban egymástól eltérő szakterületek közleményeinek összevetésekor a megfelelő mutatószámok kiválasztása. Az itt bemutatott mutatók közül egyedül a százalékos idézettségi rangszám (PRP) ad lehetőséget a szakterületi sajátosságok kiegyenlítésére.

A tudományos publikációs tevékenységnek, eredményességnek több oldala van. Ezért nem ajánlatos egyetlen mutatószámmal jellemezni egy adott kutató vagy egy kutatócsoport publikációit. A jellemzést, ha tetszik értékelést, mindig az értékelés célja szerint kiválasztott mutatószámok szerint indokolt elvégezni. Ehhez jelentős segítséget tudnak nyújtani a leghatásosabb közlemények publikációs halmazaira vonatkozó újabb tudománymetriai mutatószámok.

Kulcsszavak: tudománymetriai mutatószámok, publikációs értékelés, Hirsch-index, g-index, π-index, Garfield (impact) factor, elit közleményhalmaz, szakmai rangsor

IRODALOM

Aksnes, Dag W. (2003): Characteristics of Highly Cited Papers. Research Evaluation. 12, 159–170. DOI: 10.3152/147154403781776645

Bornmann, Lutz – Mutz, R. – Hug, S. E. – Daniel, H. D. (2011): A Multilevel Meta-analysis of Studies Reporting Correlations between the h Index and 37 Different h Index Variants. Journal of Informetrics. 5, 346–359. DOI: 10.1016/j.joi.2011.01.006

Bourke, Paul – Butler, Linda (1996): Publication Types, Citation Rates and Evaluation. Scientometrics. 37, 473–494. • WEBCÍM

Cole, Jonathan R. – Cole, Stephen (1973): Social Stratification in Science. The University of Chicago Press, Chicago

Dobrov, G[ennagyij] M[ihajlovics] (1970): Nauka o Nauke. Naukova Dumka, Kiev

Egghe, Leo (2006): Theory and Practice of the g-index. Scientometrics, 69, 131–152. DOI: 10.1007/s11192-006-0144-7 • WEBCÍM

Garfield, Eugene – Welljams-Dorof, Alfred (1992): Of Nobel Class: A Citation Perspective on High Impact Research Authors. Theoretical Medicine, 13, 117–135.

Glänzel, Wolfgang (2007): Characteristic Scores and Scales. A Bibliometric Analysis of Subject Characteristic Based on Long-term Citation Observation. Journal of Informetrics. 1. 92–102. DOI:10.1016/j.joi.2006.10.001

Hirsch, Jorge E. (2005): An Index to Quantify An Individual’s Scientific Research Output. Proceedings of the National Academy of the USA. 102, 16569–16572. DOI: 10.1073/pnas.0507655102 • WEBCÍM

Lehmann, Sune – Lautrup, B. – Jackson, A. D. (2003): Citation Networks in High Energy Physics. Physical Review. E68, 026113-1-026113-8. DOI: 10.1103/PhysRevE.68.026113 • WEBCÍM

Vinkler Péter (1988): An Attempt of Surveying and Classifying Bibliometric Indicators for Scientometric Purposes. Scientometrics. 13, 239–259. DOI: 10.1023/ A:1010519000767 • WEBCÍM

Vinkler Péter (2009): The π-index: A New Indicator for Assessing Scientific Impact. Journal of Information Science. 35, 602–612. • WEBCÍM

Vinkler Péter (2010): The Evaluation of Research by Scientometric Indicators. Chandos Publishing, Cambridge • WEBCÍM

Vinkler Péter (2013): Comparative Rank Assessment of Journal Articles. Journal of Informetrics. 7, 712–717. DOI: 10.1016/j.joi.2013.04.006

Wildgaard, Lorna – Schneider, J. W. – Larsen, B. (2014): A Review of the Characteristics of 108 Author-level Bibliometric Indicators. Scientometrics. 101, 125–158. DOI: 10.1007/s11192-014-1423-3 • WEBCÍM