Bevezetés
A tudományos kutatás célja: új tudományos ismeretek létrehozása. Az
új tudományos eredményeknek tudományos közlemények formájában
történő nyilvánosságra hozatala a kutatás elengedhetetlen része.
Annak megállapítását, hogy a közlésre szánt ismeret valóban új,
tudományos és megfelelő színvonalú, a tudományos kiadványok
szerkesztői és a közlésre szánt írás bírálói végzik.
Természettudományokban a közlés elsődleges formája a tudományos
folyóiratcikk. A közöltek szakterületén nem járatos személyek és
szervezetek részére annak megítéléséhez, hogy adott közlemények
milyen hatást gyakoroltak a tudományra, a legtöbbször csak az illető
terület kutatói által készített bírálatok (peer reviews) vagy a
tudománymetriai értékelés mutatószámai adhatnak támpontot. Igen sok
esetben hasznos vagy éppen nélkülözhetetlen annak legalább
közelítőleges megállapítása, hogy egyének, csoportok, intézmények,
országok közleményei milyen mértékben járultak hozzá a világ
tudományos ismereteinek kiszélesítéséhez és elmélyítéséhez. A
közlemények értékelése akár tudományos címek, fokozatok
odaítélésekor, egyetemi tanári kinevezéskor, akár témapályázatok
elbírálásakor vagy intézményi és országos szintű tudománypolitikai
intézkedések meghozatalakor játszik, játszhat fontos szerepet.
Az értékelő tudománymetria elmélete és gyakorlata
arra a paradigmára épül, amely szerint az ismerettermelés mértékének
és hatásának vannak olyan számszerűsíthető vonatkozásai, amelyek
összefüggésben állnak az értékelt publikációknak a tudományhoz és a
tudományos kutatáshoz való hozzájárulásával. A publikációk
értékelési módszerei tudománymetriai mutatók kidolgozásán és
alkalmazásán alapulnak.
A létrehozott és a tudományos közösség
rendelkezésére bocsátott ismeretek mennyiségének tudománymetriai
mértékegységéül a természettudományokban a tudományos
folyóiratcikket tekinthetjük. A közölt ismeretek hatásának
mértékegységéül az idézetet fogadhatjuk el. Ismeretes, hogy mind a
közölt ismeretek megjelenési helyének az ismerethordozók (folyóirat,
konferenciakiadvány, könyv stb.) közötti megoszlása, mind az adott
hivatkozások és a kapott idézetek száma erősen függ az egyes
szakterületek (sőt: témák) bibliometriai tulajdonságaitól.
Ennélfogva értékelés céljából történő összehasonlításokat a legtöbb
tudománymetriai mutatószám alapján csak azonos (hasonló)
bibliometriai sajátosságú területek kutatói, csoportjai között
tehetünk. A tudományos összteljesítmény megítélésekor érdemes azokat
a mutatószámokat előnyben részesítenünk, amelyek mind a mennyiséget,
mind a hatást egyaránt figyelembe veszik (Vinkler, 2010).
A közlemények tudománymetriai mutatószámait
korábban elsősorban az értékelendő publikációs halmaz egészéből
számították ki. Ilyen mutató például az egy adott kutatócsoport
által közölt összes cikk és kapott idézet száma vagy a cikkek
átlagos idézettsége, továbbá az egy cikkre jutó hatástényező. Ha az
összes cikk száma: P, amelyekre összesen C számú idézet érkezett,
akkor az átlagos idézettség: C/P. Ha a folyóiratoknak, amelyekben az
illető egyén vagy csoport cikkei megjelentek, összeadjuk a
Garfield-(hatás)tényezőit (impact factor) és a kapott számot
elosztjuk a közölt cikkek számával, akkor megkapjuk az egyén vagy
csoport átlagos Közlési stratégiájának mutatószámát, vagyis az
átlagosan egy cikkre jutó folyóirat-hatástényező adatát.
Megjegyzendő, helyes lenne figyelembe venni, hogy
Garfield-értelemben véve hatástényezőjük (impaktfaktoruk) csak
folyóiratoknak van, minden egyéb publikációs halmazra vonatkozó C/P
adatot (átlagos) „idézettségnek” (citedness) vagy
„idézetgyakoriságnak” (citation frequency) nevezhetünk. Furcsa, hogy
többen még ma is citációt emlegetnek a helyes magyar szavak: idézet
vagy hivatkozás helyett. Egyébként célszerű, ha az említett szavakat
nem azonos értelműként használjuk. A hivatkozás ugyanis az az
utalás, amelyet egy szerző a közleményében más szerző munkájára
vonatkoztatva ad. Az idézet pedig az az utalás, amelyet egy
közlemény szerzőjétől egy másik szerző kap.
Az élet minden területén kulcskérdés a személyekre,
szervezetekre és dolgokra vonatkozó adatok eloszlásának ismerete.
Így például a javak és képességek eloszlása az emberek, bizonyos
témájú ismeretek (pl. cikkek) eloszlása az ismerethordozók (pl.
folyóiratok), az ásványi kincsek eloszlása az országok vagy akár a
megjelent publikációk eloszlása a közlő szerzők között (lásd
Lotka-törvény).
Több szerző véleménye szerint (például Cole – Cole,
1973; Aksnes, 2003) jelentős tudományos hatást csak az illető
szakterületen az átlagosnál lényegesen erősebben idézett
közleményekben lévő ismeretek érhetnek el. (Itt most nem tárgyalom a
ritkán, de előforduló eseteket, amelyek a jó szándékú tévedés vagy a
szándékos megtévesztés, csalás tárgykörébe esnek.) Ezért lényeges,
hogy egy adott közleményhalmazból ki tudjuk választani a legnagyobb
hatású cikkeket, a legidézettebbeket, amelyek a leghatásosabb, ún.
elit részhalmazt alkotják. A leghatásosabb közlemények
részhalmazából kiszámított tudománymetriai mutatókat elit
mutatószámoknak nevezzük.
Az elit mutatók kiszámításának első lépése csaknem
minden esetben az, hogy az értékelendő teljes közleményhalmaz
elemeit az idézetek csökkenő sorrendjébe állítjuk. Ezek után a
leghatásosabb részhalmazt a halmaz többi részétől elválasztó határ
kijelölése a cél, ami azonban minden esetben önkényes választás
kérdése. Helyesen tesszük, ha az önkényesen megállapított határokat
gyakorlati tapasztalatokra építjük. Vagy megfordítva: az elméleti
megfontolások alapján kijelölt határértékek (idézetszám,
közleményszám) helyességét más (nem tudománymetriai) adatokkal,
elemzésekkel támasztjuk alá.
Közismert, hogy a közleményekre érkezett idézetek
eloszlása torz. Ez azt jelenti, hogy kevés cikk kap viszonylag sok,
míg sok cikk kap viszonylag kevés idézetet. A torz eloszlást Sune
Lehmann és munkatársai (2003) a SLAC SPIRES- (fizikai tárgyú)
adatbázis segítségével vizsgálták. Azt találták, hogy az adattár
1962–2002 között megjelentetett 281 717 folyóiratcikkének 26,7%-át
az említett évek alatt nem hivatkozták egyszer sem („ismeretlen
cikkek”). A „kevésbé ismert” cikkek (1–9 idézet/cikk) 44,4%-ot, míg
az „ismert” cikkek (10–49 idézet/cikk) 22,4%-ot, a „jól ismert”
cikkek (50–99 idézet/cikk) 3,8%-ot, a „nevezetes” cikkek (100–499
idézet/cikk) 2,5%-ot és az „elismert” cikkek (több mint 500 idézet)
0,2%-ot tettek ki. A szerzők szerint kevés igazán érdekes és
jelentős cikk „úszik a döglött cikkek tengerében”.
Egy közleményhalmaz leghatásosabb részhalmazának
meghatározására többféle módszer használható. A legkorábban
önkényesen kijelölt idézettségi határokat adtak meg. Így például
Paul Bourke és Linda Butler (1996) többféle természettudományi
terület közleményeit tanulmányozva, a következő idézetségi
osztályokat alkalmazta: 0, 1, 2–4, 5–9, 10–16, 17–25, 26–50, 51–100,
több mint 100 idézet cikkenként. A Web of Knowledge, Thomson Reuters
által alkalmazott módszer szerint a halmaz méretétől, az alkalmazott
közlési és idézési időhatároktól, továbbá a kiválóság mértékétől
függően az összes közlemény közül a legidézettebb 0,01; 0,1; 1,0
vagy 10%-ot tekinthetjük a leghatásosabb részhalmazhoz tartozónak.
Az említett adattár egy tízéves időszakban megjelent cikkeket
vizsgál, és az idézetek számát ugyancsak ebben az időben veszi
figyelembe. Az említetteknél függetlenebb módszert kínál a „jellemző
számok és mértékek” („characteristic scores and scales”) módszere
(Glänzel, 2007), amely szerint egy közleményhalmazban az átlagos
idézettségnél (C/P) például kétszer, háromszor, ötször vagy tízszer
nagyobb idézettségű közleményeket tekinthetjük kiemelkedően
idézetteknek.
Egy nagyobb közleményhalmazból a leghatásosabb
cikkek részhalmazának kiszámítására alkalmas például a Jorge E.
Hirsch (2005) által javasolt h-mutató és az Egghe-féle (2006)
g-mutató is. Az általam javasolt π-index (Vinkler, 2009) és
PRP-mutató (Vinkler, 2013) kiszámításához a P(π) halmazt mint a
leghatásosabb cikkek halmazát alkalmazzuk, amely a teljes halmazba
tartozó elemek (pl. folyóiratcikkek) számának (P) négyzetgyöke.
A publikációk leghatásosabb részhalmazának
értékelésén alapuló tudománymetriai mutatók előtérbe kerülését
mutatja az irodalomban közölt, illetve a gyakorlatban is alkalmazott
elit mutatószámok időbeni gyarapodása. Az általam 1988-ban
megjelentetett áttekintő közlemény (Vinkler, 1988) tudománymetriai
mérőszámai közül mindössze hét (14,6%) köthető a leghatásosabb
részhalmaz koncepcióhoz. Lorna Wildgaard és munkatársai (2014)
viszont 108 mutatót osztályoznak, amelyek közül 48 (44,4%)
származtatható a leghatásosabb cikkeket tartalmazó részhalmazokból.
Néhány elit mutató
A leghatásosabb cikkek részhalmazának mutatószámai közül jelenleg a
h-index a legelterjedtebb. A Hirsch-index nem más, mint a
h-statisztika szerint kiválasztott leghatásosabb cikkek száma. A
h-index értéke megegyezik azzal a legnagyobb sorszámmal, amellyel
egyenlő vagy még éppen nagyobb az illető cikkre kapott idézetek
száma (1. táblázat). A
cikkek az idézetek csökkenő sorrendjében állnak. Ha tehát a h-index
például 22, akkor az értékelt cikkhalmazban van 22 olyan cikk, amely
legalább 22 idézetet (vagy ennél többet) kapott. Ha a rangsorban
következő cikk (a 23.) szintén csak 22 idézetet vagy ennél
kevesebbet ért el, akkor a h-index értéke nem változik, marad 22. Az
index legnagyobb hátránya, hogy csaknem teljesen figyelmen kívül
hagyja éppen a legnagyobb hatású cikk vagy cikkek által kapott
idézetek számát. Ha például a cikkekre érkezett idézetek száma
egyenként a következő: 10, 5, 5, 4, 3, 2, 1, 0, akkor a h-index = 4,
hiszen 4 olyan cikk van, amely 4 vagy ennél több idézetet kapott. Ha
egy másik cikkhalmaz tagjaira 100, 50, 50, 4, 3, 2, 1, 0 idézetet
találunk, akkor ennek a halmaznak is csak 4 lehet a h-indexe, mert
csak 4 cikk kapott 4 vagy ennél több idézetet.
Nem értékeli h-index azt sem, ha a halmazban lévő
legidézettebb közlemények újabb idézeteket kapnak. A h-index értéke
csak akkor nő, ha nő a legidézettebb részhalmaz mérete, azaz éppen
akkor, ha a leghatásosabb cikkek halmazán kívüli cikkekre érkeznek
újabb idézetek. Megjegyzendő: különleges esetekben a h-mutató
értékének eggyel való növeléséhez elegendő egyetlen új idézet.
A h-mutató további hátránya a szakterületek
bibliometriai sajátosságaitól való erős függés. (Bibliometriai
sajátosság például a közlésre használt kiadványok, mint
folyóiratcikkek, könyvek, konferenciaanyagok stb. számának aránya, a
közleményekben lévő hivatkozások átlagos száma, a szakterület
publikációs sebessége stb.) Nyilvánvaló, hogy az olyan
tudományterületeken működő kutatók, mint például a matematika, ahol
átlagosan kevesebb a hivatkozások száma a cikkekben, lényegesen
kisebb h-indexet mutathatnak fel, mint azok, akik az élettudományok
egyes területein dolgoznak.
Számos mutatót vezettek be a tudománymetriába,
amelyek meghatározása a h-statisztikán alapul. Ilyen például az
R-mutató, amely a h-cikkekre kapott összes idézet (C) négyzetgyöke.
Több tanulmány igazolja azonban, hogy az említett és az itt nem
említett, származtatott mutatók érdemleges változást nem
eredményeznek az értékelésekben (lásd például Bornmann et al., 2011)
A g-mutató másféle statisztikán alapul, s részben
kiküszöböli a h-index hátrányait. Értékét úgy számítjuk ki, hogy a
cikkek idézettségi sorszámait (r) négyzetre (r²) emeljük, és
megnézzük, hogy a rangsorba állított cikkek idézeteinek (ci)
halmozott idézetszáma (Σci) melyik sorszám négyzetével egyezik,
illetve melyiknél még éppen nagyobb (1. táblázat). A g-index
a leghatásosabb halmaz (g-számú cikk) időben növekvő idézetszámát, a
h-mutatóval ellentétben figyelembe veszi. A mutató a leghatásosabb
cikkek halmazára érkezett, viszonylag nagyobb számú idézetet is
érzékeli (1. táblázat). Értéke erősen függ az egyes szakterületek
bibliometriai sajátságaitól. Sajátos hátránya, hogy esetenként nem
létező cikkeket is figyelembe kell venni (lásd később). A g-mutató
általában jelentősen nagyobb, mint a h-mutató.
2009-ben javasoltam (Vinkler, 2009), hogy egy
közleményhalmaz leghatásosabb cikkeinek részhalmazát, P(π) a
halmazban lévő összes közlemény (P) négyzetgyökével fejezzük ki. A
P(π) = √P arány alkalmazása Genagyij Dobrov (1970) írásaira
vezethető vissza, de rokonítható a fiziológiából ismert
Fechner-törvénnyel is. Az említett törvény szerint az érzékelés
mértéke az azt kiváltó hatás nagyságának logaritmusával arányos.
A (kerekített) P(π)-adat például egy 5, 10, 50, 70,
illetve 100 cikkből álló halmaz esetében: 2, 3, 7, 8, illetve 10,
amely adatok a halmaz cikkei 40, 30, 14, 11, illetve 10%-ának
felelnek meg. Megjegyzendő, hogy a P(π)-adat csaknem kivétel nélkül
kisebb, illetve lényegesen kisebb, mint a h-index értéke.
A π-mutató a P(π)-halmaz cikkeire érkezett idézetek
számának, C(π) századrésze: π-index = 0,01C(π).
A h-index és a π-index kiszámításának módját és
néhány tulajdonságát egy egyszerű modell segítségével az 1.
táblázat adatai mutatják.
Legyen mind A/, mind B/ esetben a halmazban lévő
összes közlemény száma P = 10, a közleményekre kapott idézetek száma
A/ esetben összesen: C = 100, B/ esetben pedig C = 50. Mind az A/,
mind a B/ esetben legyen az idézetek eloszlása a cikkek között
először egyenletes (e) (vagyis kapjon mind a 10 cikk egyenként 10,
illetve 5 idézetet, másodszor pedig súlyozott (s), ami jelentse azt,
hogy a 10 cikk mintegy 30%-a (azaz kerekítve: 3 cikk) kapja az
összes idézet 80%-át. Ez az A/s esetben 80 idézetet jelent, a B/s
esetben pedig 40 idézetet.
Az A/e példában a h-mutató = 10, mivel a halmazban
van olyan 10 cikk, amely 10 idézetet kapott. Az adatok alapján
megállapítható, hogy a h-mutató hátrányos az idézetek súlyozott
eloszlása szempontjából, hiszen A/s példában a mutató értéke 5-re
csökken. Tehát a h-index (ebben a modellben) az idézetek egyenletes
eloszlását részesíti előnyben, és hátrányos, ha csak néhány
kiemelkedően idézett közlemény van a halmazban. A C = 50 esetben
(B/e vs B/s) hasonló a helyzet (h = 5 vs 3). Érdemes felfigyelni
arra, hogy az A/s példában, ahol az összes idézet, C = 100 és a
legidézettebb (ún. „h-core”) cikkek 50, 20, 10, 7, 7 idézetet
kaptak, a h-index értéke ugyanakkora (h = 5), mint a B/e példában,
ahol C = 50, és a legidézettebb cikkek csupán: 5, 5, 5, 5, 5
hivatkozást értek el.
A g-mutató kiszámítását mutatja az 1. táblázat B/s
példája. Itt a g-index értéke azért 6, mert az r = 6 cikknél: Σci =
47, ami nagyobb, mint r² = 36, de a mutató nem lehet 7, mert r = 7
esetében: Σci = 48, amely érték kisebb, mint r² = 49.
|
|
A g-index = 10 az A/e példában, hasonlóan a
h-indexhez. Az 1. táblázat mutatja, hogy az elit cikkekre érkezett
viszonylag több idézet a g-mutató értékét nem csökkenti, hiszen A/s
esetben g = 10. Sőt, a B/e és B/s esetek g-adatainak összevetése
alátámasztja, hogy a g-index előnyös a kiemelten idézett
közleményeket tartalmazó halmazok értékelésénél.
Az A/s eset szemlélteti azt a furcsaságot, hogy a
g-index kiszámításánál egészen addig a sorszámig (illetve annak
négyzetéig) kell haladnunk, amíg el nem érjük az idézetek halmozott
összegét. Ha ugyanis vannak cikkek a halmazban, amelyek nem kaptak
egyetlen idézetet sem (mint például itt az r = 9-es és az r = 10-es
cikk), vagy a halmaz összesen csak 8 cikket tartalmazna, a
rangszámokkal (r) akkor is tovább kell haladnunk r = 10-ig, nem
létező cikkeket feltételezve, hogy elérjük a már az r = 8-nál
kiszámított halmozott idézetszámot (azaz: Σci = 100 = r² = 100).
Az A/ és B/ esetben is P = 10, így a π-statisztika
szerint a halmazok leghatásosabb cikkeinek részhalmazába π(P) = √10
= 3,33, kerekítve: 3 cikk tartozik. A model A/e példájában az első 3
cikk idézeteinek száma összesen: 30, így a π-index = 0,30. Az A/s
példában viszont jelentősen megnőtt a leghatásosabb részhalmazban
lévő cikkek idézeteinek száma: Σci = 80, ezért a π-index = 0,80.
Hasonlóképpen változik a B/e és a B/s példában szereplő cikkek
π-indexe: 0,15 vs 0,40.
A bemutatott példák alapján levonható a
következtetés, amely szerint a π-mutató jelentős mértékben függ az
idézeteknek a leghatásosabb cikkek részhalmazában lévő és a halmaz
fennmaradó részében található cikkekre jutó idézetek számának
arányától, továbbá, hogy előnyben részesíti a kiemelkedően nagy
hatású cikkekre érkező idézeteket.
A π-mutató hátránya, hogy a h és a g-mutatóhoz
hasonlóan erős szakterületi függőséget mutat. Minden olyan
bibliometriai hatás, amely befolyásolja a közlemények által kapott
idézetek számát, erre a mutatószámra is hatással van.
A százalékos idézettségi rangszám
Tekintve, hogy az előzőekben említett mutatószámok erősen függnek az
értékelt közlemények szakterületétől, megkíséreltem egy viszonyítási
alapot alkalmazó, de „nem paraméteres”, a szakterületek
bibliometriai sajátosságaitól független mutatószám bevezetését. A
százalékos idézettségi rangszám (PRP – Percentage Rank Position
Index) elnevezésű mutató (Vinkler, 2013) a vizsgált cikk
viszonylagos tudománymetriai hatását az ugyanabban az évben a
vizsgált cikket közlő folyóiratban megjelent cikkek idézetek
szerinti sorrendjében elfoglalt hely szerint határozza meg. Ha az
adott évben a folyóiratban összesen P számú cikk jelent meg, és
ezeknek idézetek szerinti rangsorában az általunk értékelt cikk az
r-edik helyet foglalja el, akkor a PRP-index a következőképpen
számolható:
PRP = 100 [ 1 – ( ( r – 1 ) / P ) ]
A PRP-mutató szerint a sorrendben az első, a
legidézettebb közlemény 100 ponttal szerepel, függetlenül a
megjelent cikkek számától (P). Természetesen a további helyezések
mutatószáma erősen függ P-től. Így például a P = 10, 100, 1000
méretű halmazokban az idézetek szerint rangsorban a 2. helyen lévő
cikkek PRP-mutatója rendre: 90,0; 99,0; 99,9, az 5. cikkek mutatói:
60,0; 96,0; 99,6, míg a 10. helyezetteké: 10,0; 91,0; 99,1.
Kétségtelenül jogos, hogy egy nagyobb
közleményhalmazban elért ugyanaz a helyezés sokkal értékesebb
legyen, mint egy kisebben. Ugyanakkor a mutató hátránya, hogy a
kevés cikket közlő folyóiratokban elért viszonylag jobb helyezés
esetenként indokolatlanul nagy mutatószámot ad.
A leghatásosabb részhalmazok mutatói
és a szakmai rangsor
Hogy a mutatószámok és a kutatóknak a szakmai rangsorban elfoglalt
helye közötti összefüggéseket feltárhassam, meghatároztam öt,
egyenként 10 kutatóból álló csoport közleményei leghatásosabb
halmazainak néhány tudománymetriai mutatóját. A csoportok a
következők:
• PhDj: PhD-fokozattal rendelkező, fiatal kutatók,
akiknek átlagos publikációs élettartama (PLT): 11,20 év (SD = 3,64
év). A PLT-adat kiszámítása a következőképpen történt: PLT = 2014 –
(a Web of Science-ben elsőként referált folyóirat-publikáció
megjelenésének éve).
• PhDs: PhD-fokozatot szerzett, idősebb, de nem
vezető beosztású kutatók, akiknek nincs MTA doktori címük (PLT =
29,80 év, SD = 7,02 év).
• DSc: MTA doktora címmel rendelkező kutatók (PLT =
34,40 év, SD = 2,84 év).
• MbA: az MTA Kémiai osztályának jelenleg is aktív
tagjai vagy levelező tagjai (PLT = 38,00 év, SD = 1,25 év), akiknek
2013-ban is jelent meg publikációjuk.
• Nobel: A 2008–2013. között kémiai Nobel-díjjal
kitüntetettek közül kiválasztott 10 személy (PLT = 38,90 év, SD =
0,32 év).
A kiválasztott kutatók a következők: Simomura
Oszamu (Osamu Shimomura), Thomas A. Steitz, Ada E. Yonath, Richard
F. Heck, Negisi Ei-icsi (Ei-ichi Negishi), Dan Shechtman, Robert J.
Lefkowitz, Brian K. Kobilka, Martin Karplus, Arieh Warshel.
Megjegyzendő: a PhDj-, PhDs- és a DSc-csoportokhoz tartozó kutatók
mind kémikusok, és 2014-ben az MTA TTK-ban dolgoztak.
Feltételezhető, hogy a fiatalabb kutatók (PhDj),
lévén pályájuk elején, átlagosan kevesebb cikket jelentetnek meg,
kevesebb idézetet kapnak, s többi mutatójuk is gyengébb, mint
idősebb kollégáiké. Feltételezhető az is, hogy a PhDs- és a
DSc-csoport tagjai különböző helyet foglalnak el a szakmai
rangsorban, s ezért mutatószámaik is különböznek az utóbbi csoport
javára. A DSc-csoportból nyolcan kutatócsoport-vezetők voltak, vagy
jelenleg is azok. Várható az is, hogy az illető hazai szakmai
rangsor csúcsán álló kémikus akadémikusok (MbA) közleményeinek
tudománymetriai mutatói felülmúlják az előzőekben említett csoportok
átlagait. Nyilvánvaló, hogy a világ tudósainak a közleménymutatók
területén folyó versengésében a legelőkelőbb helyezéseket átlagban a
Nobel-díjasok érik el. Számos közlemény igazolja, hogy a
Nobel-díjjal kitüntetettek idézeteinek száma jelentősen (akár
nagyságrendekkel is) nagyobb, mint az adott szakterület kutatóinak
átlaga (Garfield – Welljams-Dorof, 1992).
A tárgyalt elit mutatószámok (h, g, π, PRP)
mindegyike függ a nyilvánosságra hozott információ mennyiségétől (a
cikkek számától), ami nyilvánvalóan az illető kutatók szakmai
pályafutásának hosszával arányos. Azért, hogy a különböző hosszúságú
életpályát bejárt kutatókat közleményeik alapján
összehasonlíthassák, a mutatószámokat normálni szokták. Ennek
megfelelően képzik az egy évre jutó idézetek (C/y) vagy publikációk
számát (P/y), az egy cikkre jutó idézetek számát (C/P), az egy
cikkre eső folyóirat-hatástényezők adatát (FHT/P). Ez utóbbi
képletben FHT az illető cikkeket közlő folyóiratok hatástényezőinek
súlyozott összegét jelenti (természetesen, ha egy folyóiratban három
cikk jelent meg, akkor annak hatástényezőjét háromszorosan kell
figyelembe venni).
Megjegyzendő, hogy a C, C/P, FHT/P mutatók erősen
függnek az illető szakterületek bibliometriai sajátosságaitól. Az
utóbbi években különösen elterjedt az összimpakt, impaktfaktor
kifejezések használata egyének mutatóinak kiszámításánál. Érdemes
megjegyezni, hogy a közlő folyóiratok hatástényezőinek átlaga
(FHT/P) az illető kutató közlési stratégiájára, de semmiképpen sem
az illető által közölt információk szakmai hatására jellemző.
Ismeretes, hogy a folyóiratok cikkei idézettségének eloszlása torz,
esetenként nagyon torz. Éppen ezért helytelen a közlő folyóiratok
cikkeinek átlagos idézettségét mint az abban a folyóiratban
publikációt megjelentető kutató impaktfaktorát, mint a kutató
eredményeinek hatására, kiválóságára vonatkozó mutatószámot
értékelni. Nyilvánvaló, hogy a „jobb” folyóiratokban megjelent
cikkek arra utalnak, hogy az illető szerző „jó” helyeken tudja
elfogadtatni a cikkeit, ami kétségtelenül szakmai érdem. Ámde ettől
még nem biztos, hogy az illető adott cikke eléri az illető folyóirat
cikkeinek átlagos színvonalát. Ezt csak az értékelt cikkekre
érkezett idézetek tudják megmutatni, legalábbis tudománymetriai
értelemben.
A jelen közleményben a kutatók teljes publikációs
teljesítményét (az információ mennyiségét és hatását) jellemző
mutatószámokat vizsgáltam. Emiatt az említett fajlagos (normált)
mutatószámok nem játszanak szerepet. Nem vettem figyelembe a
különben releváns szerzői részesedés mértékét sem.
A 2.
táblázatból kitűnik, hogy az a feltevés, amely szerint a
vizsgált tudománymetriai mutatóknak a szakmai rangsorban elfoglalt
tekintélyesebb hely szerint növekedniük kell, helyes. Ez a következő
egyenlőtlenséget jelenti: PhDj < PhDs < DSc < MTA < Nobel.
A Nobel-díjjal kitüntetett kutatók tudománymetriai
mutatói jelentősen meghaladják a többi kutatóét. Az átlagok
leginkább az idézetek számában (C) különböznek (például
Nobel-átlag/PhDj-átlag = 144,97). Az említett két csoport átlagai
közötti arányszám a többi mutató esetében a következő: h = 11,20; g
= 10,08; π = 81,20 és PRP = 5,54. A Nobel-díjasok (Nobel) és az
MTA-tagok (MTA) közötti arányszámok a következők: P = 2,37; C =
10,93; h = 2,81; g = 3,18; π = 10,02; PRP = 1,61. Mivel a h-, g- és
π-mutatók közül a legutóbbi függése a legerősebb az idézetek
számától, ezért olyan nagy az erre a mutatóra vonatkozó arányszám.
Az arányokat és az illető kutatók szakterületeit áttekintve
feltehető, hogy a szakterületi bibliometriai sajátosságokat
figyelembe vevő százalékos idézetségi rangszám (PRP) nyújtja a
leginkább valóságos képet.
A többi csoport átlagai közötti arányok is
kiszámíthatóak a 2. táblázat adataiból. Így például az
MTA-tagok (MTA) és az MTA doktora (DSc) címet elért kutatók
arányszámai rendre a következők: P = 1,81; C = 1,59; h = 1,33; g =
1,28; π = 1,38; PRP = 1,41. A DSc- és a PhDs-kutatók csoportjainak
arányszámai pedig: P = 1,68; C = 3,54; h = 1,71; g = 1,78; π = 3,40;
PRP = 1,40.
Megemlítendő, hogy az egyes csoportok átlagai a P,
h és a PRP-mutatónál minden esetben szignifikánsan (p ≤ 0,03)
különböznek. A C, g és π-átlagok is szignifikánsan különböznek
egymástól minden esetben, kivéve a DSc- és az MTA-csoport átlagai
közötti különbséget. Ez a tény azt jelenti, hogy például a
C-mutatónál öten, a g-mutatónál ketten, a π-mutató esetében pedig
hatan a DSc-csoport kutatói közül elérik (illetve meghaladják) az
akadémikusok (MTA) mutatóinak átlagát.
Következtetés
A vázlatosan összefoglalt elemzés alátámasztja azt a feltételezést,
hogy a szakmai rangsorban elfoglalt hely függvényében vizsgált
tudománymetriai mutatószámok a várakozásnak megfelelő sorrendben
növekednek. Ez a tény hozzájárul a mutatók használhatóságának
igazolásához. Bár a szakmai rangsor különböző szintjein lévő kutatók
csoportjai publikációinak leghatásosabb halmazára vonatkozó
mutatószámok átlagai a legtöbb esetben szignifikánsan különböznek,
egyének esetében azonban vannak eltérések. Vagyis akadnak olyan
kutatók, akiknek mutatói meghaladják, esetleg lényegesen meghaladják
a szakmai rangsoruknak megfelelő csoport átlagát, s elérik a
magasabb szinten lévő csoportét. Éppen ezért elengedhetetlen, hogy
az egyének szakmai előremenetelét, kutatási pályázatait elbírálók ne
csak az illetők korábban kapott címeit, elért tudományos fokozatát
vagy beosztását vegyék figyelembe, hanem komolyan mérlegeljék az
értékelendő kutatók tudománymetriai mutatóit és ezeknek a különböző
szakmai szintekhez mért arányait.
A mutatószámok részletes tanulmányozása rámutat
arra is, milyen fontos a bibliometriai sajátosságaikban egymástól
eltérő szakterületek közleményeinek összevetésekor a megfelelő
mutatószámok kiválasztása. Az itt bemutatott mutatók közül egyedül a
százalékos idézettségi rangszám (PRP) ad lehetőséget a szakterületi
sajátosságok kiegyenlítésére.
A tudományos publikációs tevékenységnek,
eredményességnek több oldala van. Ezért nem ajánlatos egyetlen
mutatószámmal jellemezni egy adott kutató vagy egy kutatócsoport
publikációit. A jellemzést, ha tetszik értékelést, mindig az
értékelés célja szerint kiválasztott mutatószámok szerint indokolt
elvégezni. Ehhez jelentős segítséget tudnak nyújtani a leghatásosabb
közlemények publikációs halmazaira vonatkozó újabb tudománymetriai
mutatószámok.
Kulcsszavak: tudománymetriai mutatószámok, publikációs értékelés,
Hirsch-index, g-index, π-index, Garfield (impact) factor, elit
közleményhalmaz, szakmai rangsor
IRODALOM
Aksnes, Dag W. (2003): Characteristics of
Highly Cited Papers. Research Evaluation. 12, 159–170. DOI:
10.3152/147154403781776645
Bornmann, Lutz – Mutz, R. – Hug, S. E. –
Daniel, H. D. (2011): A Multilevel Meta-analysis of Studies
Reporting Correlations between the h Index and 37 Different h Index
Variants. Journal of Informetrics. 5, 346–359.
DOI: 10.1016/j.joi.2011.01.006
Bourke, Paul – Butler, Linda (1996):
Publication Types, Citation Rates and Evaluation. Scientometrics.
37, 473–494. •
WEBCÍM
Cole, Jonathan R. – Cole, Stephen (1973):
Social Stratification in Science. The University of Chicago Press,
Chicago
Dobrov, G[ennagyij] M[ihajlovics] (1970):
Nauka o Nauke. Naukova Dumka, Kiev
Egghe, Leo (2006): Theory and Practice of
the g-index. Scientometrics, 69, 131–152. DOI:
10.1007/s11192-006-0144-7 •
WEBCÍM
Garfield, Eugene – Welljams-Dorof, Alfred
(1992): Of Nobel Class: A Citation Perspective on High Impact
Research Authors. Theoretical Medicine, 13, 117–135.
Glänzel, Wolfgang (2007): Characteristic
Scores and Scales. A Bibliometric Analysis of Subject Characteristic
Based on Long-term Citation Observation. Journal of Informetrics. 1.
92–102. DOI:10.1016/j.joi.2006.10.001
Hirsch, Jorge E. (2005): An Index to
Quantify An Individual’s Scientific Research Output. Proceedings of
the National Academy of the USA. 102, 16569–16572. DOI:
10.1073/pnas.0507655102 •
WEBCÍM
Lehmann, Sune – Lautrup, B. – Jackson, A.
D. (2003): Citation Networks in High Energy Physics. Physical
Review. E68, 026113-1-026113-8. DOI: 10.1103/PhysRevE.68.026113 •
WEBCÍM
Vinkler Péter (1988): An Attempt of
Surveying and Classifying Bibliometric Indicators for Scientometric
Purposes. Scientometrics. 13, 239–259. DOI: 10.1023/ A:1010519000767
•
WEBCÍM
Vinkler Péter (2009): The π-index: A New
Indicator for Assessing Scientific Impact. Journal of Information
Science. 35, 602–612. •
WEBCÍM
Vinkler Péter (2010): The Evaluation of
Research by Scientometric Indicators. Chandos Publishing, Cambridge
•
WEBCÍM
Vinkler Péter (2013): Comparative Rank
Assessment of Journal Articles. Journal of Informetrics. 7, 712–717.
DOI: 10.1016/j.joi.2013.04.006
Wildgaard, Lorna – Schneider, J. W. –
Larsen, B. (2014): A Review of the Characteristics of 108
Author-level Bibliometric Indicators. Scientometrics. 101, 125–158.
DOI: 10.1007/s11192-014-1423-3 •
WEBCÍM
|
|