A Magyar Tudományos Akadémia folyóirata. Alapítva: 1840
 

KEZDŐLAP    ARCHÍVUM    IMPRESSZUM    KERESÉS


 AZ MTMT-ADATBÁZOSRÓL ÉS HATÉKONY FELTÖLTÉSÉRŐL

    HOZZÁSZÓLÁS SCHEURING ISTVÁN CIKKÉHEZ

X

Kollár István

az MTA doktora, Budapesti Műszaki és Gazdaságtudományi Egyetem • kollar(kukac)mit.bme.hu

 

 

Scheuring István megállapításai véleményem szerint kissé sommásak, de önmagukban igazak. Ugyanakkor az igazságnak csak az egyik oldalát világítják meg. Hadd tegyem hozzá a másik oldalt is.
Mindenekelőtt meg kell fogalmazni a Magyar Tudományos Művek Tára (MTMT) céljait és feladatait, és ebből a szempontból megvizsgálni, hogy a kitűzött célt lehetne-e jobban, szakszerűbben, kutatóbarátabban megoldani. Az MTMT célja elsősorban az, hogy a magyarországi tudományos szakirodalmi teljesítményt tegye láthatóvá mind a különböző bírálók, illetve döntéshozók (PhD-, illetve MTA doktori értekezések, pályázatok, kinevezések, akadémikusválasztások stb.), mind a magyar tudomány iránt érdeklődők számára, továbbá hogy lehetővé tegye egyetemek, kutatóintézetek, tanszékek, azaz bármilyen kutatókból álló szervezeti egység szakirodalmi teljesítményének és hatásának (idézeteinek) átfogó megjelenítését. Ezeket így most egyetlen általános adatbázisban sem tudjuk megtenni. Az elgondolás része az is, hogy a kutatók amúgy is naprakészen tartják közlemény- és idézőlistájukat, hiszen időnként pályáznak, jelentenek, és az egészséges hiúság is megvan majdnem mindannyiunkban. A nagy adatbázisok pedig az egyéni listák szempontjából általában nem is teljesek.

Teljesen igaz, hogy aki a maga tudományos területén szakirodalmat keres, az nem fogja az MTMT-t erre használni. Nem is erre való. Az is igaz, hogy aki alkotóan és igényesen publikál a maga területén, annak számára az MTMT karbantartása plusz teher, és tényleg feleslegesnek látszik. De ha az MTMT segít elválasztani az ocsút a búzától, a handabandázást a színvonalas kutatómunkától, akkor máris hasznos. Ha mindenki feltölti saját publikációs eredményeit (éppen ezért van előírva, hogy mindenki töltse fel), akkor azonnal kiderül, kik azok, akiket senki sem idéz (vagyis, ha vannak is publikációik, nem keltenek visszhangot), akik lektorált folyóiratban egyáltalán nem publikálnak, akiknek nincs könyvük, nincsenek tanulmányaik. Aki bírál, illetve dönt, annak számára ez jelentős segítség. Az adatbázis nem az amúgy is színvonalas kutatómunkát végzők adatai miatt fontos, hanem azért, hogy kiderüljön, ki az, aki hozzájuk képest alig publikál, ki gyenge az átlaghoz viszonyítva. Őrültség lenne, ha kizárólag a tudománymetriai adatok alapján értékelne valaki, de az objektív értékítéleteket jól támogatja egy nyilvános adatbázis, és létezése azok számára előnyös, akiknek a tudományos teljesítménye nemzetközi összehasonlításban is eredményes.

Az, hogy egy MTMT-lista önmagában mennyire jelzi a tudományos értékeket, természetesen vitatható. Az azonban kétségtelen előnye, hogy a szerzők ebben ellenőrizhető tényeket adhatnak meg: mit publikáltak és hol, kik idézik ezeket és hol, mindezek könnyen áttekinthetők, válogathatók, különböző szempontok szerint megszámlálhatók, és gyakran teljes szövegük is könnyen tanulmányozható. Tudom, hogy például Belgium flamand részén kizárólag a Web of Science-ben megjelenő cikkek számítanak. Ez is egy lehetőség, de a szakterülettől függetlenül használva nagyon aggályos, különösen, ha tudjuk, hogy a WoS referálási eljárása USA-központú, alapkutatás-centrikus, szűk válogatáson alapul, csak folyóiratokat dolgoz fel idézőkkel együtt stb. (lásd pl. URL1). Ennél az MTMT sokkal átfogóbb és kiegyensúlyozottabb. Akinek például kevesebb WoS-idézete van, annak hasznos, hogy az összes idézetét könnyen meg tudja adni az MTMT-ben.


Általános célú adatbázisok


Ésszerűnek látszik, hogy ha egyszer léteznek általános célú adatbázisok, használjuk azokat értékelésre is. Jelenleg három ilyen létezik: Web of Science, Scopus, Google Scholar. A többi aránylag szűk területen működik. Ebben a három adatbázisban lehetőség van olyan szerzői profilok létrehozására, amelybe a szerző összegyűjtheti az adott adatbázisban található közleményeit és azok hivatkozásait. Ez egyúttal megoldja az adatbázisok egyik legnagyobb problémáját: az azonos nevű szerzők cikkei közül a szerző ki tudja válogatni a saját közleményeit. Természetesen ezt a halmazt is rendszeresen karban kell tartani, hiszen új közlemények születnek, és nincs adatbázis, amely az azonos neveket automatikusan kezelni tudná (a Scopus és a Google Scholar megkísérli megadott munkahely szerint csoportosítani a szerzőket, de arra már nem jön rá – nem is jöhet rá –, hogy ha valaki új munkahelyről publikál, vagy hosszabb-rövidebb külföldi tanulmányút alatt nem az anyaintézmény címén publikál, akkor is ugyanaz a személy). Egyik adatbázisban sem található meg egy szerző valamennyi publikációja, sőt egyes publikációtípusok (disszertációk, könyvek, könyvfejezetek, konferenciacikkek) alig fordulnak elő ezekben az adatbázisokban. Például a WoS alap adatbázisa könyveket, könyvfejezeteket, résztanulmányokat, idéző disszertációkat nem is tartalmaz, és csak a Magyarországon nem általános, és drága részadatbázisok, például a Book Citation Index előfizetése juttathat újabb részadatokhoz. A WoS is és a Scopus is csak válogatott forrásokat dolgoz fel, és ami kiesik ebből a körből, arról ezekből a forrásokból nem szerezhetünk tudomást. A WoS-ban a ResearcherID-val megadott szerzői közlemények közé hivatkozásokkal együtt csak a WoS-ban feldolgozott közleményeket lehet felvenni, így sok idézőt nem is tudunk ott megjelentetni. Az összes önidézetek (a közlemény és az idéző mű szerzői között valaki közös) a WoS-ban és a Google Scholarban sem válnak el a független idézetektől: a fenti önidézet-definíció szerint csak a Scopusban szűrhetők. A WoS a konferenciacikkek idézőit nem dolgozza fel, a Google Scholar viszont mindenféle weboldalakat és PDF állományokat igen, vagyis könyvtáros szemmel nagyon is „szemetes”. Végül, egyik adatbázis-eredmény sem csoportosítható/szűrhető eléggé flexibilisen, az olvasó igényei szerint. Mindezek a hiányosságok teszik szükségessé még az STM-tudományterületek (Scientific, Technical, Medical) esetén is az MTMT használatát.


Mintaadatok


Hogy senkit ne bántsak meg esetleg hiányos adatok közlésével, az alábbi táblázatban a saját adataimat adom meg (villamosmérnök vagyok – az adatok 2012. szeptember 15-iek), illusztrálva az adatok bizonytalanságát. Az egyes adatbázisok nevénél a linkre kattintva a mutatott táblázat könnyen ellenőrizhető. Ez a példa még aránylag konzisztens adatokat mutat: mérnököknél sokkal szélsőségesebb példák is gyakran előfordulnak.

Azt, hogy a számok a „kemény” természettu-dományokban sokkal jobban egybeesnek, Scheuring István példája mutathatja. Az alábbi táblázatban mindössze az MTMT feltöltése hiányos egy kicsit, de azt könnyen pótolni lehet.

A nagyságrendek (sőt a kb. számok is) ezen a területen tehát jól kiolvashatók.

Itt igaz az is, hogy a WoS (és a Scopus is) a fentiek miatt alulról becsül,1 a Google Scholar pedig részben felülről.2 Erre tehát használhatók is lennének, de ez is rendkívül szakterületfüggő. Biológusok, fizikusok, orvosok publikálási szokásaikat és az adatbázisok válogatási szempontjait figyelembe véve valóban támaszkodhatnának ezekre. A határterületeken dolgozók fair értékelése, összehasonlítása azonban  már sérülne, a mérnököké pedig feltétlenül. A matematikusok ráadásul a Mathematical Reviews-t tekintik etalonnak, ami a határterületeken szintén

 

 

nem mindig releváns… a történészek, nyelvészek, irodalomtudósok pedig ezek alapján alig értékelhetők. Vagyis, ha valamilyen módon elfogadható alapossággal értékelni akarunk, akkor marad a szerzők által megadott és a lehetőségek szerint ellenőrzött lista: az MTMT (BME PA). Ebben meg lehet adni a WoS/Scopus/Google Scholar-listák linkjeit is, vagyis ízlés szerint nézegethetők és összevethetők a tartalmak, az MTMT pedig tartalmazhatja mindezeknek és a szerző saját gyűjtéseinek az unióját: meg lehet adni, mennyi az összes ismert idéző, és ebből mennyi található meg adatbázisokban. Az persze döntés kérdése, hogy valaki mondhassa-e azt, amit Scheuring István is mond: ő csak azt szeretné felhasználni, amit a Web of Science, illetve a ResearcherID tartalmaz. Azt hiszem, ilyenkor egy központi szolgáltatás (a WoS/RID tartalmának automatikus átolvasása az MTMT-be) lenne jó megoldás, mert ez lehetővé tenné a közvetlen összehasonlítást másokkal, a szerző külön megterhelése nélkül.


Mennyi munka
az MTMT-adatok karbantartása?


Azonnal felmerül a kérdés: mennyi munka áttöltögetni a közlemények és az idézők adatait? Az biztos, hogy kézzel nagyon sok.

A saját közleményeket elvben le is lehet tölteni, de a szerzők nagy része nem vár addig, amíg az új közlemény megjelenik valamelyik adatbázisban: az adatokat inkább kézzel feltölti. De nem is lehetne sokkal jobban járni, mert a szerzők azonosítása amúgy sem automatizálható megbízhatóan, kézi munkára tehát mindenképpen szükség van. Ha a ResearcherID-t akarjuk frissen tartani, akkor erre rá-rá kell nézni, bár elvben innen lehetne az MTMT-t frissíteni. Az idézők frissítése azonban nagyon körülményes:

• a Cited Reference Search alapján közleményenként kell letölteni egy-egy listát, és egyenként feltölteni, duplumokra ügyelve,

• vagy le kell tölteni a szerző teljes WoS-idézőlistáját, és az irodalomjegyzékek alapján darabonként hozzárendelni az egyes közleményekhez, figyelve a duplumokra (erre használható az „Import irodalomjegyzékkel”).

Ez mindenképpen nagyon nagy munka még akkor is, ha évente csak az újabbakat kell feltölteni: ezen segít, ha a WoS-ban beállítjuk az „idézők … óta” vagy „idézők feldolgozva … óta” funkciót, de a munka még így is nagy marad. Igaz, hogy a munkahely dönthet úgy is, hogy a szerzők helyett ezt könyvtáros/adminisztrátor végzi, de ettől az elvégzendő munka mennyisége lényegében nem csökken.

A fenti idézőpótlás során szerencsére nem kell emberi döntéseket hoznunk, vagyis mindez automatizálható. A Budapesti Műszaki és Gazdaságtudományi Egyetemen ezt meg is valósítottuk, és most már így tartjuk karban az idézettségeket. Így szerzőinket megkíméltük a BME PA-ban tárolt idézettségi adataik karbantartásának legkellemetlenebb részétől, pontosan úgy, ahogy Scheuring István kívánja: a szerzőknek ezzel nincsen gondjuk. Ha a közleményeiket karbantartják, az idézőket a könyvtár pótolja. Aki akarja, máshonnan is felvihet idézőket (Scopus, Google Scholar, könyvek, disszertációk stb.), de ez nem kötelező. Elvben ez az összes magyar szerző számára is működtethető lehetne.


Az MTMT további előnyei


Az MTMT-lista feltétlen előnye, hogy sokféleképpen megtekinthető. A tudományos közélet tisztaságához biztosan hozzájárul, ha a résztvevők adatai könnyen és egységesen hozzáférhetők. Ezen segítenek a különböző táblázatok is, melyek például a WoS-ra sajnos nem építhetők rá. A WoS/Scopus/Google Scholar kapcsolódó tételei az MTMT-lista hitelességét növelik,3 sőt, a BME PA-adatbázis lehetővé teszi a WoS/Scopus/GS-adatokkal való összehasonlítást (hitelesítést) is, valamint könyvek, könyvfejezetek esetén már könyvtári katalóguscédulák is belinkelhetők (lásd URL3), sőt, ugyanaz a lista angol nyelven is megmutatható és linkelhető: URL4. Mi több, az intézményi repozitórium segítségével a listához kapcsolhatók a teljes szövegű cikkek is, ami a WoS/Scopus-lista esetében csak korlátozott számú tételre, a szerző akaratától függetlenül, és gyakran korlátozott hozzáférési jogosultsággal valósul meg (ebben a Google Scholar sokkal jobb, mert eleve ezeket gyűjti). Sőt, a teljes szövegű MTMT-megadás a közlemények Google Scholarba történő automatikus felvételét is elősegíti.

Végül a BME PA/MTMT-adatbázis nagy előnye az is, hogy csoportok, tanszékek, intézetek adatait összesítve, súlyozva, átlagokat képezve is meg lehet tekinteni. A BME PA-ban most már online táblázatok segítségével (URL5) vizsgálható meg pl. a karok aktivitása.

Ezek a táblázatok több célt is szolgálnak:

• az intézmény önértékelésének eszközei,

• adatszolgáltatási kötelezettséget teljesítenek a fenntartó felé,

• országosan összehasonlíthatók,

• beköthetők egyetemi weboldalakba angol nyelven is, így a nemzetközi adatszolgáltatást is elősegítik az egyetemi rangsorokhoz.


Összefoglalás


A Magyar Tudományos Művek Tára hiánypótló, a nagy nemzetközi adatbázisok sok tudományos területen csak kis részben helyettesítik. Működtetése objektívabbá teszi a tudományos értékelést, áttekintéseket biztosít magyar kutatók, csoportok és intézmények tudományos munkáját illetőleg, sőt az áttekintő táblázatok könnyen tovább is fejleszthetők, míg a tudományos szakirodalom-kutatásra továbbra is marad a nagy adatbázisok szolgáltatása. Ugyanakkor a számítógép segítségével az is megoldható, hogy a kutatók és az intézményi adminisztrátorok alig legyenek megterhelve az MTMT közlemény- és idézőfeltöltésével. Ha így történik, akkor sikerül optimálisan üzemeltetni, és a tudományos közösség sokat nyer vele.
 Kulcsszavak: MTMT, bibliográfia, tudománymetria, közleménylista, publikációs lista, idézettségi lista, citáció, szcientometria, mycite
 


 

INTERNETES LINKEK

MTMT: WEBCÍM >

BME PA: WEBCÍM >

WoS: WEBCÍM >

ResearcherID: WEBCÍM >

Scopus: WEBCÍM >

Google Scholar: WEBCÍM >

URL1: WEBCÍM >

URL2: WEBCÍM >

URL3: WEBCÍM >

URL4: WEBCÍM >

URL5: WEBCÍM >

 


 

LÁBJEGYZETEK

1 A WoS és a Scopus nem teljesen fedik le egymást: becslések szerint a WoS-ban megtalálható tételek 10%-a nincs meg a Scopus-ban, illetve a Scopus 65%-a nincs benne a WoS-ban. <

2 A Google Scholar természetesen csak a weben ténylegesen megjelenő tételeket látja. <

3 Saját feltöltésnél ugyanis (MTMT) legalábbis valamilyen ellenőrzésre szükség van. <

 


 

Kollár István

 

közlemények

független idézők

összes idéző

Web of Science

ResearcherID

55

nem szűrhető

437

név szerint keresve1

BME-ről2

55

nem szűrhető

454

BME PA (MTMT)
tétel, amely WOS-ban szerepel3

53

(csak Kollár I. saját idézetei zárhatók ki;

így 437)

819

Scopus

 

65

470

558

Google Scholar

 

97

nem szűrhető4

1271

BME PA3 (MTMT)

 

160

1502

1793

 

 

Scheuring István   közlemények  független idézők összes idéző

Web of Science

ResearcherID

50

nem szűrhető

732

név szerint keresve5
BME-ről6

49

nem szűrhető

732

MTMT tétel, amely WOS-ban szereplőnek van megjelölve7

36

(csak Scheuring I. saját idézetei zár-
hatók ki; így 680)

339

Scopus

 

58

258

780

Google Scholar

 

69

nem szűrhető

1090

BME PA3 (MTMT)

 

79

368

454

 

1 Sajnos több Kollár I. szerző is létezik, a talált tételekből kézzel válogattam, de nagyon nehéz végigválogatni.

2 BME-jogosultsággal a Conference Proceedings Citation Index is látszik, ezért a WoS a BME-ről nézve többet mutat, mint más intézményekből.

3 A BME MTMT-kompatibilis adatbázisa.

4 Létezik a Goolge Scholar adatait használó, az önidézeteket kiküszöbölő külön program is: CIDS (URL2)

5 A WoS-ban szerencsére csak egyetlen Scheuring I. van – ez tehát szerencsés név.

6 BME-jogosultsággal a Conference Proceedings Citation Index is látszik, ezért a WoS a BME-ről nézve többet mutat, mint más intézményekből.

7 Nála az MTMT jól láthatóan nincs aktualizálva. A kézi feltöltés miatt hiányoznak az adatbázis-azonosítók is.