A csillagászatban nem csupán a nagy programoknak
van lehetőségük az adatok szabványos megosztására. A már említett
Virtuális Obszervatórium projekt keretében kifejlesztett, szabadon
alkalmazható, nyílt forráskódú szoftverek – mint például a
Strasbourgban kifejlesztett Saada – minden obszervatóriumnak
lehetőséget adnak adataik megosztására. A szoftver által alkalmazott
protokollok mellett az adatformátumok is szabványosak, és
rendelkezésre állnak azok a listák – registry a VO terminológiájában
–, amelyek felsorolják a világszerte elérhető hasonló
szolgáltatásokat. Rendelkezésre állnak olyan információs rendszerek
is, mint a szintén strasbourgi Aladin, amelyek képesek adatokat –
képeket – átvenni ezektől a szolgáltatóktól. Bár a csillagászatban
rendelkezésre állnak ezek a lehetőségek, sokan mégsem használják
őket. Az adatok megfelelő tisztítása, dokumentálása ugyanis jelentős
teher; a kutatók gyakorta csak annyit végeznek el, amennyi a saját
publikációjuk megírásához szükséges, az általános
felhasználhatósághoz szükséges többletmunkát már nem vállalják.
A kutatók jelentős része nem szívesen osztja meg
adatait, ha ezt nem követelik meg tőle. Aki megkövetelhetné, az a
munkáltatója vagy a munkáját támogató kutatási alap lehet.
Megkövetelhetik még azok a folyóiratok, ahol publikál – nem annyira
az esetleges újrafelhasználást, mint inkább az eredmények
igazolását, reprodukálhatóságát szem előtt tartva. Ritkán fordul
elő, hogy maga a tudományos folyóirat vállalkozna a cikkhez tartozó
adatok tárolására és nyilvánosságra hozatalára. De az internet által
kínált lehetőségeket úttörő módon használó kibővített folyóiratok
ezt megteszik. Az MTA Csillagászati és Földtudományi
Kutatóközpontjának Konkoly Thege Miklós Csillagászati Intézetében
(CsFK CsI) kiadott IBVS (Information Bulletin on Variable Stars)
tárolja a cikkekhez tartozó adatokat, és kereshetővé is teszi
ezeket.
A hagyományosabb folyóiratok esetében is előfordul
egy némileg szerényebb igényű megoldás. Általában a lapok nem
hajlandóak annyi ábrát, táblázatot közölni, mint amennyit a szerzők
publikálni szeretnének. Régebben egyes folyóiratok kiegészítő
folyamokat (Supplement series, Ergänzungshefte) indítottak a nagyobb
mennyiségű adat közlésére, manapság pedig előfordul, hogy a
nyomtatott változat lehetőségeit már meghaladó táblázatokat csak
elektronikus formában közlik. Ugyanez kevésbé fontos ábrákkal is
előfordulhat.
Abban az esetben, amikor a folyóirat nem tud helyet
adni nagyszámú táblázat vagy ábra elektronikus elhelyezésének, a
táblázatos vagy ábra (kép) jellegű adatok elhelyezésére szóba
jöhetnek a publikációs repozitóriumok is. Ezek a repozitóriumok
többnyire könyvtárakban működnek, és többnyire nem áll rendelkezésre
se szakértelem, se technika bonyolult (mondjuk bináris,
sokdimenziós, egyedi formátumú) adatok kezelésére. Nagy mennyiségű
(gigabyte [GB] -nyinál nagyobb) adat elhelyezésére nem igazán
alkalmasak a publikációs repozitóriumok. Viszont egyszerű, ismert,
szabványos formátumokban (PDF/A, JPEG) elhelyezett, alapvetően
szöveges, táblázat jellegű vagy az értelmezéshez feldolgozó
szoftvert nem igénylő képi adatok elhelyezésére megfelelnek. A
kívánatos munkamegosztás és munkamenet az lehet, hogy a szerző
(talán a beküldött kézirattal együtt) a repozitóriumban elhelyezi a
táblázatokat, ábrákat, és az URL-t, az azonosítót közli a
szerkesztőséggel, akik továbbadják ezt az információt a cikk
bírálóinak. A bírálók a cikkel együtt vizsgálják az adatokat. A cikk
elfogadása esetén az újság az olvasókkal is közli az adatok
elérhetőségét. Hasonló funkció implementálásán gondolkodunk a REAL
(az MTA Könyvtár és Információs Központ az Akadémia kutatóhálózatát
is kiszolgáló repozitóriuma) esetében is.
Az adatok megosztását felhő alapú alkalmazások is
segíthetik, mint a figshare (URL18). A feltöltött állományok DOI-t
kapnak, hosszú távú megőrzésüket a CLOCKSS Archívum (URL19)
garantálja. Publikációs repozitóriumokhoz hasonlít a Dryad (URL20),
és csak publikációkhoz kapcsolódó adatokat tárol. A holland DANS, a
felsőoktatás és kutatás hálózati és digitális archiválási feladatait
szolgáló szervezet, adatrepozitóriumuk webes felülete az EASY
(URL21). A tárolt adatállományok jelenleg a történelemtudomány,
régészet, társadalomtudományok köréből kerülnek ki, valamint
tartalmaz térképészeti-kataszteri adatokat is. Az Egyesült
Királyságban már évek óta működik, gyűjt és szolgáltat régészeti
adatokat az Archaeology Data Service (URL22).
A tudományos publikációk digitális formában való
hozzáférhetővé tétele és hosszú távú megőrzése sem könnyen
megoldható probléma – de ebben jó úton haladunk a megoldás felé. A
tudományos adatok esetében az akadályok nagyobbak, a megoldások
jelenleg még kevésbé beláthatóak. De mint fentebb is bemutattuk,
egyes területeken már vannak működő rendszerek. Nem szabad a
nehézségektől visszarettenni, el kell indulni a tudományos
adatmenedzsment útján, előre kell lépni, ahol lehet.
Kulcsszavak: tudományos adatok, Open Access
IRODALOM
Altman, M. – King, G. (2007): A Proposed
Standard for the Scholarly Citation of Quantitative Data. D-Lib
Magazine. 13 March, 3–4, •
WEBCÍM
Holl András (2013): Információáradat és
hullámlovaglás. Magyar Tudomány. 4, 473-478. •
WEBCÍM
URL1: FORCE 11 •
WEBCÍM
URL2:
WEBCÍM
URL3: Alliance for Permanent Access •
WEBCÍM
URL4: SIM4RDM •
WEBCÍM •
WEBCÍM
URL5: SIM4RDM Recommendations for support
of research data management •
WEBCÍM
URL6: OAIS ISO 14721:2003 •
WEBCÍM
URL7: OpenAireplus •
WEBCÍM
URL8: Knowledge Exchange •
WEBCÍM
URL9: The Value of Research Data •
WEBCÍM
URL10: DataCite •
WEBCÍM
URL11: Data Citation Index •
WEBCÍM
URL12: IVOA •
WEBCÍM
URL13: EJME - Enhanced Journals...Made
Easy! •
WEBCÍM
URL14: GreyNet EPP •
WEBCÍM
URL15: University of Edinburgh Research
Data Man-agement Roadmap •
WEBCÍM
URL16: DASPOS •
WEBCÍM •
WEBCÍM
URL17: Dataverse Network Project •
WEBCÍM
URL18 figshare •
WEBCÍM
URL19 CLOCKSS •
WEBCÍM
URL20 Dryad Digital Repository •
WEBCÍM
URL21 DANS EASY •
WEBCÍM
URL22: ADS •
WEBCÍM
LÁBJEGYZET
1 Az Open Access
bevezetéséről az Egyesült Államok kutatásfinanszírozó szervezeteinél
(URL2) <
2 SIM4RDM Recommendations
for support of research data management (URL5) <
|