A Magyar Tudományos Akadémia folyóirata. Alapítva: 1840
 

KEZDŐLAP    ARCHÍVUM    IMPRESSZUM    KERESÉS


 A BIODIVERZITÁSI ADATOK GYŰJTÉSÉRŐL ÉS MEGOSZTÁSÁRÓL

X

Bán Miklós

PhD, MTA–DE „Lendület” Viselkedésökológiai Kutatócsoport,
Debreceni Egyetem Evolúciós Állattani és Humánbiológiai Tanszék
ban.miklos(kukac)science.unideb.hu

 

Bevezetés:
az élőlényekről gyűjtött adatok jelentőségéről


Az olyan élővilággal kapcsolatos tudományok, mint az élőlények azonosítása, rendszerezése, viselkedésük okainak megértése vagy az elterjedésük feltérképezése mind az adatok gyűjtéséből, elemzéséből és publikálásából állnak. Ezekhez szervesen kapcsolódik a kritika, az újraelemzés és az adatok újrafelhasználása is. A környező élővilágról való információ gyűjtése, a tudásanyag megosztása és ezeknek az adatoknak az újrahasznosítása az emberiség történetének része, mivel a környezeti folyamatok megértése és a felhasználható természeti javak feltárása bármely emberi társadalom számára létkérdés. A társadalmak növekedésével nőtt a természettel, természeti erőforrásokkal kapcsolatos ismeretek mennyisége is, és így ezeknek az ismereteknek a rendszerezése iránti igény is megjelent. Az élővilágról szóló tudásanyag átfogó és következetes rendszerezésének története az 1700-as évek közepétől indult, és talán leginkább Carl von Linné munkásságához köthető (Linné, 1758), aki a kettős nevezéktanon alapuló élőlény-rendszerezést először publikálta.

Az emberiség, és különösen a gazdasági tevékenységek világméretűvé növekedése az élővilág és a természeti folyamatok lehető legszélesebb körű megismerését és dokumentálását hozza magával. A természeti javak mint erőforrások hasznosításával kapcsolatban viszont a pillanatnyi és a hosszú távú érdekek gyakran ütköznek, amely konfliktusok kontrollálására világszerte különféle megoldások (például természetvédelmi törvények) jöttek létre. Ezek a megoldások talán mindenekelőtt abban hasonlítanak egymásra, hogy adatokat használnak a környezeti változatosság jellemzésére, a természeti erőforrások katalogizálására és a változási folyamatok dokumentálására. Az olyan alapvető információk gyűjtése és szolgáltatása, mint amilyenek például az élőlények elterjedésével, rendszerezésével és azonosításával kapcsolatosak, annyira széles körűvé és általánossá váltak, hogy nemzetközi egyezmények (például a Riói egyezmény 10. irányelve) foglalkoznak vele, és nemzetközi szervezetek és világméretű kutatói együttműködések (például Global Biodiversity Information Facility – GBIF) jönnek létre a kezelésükre. Természeti értékekkel, illetve erőforrások védelmével kapcsolatos döntéseket pedig ezeknek a feldolgozott és publikált adatoknak a birtokában tudnak hozni a döntéshozók.

Az ökológia olyan szintetikus tudomány, amely sok más tudományterület eredményeit hasznosítja. Az ökológiai kutatások kérdései nem egyszeriek, és a kapott válaszok igen ritkán tekinthetők véglegesnek. Számos példa adódik ugyanazoknak az adatoknak az újraelemzésére vagy egyszerűen csak a változások szisztematikus összehasonlítására, ami az adatok rendszerezése és megőrzése nélkül nem lehetséges. Ilyen (esetek) például egy környezeti katasztrófa esetén a károk felmérése – ami előzetes adatok hiányában nem lehetséges, illetve a kárelhárítási munkák megtervezéséhez szintén kellenek adatok, például más hasonló esetek tapasztalatai. Magyarországon ilyen eset volt a tiszai ciánszennyezés, ahol a megfelelő adatok hiánya hátráltatta a döntések hatékony meghozását.

A természeti környezet állapotára vonatkozó adatok, információk bárkit érdekelhetnek. A megismerésnek számos oka lehet az egyéni érdeklődéstől a környezeti nevelésen át az üzleti és gazdasági tevékenységek tervezéséig. Ráadásul ezeknek az adatoknak az Aarhusi egyezmény értelmében az Európai Unióban mint közérdekű környezeti információnak szabadon elérhetőnek kell lenniük.

A természeti környezettel kapcsolatos információk, alapadatok, dokumentációk hosszú távú megőrzése és elérhetővé tétele egyrészt tehát a távlati tudományos értékük, másrészt pedig az eddig felhasznált adatok ellenőrizhetősége miatt nagyon fontos, ami viszont találkozik a tudományos és a gazdasági érdekekkel is.


Nyitott tudomány


Kutatók közötti információcsere nélkül nincs tudomány, de a teljesen szabad információáramlás mégiscsak az elmúlt évtizedekben, az internet használatának elterjedésével kezdett kiemelkedő jelentőségűvé válni egyes területeken. Ilyen terület például a matematika és fizika, ahol bevett szokás az eredmények szabadon elérhetővé tétele kereshető és hivatkozható módon (Arxiv), még a tudományos folyóiratokban publikálásuk előtt. A nyitott tudomány (angol kifejezéssel Open Science) mozgalom összefoglaló elnevezése a tudományos kommunikációval, publikációval és szabadon elérhető adatokkal kapcsolatos törekvéseknek, amely (tulajdonképpen) a tudományos információ nyílt áramlását szorgalmazza. Ilyen törekvés a szabadon elérhető tartalmú tudományos folyóiratokban (Open Access) való publikálás széles körű támogatása, vagy például annak a gyakorlatnak az elterjedése, hogy a tudományos publikációkhoz tartozó háttéradatok, lényegében a kutatók jegyzőkönyvei, legyenek szabadon elérhetők a publikációval együtt (Open Notebook Science).

A nyitott adathozzáférés előnye, hogy gyorsíthatja a publikálási folyamatot: egyszerűsíti az adatok ellenőrzését, és egyúttal csökkentheti az adatok származásának vitatását is. A háttéradatok elérésének biztosítása pedig egyre gyakrabban követelmény a publikálási és pályázati rendszerekben, miközben ezen rendszerek használata növeli a kutatók és kutatások reputációját is (Willinsky, 2010). A nyitott adatelérés egyik hátránya, hogy nehezen vagy egyáltalán nem ellenőrizhető az adatokat felhasználók köre, így könnyebb a publikus adatokat bármilyen egyéni érdekek érvényesítésére hasznosítani. Másrészt előfordulhat, hogy az olvasóközönség félreérti a tudományos eredményeket, amivel rontja a tudományos kommunikáció eredményességét, és ez végső soron a tudomány támogatását is visszavetheti. Szintén érezhető az információmennyiség gyorsuló növekedése, ami nehezíti egy-egy terület átlátását.

A nyitott tudomány felé irányuló törekvések jelenlegi legkorszerűbb internetes eszközeivel hatékony együttműködő munka, tudományos kollaboráció valósítható meg. A legszélesebb körben ismert és használt ilyen eszköz a Wikipédia. Szintén igen elterjedt és főleg az informatikában használt a közös fejlesztést lehetővé tévő változáskövető rendszerek használata, mint például a GIT, amely természetesen nemcsak szoftverek fejlesztésére használható, hanem szinte bármely digitális dokumentum együttműködő szerkesztésére. Szöveges dokumentumok is szerkeszthetők internetes eszközökkel. Kifejezetten tudományos publikációk írására fejlesztették ki az Authorea rendszert, amelynek segítségével a szövegírás folyamata osztható meg társszerzőkkel, vagy akár az egész világgal.


Biodiverzitási információs hálózat –
világméretű nyílt szolgáltatás


Az élővilágról gyűjtött adatok igen változatosak, aminek a következménye, hogy kutatási területenként, projektenként és egyénenként is eltérő adatszerkezetek és tárolási megoldások alakulnak ki. A gyűjtött adatokat pedig gyakran helyi jelentőségű adatbázisokban tárolják a kutatók vagy az intézmények. A Biodiversity Information Standards, más néven Taxonomic Databases Working Group (TDWG) weboldalán jelenleg 685 biodiverzitási információkkal kapcsolatos projekt információi vannak összegyűjtve, ami bizonyára csak a töredéke a világ összes ilyen témájú digitális adatbázisának és szolgáltatásának.

A változatos egyedi adatkezelési megoldások ugyan indokoltak, viszont megnehezítik a nagyobb léptékű kérdések megválaszolásához az adatok összegyűjtését és rendszerezését, mivel ezek a lokális adatbázisok legfeljebb szűk területenként képesek egymással kapcsolatot tartani, ráadásul az adatok tárolásának egyéni megoldásai hosszú távon nem bizonyulnak megbízhatónak (Vines et al., 2014). Eközben pedig a biodiverzitással kapcsolatos alap- és származtatott adatok szolgáltatása iránt jelentősen megnőtt az igény az elmúlt évtizedek során, amihez a világháló fejlődésének köszönhetően az eszközök is kialakultak. A hatékony adatszolgáltatáshoz elengedhetetlen a biológiai adatok gyűjtésére, leírására és tárolására vonatkozó általános szabályok kialakítása. Az adatkészletek (adatszettek) dokumentációjának (metaadat) szabványosítása volt talán az első lépés, amely megalapozta a digitálisan tárolt biológiai adatok világméretű kezelésének lehetőségét. Erre példa az EML (Ecological Metadata Language), ami egy xml-alapú dokumentumséma az ökológiai témájú digitális adatok kapcsolódó információinak a leírására, vagy a Darwin Core, amely egy, a biodiverzitási információk megosztásához fejlesztett szabvány. Az értelme a metaadatok szabványosításának pedig az, hogy ha az adatszettek dokumentációja azonos formátumú, akkor egységes keresőfelületen keresztül el lehet jutni az egyedi szerkezetű adatbázisokban tárolt adatokhoz anélkül, hogy azok szerkezetét egységesíteni kellene.

Az egységes metaadatok használata mellett természetesen megmaradt az igény az egységes adatszerkezetek és a globális adatbázisok kialakítására is. Ezek elsőnek azokon a területeken jelentek meg, ahol folyamatosan sok adat keletkezik, és emiatt nehéz követni a változásokat, illetve hagyományosan már jól rendszerezett adatok álltak rendelkezésre az átfogó, nagyléptékű vagy ellenőrzött és lektorált adatbázisok létrehozásához. Az első globális biológiai digitális adatbázis a GenBank, amely több mint harminc éve szolgáltat nyilvános tárhelyet génszekvencia-adatoknak. Az élőlények rendszerezésével és elnevezésével kapcsolatos digitális adatbázisok szintén hamar megjelentek. A Tree of Life webes adatbázis projekt éppen idén húszéves, és több mint tízezer leszármazási hierarchia szerint rendezett weboldalon nyújt információkat élőlények és élőlénycsoportok jellemzőiről és evolúciós történetükről, kapcsolataikról. A TreeBASE adatbázis filogenetikai törzsfák és a hozzájuk kapcsolódó adatok nemzetközi tárhelye, és jelenleg négyezer körüli publikációból származó, tízezer feletti törzsfa adatait tartalmazza. A TreeBASE is egy közel húszéves koncepción alapuló adatbázis, ami jelenlegi formájában 2010 óta működik.

Az érvényes fajnevek könnyen áttekinthető katalógusainak létrehozására is több nemzetközi kollaboráció jött létre. Ezek egyik első eredménye az Egyesült Államokban, 1996-ban létrehozott Integrated Taxonomic Information System (ITIS) és a vele szorosan együttműködő Species2000 program, amelyek együttesen hozták létre a Catalogue of Life (CoL) adatbázist, amely jelenleg 1,58 millió faj érvényes elnevezését, alternatív neveit és a nevezéktannal kapcsolatos irodalmi hivatkozásait tartalmazza. Szintén globális és a nevezéktannal kapcsolatos rendszer az uBio, ami taxonómiai névszótárat (nevek és alternatív nevek együttesen) és névbankot (ami a nevekhez kapcsolódó nem változó információkat tartalmaz) szolgáltat, és egy rendszertani adatbankot is, amely különféle rendszerezéseket és taxonómiai koncepciókat tartalmaz, és ezzel jól kiegészíti a névbanki szolgáltatást. Az uBio jelenleg tizenegy millió élő vagy valaha élt élőlénynévről tartalmaz adatokat. A szolgáltatásait leginkább más alkalmazásokból való programozott adatelérésre tervezték, azaz főleg más adatbázisok és tudományos alkalmazások használják tudományos nevek automatikus ellenőrzésére, javítására vagy listázására. Kifejezetten csak növények érvényes neveinek ellenőrzéséhez nyújt webes felületet és automatizálva használható eszközöket a Taxonomic Name Resolution Service (TNRS). A TNRS többek között a Global Names Index (GNI) adatbázis-alkalmazást használja, ami a taxonnevekben előforduló karakterláncok adatbázisa, és a különböző névírási módok automatizált keresésére lehet használni, például egy névtöredék alapján meg lehet találni az összes alternatív nevet. A GNI jelenleg közel tizennyolcmillió név karakterláncot tartalmaz, amelyeket harminckilenc nagy adatbázis névadatait indexelve állítottak össze. A GNI a Global Names Architecture (GNA) része, ami a világ eddig ismert közel kétmillió fajához tartozó közel húszmillió név kezelési problémáira próbál egységes megoldást nyújtani. A taxonnevek elgépelésének vagy fonetikus írásának kezelésére, ellenőrzésére számos más megoldás is van, ezek szintén részben a fenti nagy adatbázisokon alapulnak. A taxamatch például egy fuzzy keresésen alapuló hasonlósági egyezés algoritmus, amelynek számos programozási felületre léteznek megvalósításai, és végső soron maguk a nagy adatgyűjtő portálok a legnagyobb felhasználói és fejlesztői.

Az élőlények előfordulásával kapcsolatos globális adatbázisok építése főleg az adatok térképi megjelenítése miatt összetett és nagy erőforrásigényű feladat. Valószínűleg emiatt csak az elmúlt évtizedben kezdtek elterjedté válni. A legelső nemzetközi együttműködés biodiverzitási adatok összegyűjtésre a Global Biodiversity Information Facility (GBIF) 2001-ben a Gazdasági Együttműködési és Fejlesztési Szervezet (OECD) javaslata alapján huszonegy ország együttműködésével jött létre. A GBIF (jelenleg harminchét tagországa van) közel 450 millió faj előfordulási adatával bizonyosan a világ legnagyobb biodiverzitási adatbázisát üzemelteti. A Map Of Life (MoL) egy újabb projekt, ami modern nyílt forráskódú informatikai eszközöket használ egy óriás fajelterjedési adatbázis létrehozására. Az adatokat különféle forrásokból gyűjti össze és integrálja, hogy térképeket, fajlistákat és megfigyelési adatokat szolgáltasson. Jelenleg 970 ezer fajról több mint 360 millió adatrekordot tartalmaz, amivel a világ egyik legnagyobb szabadon használható biodiverzitási adatbázisa. A MoL-projekt jelenleg a ötvennégy különböző adatbázisból gyűjti az adatait a világ minden tájáról, és partnerszervezetei között szerepel a GBIF és a NASA (Amerikai Űrkutatási Hivatal) is.

A tudományos publikációkhoz tartozó adatok tárolására és az adatok megosztására szolgáló általános rendszerek teljesen új keletűek. Specifikus megoldások, mint amilyen egy-egy folyóirat estében a publikációkhoz tartozó háttéradatok tárolására nyújtott szolgáltatás, már régebb óta létezik. Ilyen például az Amerikai Ökológiai Társulat által kiadott lapokban megjelent publikációk számára fenntartott Ecological Archives. Az általános megoldásokra példa a Dryad, ami a megjelent publikációkhoz kapcsolódó adatok tárolását, az adatok publikus elérését és a tárolt adatok egyedi idézését teszi lehetővé különféle eszközökkel és költséghatékony módon (Piwowar et al., 2011). A költséghatékonyság azért kiemelendő, mert a nagy mennyiségű adatok biztonságos tárolására ugyan sok megoldás van, de ezek többnyire elég drágán

 

 

vehetők igénybe. Az OpenBioMaps egyéni fajelőfordulási adatbázisok tárolására és megosztására kialakított hazai fejlesztésű keretrendszer, amelyben a bennfoglalt adatbázisok és a tárolt lekérdezések is hivatkozhatók. Az OpenBioMaps felhasználói tetszőleges szerkezetű adatbázisokat hozhatnak létre, amelyekben az adatok szabadon érhetőek el, és az adattárolásért sem kell fizetni. Az OpenBioMaps tartalmaz egy megoldást a taxonnév egyeztetésére is, amellyel az adatbázisaiban előforduló fajneveket könnyen meg lehet találni. A megoldás lényege, hogy abban az esetben is ad találatot a kereső, ha az adatbázisban szerepel hibásan egy név, illetve a legkülönfélébb elírásokat is kezelni tudja.

A biodiverzitás témájú tudományos irodalom rendszerezése és gyűjtése olyan terület, amely szintén egy világméretű adatbázis létrehozását indukálta. A The Biodiversity Heritage Library (BHL) könyvtárak együttműködéseként jött létre, hogy a biodiverzitásról szóló globális szakirodalom egy helyen legyen szabadon elérhető. A BHL több millió oldalnyi taxonómiai cikket digitalizált, és több mint 150 millió fajnévről szerepel szöveges információ az archívumában. A BHL számos eszközt nyújt az adatbázis használatára. Például az intelligens fajnévkeresés a GNA által fejlesztett Global Names Recognition and Discovery (GNRD) eszközt használja, amellyel különböző típusú dokumentumokban lehet megtalálni a fajneveket. A BHL adatbázisából lehet adatokat exportálni bibliográfiakezelő alkalmazások formátumaiba (például Bibtex, EndNote) és a BHL programozási felületet is nyújt az adatbázisán alapuló új alkalmazások fejlesztéséhez.

Egészen új lehetőség a biológiai témájú kéziratokat tudományos lapba való beküldésük előtt megosztani az érdeklődő közönséggel. Ezt a célt szolgálja a bioRxiv projekt, amely a matematika és a fizikai tudományok terén nagyon jól bevált és igen széles körűen használt arXiv adatbázis mintájára működik. A bioRxiv-be feltöltött kéziratok nem kerülnek tudományos elbírálásra, de a közösség véleményezheti a munkákat. A kéziratok egyedi (DOI) azonosítót kapnak, amellyel tartósan hivatkozhatók, és a publikálásuk után a folyóirat-hivatkozások is elérhetők az adatbázisból.

Az Encyclopedia of Life (EoL) projekt célkitűzése, hogy összegyűjtse, és ingyenes hozzáférést biztosítson a földi élettel kapcsolatos összes tudásanyaghoz. Az adatok gyűjtése először is a tágabb érdeklődésre számot tartó fajokkal kapcsolatos információkkal kezdődött. Az adatbázist folyamatos fejlesztik az érdeklődést követve, így előtérbe kerülnek a gazdaság szempontjából érdekes információk, például az invazív és a fertőző fajok. Az EoL-adatbázisban szöveges információk, elterjedési térképek és multimédiás információk is vannak. Például a kakukk szóra keresve megkapjuk a Cuculus canorus fajt, amelyről a részletes leírásokon túl 75 médiaállományt, 3 elterjedési térképet, 8 klasszifikációt és 178 elnevezést is találhatunk (a magyar nevet az Avibase adatbázist használva találta meg). Az EoL nemcsak az általa rendszerezett információkat jeleníti meg, hanem külső adatforrásokhoz is tartalmaz kapcsolatokat, mint például a National Center for Biotechnology Information (NCBI) nukleotid szekvencia adatbázisa.
A biodiverzitással kapcsolatos adatok és metaadatok koordinált gyűjtésére, tárolására, megosztására és az adatok felhasználását könnyítő szolgáltatások kialakítására jött létre az Egyesült Államokban a Knowledge Network for Biocomplexity (KNB) projekt, amely a DataONE szövetség tagjaként egyrészt garantálni tudja a biztonságos adattárolást, másrészt számos informatikai eszközt nyújt az adatok kezeléséhez, archiválásához és beszerzéséhez. Szintén az Egyesült Államokban hozták létre múzeumok és kutatóintézetek partnerségével a VertNet projektet, amelynek jelenleg hatvanhárom adatközlő partnerszervezete (köztük például a New York-i Természettudományi Múzeum) körülbelül 13 millió adatrekordot osztott meg.

Ebben a szubjektív válogatásban bemutatott digitális adatbázisok és szolgáltatások mindegyike valamilyen módon hozzájárul a világ biodiverzitással kapcsolatos tudásanyagának hasznosításához. Ezeket ugyan más-más igények kiszolgálására hozták létre, de az információk komplex felhasználása miatt mégis egy egymásra támaszkodó adathálózatot alkotnak (1. ábra, 1 táblázat). A még tíz évvel ezelőtt különálló biológiai adatbázisok ma már globális léptékben kapcsolódnak egymáshoz, és a nyílt információs protokollok segítségével egy folyamatosan bővülő és egyre egyszerűbben használható, ingyenesen és szabadon hozzáférhető biológiai információs réteget hoznak létre. Ez a komplex információs rendszer jelenleg is aktívan fejlődik és változik. A szolgáltatásokban vannak átfedések és minőségi különbségek is, amelyek hatással vannak az egyes projektek működésére és támogatására.


Összefoglalás és a hazai viszonyok


Az élő környezet drámai változásai (Butchart et al., 2010) miatt a természetvédelem világszerte gazdasági és politikai téren is fontos kérdéssé vált, ami a nemzetközi kommunikáció fejlődését és az élővilággal kapcsolatos globálisan tevékenykedő szervezetek létrejöttét eredményezi. Ezzel egy időben megindult a biodiverzitási és konzervációbiológiai kutatások intenzív nemzetközi támogatása is, aminek eredményeképpen az elmúlt húsz év során rengeteg kísérletes és elméleti kutatás eredményei láttak napvilágot. Világméretű tudományos adatbázisok és adatbázis-hálózatok jöttek létre az alapadatok és publikációk tárolására, elérhetővé tételére. Visszás helyet, hogy miközben a tudomány fontosságát felismerve a kutatási projektek támogatásának köszönhetően az elérhető információk mennyisége rohamosan növekszik (Costello et al., 2013), a gyakorlati szakemberek és a döntéshozók kevésbé használják a természetvédelmi és biodiverzitási tudományok terén publikált eredményeket (például: Sutherland et al., 2004; Pulline et al., 2004; Gibbons et al., 2008; Cook et al., 2010). Mindemellett újabban vannak pozitív példák is a tudomány és a természetvédelem együttműködésére és a kapcsolatkeresésre (például: Arlettaz et al., 2010; Gordon et al., 2014).

Számos olyan biológiai tudományterületet átfogó, globális információhálózat épült ki az elmúlt években, amely az adatok megosztásán alapul. Ezeknek az áttekintése és még inkább a használata nem egyszerű. A kutatók szerte a világon mégis egyetértenek abban, hogy fontos a biodiverzitással kapcsolatos adataikat megosztani (Huang et al., 2012), aminek gyakorlati eredménye a nagy adatbázisok rohamos fejlődése (Castello et al., 2013). Magyarország eddig az adatok közzététele és az adatok használata terén sem kapcsolódott be jelentősen a világ biodiverzitási információs hálózatába. Például a GBIF-adatbázisban egyetlen magyarországi adatközlő adata sincs (bár több mint ötvenezer adatbejegyzés van Magyarország területéről), és a fent bemutatott projektek számos partnerszervezete között nincs egyetlen hazai egyetem vagy kutatóintézet sem. Ez részben azért fordulhat elő, mert ezek a nagy projektek általában nyugat-európai vagy az Egyesült Államokból induló kezdeményezések, ahonnan talán nem is keresnek magyarországi partnereket, de egészen biztos, hogy a magyarországi kutatói gyakorlatban sincs benne, hogy részt akarnánk venni a biológiai alapadatok publikus közzétételében, habár Magyarország is ratifikálta az Aarhusi egyezményt (2001-ben). Magyarországon az élőlények előfordulásával kapcsolatos adatokat hivatalos szervek (például Nemzeti Biodiverzitás-monitorozó Rendszer), civil szervezetek és amatőr adatgyűjtők is közölnek szervezett módon, alkalmi és rendszeres gyűjtési programokban (például Vadonleső, Mindennapi Madaraink Monitoringja, birding.hu), és szerte az országban dolgoznak kutatók állami pénzen olyan kutatási projektekben, ahol minősített adatok milliói keletkeznek. Érdekes módon az adatok gyűjtése van a legtöbb helyen előtérben, és az adatok szolgáltatása másodlagosnak tűnik. Például a kormányzat részéről ugyan van szándék Magyarország mindenkori természeti állapotára vonatkozó információk nyilvánossá tételére (Takács et al., 2008), de ennek ellenére a Természetvédelmi Információs Rendszer (TIR) közönségszolgálati moduljában nincsenek élőlények előfordulásával kapcsolatos adatok. Elmondható, hogy a nagy civil adatbázisokba könnyebb adatot feltölteni, mint lekérdezni, és nincs példa a kutatói munkát lehetővé tévő szabványos internetes eszközök integrálására és a teljesen nyílt adatbázisok létrehozására.

Ez a hazai helyzet motiválta egy GIS-alapú, fajelterjedési adat-tároló és adatfelhasználást segítő rendszer megtervezését, ami a Debreceni Egyetem és a Duna–Ipoly Nemzeti Park Igazgatóság együttműködésének eredményeképpen jött létre. Ez a rendszer a magyarországi gyakorlatban még kevésbé elfogadott teljes adatnyilvánosságot vezeti be, ami bizonyos esetekben már kikerülhetetlen követelmény. Például a keletkezett adatokat kötelező volt a partnerszervezeteknek megosztani a DanubeParks vagy a Bioregio Carpathians projektekben, ahol a hazai partner a Duna–Ipoly Nemzeti Park volt. Többek között ezeknek a nemzetközi adatbázisoknak is helyet ad az OpenBioMaps keretrendszer, amellyel a nyílt adat koncepció terjedéséhez járulhat hozzá Magyarországon. Ezt jól kiegészíti, hogy az OpenBioMaps kiszolgáló rendszer kizárólag nyílt forráskódú szoftverkomponensekből áll, és szabadon másolható.

A gyakorlati természetvédelem és a természetvédelmi kérdéseket érintő biodiverzitás-kutatás más anyagi forrásokra támaszkodik, és más visszacsatolási mechanizmusokat használ az eredmények elszámolása kapcsán, ami részben magyarázat a kutatók és gyakorlati szakemberek közötti kapcsolat hiányára. Ez a kapcsolati probléma nemzetközi szinten is ismert, és léteznek is különböző próbálkozások az orvoslására (például: Gordon et al., 2014). A hazai gyakorlatban jó példa a Hortobágyi Nemzeti Park és a Debrecen Egyetem együttműködése, amelynek keretében a Hortobágyi Nemzeti Park természetvédelmi kezelésében felmerülő kutatási feladatok elvégzésére egyetemi hallgatók jelentkezhetnek. A hallgatók a nemzeti park és az egyetem közös koordinációja mellett végzik a terepi kutatómunkát.

A kutatás a természetvédelem számára olyannyira fontos kérdés, hogy az Európai Nemzeti Parkok szövetségének legutóbbi konferenciáján (EUROPARC 2014) egy egész munkaértekezlet erről a témáról szólt (The Value of Research), és az egyik kulcselőadás éppen ezt a hazai, példaértékű együttműködést mutatta be.

Az OpenBioMaps metaadatbázis és adatbázis keretrendszer fejlesztése a TÁMOP-4.2.4.A/ 2-11/1-2012-0001 azonosító számú Nemzeti Kiválóság Program – Hazai hallgatói, illetve kutatói személyi támogatást biztosító rendszer kidolgozása és működtetése konvergencia program című kiemelt projekt keretében zajlott. A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. Szintén az OpenBio Maps projekt megvalósulását támogatta az Adatmentés Kft., Sipos Katalin, Bérces Sándor, Barta Zoltán, Ritter Dávid és Ecsedi Kornél.
 



Kulcsszavak: biológiai adatbázisok, adattárolás, publikálás
 


 

IRODALOM

Arlettaz, Raphaël – Schaub, M. – Fournier, J. – Reichlin, T. S. – Sierro, A. – Watson, J. E. M. – Braunisch, V. (2010): From Publications to Public Actions: When Conservation Biologists Bridge the Gap between Research and Implementation. Bioscience. 60, 835–842. DOI: 10.1525/bio.2010.60.10.10

Butchart, Stuart H. – Walpole, M. – Collen, B. – Scharlemann, J. P. W. – Almond, R. E. A. – Baillie, J. E. M. – Bomhard, B. – Brown, C. – Bruno, J. – Carpenter, K. E. – Carr, G. M. – Chanson, J. – Chenery, A. M. – Csirke, J. – Davidson, N. C. – Dentener, F. – Foster, M. – Galli, A. – Galloway, J. N. – Genovesi, P. – Gregory, R. D. – Hockings, M. – Kapos, V. – Lamarque, J-F. – Leverington, F. – Loh, J. – McGeoch, McRae, L. – Minasyan, A. – Hernández Morcillo, M. – Oldfield, T. E. E. – Pauly, D. – Quader, S. – Revenga, C. – Sauer, J. R. – Skolnik, B. – Spear, D. – Stanwell-Smith, D. – Stuart, S. N. – Symes, A. – Tierney, M. – Tyrrell, T. D. – Vié, J-C. – Watson, R. (2010). Global Biodiversity: Indicators of Recent Declines. Science. 328, 1164–1168. DOI: 10.1126/science.1187512 • WEBCÍM

Cook, Carly N. – Hockings, M. – Carter, R. (Bill) (2010): Conservation in the Dark? The Information Used to Support Management Decisions. Frontiers in Ecology and the Environment. 8, 181–186. DOI: 10.1890/090020

Costello, Mark J. – Michener, W. K. – Gahegan, M. – Zhang, Z. Q. – Bourne, P. E. (2013): Biodiversity Data Should Be Published, Cited, and Peer Reviewed. Trends in Ecology & Evolution. 28, 8, 454–461. DOI:10.1016/j.tree.2013.05.002

Gibbons, Philip – Zammit, C. – Youngentob, K. – Possingham, H. P. –Lindenmayer, D. B. – Bekessy, S. – Burgman, M. – Colyvan, M. –Considine, M. – Felton, A. – Hobbs, R. J. – Hurley, K. – McAlpine, C. – McCarthy, M. A. – Moore, J. – Robinson, D. – Salt, D. – Wintle, B. (2008): Some Practical Suggestions for Improving Engagement between Researchers and Policy-Makers in Natural Resource Management. Ecological Management & Restoration. 9, 3, 182–186. DOI: 10.1111/j.1442-8903.2008.00416.x • WEBCÍM

Gordon, Iain J. – Evans, D. M. – Garner, T. W. J. – Katzner, T. – Gompper, M. E. – Altwegg, R. – Branch, T. A. – Johnson, J. A. – Pettorelli, N. (2014): Enhancing Communication between Conservation Biologists and Conservation Practitioners: Letter from the Conservation Front Line. Animal Conservation. 17, 1–2. DOI:10.1111/acv.12097 • WEBCÍM

Huang, Xiaolei – Hawkins, B. A. – Lei, F. – Miller, G. L. – Favret, C. – Zhang, R. – Qiao, G. (2012): Willing or Unwilling to Share Primary Biodiversity Data: Results and Implications of an International Survey. Conservation Letters. 5, 399–406. DOI: 10. 1111/j.1755-263X.2012.00259.x • WEBCÍM

Linné, Carl von (1758): Systema naturæ per regna tria naturæ, secundum classes, ordines, genera, species, cum characteribus, differentiis, synonymis, locis. Laurentii Salvii, Hilmiae • WEBCÍM

Pullin, Andrew S. – Knight, T. M. – Stone, D. A. – Charman, K. (2004): Do Conservation Managers Use Scientific Evidence to Support Their Decision-making? Biological Conservation. 119, 2, 245–252. DOI:10.1016/j.biocon.2003.11.007

Piwowar, Heather A. – Vision, T. J. – Whitlock, M. C. (2011): Data Archiving Is a Good Investment. Nature, 473, 7347, 285-285. DOI:10.1038/473285a • WEBCÍM

Sutherland, William J. – Pullin, A. S. – Dolman, P. M. – Knight, T. M. (2004): The Need for Evidence-Based Conservation. Trends in Ecology & Evolution.. 19, 6, 305–308. DOI:10.1016/j.tree.2004.03.018 • WEBCÍM

Takács András Attila – Takács G. – Lőrincz T. (2008): A Természetvédelmi Információs Rendszer. KvVM, Budapest

Vines, Timothy H. – Albert, A. Y. K. – Andrew, R. L. – Débarre, F. – Bock, D. G. – Franklin, M. T. – Gilbert, K. J. – Moore, J.-S. – Renaut, S. – Rennison, D. J. (2014): The Availability of Research Data Declines Rapidly with Article Age. Current Biology. 24, 94–97. DOI:10.1016/j.cub.2013.11.014 • WEBCÍM

Willinsky, John (2010): Open Access and Academic Reputation. Annals of Library and Information Studies. 57, 296–302. • WEBCÍM

 


 

 

1. ábra • Biodiverzitással kapcsolatos adatbázisok és projektek nemzetközi hálózata. Mindössze 30 szubjektíven válogatott projektet tüntettünk fel a világszerte működő sok száz ilyen digitális információs csomópontból. A különböző projektek logóinak magyarázata az 1-es táblázat első oszlopában van.

Vastag nyilak: kicsípett végű: közvetlen adatbevitel dupla vonal végű: további adatbázisok kapcsolódása. Vékony vonalak: Kapcsolatok. A vonalak végén a nyilak az adatáramlás irányát mutatják.

A szaggatott vékony vonalak együttműködéseket jelentenek. <
 



 

  projekt vagy adatbázis neve és elérhetősége rövid leírás
1

Integrated Taxonomic Information System (ITIS) http://itis.gov

taxonómiai információk szolgáltatása

2

Species2000 http://www.sp2000.org

adatbázisok és szervezetek szövetsége

3

Catalogue Of Life (CoL) http://www.catalogueoflife.org

taxonómiai adatbázis- szolgáltatás,
ami az ITIS és Species2000 szövetségén alapul

4

Global Biodiversity Information Facility (GBIF) http://www.gbif.org

nemzetközi nyílt biodiverzitási adatinfrastruktúra

5

Encyclopedia Of Life (EOL) http://eol.org

a világ élőlényeinek multimédiás enciklopédiája

6

IUCN Vörös Lista http://www.iucnredlist.org

természetvédelmi világszövetség:
a kihalással fenyegetett fajokról

7

Global Name Index (GNI) http://gni.globalnames.org

tudományos nevekkel kapcsolatos szolgáltatások

8

Taxonomic Name Resolution Service http://www.iplantcollaborative.org/ci/tnrs

növénynevek automata ellenőrzésére. Szolgáltatás.

9

Dryad http://datadryad.org

publikációsadat-tárhely

10

TreeBase http://treebase.org

leszármazási törzsfa adatbázis

11

OpenBioMaps http://openbiomaps.org

hazai adatbázis tárhely,
térbeli adatok nyílt szolgáltatása

12

Barcode of Life Data Systems (BOLD) http://www.boldsystems.org

DNS-vonalkódrendszer-szolgáltatás

13

EMBL European Nucleotide Archive (ENA) http://www.ebi.ac.uk/ena

nukleotid szekvencia archívum és szolgáltatás

14

LifeWatch http://www.lifewatch.eu

európai információs infrastruktúra
a biodiverzitási kutatásoknak

15

Universal Biological Indexer and Organiser (uBio) http://www.ubio.org

tudományos nevekkel és rendszertannal kapcsolatos szolgáltatások

16

Knowledge Network for Biocomplexity (KNB) https://knb.ecoinformatics.org

nemzetközi adattárhely:
ökológiai és környezeti kutatások

17

Data Observation Network for Earth (DataONE) https://www.dataone.org

nyílt adatkezelő infrastruktúra és szolgáltatás

18

eBird http://www.ebird.org

madármegfigyelési adatok

19

VertNet http://www.vertnet.org

gerincesekkel kapcsolatos biodiverzitási adatbázisok

20

Reference Centre of Environmental Information (CRIA) http://www.cria.org.br

Brazília: élővilág információk

21

Atlas of Living Australia (ALA) http://www.ala.org.au

a GBIF ausztráliai csomópontja

22

South Africa National Biodiversity Institute (SANABI) http://www.sanbi.org

Dél-Afrikai Nemzeti Biodiverzitási Intézet

23

Tree of Life http://tolweb.org/tree

részletes filogenetikai alapú biodiverzitási áttekintés

24

GEOSS http://www.epa.gov/geoss

globális környezeti megfigyelési adatok szolgáltatása

25

Creative-B http://creative-b.eu

koordináció a kutatási infrastruktúrák között

26

Darwin Core http://www.tdwg.org/standards/450/

fajinformációk cseréjére tervezett adat sztenderd

27

Taxonomic Databases Working Group (TDWG) http://www.tdwg.org

nemzetközi közhasznú tudományos
és oktatási társaság

28

Open Geospatial Consortium (OGC) http://www.opengeospatial.org

nemzetközi szövetség, publikus térbeli informatikai sztenderdek létrehozására

29

Avibase http://avibase.bsc-eoc.org

a világ madarainak adatbázisa, elterjedés, taxonómia, nyelvek

30

Map of Life (MOL) http://www.mol.org

fajok elterjedési térképei világszerte

 
1. táblázat • Nemzetközi kapcsolatokkal rendelkező internetes adatbázisok,

szabványok és szolgáltatások neve, rövid leírása és webes elérhetősége.

Az első oszlopban lévő számok az 1. ábrán levő címkéket jelentik. <