Magyar Tudomány, 2002/10 1330. o.

Kaotikus és nemlineáris dinamika

Bozsonyi Károly

Veres Előd

Nagy időfelbontású öngyilkossági idősorok nemlineáris viselkedése*


Bevezetés

Elemzésünkben Hurst-analízis** segítségével vizsgáljuk 31 év napi felbontású öngyilkossági adatait. A nemlineáris idősorok elemzési technikáit társadalomtudományi területen viszonylag ritkán alkalmazzák, ugyanis ezek az elemzési módszerek csak nagy mennyiségű (tipikusan több ezer) adat esetén működnek igazán megbízhatóan. A társadalomtudományi szempontból releváns jelenségek idősoros adatbázisai pedig általában ennél nagyságrendekkel kevesebb adatot tartalmaznak.

Kutatásunk során először az idősor-elemzés klasszikus, a társadalomtudományokban jól ismert módszereit - exponenciális simítás, szezonális dekompozíció, ARIMA modellek - alkalmazzuk, hogy az idősorokat stacionáriussá tegyük és megtisztítsuk a környezet változásából adódó hatásoktól. Majd a reziduális valamint differenciált idősorokat elemezzük Hurst-analízissel.

Számításainkat a nemek szerint bontott adatokon végeztük, de mivel (a jelentős mennyiségi eltérésen kívül) jelentős különbségeket nem tapasztaltunk, helytakarékossági okokból a közölt grafikonok mindig a nemi bontást nem tartalmazó, egyesített adatokra vonatkoznak.

Adatelőkészítés - klasszikus idősor-elemzés

A vizsgált idősorok az öngyilkosságok napi gyakoriságait tartalmazzák nemek szerinti bontásban 1970. január 1-jétől 2000. december 31-éig. Mivel a 31 évben 8 szökőév volt, az idősorok 11 323 napot fognak át. A KSH adatai szerint ebben a 31 évben összesen 127 877 öngyilkosság történt, egy napra átlagosan 11 esemény jutott. A teljes esetszámból 15 esetben nem lehetett megállapítani az öngyilkosság pontos idejét, ezért a nemek bontása nélküli idősor 127 862 öngyilkosság napokra lebontott gyakoriságaiból áll. A vizsgált 31 évben 90 912 férfi és 36 965 nő követett el öngyilkosságot, ebből 11 férfinek és 4 nőnek nem ismert a pontos halálozási ideje. A teljes idősorban egy nap kivételével (2000. december 13.) minden nap előfordult legalább egy eset, a 0 esetszámú napok száma a férfiaknál 15, a nőknél 619.

A vizsgálat megbízható adatokat tartalmaz, hiszen forrását azok a vizsgálati bizonyítványok és halálozási lapok adják, amelyek a KSH halálozási statisztikájának legfontosabb dokumentumai.

Napi gyakoriságokat bemutató idősorainkon az események általános, valamiféle természeti rendhez igazodó alakulásának feltárása önmagában is érdekes kérdés, de a vizsgálat más kérdésre kereste a választ: van-e a vizsgált idősorokban olyan tényező, amely a rendszer belső logikájából következően hat az eseményekre. Az idősorokra vonatkozó egyik megfogalmazható kérdés tehát a rendszerre kívülről ható tényezőkkel foglalkozik, a másik a rendszer belső elemeinek egymásra hatásával.

Az alábbiakban röviden ismertetjük a vizsgált idősorok bemenő változókká alakításának módszerét és azok fontosabb tulajdonságait. Az alábbi idősorok nemi bontás nélküliek, de a vizsgálatban természetesen elkülönítetten is kezeltük a férfiak és a nők idősorait.

Jól ismert és a hazai öngyilkossági statisztikák publikált nyers adataiból is világosan látszik1, hogy 1970-től 2000-ig az öngyilkosságok számszerű alakulásának van egy felszálló és egy leszálló ága. A pontos fordulópontot nehéz meghatározni, de a trend egyértelmű: az 1980-as évek második feléig emelkedett, azt követően pedig csökkent az öngyilkosságok száma (1. ábra). A későbbiekben szerephez jutó nyers havi gyakoriságok idősorára illesztett polinomiális trendvonal ezt jól szemlélteti.

Az idősorokban levő trendhatásokat különböző aggregáltsági szinteken különböző statisztikai módszerekkel lehet vizsgálni, de a modell kiválasztását és az idősor felépítését alapvetően a szezonális komponensekre tett előfeltételezések határozzák meg.

A vizsgálat trendhatásoktól mentesített idősorát a hónapokra aggregált nyers napi gyakoriságok egyszerű exponenciális simító eljárással képzett reziduálisaiból állítottuk össze. A hosszú távú trend eltávolítása után kapott idősort azonban évek szerint ismétlődő szabályos ingadozások terhelik. A diagramon azt a sajátosságot lehet megfigyelni, hogy a hónapok váltakozásának szabályos rendje valamilyen úton-módon hat az idősor megfigyelt adataira. Az öngyilkosságok ilyen szezonalitása jól ismert a nemzetközi szakirodalomban és nemrégiben hazai vizsgálatok is igazolták azok megállapításait: "Egyértelmű és konzekvens az a tapasztalat, hogy az öngyilkosság sajátos szezonalitással rendelkezik: a tavaszi hónapokban kezd a tragikus események száma emelkedni, a május-június-július hónapokban éri el a tetőpontját, míg a téli hónapokban a gyakoriság számottevően visszaesik (december-január-február)."2 Ezt a jelenséget az öngyilkosságok havi átlagai mutatják a 2. ábrán.

A detrendelt, havi szezonális hatásoktól mentes idősor előállításához a 31 év havi gyakoriságaiból álló idősor dátum változóját 12 hónapos periodicitással definiáltuk, és a szezonális dekompozíciós idősorelemző eljárás additív modellje alapján elkülönítettük az idősor egyes szezonális komponenseit. A havi szezonalitást leválasztó szezonális index-komponens egyértelműen igazolja a havi szezonalitásról mondottakat, a modell reziduális változója pedig egyértelműen olyan stacionárius idősort mutat, amely mentes a havi szezonális ingadozásoktól.

Az öngyilkosságok idősorában kimutatható rövidebb távú szabályos ingadozások közül a havi szezonális ingadozás csak az egyik, mondhatnánk jobban ismert általános jellegzetesség. A környezet társadalmi rendjéhez tartozó heti ciklikusosság kevésbé látható és észrevehető módon, de statisztikailag igazolhatóan befolyásolja az öngyilkosságok alakulását. A heti ciklusok alakulását vizsgálhattuk idősorainkon, hiszen azok napi gyakoriságokból épülnek fel. Az idősorokra illesztett dátum változó heti periódusának definiálásával 1617 periódust megkülönböztető idősorhoz jutottunk. A 3. ábra mutatja az öngyilkosságoknak a hét napjai szerinti átlagait.

Az idősor meghatározó komponenseit ez esetben is a szezonális dekompozíciós idősor-elemzés additív modellje alapján különítettük el egymástól. Az eljárás eredményeként kapott szezonális index értékei egyértelműen mutatják a hétfői csúcsot és a hétvégére eső visszaesést, a reziduális változó pedig vizsgálatunknak a heti szabályos ingadozásoktól mentes idősorát adta.

Említettük már, hogy a szezonális dekompozíciós eljárással elkülöníthető komponensek az idősor aggregáltsági szintjétől függnek: havi szabályos ingadozást csak havi, heti szabályos ingadozást csak napi gyakoriságokból álló idősorokon lehet vizsgálni. Vizsgálatunkban a napi gyakoriságokból álló idősorról úgy választottuk le a havi szezonalitást, hogy abból kivontuk a hónapok hosszával normált havi szezonális index értékeket. Az így képzett változóval megismételtük a heti periodicitással definiált szezonális dekompozíciós eljárást. A kapott teljes reziduális idősor változónak kitüntetett jelentősége van, hiszen az most már majdnem megfelel a vizsgálat bemenő változóival szemben támasztott legfontosabb követelményeknek: az idősor alakulását biztos, hogy nem befolyásolják a trend- és szezonális hatások.

Az idősoron ekkor azonban még lehetnek egy lineáris valószínűségi folyamatból származó hatások. Ezeket egy AutoRegressive Moving Average (ARIMA) modell specifikálásával szűrtük ki. Az adatokra legjobban illeszkedő folyamat egy másodrendű autoregresszív és egy másodrendű mozgóátlag tagot tartalmazó [AR(2)MA(2)] modell volt. Ennek a folyamatnak a reziduálisa már a lineáris folyamatok "rövid távú memória" hatásait sem tartalmazta, így teljesen megfelelt nem lineáris idősor-elemzésünk céljaira.

Az autokorrelációs és parciális autokorrelációs függvényeket bemutató 4. ábrán jól látszik, hogy a lineáris folyamatok és a szezonális komponensek leválasztása után is szignifikáns hosszú távú korrelációk vannak az idősorban (melyek nem csengenek le exponenciálisan), ez önmagában is jelzi egy nemlineáris "hosszú távú memória" jelenlétét az idősort generáló folyamatban.

Az eredeti idősorokat egyszerű differenciálással is stacionáriussá tehetjük.

Az autokorrelációs függvények a differnciált idősorok esetén is a reziduális folyamat autokorrelációs függvényeihez hasonlóan viselkednek, ezért közlésüktől eltekintünk.

Hurst-analízis - nemlineáris idősor-elemzés

Mind az eredeti idősorok, mind a reziduális, mind a differenciált idősorok Hurst-exponenseit (H) meghatároztuk. Ezt közöljük az alábbi táblázatban nemek szerinti bontásban, megadva az exponens becslésének megbízhatóságát kifejező r2 értéket is. A nyers adatok esetén nem túl meglepő módon 1-hez közeli*** Hurst-exponenst kaptunk, ami az erős trend- és szezonális hatások következménye. Ez a magas érték mintegy igazolja, miért volt szükséges az a rengeteg erőfeszítés a trend- és szezonkomponensek eltávolítására.


			férfi 			nő 			együtt

			H 	r2 		H 	r2 		H 	r2

nyers 			0,979 	0,957 		1,07 	0,952 		1,03 	0,955 
nyers detrendelt 	0,202 	0,822 		0,189 	0,871 		0,217 	0,839 

differenciált
10-21 nap 		0,4 	0,97 		0,40 	0,97 		0,4 	0,97 
22-1825 nap (5475) 	0,13 	0,96 		0,110 	0,92 		0,14 	0,96 
1826 (5476) -11318 nap 	0,09 	0,5 		0,020 	0,03 		0,1 	0,55 

ARIMA reziduális
0-21 nap 		0,53 	0,97 		0,51 	0,98 		0,44 	0,97 
22-1825 (5475) nap 	0,16 	0,96 		0,17 	0,91 		0,14 	0,88 
1826 (5476) -11318 nap 	0,39 	0,86 		0,14 	0,16 

Mondanivalónk szempontjából a reziduális és a differenciált idősorok részletes elemzése az érdekes. Megállapítható, hogy mind a férfiak, mind a nők esetében a 31 éves időszak három szakaszra bomlik. Ezeknek a szakaszoknak a határai azonban különböznek nemek szerint. A Hurst-exponens viselkedése az egyes szakaszokon belül már nem mutat jelentős eltérést a nemek között. Általánosságban elmondható az is, hogy a reziduális és a differenciált idősorok hasonlóan viselkednek, attól eltekintve, hogy az utolsó periódus exponense a differenciált idősorok esetén már nem becsülhető megbízhatóan.

Az első periódus 21 nap körüli hosszúságú (de az egyenes illesztésének bizonytalansága és az eljárás robusztussága miatt nyugodtan mondhatjuk azt is, hogy néhány hét nagyságrendű) ahol a Hurst-érték 0,5 körül van, ami véletlen bolyongást jelez. Az egyes napok reziduális öngyilkossági adatai tehát néhány héten át nem mutatnak egymással kapcsolatot, véletlenszerűen változnak: nőnek vagy csökkennek egymástól függetlenül.

Sokkal érdekesebb a középső szakasz. Ez férfiaknál a 21 és 1825 nap között van, ami 5 év körüli periódust jelent, a nőknél viszont 15 év körüli ezen periódus hossza. Ezekben a középső periódusokban 0,15 körüli az exponens értéke mindkét nem esetén. Az alacsony érték úgynevezett "rózsaszín zaj" jelenlétére utal. Ilyen zajfolyamat esetén nagyon erősek a trendet fordító hatások, ami a mi esetünkben pontosan azt jelenti, hogy a folyamat nem tud messze eltávolodni a trend és a szezonális ciklusok által meghatározott pályától.

Az alacsony Hurst-értékkel jellemezhető folyamatok másik jellegzetessége a relaxációs idő jelenléte. A relaxációs idő az az átlagos időtartam, amely alatt a rendszer egy külső zavar után visszaáll eredeti állapotába. Esetünkben ezt az időtartamot mindkét nem esetén néhány hétre becsülhetjük, hiszen átlagosan 21 nap véletlen ingadozás után megjelennek az eredeti pályától való további eltávolodást gátló, visszatérítő hatások.

A rózsaszín zaj ötéves tartománya a férfiaknál azt jelenti, hogy igazából ötéves intervallumon belül van jó előrejelzési lehetőségünk az öngyilkosságok alakulására, hiszen addig intenzíven a trend felé törekszik az idősor, öt év után pedig ismét 0,5 körüli (0,39) értékkel inkább a véletlen bolyongáshoz hasonlít jobban az viselkedése.

A nők esetén a trendhez visszatérő viselkedés időtartama 15 év, tehát ott sokkal hosszabb előrejelzéseink lehetnek, mint a férfiak esetén. A harmadik periódusra azonban a nők esetén már nem tudjuk az exponenst megbízhatóan becsülni, hiszen már csak idősor második fele áll rendelkezésünkre, ezt a bizonytalanságot egyébként az alacsony (0,14) r2 is mutatja.

Összefoglalás

Megállapítottuk, hogy a trend- és szezonális komponensek leválasztása után kapott (valamint a differenciált) magyarországi öngyilkossági adatok erősen nemlineáris jellegűek. Kvalitatíve hasonlóan viselkednek a férfiakra és a nőkre vonatkozó idősorok is. A jellemző nemlineáris zajfolyamat a férfiak és a nők esetén egyaránt "rózsaszín zaj" jellegű 0,15 körüli Hurst-exponenssel. A rendszerre jellemző relaxációs idő néhány hét nagyságrendű, ezen belül véletlenbolyongás-szerűen távolodik a rendszer a trend- és szezonkomponenstől, ezen az időtartamon túl viszont tartani próbálja a korábbi pályához viszonyított állapotát. A férfiak esetén a rózsaszín zaj által meghatározott szakasz 5, a nőknél 15 év körüli.

További kutatási irány az idősort generáló folyamat fázisterének rekonstruálása és a Ljapunov-exponensek meghatározása az alacsony dimenziós káosz esetleges kimutatása érdekében. E vizsgálatok azonban az eddigieknél több és bonyolultabb számítást igényelnek.


Kulcsszavak: idősor-elemzés, Hurst-exponens, nemlineáris folyamatok, rózsaszín zaj, R/S-analízis.


* A tanulmány az OTKA T33030 számú kutatás támogatásával készült. A szerzők köszönetet mondanak továbbá a Központi Statisztikai Hivatalnak (a Népesedés-egészségügyi és szociális statisztikai főosztály vezetőjének, Gárdos Évának, valamint Szvitecz Zsuzsanna osztályvezetőnek), amiért a tanulmány alapját képező adatok elemzéséhez hozzájárult.

** A Hurst-exponens legfontosabb tulajdonságai és részletes definíciója megtalálható többek között Fokasz Nikosz: Nemlineáris idősorok - a tőzsde káosza? című tanulmányában a jelen kiadványban.

1 Adatok az öngyilkosságokról 1980-1999 / Gárdos Éva, Szvitecz Zsuzsanna; közrem. Veres Előd. Budapest: KSH, 2000. 17 p.

2 Zonda Tamás - Bozsonyi Károly: A magyarországi öngyilkossági adatok szezonalitásáról, Szenvedély (Addictologia Hungarica, 2001. április)

*** A Hurst-exponens elméleti értéke ugyan nem lehet nagyobb 1-nél, de mivel becslését egy regressziós egyenes meredeksége adja, ezért a becslési hiba jelenléte miatt az adatokból számított érték lehet egynél nagyobb is. Az eltérés azonban esetünkben megnyugtatóan kicsi.


<-- Vissza a 2002/10 szám tartalomjegyzékére
<-- Vissza a Magyar Tudomány honlapra
[Információk] [Tartalom] [Akaprint Kft.]