A Magyar Tudományos Akadémia folyóirata. Alapítva: 1840
 

KEZDŐLAP    ARCHÍVUM    IMPRESSZUM    KERESÉS

 

 VALÓSZÍNŰSÉG ÉS RELATÍV GYAKORISÁG

X

Szabó Gábor

PhD, Zsigmond Király Főiskola Filozófia és Vallástudományi Tanszék, ELTE BTK Logika Tanszék • gsz(kukac)szig.hu

 

Ha egy természettudóstól megkérdezzük, vajon mit ért azon, hogy egy szabályos kockával való dobás során a hatos valószínűsége egyhatod, akkor többnyire ilyen választ fogunk kapni: az egyhatod valószínűség azt jelenti, hogy egy elegendően hosszú dobássorozatban a hatos dobás relatív gyakorisága közel egyhatod lesz. A válasz mögött meghúzódó álláspontot a valószínűség relatívgyakoriság-interpretációjának nevezzük.
A relatív gyakoriság- vagy más néven frekvenciainterpretáció a valószínűségnek nem az egyetlen interpretációja,1 a természettudósok között azonban bizonyosan a legnépszerűbb. Az interpretáció történetileg a 19. század közepére nyúlik vissza: Cambridge-ben jelent meg Robert Leslie Ellis és John Venn munkássága nyomán, mintegy empirista válaszként Laplace klasszikus valószínűség-interpretációjára, amely szerint a hatos dobás azért egyhatod valószínűségű, mert a kedvező és az „egyenlően lehetséges” esetek aránya a kocka esetében egyhatod. A válasz nyilvánvalóan az „egyenlően lehetséges” értelmezési nehézségébe torkollott, amely nehézség a frekventista megközelítésben nem jelentkezett. A frekvenciainterpretáció igazi népszerűségre azonban csak a logikai pozitivizmus kialakulása során a Berlini kör két képviselőjénél, Hans Reichenbach és Richard von Mises révén tett szert. Kettőjük közül mi az utóbbi elképzeléseit ismertetjük. Von Mises frekventizmusát az 1928-ban megjelent Wahrscheinlichkeit, Statistik und Wahrheit,2 és az 1931-es, nagyszabású Wahrscheinlichkeitsrechnung und ihre Anwendung in der Statistik und theoretischen Physik című műveiben fejtette ki, valamint az egyetemi jegyzeteiből 1964-ben posztumusz kiadott Mathematical Theory of Probability and Statisticsben.


1. A relatívgyakoriság-interpretáció


A relatívgyakoriság-interpretáció a valószínűséget nem egy szinguláris eseményhez, hanem egy eseménytípushoz rendeli. A hatos dobás valószínűsége a hatos relatív gyakorisága a kockadobások sorozatában. Az olyan szinguláris valószínűségi kijelentésekre vonatkozóan, mint az Ennek a kockadobásnak a valószínűsége egyhatod ezek után két álláspont lehetséges. A toleránsabb álláspont Reichenbaché (1949): „Egy szinguláris eset valószínűségére vonatkozó kijelentést nem tekintem jelentéssel bíró kijelentésnek, hanem pusztán elliptikus beszédmódnak. Ahhoz, hogy egy ilyen kijelentés jelentéssel bírjon, le kell fordítani ismételt történések sorozatában relatív gyakoriságokra vonatkozó kijelentésre. A szinguláris eset valószínűségére vonatkozó kijelentésnek tehát átvitt jelentése van, amelyet az általánosról a partikuláris esetre való jelentésátvitellel konstruálunk.” (Reichenbach, 1949, 376–77.)

A szinguláris valószínűségi kijelentések tehát csak annyiban értelmesek, amennyiben eseménytípusra vonatkozó kijelentésekből származnak. Ez a származtatás azonban rögtön felveti az alábbi problémát:

„Ha megkérdezik tőlünk egy szinguláris jövőbeli eset valószínűségét, akkor először is az esetet egy megfelelő referenciaosztályba kell sorolnunk. Az egyedi dolgok vagy események azonban sok referenciaosztályba sorolhatók, amelyekből különböző valószínűségek származnak. Ezt az ambiguitást nevezzük a referenciaosztály problémájának.”3 (Reichenbach, 1949, 374.)

A referenciaosztály problémája tehát bármely olyan frekventista értelmezés problémája, amely a szinguláris kijelentéseknek jelentést tulajdonít. Elkerülni csak úgy lehet, ha a szinguláris valószínűségi kijelentésektől minden értelmet megvonunk. Ez a radikális álláspont von Mises-é (1928): „…annak a »valószínűségnek, hogy megnyerjük a csatát« például nincs helye valószínűségelméletünkben, mert nem tudunk elgondolni egy olyan kollektívát, amelyhez ez az esemény tartozna. A valószínűség elmélete ugyanolyan kevéssé alkalmazható erre a problémára, mint amennyire a munka fizikai fogalma alkalmazható a színész munkájára midőn eljátssza szerepét a színpadon.”

Egy eseménytípus vagy más szóhasználatban egy tulajdonság valószínűsége tehát a tulajdonságot instanciáló egyedi események bekövetkezési gyakoriságával azonos egy alkalmasan választott referenciaosztályon. A frekventista interpretáció rendszerint a következőképpen halad. Mivel a valószínűséget relatív gyakorisággal azonosítjuk, ezért első lépésben a valószínűség mértékelméleti fogalmait egy másik matematikai diszciplína, a sorelmélet fogalmaival reprezentáljuk. Az alapstruktúra tehát a mérhető tér helyett a sorozat lesz. A második lépésben e sorozatokat interpretáljuk fizikailag úgy, mint bizonyos eseménytípusba tartozó szinguláris események rendezett összességét. Mindkét lépésnek megvannak a maga nehézségei. A valószínűségelmélet más matematikai struktúrákkal való reprezentációja azt a problémát veti fel, amelyet Wesley C. Salmon (1966, 63.) megengedhetőségi kritériumnak nevez: az így nyert struktúrák vajon a releváns szempontból izomorfak lesznek-e a valószínűség mértékelméleti megfogalmazásával. A második lépés, a sorozatok fizikai interpretációjának nehézsége abban áll, ami minden interpretáció közös nehézsége, és ami Salmon osztályozásában a kideríthetőség nevet viseli: mit is jelentenek fizikailag a sorozatok? A két kritériumot az alábbiakban gondosan elkülönítve tárgyaljuk.

Ami a kideríthetőséget illeti, azt kell tehát megvizsgálnunk, hogy a frekventista iskola hogyan értelmezi az interpretáció matematikai alapjául szolgáló sorozatokat. A sorozatok szinguláris események, megfigyelések rendezett összessége. Ez rögtön nyilvánvalóvá teszi azt a tényt, hogy a sorozatok révén definiált valószínűség érzékenyen fog függni a sorozatokkal reprezentált események körétől. Milyen egyedi eseményeket tekintsünk kockadobásnak? Milyen magasról, milyen sebességgel kell eldobni a kockát, hogy az dobásnak számítson? A referenciaosztály rögzítése tehát előfeltétele minden frekventista definíciónak. Milyen események alkossák tehát a referenciaosztályt? Ebben a kérdésben két ellentétes álláspont létezik: az aktuális és a hipotetikus frekvenciainterpretáció.

Az aktuális frekventizmus a szigorú empirista hagyomány szellemében a sorozatokat az aktuálisan megfigyelt események halmazával azonosítja. Mivel ez a halmaz véges, ezért a matematikai struktúra a véges sorozat, amelynek elemei tulajdonságok valamilyen algebrájából vesznek fel értékeket. Egy tulajdonság (eseménytípus) valószínűsége a véges sorozatban vett relatív gyakorisága. Ahogy Venn (1866) fogalmaz: „A valószínűség semmi más, mint arány”. A hatos valószínűsége tehát a kockának egy adott véges sorozatában a hatos dobás relatív gyakorisága.

Ez az elképzelés jól vizsgázik a kideríthetőség kritériuma szempontjából: minden valószínűségi kijelentés szigorúan verifikálható lesz. Ugyanakkor azonban a valószínűség fogalmának ilyen szigorú operacionalizálása kiüresíti a fogalmat. Az interpretáció elvileg zárja ki annak lehetőségét, hogy a valószínűség ne manifesztálódjon maradéktalanul minden statisztikus mintán. Egy valószínűségi kijelentés csak az aktuálisan megfigyelt véges számú esetre alkalmazható, azon túl pedig nem általánosítható. Az aktuális frekventizmust ebben a véges formában ezért nem is képviseli senki.

A hipotetikus frekventizmus alapstruktúrája a végtelen sorozat. Az értelmezés nehézségét éppen ennek a végtelennek a fizikai értelmezése jelenti. A ’hipotetikus’ kifejezés arra a modális elemre utal, amely ezt az iskolát megkülönbözteti szigorúan empirista párjától. Mivel az aktuális világban a megfigyelések száma véges, ezért mondani kell valamit a valószínűséget reprezentáló sorozat végtelen számú nem aktuális eleméről. A klasszikus megoldás valamilyen modális fogalom bevezetése: a sorozat azt az eseményekből álló rendezett összességet reprezentálja, amelyhez aktuális megfigyeléseink tartoznának, ha a kísérletet végtelenszer megismételnénk. A modális elem itt a kontrafaktuális kifejezésben jut kifejezésre. A hatos dobás valószínűsége tehát az az érték, amelyet a hatos relatív gyakorisága határértékben felvenne, ha a kockával a végtelenségig dobálnánk. De hogyan értelmezzük a modális kifejezéseket? A realista megoldás a modális kifejezések mögötti ontológia komolyan vétele. A végtelen sorozatok reálisan léteznek, csak éppen nem az aktuális, hanem egy lehetséges világban. De miképpen léteznek ezek a lehetséges világok?
A gondolatmenetet nem szükséges folytatnunk. Látható, hogy a hipotetikus frekventizmus, és amibe torkollik, a modális realizmus, súlyos metafizikai elköteleződéssel jár. Ezért a hipotetikus frekventizmusnak ma, a véges aktualizmushoz hasonlóan szintén nem akad képviselője. A reálisan létező interpretációk a két szélsőség között lavíroznak.

Térjünk át a megengedhetőség kérdésére. A feladat itt az, hogy a valószínűség mértékelméleti megfogalmazásának megadjuk valamilyen izomorf matematikai megfogalmazását, amelynek relatív gyakoriságként való fizikai interpretációja valamilyen okból kézenfekvőbb, mint az eredeti megfogalmazásé. A választott matematikai struktúra a legtöbb ilyen esetben a sorozat, izomorfia alatt pedig a következőt értjük. Legyen (Ω, Σ, p) valószínűségi mértéktér, és legyen x: N → Σ egy sorozat, amely olyan szinguláris események végtelen rendezett összességét reprezentálja, amelyek mindegyike bizonyos Σ-beli tulajdonsággal jellemezhető. Egy a Î Σ tulajdonság relatív gyakoriságának határértékét az x sorozatban jelöljük rx(a)-val. Ekkor a valószínűség relatív gyakoriságként való matematikai reprezentációját így definiáljuk:

Definíció: Egy (Ω, Σ, p) valószínűségi mértéktér rendelkezik relatív gyakoriság-modellel, ha létezik olyan x: N → Σ sorozat, ahol minden a Î Σ tulajdonságra rx(a) = p(a).

Hangsúlyozzuk: egy ilyen modell létezése még nem jelenti azt, hogy a valószínűségeknek van relatív gyakoriság-interpretációjuk. Az ’interpretáció’ kifejezést a fentiekkel összhangban kizárólag a fizikai interpretációra tartjuk fent. A relatív gyakoriságmodell csak az első lépés a relatív gyakoriság-interpretáció felé, amelyet a modell fizikai értelmezésének kell követnie.

2. Kollektívák

A valószínűségelmélet tárgyát von Mises az alábbi módon jellemzi:

„A valószínűségelmélet tárgya a nagyon gyakran és változatlan körülmények között végzett kísérletek vagy megfigyelések hosszú sorozatai.4 Megfigyeljük például egy pénzérme vagy egy kockapár ismételt eldobásának kimeneteit; feljegyezzük az újszülöttek nemét egy populációban; meghatározzuk egy céltáblára irányzott egymást követő lövések találati helyeinek koordinátáit; vagy, hogy egy általánosabb példát adjunk, feljegyezzük az »azonos folyamattal« mért »azonos fizikai mennyiség« mérési eredményeit. Minden esetben megfigyelések valamely sorozatával van dolgunk; meghatározzuk a lehetséges kimeneteket, és feljegyezzük az aktuálisakat.” (Mises, 1964, 2.)

A jellemzésből rögtön kitűnik, hogy a tömegjelenségek reprezentációja valamilyen rendezett módon történik, azaz lehetséges eseménytípusokat (attribútumokat) instanciáló aktuális események sorozatával. A szóba jöhető sorozatok karakterizációja a tömegjelenségek empirikus jegyeinek vizsgálatai révén válik lehetővé. A valószínűségelmélet fogalomkörébe eső jelenségeket von Mises szerint két ilyen jegy jellemez. Az első a relatív frekvencia stabilitása:

„A valószínűségelmélet szempontjából lényeges, hogy a tapasztalat szerint a kockajátékban, és minden egyéb tömegjelenségben, amelyet említettünk, bizonyos attribútumok relatív gyakorisága egyre stabilabbá válik a megfigyelések számának növekedtével.”5 (Mises, 1964, 108.)

A másik empirikus jegy a véletlenség, amelynek vizsgálata von Mises frekventista valószínűséginterpretációját minden más frekventista interpretációtól megkülönbözteti. A véletlent von Mises a következőképpen ragadja meg. Képzeljünk el egy játékost, aki a kaszinóban rulettezik, és hol a pirosra, hol a feketére tesz. A játékosnak különböző játékstratégiái lehetnek: például, ha három egymást követő pirosat lát, akkor a következőben feketére tesz; vagy figyeli a szomszéd asztalt, és amikor ott fekete jön ki, akkor a következő körben itt is a feketére fogad; vagy egyszerűen minden prímszámadik menetben a feketére tesz6 stb. Ám játékosunk „…előbb vagy utóbb arra a szomorú következtetésre jut, hogy egyik rendszer sem képes javítani esélyeit a hosszú távú nyerésben, azaz befolyásolni a relatív gyakoriságot, amellyel a különböző színek vagy számok megjelennek abban a sorozatban, amelyet a játékos a játék teljes sorozatából kiválasztott.” (Mises, 1964, 10.)

A relatív gyakoriság határértékének ezt a játékstratégiára való invariancióját nevezi von Mises a kizárt játékrendszer elvének (Prinzip vom ausgeschlossenen Spielsystem) vagy szabálytalansági axiómának.7 A tömegjelenségek véletlen jellege tehát a fentihez hasonló esélynövelő játékstratégiák nemlétét jelenti.

A tömegjelenségek két empirikus jegye tehát a relatív gyakoriság stabilizációja és a véletlenség. A két empirikus jeggyel rendelkező rendezett összességeket von Mises kollektíváknak nevezi. Az empirikus kollektívák matematikai reprezentációja végtelen sorozatokkal történik, amelyeket von Mises ugyancsak kollektíváknak nevez.

Milyen matematikai kollektívák reprezentálják helyesen az empirikus kollektívákat? A relatív határérték empirikus stabilizációját von Mises matematikailag úgy reprezentálja, hogy a valószínűség fogalmát kizárólag olyan sorozatok esetében tartja alkalmazhatónak, amelyekben a tulajdonságoknak végtelen határértékben van relatív gyakoriságuk. A másik empirikus jegy, a véletlenség reprezentációját von Mises a helyszelekció fogalmának bevezetésével kívánja megoldani. A helyszelekció egy eljárás, amelynek segítségével az eredeti sorozatunkból bizonyos szempontok alapján kiválasztunk egy részsorozatot. (A pontos definíciót lásd alább.) Egy sorozatban egy adott attribútum véletlenszerűen fordul elő (helyszelekciók egy adott halmazára nézve), ha relatív gyakorisága ugyanaz lesz a szelekcióval szűrt valamennyi részsorozatban, mint az eredeti sorozatban. A véletlenség tehát a szelekcióra való érzéketlenséget hivatott kifejezni. A véletlenségnek ez a reprezentációja fejezi ki azt a fizikai tényt, hogy fenti rulettjátékosunk nem képes úgy szelektálni a futamok között, hogy a piros–fekete arányt megváltoztassa. A rulett azért véletlen játék, mert a kimenetek aránya érzéketlen a fizikailag megengedhető helyszelekciókra nézve.

A matematikai kollektívák tehát aszimptotikus relatív gyakorisággal rendelkező véletlen sorozatok. Definíciójuk formálisan a következő:

Definíció: Legyen Σ valamilyen tulajdonságok (attribútumok) algebrája, és legyen x: N → Σ egy sorozat. Egy x sorozatot kollektívának nevezünk,

– ha minden tulajdonságnak a sorozatban létezik aszimptotikus relatív gyakorisága, vagyis minden a Î Σ -ra létezik a fentebb definiált rx(a) érték;

– és ez a határérték nem változik a megengedhető helyszelekciókra nézve, vagyis ha φ megengedhető helyszelekció, φ(x) pedig a helyszelekcióval szűrt részsorozat, akkor minden a Î Σ tulajdonságra: rx(a) = rφ(x)(a)

Egy x kollektíva akkor relatívgyakoriság-modellje egy valószínűségi mértéktérnek, ha a fenti definíció értelmében a relatív gyakoriságok képesek reprodukálni a mértéktér valószínűségeit. Ilyenkor a kollektívában egy, a tulajdonsághoz tartozó aszimptotikus relatív gyakoriságot az a tulajdonság px(a) valószínűségének nevezzük.

A kollektíva fenti definíciója nem mond semmit arról, hogy mit tekintsünk megengedhető helyszelekciónak. A kollektíva fogalma nyilvánvalóan érzékenyen függ a megengedhető helyszelekciók körétől (és a tulajdonságok algebrájától). Mielőtt erre a kérdésre térnénk, vizsgáljuk meg előbb azt, hogy hogyan képzeli el von Mises a kapcsolatot a véges empirikus kollektívák és ezek matematikai reprezentációjául használt végtelen kollektívák között. Von Mises kettős szóhasználata nem véletlen; megértéséhez fontos tudatosítani azt az empirikus attitűdöt, amely valószínűségelméletét – a szigorú axiomatizálására való törekvése mellett – megkülönböztette a végül uralomra jutó mértékelméleti megközelítéstől. Von Mises számára a valószínűségelmélet nem az absztrakt matematika egyik ága, hanem ugyanolyan empirikus tudomány, mint a mechanika vagy (sic!) a geometria:

„Valószínűségelmélet alatt mi, akárcsak mechanika vagy geometria alatt megfigyelt mennyiségek bizonyos tartományának tudományos elméletét értjük. Ha megpróbáljuk leírni a tudományos kutatás ismert formáit, a következőket mondhatjuk: minden egzakt tudomány megfigyeléssel kezdődik, amely kezdetben hétköznapi nyelven nyer megfogalmazást, majd a pontatlan kifejezések egyre finomodnak, míg végül axiomatikus feltevésekkel helyettesítjük őket, amelyek egyúttal az alapfogalmakat is definiálják. Tautologikus, azaz matematikai transzformációk következnek ezután, amelyek a feltevésekből következményekhez vezetnek, amelyeket visszafordítva a köznyelvbe megfigyelésekkel ellenőrizhetünk operacionalista előírásoknak megfelelően. Így minden elegendőn fejlett matematikai tudományban van egy »középső« rész, egy tautologikus vagy matematikai rész, amely matematikai levezetésekből áll. Manapság, a valószínűség tanulmányozásánál gyakori tendencia, hogy ezzel a matematikai résszel gondosan és szigorún foglalkozzanak, míg kevés figyelmet szentelnek magának a témának, a valószínűségelméletnek mint tudománynak.

Ez tükröződik abban a tényben is, hogy a »mértékelméleti megközelítést« általában előnyben részesítik a »frekvencia-megközelítéshez« képest… A valószínűségi kalkulusban használt matematikai eszközök leírása azonban csak egy része a történetnek. A tömegeloszlás, a sűrűségeloszlás, az elektromos töltés mind-mind additív függvények. Ha a valószínűségben semmi sajátos nincsen, akkor miért definiáljuk valószínűségi eloszlások függetlenségét, és miért nem definiáljuk a tömegeloszlásokét? Miért használunk véletlen változót, konvolúciót, láncokat és a valószínűségi kalkulus egyéb sajátos fogalmait?” (Mises, 1964, 43–44.)

 

 

Az utolsó két bekezdés utalásai Andrej Kolmogorov valószínűség-számítására vonatkozik. A valószínűségelmélet von Mises szerint tehát nem egy speciális mértékelmélet, hanem egy matematizált, ugyanakkor mégis empirikus tudomány. Ezért a nézetéért, amely összhangban állt tágabb empirista tudományfilozófiai nézeteivel – lévén a Berlini kör reprezentáns alakja –, gyakran érte vád: „Von Mises definíciója összekeveri az empirikus és teoretikus elemeket, amelyeket általában szétválasztunk a modern axiomatikus elméletekben. Ahhoz hasonlít ez, mintha a geometriai pontot krétapontok végtelenül csökkenő határértékeként definiálnánk.” – írja Harald Cramér (1946) von Misesről, aki így válaszol a vádakra:

„Az »empirikus és teoretikus elemek összekeverése« véleményünk szerint elkerülhetetlen egy matematikai tudományban. Amikor a rugalmasságtanban bevezetjük a feszültség fogalmát, nem szorítkozhatunk pusztán arra a megállapításra, hogy ez egy másodrendű szimmetrikus tenzor. Be kell még vezetnünk a kontinuummechanika alapfeltevéseit is, a Hooke-törvényt stb., amelyek mindegyike empirikus és teoretikus elemek összekeverése. A rugalmasságtan nem tenzoranalízis… a megfigyeléstől az elméleti fogalmakhoz való átmenet nem teljesen matematizálható. Nem logikai következtetés ez, inkább választás, amely, úgy hisszük, új megfigyelések mellett egyre bizonyosabb lesz.” (Mises, 1964, 45.)

A kollektíva a feszültséghez hasonlóan egy empirikus tudomány elméleti fogalma. Az a tény, hogy a valószínűségelmélet ilyen elméleti fogalmakat használ, nem jelent nagyobb problémát, mint a ’végtelenül vékony vonal’ fogalma a geometriában, vagy a ’sebesség’ fogalmának használata a mechanikában.

„A valószínűség fogalmának a valószínűségelméletben ugyanaz a struktúrája, mint bármely olyan terület alapfogalmának, amelyen a valóság leírására és reprezentációjára matematikai analízist használunk. Tekintsük például a sebesség fogalmát a mechanikában. Amíg a sebesség csak mint az s elmozdulás és a t idő hányadosa mérhető, ahol mind s és t véges, nem nulla mennyiség, addig a sebesség a mechanikában mint ennek a hányadosnak a határértéke van definiálva amint t → 0 vagy mint a dt/ds differenciálhányados. Nincs értelme megkérdezni, hogy a differenciálhányados létezik-e a ’valóságban’. Matematikai létének feltevése a mozgás elméletének egyik alapja; igazolását abban leli, hogy segítségével képesek leszünk megfigyelhető mozgásokat leírni és megjósolni.” (Mises, 1964, 1-2. o.)

Hasonlóan: a relatív gyakoriság határértéke, akárcsak a sebesség, elméleti fogalom. Bevezetésüket bizonyos hányadosok értékének stabilizációja indokolja a gyakorlatban. A relatív gyakoriság empirikus stabilizációja azonban még nem jelenti a határérték létezését. Jól ismert tény, hogy egy végtelen sorozat véges kezdőszeletének ismerete semmilyen információval nem szolgál a sorozat határértékének tekintetében; sőt létezése tekintetében sem. Vagyis egy tetszőlegesen nagy véges minta esetében sem tudjuk kiválasztani azt a kollektívát, amely a mintát hivatott reprezentálni. Véges számú megfigyelés alapján nem jelenthetjük ki, hogy a határérték létezik, és még ha létezik is, nem tudhatjuk, hogy mi ez az érték. A sebesség vagy a sűrűség esetében azonban ugyanez a helyzet – érvel von Mises – ezek a fogalmak mégis jó szolgálatot tesznek a gyakorlati predikciókban. Így a valószínűség relatív gyakoriság-értelmezése semmivel sem áll rosszabbul, mint bármely, a határérték fogalmára épülő elméleti fogalom.

„A végtelen kollektíva fogalmára épülő elmélet eredményei olyan módon alkalmazhatók megfigyelések véges sorozatára, amely maga logikailag nem definiálható, azonban elegendően pontos a gyakorlatban. Az elmélet viszonya a megfigyeléshez ebben az esetben lényegében ugyanaz, mint az összes többi fizikai tudományban.” (von Mises, 1928)

Az analógia azonban sántít. A nem valószínűségi tudományokban egy elmélet általában pontos jóslatokkal rendelkezik egy fizikai mennyiség elméleti értékét illetően. Ez az érték azután a megfelelő (önkényesen vagy a gyakorlat által motiváltan választott) hibahatáron belül összevethető lesz a mérési eredményekkel, így igazolható lesz, vagy legalábbis cáfolható. A valószínűségelmélet esetében azonban az elméleti jóslat és a tapasztalat viszonya bonyolultabb. Hogyan igazolható vagy cáfolható ugyanis egy valószínűségi állítás?

Egy tulajdonság valószínűsége nyilvánvalóan nem konfirmálható úgy, hogy egy tetszőleges hibahatárt választva megköveteljük, hogy a valószínűség a vizsgált esetek számának egy adott értékétől kezdve sohase térjen el a relatív gyakoriságtól. A relatív gyakoriság empirikus stabilitása nem ennyire szigorú törvény. De talán konfirmálható a nagy számok törvényére hivatkozva. Az valóban nem igaz – hangzik az érv –, hogy egy kollektívában egy véges mintán vett tulajdonság megegyezne a tulajdonság relatív gyakoriságával, azonban a kettő eltérése valószínűség erejéig rögzített. Vagyis megfelelő valószínűségi konfidenciaküszöböt választva a valószínűségi jóslatok véges mintán ugyanúgy konfirmálhatók vagy falszifikálhatók, ahogyan a nem valószínűségi elmélet jóslatai a nem valószínűségi hibahatár megadása után. Az érv a nagy számok egyik-másik törvényére támaszkodik, amely szerint azonos eloszlású, független véletlen változókból képzett számtani átlag a változók számának növekedtével valószínűségi értelemben tart a várható értékhez.

Ez a kiút azonban, még ha működne is, el van zárva von Mises elől. A nagy számok törvénye egy adott véletlen változó iterálásából származó átlaggal van kapcsolatban. Ezt a valószínűségi változót interpretálják rendszerint úgy, mint egy szinguláris esemény valószínűségét, amelynek ismétlése adja a megfelelően hosszú sorozatok valószínűségét (a szorzatmértékben). Von Mises azonban épp ezt az interpretációt nem engedheti meg, hiszen számára az egyedi eseményeknek nincs valószínűségük, így nem is rendelhető hozzájuk valószínűségi változó.
Megtehetjük persze, hogy a nagy számok törvényeiben szereplő valószínűséget frekventistán értelmezzük, vagyis mint az illető kollektívában valamely attribútum határértékét. A konfirmáció kérdésére azonban ekkor sem kapunk megnyugtató választ. Ekkor ugyanis a nagy számok törvényeiben szereplő szorzatmértéket is frekventistán leszünk kénytelenek értelmezni, vagyis mint bizonyos tulajdonságú sorozatok relatív gyakoriságának határértékét sorozatok sorozataiban. Így értelmezve a szorzatmértéket a nagy számok erős törvénye arra a tautológiára zsugorodik, hogy adott aszimptotikus relatív gyakoriságú sorozatok sorozatában az adott aszimptotikus relatív gyakoriságú sorozatok relatív gyakorisága 1. De a gyenge törvény sem alkalmasabb a feladatra; ez ugyanis azt mondja, hogy az olyan sorozatok sorozatainak relatív gyakorisága, amelyekben a sorozat kezdőszeletéből számított relatív gyakoriságok tetszőlegesen kicsit térnek el az aszimptotikus relatív gyakoriságoktól, a kezdőszelet hosszával nullához tartanak. De mi köze ennek az állításnak az eredeti kérdésünkhöz, ti., hogy hogyan konfirmálható egy valószínűségi kijelentés? Úgy tűnik tehát, hogy von Mises frekvenciainterpretációja a kideríthetőség tekintetében hagy némi kétséget maga után. Most azonban térjünk át a frekvencia interpretáció megengedhetőségének kérdésére, vagyis arra a kérdésre, hogy a fenti kollektívák mennyire helyes matematika modelljei a valószínűségelméletnek.


3. Helyszelekció


Mindenekelőtt a kollektívák definíciójában szereplő helyszelekciók fogalmát szükséges tisztáznunk. A helyszelekció meghatározásánál Von Mises így fogalmaz: „A végtelen sorozatból egy végtelen részsorozatot úgy választunk ki, hogy a kiválasztandó elem indexénél nem használjuk a tulajdonságbeli különbségeket” (Mises, 1928). A homályos fogalmazás ellenére az intenció világos: egy tulajdonság relatív határértéke nyilván megváltozik, ha a részsorozatot úgy állítjuk elő, hogy a sorozatból egyszerűen kiválasztjuk az adott tulajdonságú elemeket. Az ilyen szelekciókat tehát zárjuk ki. Néhány példa megengedhető szelekcióra:

i. Kiválasztani a sorozat minden prím indexű elemét.

ii. Kiválasztani a sorozat egy elemét, ha előtte három adott tulajdonságú elem áll.

iii. Kiválasztani a sorozat egy elemét, ha egy másik kollektíva azonos indexű eleme egy bizonyos tulajdonságú.

Az i. és ii. szelekciókat törvényszerű, a iii. szelekciót véletlenszerű helyszelekciónak nevezzük. Az első próbálkozások a megengedhető helyszelekció körvonalazására Copelandtől (1932), Reichenbachtól (1932) és Karl Poppertől (1935) származnak, akik egymástól függetlenül érkeztek el az ún. Bernoulli-szelekció fogalmához. Informálisan a Bernoulli-szelekció (0-1 sorozatokra) a következőt jelenti. Legyen x egy végtelen 0-1-sorozat. Vegyünk egy véges hossszú 0-kból és 1-esekből álló m hosszúságú ’szót’, például a 01101-et, és vizsgáljuk meg, hogy a választott szó hol fordul elő x-ben. Ha a szó előfordul a sorozat xk, xk+1 … xk+m szakaszán, akkor válasszuk ki a sorozat xk+m+1-ik elemét. Ha x végtelenszer tartalmazza a választott szót, akkor a fenti szelekció egy végtelen részsorozatot ad. Az olyan sorozatokat, amelyekben a 0 és 1 relatív gyakoriságának határértéke invariáns minden Bernoulli-szelekcióval szemben, Bernoulli-sorozatnak nevezzük. A kollektívákat kezdetben a fenti szerzők ezekkel a Bernoulli-sorozatokkal azonosították.

A Bernoulli-sorozatok speciális esetei a normális számok: azok a Bernoulli-sorozatok, amelyekben az 1-ek és 0-ák valószínűsége a sorozatban 1/2. A normális számokra vonatkozóan David Gaven Champernowne (1933) eredménye fontosnak bizonyult a kollektívákra nézve is. Champernowne ugyanis megmutatta, hogy létezik megkonstruálható normális szám: például az x = 0100011011000…, amely bináris számok lexikografikus rendezéséből adódik. Ez a számelméleti eredmény közvetve arra is rámutatott, hogy a Bernoulli-sorozatok nem tölthetik be azt a szerepet, amelyet von Mises a kollektíváknak szánt, mivel a konstruálható Bernoulli-sorozatokban maga a konstrukció nyújt lehetőséget olyan helyszelekcióra, amelyre nézve a relatív gyakoriságok nem invariánsak.
A Bernoulli-sorozatok általánosításaként a helyszelekció fogalmára végül a következő meghatározás született. Legyen x: N → {0,1} egy végtelen sorozat, és f: N → R egy tetszőleges függvény. Az indexek k sorozatából válasszuk ki azt a k’ végtelen részsorozatot (ha van ilyen), amelyre teljesül, hogy ck = 1, ahol ck = f(bk), bk+1 = 2bk + xk és b1= 1. Ekkor a helyszelekciót a (φx)k = xk’ egyenlettel definiáljuk. A konstrukció mögött a gondolat nyilvánvaló: a megengedhető szelekciók azok, amelyek csak az elem indexénél kisebb indexű elemektől függenek. E függést a megelőző tagoktól biztosítják a bk elemek a konstrukcióban.

A definíció azonban ebben a formában, ahogy azt Erich Kamke (1932) megmutatta, ellentmondásos. Legyen ugyanis f(k) = xl(k) ahol l(k) a legkisebb pozitív egész, amelyre 2l(k) > k. Ekkor az xk’ sorozat épp az xk sorozat 1-es elemeit fogja tartalmazni, vagyis az 1-esek relatív gyakorisága a részsorozatban 1 lesz, bármennyi volt is az eredeti sorozatban. Ha tehát megengedjük a fenti f függvénnyel generált helyszelekciót, akkor kollektívák nem léteznek. Von Mises épp ettől tartott.

A fenti definíciót Alonzo Church (1940) pontosította. A fenti meghatározásban szereplő f függvényekre kikötötte, hogy azok legyenek rekurzívak. Ezzel a kikötéssel nemcsak Kamke ellenvetése vált elkerülhetővé, hanem von Mises azon félelmére is – miszerint kollektívák esetleg egyáltalán nem is léteznek – megnyugtató válasz érkezett. A kollektívák létezése ugyanis nem magától értetődő. Egy végtelen sorozat tudniillik mindig valamilyen rekurzióval adható meg. Az a rekurzió azonban, amellyel egy ilyen sorozatot megadunk, egyben arra is alkalmas, hogy a sorozat elemei között szelektáljunk: vagyis a sorozat nem lesz véletlen. Konstruktíve nem lehet tehát megadni olyan véletlen sorozatot, amely minden helyszelekcióval szemben véletlen lenne.8 Ám a rekurzív függvények megszámlálhatóan sokan vannak, és így Abraham Wald (1937) tétele alapján a helyszelekciók fenti megszámlálható halmazára nézve kontinuum sok véletlen kollektíva létezik.

Az öröm azonban nem tartott sokáig. Jean Ville (1939) megmutatta, hogy helyszelekciók bármely megszámlálható halmazához létezik olyan bináris kollektíva, amelyben az 1-esek aszimptotikus frekvenciája p, azonban a kollektíva minden véges kezdőszeletében az 1-esek relatív gyakorisága – véges kivételtől eltekintve – nagyobb vagy egyenlő p-nél. Röviden, a relatív gyakoriság felülről tart határértékéhez. Ez a tulajdonság a (később Alekszandr Hincsin [nemzetközi átírásban Khinchin] révén bizonyított) iterált logaritmus törvénye fényében meglehetősen atipikus viselkedésnek számított. Ez a törvény ugyanis a relatív frekvenciák oszcillációjára ad küszöböt; ezzel szemben a frekventista elmélet ezekre az oszcillációkra semmilyen korlátot nem ad. Mindezek azt mutatták, hogy von Mises valószínűségelmélete nem azonos az éppen kialakulóban levő mértékelméleti megközelítéssel. Az ellenvetésekre von Mises lakonikusan válaszolt: „Elfogadom a tételt, de nem látom az ellenvetést”. Valóban, von Mises elmélete számára nem jelentett a priori előírást, hogy izomorf legyen a kolmogorovi elmélettel.

A frekventista valószínűségelméletre a legsúlyosabb csapást a martingálok megjelenése mérte. A martingálok segítségével Ville megmutatta, hogy a kizárt játékrendszer von mises-i elvét a kollektívák nem ragadják meg jól, mivel Ville fenti kollektíváihoz lehetséges olyan stratégiákat gyártani, amelyek végtelen nyereményhez vezetnek. Ugyanakkor a kollektívák a von mises-i értelemben épp az ilyen nyerő stratégiák létét hivatottak kizárni.
A fenti és a hasonló kritikák hatására von Mises elképzeléseit a valószínűség Kolmogorov-féle mértékelméleti megfogalmazása végleg háttérbe szorította. A valószínűség-számítás alapjai tisztázásának szentelt 1937-es genfi konferencián – amelyen von Mises maga nem volt jelen – Maurice Fréchet csokorba szedte a frekventista megközelítés hátrányait, és ezzel a szakma végleg elfordult von Misestől.
 



Kulcsszavak: valószínűség, relatív gyakoriság, von Mises, véletlen sorozatok, helyszelekció
 


 

IRODALOM

Champernowne, David Gaven (1933): The Construction of Decimal Normal Numbers in the Scale of Ten. Journal of the London Mathematical Society. 8, 254–260.

Copeland, Arthur H. (1932): The Theory of Probability from the Point of View of Admissible Numbers. Annals of Mathematical Statistics. 3, 143–156.

Cramér, Harald (1946): Mathematical Methods of Statistics. Princeton

Church, Alonzo (1940): The Concept of a Random Sequence. Bulletin of the American Mathematical Society. 46, 130–135.

Kamke, Erich (1932): Über neuere Begründungen der Wahrscheinlichkeitsrechnung. In: Braithwaite R. B. (ed.): Jahresbericht der Deutschen Mathematiker-Vereinigung. 42, 14–27.

Mises, Richard von (1928/51): Wahrscheinlichkeit, Statistik und Wahrheit. Berlin  WEBCÍM >

Mises, Richard von (1931): Wahrscheinlichkeitsrechnung und ihre Anwendung in der Statistik und theoretischen Physik. Franz Deuticke, Leipzig–Wien

Mises, Richard von (1964): Mathematical Theory of Probability and Statistics. Academic Press, New York

Popper, Karl (1935): Logik der Forschung, Springer, Magyarul: A tudományos kutatás logikája. (ford. Petri György, Szegedi Péter) Európa, Budapest, 1997

Reichenbach, Hans (1932): Axiomatik der Wahrscheinlichkeitsrechnung. Mathematische Zeitschrift. 34, 568–619.

Reichenbach, Hans (1949): The Theory of Probability. University of California Press, Berkeley

Salmon, Wesley C. (1966): The Foundations of Scientific Inference. University of Pittsburgh Press, Pittsburgh

Tornier, Erhard (1933): Comment. Mathematische Annalen. 108, 320.

Venn, John (1866): The Logic of Chance. Macmillan, London
Ville, Jean (1939): Étude Critique de la Notion de Collectif. Gauthiers-Villars, Paris

Wald, Abraham (1937): Die Widerspruchsfreiheit des Kollektivbegriffes der Wahrscheinlichkeitsrechnung. Ergebnisse eines mathematischen Kolloquiums. 8, 38–72.
Wittgenstein, Ludwig (1922/56): Tractatus Logico-Philosophicus. Routledge & Kegan Paul, London, Magyarul: Logikai-filozófiai értekezés. (ford. Márkus György) Akadémiai, Budapest, 1989
 


 

LÁBJEGYZETEK

1 Ehhez lásd majd a szerző A valószínűség interpretációi című, hamarosan megjelenő könyvét. <

2 A könyv a Bécsi kör gondozásában a Philipp Frank és Moritz Schlick által szerkesztett Schriften zur wissen-schaftlichen Weltauffassung 3. köteteként jelent meg <

3 A referenciaosztály problémájának egy korai megfogalmazása John Venntől (1866) származik: „Tegyük fel például, hogy tíz angolból kilenc megsérül Madeirában tartózkodása során, de tíz tüdőbetegből kilencre jótékony hatással van ugyanez a hely. Ezek a statisztikák bár képzeletbeliek, de tökéletesen elképzelhetőek és összeegyeztethetőek. John Smith tüdőbeteg angol; vajon ajánljuk neki Madeirát vagy sem? Más szavakkal, milyen következtetést vonhatunk le a halálát illetően? Mindkét statisztikai táblázat illik rá, azonban ellentétes következményekhez vezetnek… További adat nélkül nem jutunk döntésre.” (222–223.) <

4 Vö. Ludwig Wittgenstein (1956): „Nincs olyan különleges tárgy, amely a valószínűségi kijelentések sajátos tárgya lenne.” (5.1511) <

5 Sőt, a tapasztalat szerint a relatív gyakoriságnak ez a stabilizálódása viszonylag gyorsan következik be: „Hallgatólagos feltevésünk, hogy a valószínűségelmélet néhány ismert alkalmazási területén (véletlen játékok, fizika, biológia, biztosítás stb.) a frekvenciák (a különböző problémák esetében különböző mértékben) viszonylag gyorsan tartanak határértékeik felé… Ennek a feltevésnek semmi köze a valószínűségi kalkulus axiómáihoz, és nem magyarázható semmilyen elméleti statisztika révén, hiszen az éppen ezen a feltevésen nyugszik.” (Mises, 1964, 108.) <

6 E stratégiának Joseph Leonard Doob szerint az az előnye, hogy a játékosnak a fogadások között egyre több ideje lesz gondolkodni a valószínűségelméletről. <

7 Amely elvet a perpetuum mobile nem létezésének termodinamikai tételéhez hasonló alapelvnek tart. <

8 Von Mises definíciójának értelmességével szemben tipikus korabeli reakció Erhard Tornieré (1933): „Nem hiszem, hogy a próbálkozás, hogy von Mises elméletét tiszta matematikai formába öntsük, sikeresen keresztülvihető, és azt sem hiszem, hogy az ilyen próbálkozásoknak hasznuk volna. Itt nyilvánvalóan azzal a fölöttébb érdekes jelenséggel van dolgunk, hogy egy gyakorlati és teljesen értelmes fogalom – kiválasztás a tulajdonságbeli különbségekre való tekintet nélkül – elvileg zár ki mindenféle tisztán matematikai és axiomatikus megragadást. Mindazonáltal kívánatos volna, hogy ez a kérdés, amely talán alapvető jelentőségű, matematikusok újabb köreinek figyelmét is magára vonja.” (Tornier, 1933, 320.) <