- Kombinatorika
- Valszám alapok, klasszikus valszám
- Teljes valószínűség tétele, Bayes tétel
- Eloszlás, eloszlásfüggvény, sűrűségfüggvény
- Geometriai valószínűség, Binomiális tétel
- Várható érték és szórás
- Markov és Csebisev egyenlőtlenségek
- A binomiális eloszlás és a hipergeometriai eloszlás
- Nevezetes diszkrét és folytonos eloszlások
- Kétváltozós eloszlások
- Statisztikai alapfogalmak
- Becslések
- Hipotézisvizsgálat
- Regressziószámítás
- Nem hátrány, ha tudunk integrálni
Markov és Csebisev egyenlőtlenségek
Markov egyenlőtlenség
A Markov-egyenlőtlenség egy nagyon egyszerű dolgot állít. Az, hogy az $X$ valószínűségi változó sokkal nagyobb legyen a várható értéknél nem túl valószínű:
\( P \left(X \geq t \cdot E(X) \right) \leq \frac{1}{t} \)
Csebisev egyenlőtlenség
A Csebisev egyenlőtlenség arról szól, hogy a várható értéktől való eltérés nem lehet túl nagy.
Ha ez az eltérés nagyobb, mint a szórás $t$-szerese, akkor ennek a valószínűsége kicsi:
\( P \left( \mid X-E(X) \mid \geq t \cdot D(X) \right) \leq \frac{1}{t^2} \)
Ha az eltérés kisebb, mint a szórás $t$-szerese, akkor ennek valószínűsége nagy:
\( P \left( \mid X-E(X) \mid < t \cdot D(X) \right) > 1- \frac{1}{t^2} \)
Nagy számok törvénye
Ha egy esemény bekövetkezésének elméleti valószínűsége $p$, akkor minél többször végezzük el a kísérletet, a relatív gyakoriság és az elméleti valószínűség eltérése annál kisebb lesz.
\( P \left( \mathrel{\Big|} \frac{X}{n} - p \mathrel{\Big|} < \epsilon \right) \geq 1 - \frac{ p (1-p)}{n \epsilon^2} \qquad P \left( \mathrel{\Big|} \frac{X}{n} - p \mathrel{\Big|} > \epsilon \right) < \frac{ p (1-p)}{n \epsilon^2} \)
Ha egy újságárus óránként 64 darab újságot szokott eladni, mekkora a valószínűsége, hogy az egyik órában
a) legalább 250-et ad el?
b) 200-nál kevesebbet ad el?
a) Egy újságárus óránként 64 darab újságot szokott eladni, a szórás pedig 8 darab. Adjunk becslét annak valószínűségére, hogy az újságos által eladott lapok száma 50 darab és 78 darab közé esik.
b) Egy üzemben 150 mm hosszú csavarokat gyártanak 2 mm szórással. Egy csavar selejtes, ha 146 mm-nél rövidebb vagy 154 mm-nél hosszabb. Adjunk becslést a selejtarányra.
c) Egy bankba óránként általában 120 ügyfél érkezik, a szórás 10. Adjunk becslést annak valószínűségére, hogy egy adott órában 100 és 150 közé esik az ügyfelek száma.
d) Egy sí üdülőhelyen a téli szezonban hetente átlag 300 cm hó esik, a szórás 60 cm. Ha 50 cm-nél kevesebb hó esik, akkor a túl kevés hó miatt le kell zárni egy bizonyos pályát. Ugyanezt a pályát 480 cm feletti hóesésnél lavinaveszély miatt kell lezárni. Adjunk becslést a pálya lezárásának valószínűségére.
a) Hányszor kel dobnunk a kockával ahhoz, hogy a hatos dobás valószínűségét a relatív gyakoriság 0,1-nél jobban megközelítse az esetek 95%-ában?
b) Hányszor kell feldobnunk egy érmét ahhoz, hogy a fej dobások valószínűségét a relatív gyakoriság 0,05-nél jobban megközelítse legalább 0,9 valószínűséggel?
a) Egy könyvárus óránként átlag 8 könyvet tud eladni. Mekkora a valószínűsége, hogy 5 óra alatt elad legalább 50 darabot? Adjunk erre becslést a Markov-egyenlőtlenséggel.
b) Az $X$ valószínűségi változó várható értéke 20. Adjunk becslést a $P(X<80)$ valószínűségre a Markov-egyenlőtlenséggel.
a) Egy csavargyárban 10 cm hosszú csavarokat gyártanak, 2 mm szórással. Egy csavar selejtes, ha a hossza 9,5 cm-nél kisebb vagy 10,5 cm-nél nagyobb. Adjunk becslést a selejtarányra.
b) Egy mozi előadásainak átlagos nézőszáma 120 fő, a szórás 16. Adjunk becslést annak valószínűségére, hogy egy előadáson a nézők száma 100 és 140 közé esik.
c) Az $X$ valószínűsége változó várható értéke 20, szórása 4. Adjunk becslést annak valószínűségére, hogy $X$ 15 és 28 közé esik.
d) Egy üzletben óránként átlag 80-an vásárolnak, a szórás 10. Adjunk becslést annak valószínűségére, hogy egy adott órában a vevőszám 60 és 90 közé esik.
e) Egy üzletben óránként átlag 12-en vásárolnak. A vásárlók száma Poisson-eloszlású. Adjunk becslést annak valószínűségére, hogy egy 3 órás időtartamban a vevőszám 25 és 45 közé esik.
a) Az $X$ valószínűségi változó várható értéke 20, annak valószínűsége, hogy $X$ 15 és 25 közé esik a Csebisev-egyenlőtlenség alapján legalább 0,96. Legfeljebb mekkora valószínűséggel esik $X$ a várhatótól legalább 4-nél távolabb?
b) Az $X$ valószínűségi változó várható értéke 40, annak valószínűsége, hogy $X$ a várható értéktől legalább 6-tal eltér legfeljebb 0,25. Legalább mekkora valószínűséggel esik $X$ 30 és 52 közé?
Elmeséljük mi az a Markov egyenlőtlenség és hogy mire is jó valójában. Mindezt egyszerű és nagyon szemléletes példákon keresztül. Markov egyenlőtlenség, Valószínűségi változó, Várható érték, Valószínűségek becslése, Alsó becslés, Felső becslés. Azt is elmeséljük mi az a Csebisev egyenlőtlenség és hogy mire is jó valójában. Mindezt egyszerű és nagyon szemléletes példákon keresztül. Csebisev egyenlőtlenség, Valószínűségi változó, Várható érték, Szórás, Valószínűségek becslése. Végül pedig elmeséljük mi az a Nagy számok törvénye és nézünk rá rengeteg példát. Mindezt egyszerűen és szuper-érthetően. Nagy Számok Törvénye, Relatív gyakoriság, Elméleti valószínűség, Sztochasztikus konvergencia, Bernoulli-féle képlet, A Nagy számok törvényének kétféle alakja.
HOGYAN MŰKÖDIK A NAGY SZÁMOK TÖRVÉNYE ÉS MIRE JÓ VALÓJÁBAN?
A nagy számok igazi csodákra képesek. Egy kutatás azt vizsgálta, hogy az USA államaiban milyen gyakorisággal fordulnak elő tüdőrákos megbetegedések. A vizsgálatban négy állam vett részt, két nagyobb meg két kisebb, és egy adott évben bekövetkezett megbetegedések százalékos megoszlását hasonlították össze. Abban nem volt semmi különös, hogy a nagyobb államokban több megbetegedést észleltek, hiszen a nagyobb államokban többen laknak, így nem csoda, hogy azokban több a beteg. Az viszont már meglepőbb volt, hogy nemcsak a betegek száma volt nagyobb, hanem az arányuk is. Egymillió lakosra 695 tüdőrákos beteg jutott a két nagyobb államban, és csak 670 a két kisebben. A kutatók pedig föltették maguknak a kérdést, vajon mivel magyarázható az, hogy a nagyobb államok lakói sokkal betegebbek. Talán azzal, hogy a kisebb államokban kevésbé városias környezetben élnek az emberek, és jobb a levegő? Vagy a több mozgás és kevesebb stressz az oka?
Különböző teóriákat eszeltek ki, egy évvel később pedig megismételték a vizsgálatot. Megint két nagyobb és két kisebb államot választottak, az eredmény pedig egészen meglepő volt. Fordult a kocka. A nagyobb államokban lényegében az előző évihez hasonló arányokat kaptak, a két kisebben viszont ezúttal jóval nagyobb volt a tüdőrákos megbetegedések előfordulása. Újabb teóriák születtek: talán a kisebb államokban kevésbé fejlett az egészségügyi hálózat, vagy éppen a vidéki életmód nagyobb alkoholfogyasztással jár… Egy évvel korábban még arra próbáltak meg magyarázatot adni, hogy miért értek el lényegesen jobb eredményeket a kisebb államok, most pedig már arra, hogy miért lettek azok sokkal rosszabbak.
Az emberi fantázia nem ismer határokat, így gond nélkül talál számtalan érvet amellett, hogy miért kevésbé betegek a kisebb államok lakói, és amellett is, hogy miért betegebbek. A valódi megoldást azonban valahol egészen máshol kell keresni. A magyarázatnak semmi köze a vidéki életmód okozta veszélyekhez, vagy épp a jó levegőhöz. A valódi megoldást egy matematikai törvényszerűség adja, amit úgy hívunk, hogy nagy számok törvénye. Nézzük meg, mi is a nagy számok törvénye valójában. Ahhoz, hogy jobban megértsük, mit mond ki ez a törvény, következzen egy kis mese egy dobókockáról és a 100%-os teljesítmény sanszáról.
Képzeljük el, hogy van egy dobókockánk, és dobunk vele egyszer. A dobás sikerességét a hatos dobások számával fogjuk mérni. Ha abból az egyetlen dobásból, amit dobtunk, egy darab hatos van, akkor 100%-osan sikeresek vagyunk. Ha viszont a dobás nem hatos, akkor 0%-os a siker. Megkísérelhetjük azt is kiszámolni, hogy mekkora esélyünk van erre a 100%-os sikerre. Ahhoz, hogy 100%-osak legyünk, annak az egyetlen dobásnak hatosnak kell lennie. A kockának hat oldala van, ezért annak esélye, hogy ez az egy dobás éppen hatos, 1/6 = 0,167. Másként fogalmazva: az esetek 16,7%-ában dobunk hatost, így az esetek 16,7%-ában teljesítünk 100%-osan.
Most nézzük, mi történik akkor, ha kétszer dobunk a kockával. Megeshet, hogy mindkét dobás hatos. Az is lehet, hogy csak az egyik dobás hatos, és előfordulhat, hogy egyik sem. Olyankor lesz 100%-os az eredményünk, amikor mindkét dobás hatos. Abban az esetben, ha a két dobásból csak az egyik hatos, a dobásoknak éppen a felében sikerült hatost dobni, így az eredményünk 50%-os, ha pedig egyik sem hatos, akkor az eredmény 0%-os. A 100%-os eredményhez tehát két hatost kell dobnunk, és ennek esélye 1 : 36 = 0,027. Ez azt jelenti, hogy ha kétszer dobunk a kockával, akkor már csak az esetek 2,7%-ában leszünk 100%-osak.
Mielőtt végleg elmenne mindenkinek a kedve a sok számolástól, nézzük a lényeget. Három dobásnál a 100%-os teljesítmény esélye már csak 0,46%, négy dobásnál már csak 0,077%, és 16 dobásnál a 100%-os teljesítmény esélye hihetetlenül picike. Azért olyan pici, mert ehhez 16-szor egymás után hatost kéne dobnunk. Annak az esélye pedig, hogy 16-szor egymás után hatost dobunk 64 000-szer kisebb, mint az, hogy telitalálatosunk lesz a lottón. Másként fogalmazva: képzeljük el, hogy telitalálatosunk lesz a lottón, nyerünk több milliárdot, veszünk egy házat, néhány új autót stb. Aztán megint telitalálatosunk lesz, megint jönnek a milliárdok, aztán újra, és újra, 64 000-szer egymás után. Ha pedig ez már mind megvolt…, na majd utána az is bekövetkezhet, hogy 16-szor egymás után hatost dobunk a kockával.
Talán nem szükséges tovább részletezni, hogy a 16 egymás utáni hatos dobásnak az esélye egészen elképesztően kicsi. A nagy számok törvénye azt mondja, hogy minél többször dobunk a kockával, annál ritkábban fordulhat elő a 100%-os teljesítmény. 16 dobásnál pedig már jóformán lehetetlen. De 16 dobásnál már a 80%-os teljesítmény is gyakorlatilag lehetetlen, sőt a 60%-os is. Ha 16-szor egymás után dobunk a kockával, akkor a teljesítményünk valahol a 16,7% körül lesz. És minél többször dobunk a kockával az elért teljesítménynek annál jobban közelítenie kell a 16,7%-hoz, ami a hatos dobás valószínűsége. A nagy számok törvénye könyörtelenül és visszavonhatatlanul legyalulja a kivételeket, és ahogy a dobások száma egyre nagyobb, már nem igazán tűr meg mást, csak a 16,7%-ot.
Visszatérve a kiinduló problémánkhoz, lássuk, miért volt lényegesen kevesebb a rákos beteg a kisebb államokban. Vagy éppen miért volt lényegesen több? A rejtélyre a nagy számok törvénye ad magyarázatot. A nagy számok törvénye ugyanis azt mondja, hogy minél több embert vizsgálunk meg, a betegek aránya annál jobban közelíteni fog egy univerzális állandóhoz. A kisebb államokban kevesebb ember él, ezért ott még előfordulhat, hogy a betegek aránya sokkal nagyobb, vagy épp sokkal kisebb, mint ez a bizonyos állandó. A kicsi államok között vannak tehát olyanok, ahol a betegek aránya a szokásostól jelentősen eltér. Vagy kisebb – ezek az „egészséges vidéki államok” –, vagy éppen nagyobb – ezek a „beteg vidéki államok”. De minél nagyobb az esetek száma, vagyis minél többen laknak egy adott államban, annál jobban csökkennie kell az eltérésnek az univerzális aránytól. Ez egyúttal magyarázatot ad arra is, hogy a nagy államokban miért volt mindkét évben lényegében ugyanaz a betegek aránya. A nagy államokban a nagy számok törvénye már nem engedte meg, hogy a betegek aránya sokkal nagyobb vagy épp sokkal kisebb legyen a szokásos értéknél.
Olyan ez, mint az érmedobás. Próbáljuk ki, hogy mi történik, ha egy pénzérmét ötször feldobunk (kisebb államok), és nézzük meg, mi történik akkor, ha mondjuk tízszer (nagyobb államok). Amikor ötször dobunk az érmével, a fejek aránya még bőven lehet 50% felett, vagy épp jócskán lehet 50% alatt. Az is előfordulhat, hogy mind az öt dobás fej, vagy épp mind az öt dobás írás. Ha tízszer dobunk, akkor már a fejek aránya látványosan közelebb kerül az univerzális állandóhoz, ami az érmék esetében az 50%. Mintha az érme valahogy igazságot akarna szolgáltatni, és ki akarná egyenlíteni a kezdeti túl sok fej vagy túl sok írás dobást. Úgy tűnik, hogy „egy isteni kéz igazgatja a dobásokat”, ami nem engedi, hogy a fejek és az írások száma hosszú távon komolyabban eltérjen. Ezen a ponton pedig fölmerül a kérdés, hogy vajon honnan tudja az érme, hogy épp túl sok fejet dobtunk vele, és most már néhány írásnak is illene kijönnie. A válasz az, hogy sehonnan. Ha egymás után tízszer fejet dobunk, akkor valahogy úgy érezzük, hogy most aztán már tényleg írásnak kell jönnie, és valahogy nagyobb eséllyel kell ennyi fej után írást dobnunk, mint a szokásos 50%, Hiszen, ha ez nem így lenne, akkor veszélybe kerülne az 50-50 százalékos fej-írás arány. Csakhogy ez egy tévedés. Az érme minden alkalommal 50% eséllyel fej és 50% eséllyel írás. Még akkor is, ha már tízszer egymás után fejet dobtunk. Sőt akkor is, ha százszor. Az érme nem emlékszik a korábbi dobásokra, nem tudja, hogy most már aztán tényleg írásnak kéne jönnie. De akkor mégis mitől egyenlítődik ki hosszú távon a fejek és írások száma? A válasz az, hogy a számuk sosem egyenlítődik ki, hanem csak az arányuk. Képzeljük el, hogy nagyon szeretnénk írást dobni, és már tízszer egymás után fejet dobtunk. Úgy érezzük, hogy most az lenne igazságos, ha sok írás jönne egymás után, de ennek egyáltalán nem kell így lennie. Ha mostantól kezdve épp fele-fele arányban lesz fej és írás, akkor bizony sosem fog kiegyenlítődni az „igazságtalanság”. De a fejek és az írások aránya egy idő után mégis meg fog egyezni, mert ahogy egyre többször dobunk az érmével, az a tíz dobás egyre kevesebbnek látszik. A tízzel több fej ugyanis ezer dobásnál már csak 10/1000 = 0,01, egymillió dobásnál pedig 10/egymillió = 0,00001, vagyis már olyan picike, mintha nem is lenne.
A nagy számok törvénye tehát nem úgy működik, hogy egy isteni kéz igazgatja a véletlen eseményeket, és tereli őket az előre megadott valószínűségek felé. Hanem úgy működik, hogy a rendszerben lévő „igazságtalanságok” mindig megmaradnak, de a nagyszámú eset miatt szép lassan egyre jelentéktelenebbé válnak. Egy szemléletes példával élve kicsit olyan ez, mintha úgy akarnánk megszüntetni a Földön a szegények és a gazdagok közötti hatalmas vagyoni különbségeket, hogy minden egyes embernek adnánk 100 milliárd dollárt. A vagyoni különbségek ettől még ugyanakkorák maradnának, csak éppen már senkit sem érdekelnének. Ha ugyanis mindenki kap 100 milliárd dollárt, akkor teljesen mindegy, hogy valakinek kezdetben 20 millió forinttal nagyobb volt-e a vagyona vagy sem. Mert ez a 20 millió forint különbség a 100 millió dollárhoz képest olyan jelentéktelen, mint egy 30 centis kő a Mount Everest tetején.