- Becslések
- Differenciálegyenletek
- Differenciálegyenletek, izoklinák
- Eloszlás, eloszlásfüggvény, sűrűségfüggvény
- Fourier sorok
- Geometriai valószínűség, Binomiális tétel
- Hipotézisvizsgálat
- Interpolációs polinomok
- Kétváltozós eloszlások
- Laplace transzformáció
- Markov és Csebisev egyenlőtlenségek
- Nevezetes diszkrét és folytonos eloszlások
- Sorok & hatványsorok & Taylor-sorok
- Teljes valószínűség tétele, Bayes tétel
- Valszám alapok, Kombinatorika
- Várható érték és szórás
Matek 3 DE
Intervallumbecslés
Egy TV csatorna szeretné megtudni, hogy a TV-nézők naponta átlagosan hány percet nézik műsoraikat. 500 embert terveznek megkérdezni, a válaszaik alapján kapott minta- átlaggal pedig szeretnék megbecsülni, hogy 95%-os biztonsággal mi mondható az összes TV-nézőre.
Akit az elméleti jellegű részletek untatnak, az a piros nyílra kattintgatva nyugodtan ugorja át a most következő részt, a feladatok megoldását enélkül is érteni fogja.
Nincs más dolga, mint figyelni, hogy a csiga mikor ér át a túloldalra.
Ha a minta elemszáma nagy, akkor a mintaátlagok a tényleges átlag körül lényegében normális eloszlással helyezkednek el, ezt a Centrális határeloszlás tételek alapján tudjuk. Ennek a normális eloszlásnak a várható értéke a tényleges átlag, amit jelöljünk -vel, szórása pedig
ahol a megkérdezettek száma, most éppen 500, pedig a teljes sokaság, tehát az összes TV-néző erre a csatornára áldozott idejének szórása, vagyis ördög tudja mennyi.
Ha a tényleges átlag mondjuk =80 perc, akkor a megkérdezett 500 ember válaszai alapján kapott mintaátlag a 80 perc körül fog ingadozni olyan normális eloszlást alkotva, amelynek várható értéke ez a bizonyos 80 perc.
Megeshet, hogy mázlink van, és olyan mintát választottunk, aminek a mintaátlaga közel esik a tényleges átlaghoz. Ilyenkor elmondhatjuk, hogy becslésünk pontos.
Ha nincs mázlink, előfordulhat, hogy bármennyire is szuper TV-nézőket igyekeztünk választani a felméréshez, azok válaszaikkal mégis tévútra vittek minket.
A becslésünknek 95%-os megbízhatósági szintet szeretnénk, ami azt jelenti, hogy megadjuk azt a tartományt a tényleges átlag körül, amibe a minta átlagok 95%-a beleesik, így ha nem vagyunk különösen szerencsétlenek, akkor a mi mintánk átlaga is. Ezt megbízhatósági szintet konfidencia szintnek nevezzük. A konfidencia szint szokásos jelölése .
A tényleges átlag körüli tartomány, amibe a mintaátlagok valószínűséggel bele-esnek, a normális eloszlás harang-görbéjének sötétebb középső része.
A normális eloszlást átalakítjuk standard-normális eloszlásra, ami úgy zajlik, hogy mindenkiből kivonjuk a várható értéket, aztán elosztjuk a szórással, ami
A mintaátlag, ami kezdetben volt, a standard normális eloszlásban átalakult:
Vagyis most már ezek esnek valószínűséggel a harang-görbe sötétebb középső részébe.
Itt a standard normális eloszlás eloszlás-táblázatában az -höz tartozó Z érték.
Célunk a sokasági átlag becslése, amit megpróbálunk ebből előbányászni.
Kis bűvészkedéssel
A sokasági átlag tehát valószínűséggel esik a megadott intervallumba. Ezt az intervallumot az konfidencia szinthez tartozó konfidencia intervallumnak nevezzük.
Az megbízhatósági szinthez, vagy másként konfidencia szinthez tartozó konfidencia intervallumok azok az intervallumok, amik a sokasági átlagot valószínűséggel tartalmazzák. A konfidencia intervallum végpontjai:
ahol
= a minta átlaga
= a minta elemszáma
=a teljes sokaság szórása
pedig a standard normális eloszlás -höz tartozó Z értéke.
Az konfidencia szinthez tartozó konfidencia intervallumok tehát a sokasági átlagot valószínűséggel tartalmazzák.
Vannak jó konfidencia intervallumok, amik tartalmazzák a sokasági átlagot, ábránkon ezek sárgával vannak jelölve,
és vannak rossz konfidencia intervallumok, amik nem tartalmazzák, ábránkon pirossal jelölve.
Jól látszik, hogy a jó konfidencia intervallumok éppen azokhoz a mintaátlagokhoz tartoznak, amik a normális eloszlás harang-görbéjének sötétebb valószínűségű részébe esnek, vagyis közel vannak a tényleges átlaghoz. Rosszak pedig azok a konfidencia intervallumok, ahol a mintaátlag ezen kívül esik.
Fontos azonban megérteni, hogy egy konkrét mintavételnél egy konkrét konfidencia intervallumot kapunk, ami már nem valószínűséggel tartalmazza a sokasági átlagot, hanem 0 vagy 1 valószínűséggel, mert vagy jó intervallum és akkor tartalmazza,
vagy rossz és akkor meg nem.
Visszatérve a TV-nézők problémájához, egy 500 fős felméréssel szeretnénk 95%-os megbízhatósággal megállapítani, hogy az emberek naponta átlagosan hány percet nézik a csatorna műsorait. Az 500 fős minta átlaga 80 perc. A kérdés az, hogy a tényleges átlag 95%-os konfidencia szinten milyen értékek között mozog.
Feladatunk tehát a 95%-os konfidencia szinthez tartozó konfidencia intervallum meghatározása.
Az konfidencia szinthez tartozó konfidencia intervallum végpontjai:
ahol
= a minta átlaga
Ez most a felmérés alapján 80 perc
= a minta elemszáma
Most 500 embert kérdeztek meg, tehát n=500
=a teljes sokaság szórása
A helyzet az, hogy ezt a szórást előre ismernünk kell. Jogosan vetődik föl a kérdés,
hogy mi van, ha nem ismerjük, ezzel majd a következő esetben foglalkozunk. A
sokasági szórás például egy korábbi felmérés alapján =25 perc.
pedig a standard normális eloszlás -höz tartozó Z értéke.
Most a konfidencia szint =0,95 így =0,05 és
A képlet alapján
z
z
0
0,5000
1,05
0,8531
0,05
0,5199
1,1
0,8643
0,1
0,5398
1,15
0,8749
0,15
0,5596
1,2
0,8849
0,2
0,5793
1,25
0,8944
0,25
0,5987
1,3
0,9032
0,3
0,6179
1,35
0,9115
0,35
0,6368
1,4
0,9192
0,4
0,6554
1,45
0,9265
0,45
0,6736
1,5
0,9332
0,5
0,6915
1,55
0,9394
0,55
0,7088
1,6
0,9452
0,6
0,7257
1,65
0,9505
0,65
0,7422
1,7
0,9554
0,7
0,7580
1,75
0,9599
0,75
0,7734
1,8
0,9641
0,8
0,7881
1,85
0,9678
0,85
0,8023
1,9
0,9713
0,9
0,8159
1,95
0,9744
0,95
0,8289
2
0,9772
1
0,8413
2,05
0,9798
[Szövegdoboz: A normális eloszlás táblázatából ki kell keresnünk a értéket. Itt nem Z=0,975, hanem azt a Z értéket keressük, ami a 0,975 valószínűséghez tartozik. A konfidencia intervallum tehát 2,19 2,19 77,81 80 82,19 Az átlagos idő, amennyit nézik a csatorna műsorait 77,81 és 82,19 perc között van. Fontos azonban megjegyezni, hogy a konfidencia intervallum csak az összes lehetséges mintát véve tartalmazza =0,95 valószínűséggel a sokasági átlagot. Amikor már egy konkrét minta alapján egy konkrét konfidencia intervallumot kapunk, ez a való-]
színűség értelmét veszti. A konkrét konfidencia intervallum már vagy 100%, hogy tartalmazza a sokasági átlagot, vagy 0%. A 95%-os konfidencia szint csak arra enged következtetni, hogy 95% eséllyel választunk olyan mintát, ami a sokasági átlagot tartalmazni fogja.
A sokasági átlag becslésének módszere alkalmazható a sokasági arány becslésére is. Például, ha egy párt népszerűségét akarjuk megbecsülni, vagy, hogy egy TV műsort a lakosság hány százaléka nézett. A következőkben összefoglaljuk az ilyen típusú becsléseket.
Sokasági átlag, arány és variancia intervallumbecslése FAE-minták esetén
Az előzőekben bemutatott módszerrel alapvetően két sokasági jellemzőre, a sokasági átlagra és a sokasági arányra adhatunk intervallumbecslést úgynevezett FAE-minták esetén. A FAE-mintában a mintaelemek független és azonos eloszlású valószínűségi változók. Tipikusan ilyen a visszatevéses mintavétel, vagy ha ugyan visszatevés nélküli a minta, de olyan nagy a teljes sokaság, hogy ennek nincs jelentősége.
A most bemutatott módszerek a sokasági átlag és arány becslésére kis minták (n<30) esetén akkor igazak, ha maga az alapsokaság is normális eloszlású. Nagyobb minták esetén (30<n<100) már nem kell, hogy az alapsokaság normális eloszlású legyen, de közel szimmetrikusnak kell lennie. Ha pedig a minta elemszáma kellően nagy (n>100) akkor a Centrális határeloszlás tételek alapján a mintaátlag és arány még akkor is közel normális eloszlást követ, ha az alapsokaság meglehetősen kellemetlen eloszlású, vagyis nagy minták esetén módszereink jó közelítéssel bármilyen eloszlású alapsokaságra működnek.
Más a helyzet a harmadik fontos ismérv, a sokasági szórás esetében. A sokasági szórás becslésének technikája ugyanis kissé eltér az eddig bemutatottaktól. Ez a módszer csak akkor alkalmazható, ha a teljes sokaság normális eloszlású, de legalábbis közel normális eloszlású. Nézzünk mindegyikre egy-egy példát.
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT (FAE MINTA) konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása, a sokasági szórás nem = a t-eloszlás -höz tartozó értéke.] [Szövegdoboz: VARIANCIA INTERVALLUMBECSLÉSE (FAE MINTA) konfidencia szint = a minta elemszáma = a minta szórása, a sokasági szórás nem = a khi-négyzet eloszlás megfelelő értéke] [Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE (FAE MINTA) konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.] [Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS ISMERT (FAE MINTA) konfidencia szint = a minta átlaga = a minta elemszáma = a teljes sokaság szórása =a standard normális eloszlás valószí- nűséghez tartozó Z értéke, lásd táblázat]
Egy napilapkiadó kacsa-magazin típusú újság beindításával kívánja szélesíteni olvasóinak látókörét, ezért felmérést készíttet, hogy a jelenleg kapható hasonló kiadványokra naponta átlagosan mennyit költenek az újságolvasók. Az új lap megjelentetése akkor érné meg, ha ez az összeg havi szinten átlagosan legalább 760 forint lenne. A kérdés az, hogy mi mondható 90%-os illetve 95%-os konfidencia szinten erről az átlagról.
400 embert kérdeztek meg, akik havonta átlag 780 forintot fordítanak pletykalapok vásárlására. A kérdés az, hogy milyen becslést tudunk adni a sokasági átlagra, ha ismert, hogy a sokasági szórás =250 forint.
Ezt a szórást előre ismernünk kell vagy egy másik hasonló felmérés alapján vagy egyéb statisztikai adatok alapján. Jogosan vetődik föl a kérdés, hogy mi van akkor, ha ezt a szórást nem ismerjük. Ezzel a következő példánkban foglalkozunk majd.
Ha a kiadó megelégszik a 90%-ban megbízható eredménnyel, akkor a becslés a következő: [Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS ISMERT konfidencia szint = a minta átlaga = a minta elemszáma = a teljes sokaság szórása =a standard normális eloszlás valószí- nűséghez tartozó Z értéke, lásd táblázat]
, ez a konfidencia szint, amiből kiszámoljuk, hogy
, ez a minta átlaga
, ez a minta elemszáma,
, ez a teljes sokaság szórása.
A konfidencia intervallum tehát
Kikeressük a standard normális eloszlás táblázatából a 0,95-höz tartozó Z értéket, ami alighanem 1,65.
Ekkor becslésünk:
Az összes újságolvasó tehát átlagosan 759,4 és 800,6 forint között költ ilyen típusú újságokra 90%-os konfidencia szinten. Ez azonban nem jelenti, hogy a tényleges átlag 90%-al esne 759,4 és 800,6 közé. A 90% annyit jelent, hogy az összes lehetséges konfidencia intervallum 90%-a tartalmazza a tényleges átlagot, 10%-a pedig nem. Mindaddig, amíg nem számoljuk ki egy konkrét minta alapján a határokat, 90% eséllyel kapunk jó intervallumot. Amint azonban a konkrét minta és vele együtt a határok megvannak, a kapott intervallum már vagy tartalmazza az átlagot vagy nem, így a 90% értelmét veszti. Olyan ez, mint a lottó. Amikor kitöltjük a szelvényt, van valamekkora esélyünk nyerni, de a sorsolás után ez az esély megszűnik, akkor már vagy nyertünk,ami 100%-ot jelent vagy nem, ami pedig 0!%.
Ha a kiadó 95%-os konfidencia szintet választ, vagyis több lottószelvényt tölt ki, nagyobb eséllyel nyer. A sorsolás után viszont ez a nagyobb esély is átalakul 100%-ra vagy 0%-ra. A lottó esetében annyival jobb a helyzet, hogy lehetőségünk van megnézni, vajon nyertünk-e és így kételyeink eloszlanak. Itt a becsléseknél azonban a tényleges értéket általában nem fogjuk tudni, hiszen ezért kell maga a becslés.
Lássuk mi mondható 0,95-ös konfidencia szint esetén
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS ISMERT konfidencia szint = a minta átlaga = a minta elemszáma = a teljes sokaság szórása =a standard normális eloszlás valószí- nűséghez tartozó Z értéke, lásd táblázat]
, így
, ez a minta átlaga
, ez a minta elemszáma,
, ez a teljes sokaság szórása.
A konfidencia intervallum tehát
Kikeressük a standard normális eloszlás táblázatából a 0,975-höz tartozó Z értéket, ami alighanem 1,95.
Ekkor becslésünk:
A sokasági átlag új becslésünk alapján 755,5 és 804,5 közé esik. Annak a kívánalomnak, hogy legalább 760 legyen, 90%-os konfidencia szinten még lényegében megfelelt, 95%-os szinten már kevésbé.
Térjünk rá arra az esetre, amikor a sokasági szórás nem ismert. Ebben az esetben nekünk kell a szórást valahogy előállítani. Egy múzeum látogatóinak átlagéletkorát szeretnénk megállapítani 90%-os konfidencia szinten. Öt embert sikerült találnunk, akiknek válaszai
25, 52, 47, 61, 55
A minta átlaga
A minta szórása pedig
Az 5 fős minta szórása tehát 13,8 ez azonban eléggé eltérhet a teljes sokaság szórásától. Ezt az eltérést korrigálja az úgynevezett t-eloszlás. A t-eloszlás lényegében olyan, mint a normális eloszlás, amiben azonban mégis különbözik tőle, hogy figyelembe veszi a mintánk elemszámát is. Más és más érték tartozik az 5 elemű, a 10 elemű vagy éppen a 25 elemű mintához. A t-eloszlás ezzel korrigálja azt a pontatlanságot, ami abból ered, hogy a mintából számítjuk ki a szórást. Ha például mindössze 5 elemű a mintánk, akkor jobban, ha 50 akkor kevésbé korrigál. Ennek a korrigálásnak a mértékét a minta szabadság foka adja meg, ami n-1.
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása, a sokasági szórás nem = a t-eloszlás -höz tartozó értéke.]
A szabadság fok növekedésével a mintából számított szórás egyre kevésbé tér el a teljes sokaság szórásától, ezért egyre kisebb korrekcióra van szükség. A t-eloszlás értékei tehát a minta elemszámának növekedésével közelítenek a standard normális eloszlás Z értékeihez és 150-nél nagyobb elemszámú minták esetén már lényegében a két eloszlás megegyezik.
Határozzuk meg a 0,9 konfidencia szinthez tartozó konfidencia intervallumot
tehát
[Szövegdoboz: t-eloszlás eloszlástáblázata n-1 1 3,08 6,31 12,71 31,82 63,66 2 1,89 2,92 4,3 6,96 9,92 3 1,64 2,35 3,18 4,54 5,84 4 1,53 2,13 2,78 3,75 4,6 5 1,48 2,02 2,57 3,36 4,03 6 1,44 1,94 2,45 3,14 3,71 7 1,42 1,9 2,36 3 3,5 8 1,4 1,86 2,31 2,9 3,36 9 1,38 1,83 2,26 2,82 3,25 10 1,37 1,81 2,23 2,76 3,17 15 1,34 1,75 2,13 2,6 2,95 24 1,32 1,71 2,06 2,49 2,8 29 1,31 1,7 2,04 2,46 2,76 40 1,3 1,68 2,02 2,42 2,7 60 1,3 1,67 2 2,39 2,66 120 1,29 1,66 1,98 2,36 2,62]
A konfidencia intervallum
Keressük meg a 0,95-höz tartozó t-értéket.
A szabadsági fok n-1=4.
A kapott t-érték 2,13.
A látogatók átlagos életkora tehát 90%-os konfidenciaszinten 34,9 és 61,1 év közé esik.
Eddigi példáinkban a sokasági átlagra próbáltunk meg becslést adni. Most nézzük meg, a sokasági arány becslését. Például egy párt népszerűségét szeretnénk megállapítani, amihez 400 fős közvélemény kutatást végzünk. A felmérés eredménye az, hogy támogatottságuk 54%-os. A kérdés az, hogy mi mondható 90%-os konfidencia szinten a teljes lakosságra vonatkozóan.
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.] Nézzük ki kicsoda.
ez a konfidencia szint, amiből alighanem
a minta alapján kapott 54%
A gyökös izét kiszámoljuk
Kikeressük a standard normális eloszlás táblázatból az -höz tartozó Z-t
A tényleges népszerűség tehát 50% és 58% közé esik 90%-os konfidencia szinten.
Sokasági átlag, arány és variancia intervallumbecslése
EV-minták esetén
Az EV-minta abban különbözik a FAE-mintától, hogy az egymást követően kiválasztott mintaelemek nem függetlenek egymástól, a mintavétel ugyanis visszatevés nélkül történik. Ennek akkor van igazán jelentősége, ha a teljes sokaság száma, amit N-el jelölünk viszonylag kicsi a minta elemszámához képest. EV-minták esetén tehát a minta fontos jellemzőjévé válik, hogy mekkora a teljes sokaság vagyis mekkora az N.
Ha a teljes sokaság a minta elemszámához képest viszonylag nagy ( ), akkor az EV-minta és a FAE-minta lényegében ugyanúgy viselkedik. Gondoljuk csak végig, hogy ha N=50 000 és n=50, akkor számít-e, hogy visszatevéssel húzunk? Nem igazán.
Ha viszont a teljes sokaság a minta elemszámához képest nem olyan nagy, a visszatevés nélküliség szerepe felértékelődik. FAE-minta esetén előfordulhat, hogy ugyanazt az elemet többször is beválogatjuk a mintába, szélsőséges esetben akár megeshet, hogy minden mintaelem ugyanaz. Az EV-mintánál ez nem fordulhat elő, itt minden mintaelem kiválasztása függ az előzőekben kiválasztott elemektől, így a minta valahogy jobban megőrzi a teljes sokaság szerkezetét, a becslés pontosabb lesz, mint a FAE-minta esetén.
Az EV-mintának ez az előnye sajnos egyben hátránya is. Mivel a mintaelemek nem függetlenek, a korábban látott intervallumbecslések itt csak részben működnek.
Ha a minta elemszáma viszonylag nagy, a mintaátlagok és az arány jóindulattal közelítőleg normális eloszlású. Kis módosítással tehát korábban kapott eredményeink működnek. Gond a sokasági szórással van, ennek becslése ugyanis sokkal bonyolultabbá válik, vizsgálatától így eltekintünk. Szintén nem marad érvényben a t-eloszlással kapott becslésünk arra az esetre, amikor a sokasági szórás nem ismert. A korábbi négy képletből tehát kettő maradt:
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE (EV-MINTA) konfidencia szint a minta alapján kapott valószínűség a minta elemszáma = a teljes sokaság elemszáma a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.] [Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS ISMERT (EV-MINTA) konfidencia szint = a minta átlaga = a minta elemszáma = a teljes sokaság elemszáma = a teljes sokaság szórása =a standard normális eloszlás valószí- nűséghez tartozó Z értéke, lásd táblázat]
A képletekben megjelenő faktor
Ha a teljes sokaság a minta elemszámához képest nagy ( ), akkor
Ilyenkor, tehát a megjelenő faktor éppen 1, vagyis az EV-mintákra vonatkozó képlet lényegében megegyezik a FAE-mintákra vonatkozó korábbi képletekkel.
Ha a teljes sokaság a minta elemszámához képest kisebb, akkor ez a faktor egy nulla és egy közti szám. Nézzük meg például azt az esetet, amikor mondjuk . Ez azt jelenti, hogy a teljes sokaság minden századik elemét beválogattuk a mintába. Ekkor
A konfidencia intervallum hossza és ezáltal a becslés bizonytalansága a FAE-mintához képest 0,995-szeresére csökken.
Ha vagyis a teljes sokaság minden tizedik elemét beválogatjuk a mintába
A konfidencia intervallum hossza és ezáltal a becslés bizonytalansága a FAE-mintához képest 0,95-szeresére csökken.
Végül szélsőséges esetben, ha vagyis a teljes sokaság minden elemét beválogatjuk a mintába
A konfidencia intervallum hossza és ezáltal a becslés bizonytalansága a FAE-mintához képest 0-ra csökken.
Egy napilap olvasóinak átlagéletkorát szeretnénk megbecsülni. A lapot átlagosan naponta 10 ezren vásárolják, a közel reprezentatívnak tekinthető EV-minta 500 elemű.
életkor
Válaszolók száma
20-39
57
40-59
318
60-79
125
Össz:
500
Adjunk becslést 95%-os konfidencia szinten a napilapot vásárlók átlagéletkorára, illetve a 40 év alatti vásárlók arányára.
A minta adatai alapján az átlagéletkor:
és a szórás
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS ISMERT (EV-MINTA) konfidencia szint = a minta átlaga = a minta elemszáma = a teljes sokaság elemszáma = a teljes sokaság szórása =a standard normális eloszlás valószí- nűséghez tartozó Z értéke, lásd táblázat] A minta viszonylag nagy elemszáma miatt a jó közelítéssel megegyezik a teljes sokaság szórásával.
0,95 így és
= 52,72
= 500
= 10 000
A konfidencia intervallum
A napilap olvasóinak átlagéletkora 95%-os megbízhatósági szinten:
A 40 év alatti olvasók arányának becslése a minta alapján 57/500=0,114 ami 11,4%.
A konfidencia szint ezúttal is 95%-os.
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE (EV-MINTA) konfidencia szint a minta alapján kapott valószínűség a minta elemszáma = a teljes sokaság elemszáma a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.]
0,95 így és
0,114
500
= 10 000
A konfidencia intervallum
A 40 év alatti olvasók aránya tehát 8,7% és 14% között van.
Rétegzett minták
Mivel a teljes sokaság, amiből mintánkat vesszük általában heterogén, ez a heterogenitás magában a mintában is jelen van, ami megnöveli a becslés varianciáját, vagyis rontja a becslés pontosságát. Ha azonban a teljes sokaságot felosztjuk viszonylag homogén rétegekre, és a mintát is ezen a rétegek szerint vizsgáljuk, a variancia csökkenthető.
TELJES SOKASÁG
MINTA
SOKASÁGI
RÉTEG
ELEMSZÁM
ÁTLAG
SZÓRÁS
MINTABELI
RÉTEG
ELEMSZÁM
ÁTLAG
SZÓRÁS
…
…
A sokasági átlag az M darab sokasági réteg részátlagainak súlyozott átlaga:
A sokasági átlag pontbecslését úgy kapjuk, hogy az egyes mintabeli rétegek átlagait súlyozzuk, de a teljes sokaság rétegeinek elemszámával. Világos, hogy a pontos elemszámok helyett jóval hasznosabb az egyes rétegeknek a teljes sokasághoz viszonyított mérete. Ezt jelöljük W-vel.
A konfidencia intervallum ekkor
ahol itt a minta rétegeinek szórása
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE RÉTEGZETT MINTÁBÓL ahol konfidencia szint = a minta átlaga = a minta elemszáma = a minta j-edik rétegének elemszáma = a teljes sokaság elemszáma = a teljes sokaság j-edik rétegének elemszáma = a teljes sokaság j-edik rétegének a teljes sokasághoz viszonyított aránya a minta j-edik rétegének szórása]
Nézzünk meg egy példát.
Egy város három kerületében 250 000, 320 000 és 180 000 lakos él. Adjunk becslést 90%-os konfidenciaszinten a naponta átlagosan utazással töltött időre az alábbi rétegzett minta alapján:
megkérdezettek
száma
átlag
(perc)
szórás
(perc)
A RÉTEGEK NÉPESSÉGE
1. kerület
180
75
28
250 000
2. kerület
220
54
19
320 000
3. kerület
100
43
10
180 000
ÖSSZ.
500
750 000
A mintanagyság a teljes sokasághoz képest olyan kicsi, hogy
ekkor pedig lényegében egy.
A konfidenciaszint pedig 90%, tehát és ekkor
Kétmintás becslések
A kétmintás becslésekre akkor van szükség, amikor két sokaság valamilyen paraméterét, leginkább az átlagát szeretnénk összehasonlítani, például két ország lakosainak átlagjövedelmét szeretnénk minta alapján becsléssel összehasonlítani. De kétmintás becslés az is, ha néhány olyan vállalat, ami mindkét országban jelen van, egyik és másik országban fizetett átlagbéreit szeretnénk összehasonlítani.
A kétmintás becslések lehetnek független mintás becslések vagy páros mintás becslések.
Páros minták esetében létezik valamilyen hozzárendelés az egyik sokaság elemei és a másik sokaság elemei között és ez a mintában is megőrződik. Ilyen például, ha nők és férfiak átlagkeresetének vizsgálatához házaspárokat vizsgálunk, vagy ha két ország jövedelmi viszonyainak vizsgálatához olyan cégek átlagbéreit vesszük, amelyek mindkét országban jelen vannak.
Független mintás becsléseknél ilyen megfeleltetés a két sokaság elemei közt nincs, vagy ha van, a minta elemeire már nem öröklődik. Míg a páros minták elemszáma a párosítás miatt mindig megegyezik, addig független minták esetében ez nem feltétlen van így.
Ha mindkét sokaság közel normális eloszlású, akkor az átlagok különbségének becslésére a következő formula van forgalomban.
[Szövegdoboz: KÉT ÁTLAG KÜLÖNBSÉGÉNEK BECSLÉSE ahol itt konfidencia szint = az egyik minta átlaga = az másik minta átlaga = az egyik minta elemszáma = a másik minta elemszáma A szabadságfok]
Egy üzemben több gépen töltenek 75 ml-es tubusokba fogkrémet, a tubusokba töltött fogkrém mennyisége normális eloszlású. Hasonlítsuk össze az átlagosan a tubusokba töltött fogkrém mennyiségét 90%-os konfidenciaszinten, ha a két gépről az alábbi 12 elemű minták állnak rendelkezésre:
Egyik gép
76
71
75
74
76
76
74
75
77
75
75
75
Másik gép
75
75
74
77
73
73
76
77
76
73
75
74
A két sokaságból egymástól függetlenül vett két minta alapján szeretnénk összehasonlítani az átlagokat.
A konfidenciaszint így
A szabadságfok =12+12-2=22
Az eltérés tehát 90%-os konfidenciaszinten 0 ml és 1,12 ml között van.
7.1. Egy vasúttársaság nagysebességű járatain az utasok száma lényegében normális eloszlású. Adjunk becslést az utasok átlagos számára 90%-os konfidenciaszinten, ha 10 megvizsgált járaton az utasok száma: 360; 453; 467; 451; 487; 491; 390; 512; 488; 495.
A vonaton 480 ülőhely van. Adjunk becslést, arra, hogy az esetek hány százalékában fordul elő, hogy van ülőhely nélküli utas. (a konfidenciaszint legyen 90%)
Az átlag intervallumbecsléséhez először kiszámoljuk az átlagot.
A sokasági szórást nem ismerjük, úgyhogy itt alighanem t-eloszlásra lesz szükség.
A minta szórása:
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT (FAE MINTA) konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása, a sokasági szórás nem = a t-eloszlás -höz tartozó értéke.]
A konfidenciaszint amiből
kiszámoljuk, hogy
, ez a minta átlaga
, ez a minta elemszáma,
, ez a minta szórása.
A konfidencia intervallum tehát
Kikeressük a t-eloszlás táblázatából a
0,95-höz tartozó t értéket, a
szabadságfok v=n-1=9
Ekkor becslésünk:
Az utasok átlagos száma tehát 431,2 és 487,6 között van 90%-os konfidenciaszinten.
A vonaton 480 ülőhely van. Adjunk becslést, arra, hogy az esetek hány százalékában fordul elő, hogy van ülőhely nélküli utas. A mintában öt esetben nagyobb az utasok száma 480-nál, tehát p=0,5
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.]
A gyökös izét kiszámoljuk
Kikeressük a standard normális eloszlás táblázatból az -höz tartozó Z-t
A kapott becslés alapján 90%-os konfidenciaszinten 24% és 76% közötti azon esetek részaránya, amikor van legalább egy ülőhely nélküli utas.
7.2. Egy bankfiókban a sorra kerülésig eltelt idő lényegében normális eloszlású. Adjunk becslést az átlagos várakozási időre 95%-os konfidenciaszinten az alábbi minta alapján:
5; 12; 4; 7; 6; 8; 4; 3; 2; 5
Az 5 percnél hosszabb várakozást a bank vezetősége nem díjazza, és ezt igyekszik alkalmazottjai tudomására hozni. A minta alapján adjunk becslést, hogy az ügyfelek hány százalékánál haladja meg a várakozási idő az 5 percet.
Az átlag intervallumbecsléséhez először kiszámoljuk az átlagot.
A sokasági szórást nem ismerjük, úgyhogy itt alighanem t-eloszlásra lesz szükség.
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT (FAE MINTA) konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása, a sokasági szórás nem = a t-eloszlás -höz tartozó értéke.] A minta szórása:
A konfidenciaszint amiből
kiszámoljuk, hogy
, ez a minta átlaga
, ez a minta elemszáma,
, ez a minta szórása.
A konfidencia intervallum tehát
Kikeressük a t-eloszlás táblázatából a 0,975-höz tartozó t értéket, a
szabadságfok v=n-1=9
Ekkor becslésünk:
Az átlagos várakozási idő tehát 3,6 és 7,6 perc között van.
Adjunk becslést az 5 percen felüli várakozási idő részarányára. A 10 esetből 4-szer fordul elő 5 percnél nagyobb várakozási idő, így p=0,4.
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.]
A gyökös izét kiszámoljuk
Kikeressük a standard normális eloszlás táblázatból az -höz tartozó Z-értéket
A kapott becslés alapján 95%-os konfidenciaszinten 10% és 70% között van az 5 percnél többet várakozók részaránya.
7.3. Egy múzeum látogatóinak átlagéletkorát szeretnénk megbecsülni.
A megkérdezett 30 ember megoszlása:
életkor
látogatók
száma
10-29
5
30-49
13
50-69
12
Össz.
30
Adjunk becslést 0,95-ös konfidenciaszinten a múzeum látogatóinak átlagéletkorára és az 50 év alatti látogatók %-os arányára.
A minta átlaga
A minta szórása pedig
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása, a sokasági szórás nem = a t-eloszlás -höz tartozó értéke.]
Először az átlagot becsüljük meg a 0,95
konfidencia szinthez tartozó konfidencia intervallummal.
tehát
A konfidencia intervallum
[Szövegdoboz: t-eloszlás eloszlástáblázata n-1 1 3,08 6,31 12,71 31,82 63,66 2 1,89 2,92 4,3 6,96 9,92 3 1,64 2,35 3,18 4,54 5,84 4 1,53 2,13 2,78 3,75 4,6 5 1,48 2,02 2,57 3,36 4,03 6 1,44 1,94 2,45 3,14 3,71 7 1,42 1,9 2,36 3 3,5 8 1,4 1,86 2,31 2,9 3,36 9 1,38 1,83 2,26 2,82 3,25 10 1,37 1,81 2,23 2,76 3,17 15 1,34 1,75 2,13 2,6 2,95 24 1,32 1,71 2,06 2,49 2,8 29 1,31 1,7 2,04 2,46 2,76 40 1,3 1,68 2,02 2,42 2,7 60 1,3 1,67 2 2,39 2,66 120 1,29 1,66 1,98 2,36 2,62] Keressük meg a 0,975-höz tartozó t-értéket.
A szabadsági fok n-1=29.
A kapott t-érték 2,04.
A látogatók átlagos életkora tehát 95%-os konfidenciaszinten 39,3 és 50,1 év közé esik.
Térjünk rá az 50 év alattiak
arányának becslésére.
A mintában 18-an 50 év alattiak, ami a
30 fős mintának 60%-a.
Az arány becslésben tehát p=0,6 a konfidencia szint ugyanúgy 0,95.
Nézzük ki kicsoda.
, amiből alighanem így
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.]
A gyökös izét kiszámoljuk
Kikeressük a standard normális eloszlás táblázatból az 0,975-höz tartozó Z értéket
Az 50 év alattiak aránya 95%-os konfidencia szinten 43% és 77% közé esik.
7.4. Egy étteremben felmérést készítettek arról, hogy a vendégek átlagosan mennyi időt töltenek náluk. A 40 megfigyelt vendég adatai:
Az étteremben
eltöltött idő (perc)
vendégek
száma
0-29
4
30-59
12
60-89
18
90-119
6
Össz.
40
Adjunk becslést 0,95-ös konfidenciaszinten az étteremben átlagosan eltöltött időre és a másfél óránál tovább maradók részarányára.
Mekkora mintára lenne szükség, ha ugyanezen a konfidenciaszinten az átlag hibáját felére akarjuk csökkenteni?
Mekkora mintára van szükség, ha az eredeti hiba mellett, de 99%-os konfidenciaszintet szeretnénk biztosítani?
A minta átlaga
A minta szórása pedig
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása, a sokasági szórás nem = a t-eloszlás -höz tartozó értéke.]
Először az átlagot becsüljük meg a 0,95
konfidencia szinthez tartozó konfidencia intervallummal.
tehát
A konfidencia intervallum
[Szövegdoboz: t-eloszlás eloszlástáblázata n-1 1 3,08 6,31 12,71 31,82 63,66 2 1,89 2,92 4,3 6,96 9,92 3 1,64 2,35 3,18 4,54 5,84 4 1,53 2,13 2,78 3,75 4,6 5 1,48 2,02 2,57 3,36 4,03 6 1,44 1,94 2,45 3,14 3,71 7 1,42 1,9 2,36 3 3,5 8 1,4 1,86 2,31 2,9 3,36 9 1,38 1,83 2,26 2,82 3,25 10 1,37 1,81 2,23 2,76 3,17 15 1,34 1,75 2,13 2,6 2,95 24 1,32 1,71 2,06 2,49 2,8 29 1,31 1,7 2,04 2,46 2,76 40 1,3 1,68 2,02 2,42 2,7 60 1,3 1,67 2 2,39 2,66 120 1,29 1,66 1,98 2,36 2,62] Keressük meg a 0,975-höz tartozó t-értéket.
A szabadsági fok n-1=39.
A kapott t-érték 2,02.
A vendégek tehát 95%-os konfidenciaszinten átlagosan 56,23 és 72,77 közötti percet töltenek az étteremben.
Térjünk rá a másfél óránál tovább maradók részarányának becslésére.
A mintában 6-an vannak, akik 90 percnél több időt töltenek az étteremben.
A részarány tehát a minta alapján p=0,15 vagyis 15%.
A konfidencia szint ugyanúgy 0,95.
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.] Lássuk a részleteket.
, amiből alighanem
így
A gyökös izét kiszámoljuk
Kikeressük a standard normális eloszlás táblázatból az 0,975-höz tartozó Z értéket
A másfél óránál tovább maradók részaránya tehát valahol 4% és 26% között van.
Az átlag becslésének hibája 8,27. Ha ugyanezen konfidenciaszinten fele akkora hibát szeretnénk, lássuk csak 8,27 fele 4,135 tehát
Mivel pedig ahogy ez korábban kiderült
Ebből n-et előbányásszuk:
160 fős mintára van tehát szükség.
Ha az eredeti 8,27-es hibával, de 99%-os konfidenciaszintet szeretnénk, akkor
tehát és így
7.5. Korábbi felmérések alapján valamelyik egyetemi előadás átlagos látogatottsága 98 fő, a szórás pedig 34 fő. Egy új felmérés készítését tervezik, hogy kiderüljön, van-e olyan rossz az előadás, hogy elegendő legyen 100 fős előadóban tartani. Hány előadás létszámát kell megvizsgálni, hogy az átlagos létszám becslésének hibája 10 főnél kisebb legyen 90%-os konfidenciaszinten?
A becslés FAE mintából történik és, mivel ismert a szórás, ezt a képletet használjuk, hogy
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS ISMERT (FAE MINTA) konfidencia szint = a minta átlaga = a minta elemszáma = a teljes sokaság szórása =a standard normális eloszlás valószí- nűséghez tartozó Z értéke, lásd táblázat]
A becslés hibája és a kérdésből úgy tűnik, hogy alighanem n-et keressük.
A konfidenciaszint , így és .
Azt szeretnénk, hogy a hiba legyen 10 főnél kisebb. Ezt úgy fogjuk megoldani, hogy megnézzük mi van akkor, amikor a hiba pont 10, aztán majd meglátjuk mi lesz a helyzet akkor, amikor 10-nél kisebb.
vagyis
Lássuk csak, , kikeressük az ehhez tartozó Z-értéket.
Beszorzunk
ekkor tehát n=31,47.
Ha azt szeretnénk, hogy a hiba éppen 10 legyen, akkor n=31,47 tehát ennyi előadást kell megvizsgálni, ha pedig azt szeretnénk, hogy a hiba 10-nél kisebb legyen, akkor többet. A minta elemszáma tehát legalább 32 kell, hogy legyen.
7.6. Egy utazási iroda opcionálisan meghirdetett városnéző túrája minimum 35 fő esetén indul el. A csoport 70 főből áll és 40-en már nyilatkoztak, közülük 28-an mutatnak hajlandóságot városnézésre. 90%-os konfidenciaszinten kijelenthetjük-e, hogy lesz csoportos városnézés?
Akkor lesz csoportos városnézés, ha a 70 fős csoportból akad legalább 35 tisztességes turista, aki hajlandóságot mutat várostnézni.
A jelek szerint tehát 50%-os érdeklődés mellett lesz városnézés.
A megkérdezett 40 emberből 28-an éreznek leküzdhetetlen vágyat városnézés iránt, ami
tehát 70%. Ez a 40 ember egy 40 fős minta, amiből következtethetünk a teljes csoport szándékaira. 90%-os konfidenciaszinten az alábbi becslés adható a teljes csoport városnézési hajlandóságára:
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.]
A minta elemszáma n=40
a minta alapján
a konfidenciaszint pedig
vagyis .
Ekkor a konfidencia intervallum
tehát
Keressük ki a 0,975-höz tartozó Z-értéket:
A városnézési hajlandóság tehát 95%-os szignifikanciaszinten 58% és 82% között van, ami 50% feletti, tehát 0,9-es konfidenciaszinten kijelenthetjük, hogy lesz városnézés.
7.7. Egy mozi felmérést készít látogatóinak életkorával kapcsolatban. A mozilátogatók életkora tekinthető normális eloszlásúnak. A 400 fős minta eredménye:
életkor
nézők
száma
0-10
7
11-20
132
21-40
157
41-60
104
össz
400
Adjunk becslést 95%-os megbízhatósággal az átlagos életkorra, szórásra és a 20 évnél idősebb nézők részarányára. Hány embert kéne megkérdezni, ha ugyanekkora hibával, de 99%-os megbízhatóságot szeretnénk?
A minta átlaga
A minta szórása pedig
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása, a sokasági szórás nem = a t-eloszlás -höz tartozó értéke.]
Először az átlagot becsüljük meg a 0,95
konfidencia szinthez tartozó konfidencia intervallummal.
tehát
A konfidencia intervallum
[Szövegdoboz: t-eloszlás eloszlástáblázata n-1 1 3,08 6,31 12,71 31,82 63,66 2 1,89 2,92 4,3 6,96 9,92 3 1,64 2,35 3,18 4,54 5,84 4 1,53 2,13 2,78 3,75 4,6 5 1,48 2,02 2,57 3,36 4,03 6 1,44 1,94 2,45 3,14 3,71 7 1,42 1,9 2,36 3 3,5 8 1,4 1,86 2,31 2,9 3,36 9 1,38 1,83 2,26 2,82 3,25 10 1,37 1,81 2,23 2,76 3,17 15 1,34 1,75 2,13 2,6 2,95 24 1,32 1,71 2,06 2,49 2,8 29 1,31 1,7 2,04 2,46 2,76 40 1,3 1,68 2,02 2,42 2,7 60 1,3 1,67 2 2,39 2,66 120 1,29 1,66 1,98 2,36 2,62]
Keressük meg a 0,975-höz tartozó t-értéket.
A szabadsági fok n-1=399, ami olyan nagy, hogy benne sincs a táblázatban. A minta nagy elemszáma miatt Z-eloszlást használunk..
A látogatók átlagos életkora tehát 95%-os konfidenciaszinten 28,45 és 31,15 közé esik.
Az átlag becslésének hibája 1,35 év. Ha ugyanekkora hibával 99%-os megbízhatóságot szeretnénk, akkor így . A nagy elemszám miatt Z-eloszlást használunk.
tehát
amiből és n=692,53, vagyis legalább 693 embert kell megkérdezni.
Térjünk rá a 20 évnél idősebb nézők részarányának kérdésére.
A mintában 261-en vannak, akik 20 évnél idősebbek.
A részarány tehát a minta alapján p=0,6525 vagyis kb. 65%.
A konfidencia szint ugyanúgy 0,95.
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.]
, amiből alighanem
így
A gyökös izét kiszámoljuk
Kikeressük a standard normális eloszlás táblázatból az 0,975-höz tartozó Z értéket
A 20 éven felüliek részaránya tehát 0,6058 és 0,6992 között van.
7.8. A naponta átlagosan háztartási tevékenységgel töltött időt szeretnénk megbecsülni. A becsléshez rétegzett mintát vettünk, a rétegképző ismérv az volt, hogy a megkérdezett nő-e vagy férfi. A nők és férfiak részaránya egyezőnek tekinthető.
megkérdezettek
száma
átlag
(perc)
szórás
(perc)
nő
180
74
28
férfi
120
32
19
Adjunk 90%-os megbízhatóságú becslést az átlagosan háztartási tevékenységgel töltött időre.
A mintanagyság a teljes sokasághoz képest olyan kicsi, hogy
ekkor pedig lényegében egy.
A konfidenciaszint pedig 90%, tehát és ekkor
A naponta átlagosan háztartási munkával töltött idő 90%-os konfidenciaszinten 50 perc és 56 perc közé esik.
7.9. Egy város három kerületében 250 000, 320 000 és 180 000 lakos él. Adjunk becslést 95%-os konfidenciaszinten a naponta átlagosan utazással töltött időre az alábbi rétegzett minta alapján:
megkérdezettek
száma
átlag
(perc)
szórás
(perc)
1. kerület
180
75
28
2. kerület
220
54
19
3. kerület
100
43
10
Kiegészítjük a táblázatot:
megkérdezettek
száma
átlag
(perc)
szórás
(perc)
A RÉTEGEK NÉPESSÉGE
1. kerület
180
75
28
250 000
2. kerület
220
54
19
320 000
3. kerület
100
43
10
180 000
ÖSSZ.
500
750 000
A mintanagyság a teljes sokasághoz képest olyan kicsi, hogy
ekkor pedig lényegében egy.
A konfidenciaszint pedig 90%, tehát és ekkor
7.10. Egy gyümölcslé rosttartalmára szeretnénk becslést adni 30 elemű FAE-minta alapján. A minta eredménye:
Rosttartalom
(%)
elemszám
0-1,9
17
2-3,9
9
4-5,9
4
Össz.
30
Adjunk becslést 0,95-ös konfidenciaszinten az átlagos rosttartalomra.
Legfeljebb a gyümölcslevek hány százaléka rendelkezhet 4%-nál nagyobb rosttartalommal 95%-os konfidenciaszinten?
[Szövegdoboz: ÁTLAG INTERVALLUMBECSLÉSE, HA A SOKASÁGI SZÓRÁS NEM ISMERT konfidencia szint = a minta átlaga = a minta elemszáma = a minta szórása = a t-eloszlás -höz tartozó értéke.]
A minta átlaga
A minta szórása pedig
Először az átlagot becsüljük meg a 0,95
konfidencia szinthez tartozó konfidencia intervallummal.
tehát
A konfidencia intervallum
[Szövegdoboz: t-eloszlás eloszlástáblázata n-1 1 3,08 6,31 12,71 31,82 63,66 2 1,89 2,92 4,3 6,96 9,92 3 1,64 2,35 3,18 4,54 5,84 4 1,53 2,13 2,78 3,75 4,6 5 1,48 2,02 2,57 3,36 4,03 6 1,44 1,94 2,45 3,14 3,71 7 1,42 1,9 2,36 3 3,5 8 1,4 1,86 2,31 2,9 3,36 9 1,38 1,83 2,26 2,82 3,25 10 1,37 1,81 2,23 2,76 3,17 15 1,34 1,75 2,13 2,6 2,95 24 1,32 1,71 2,06 2,49 2,8 29 1,31 1,7 2,04 2,46 2,76 40 1,3 1,68 2,02 2,42 2,7 60 1,3 1,67 2 2,39 2,66 120 1,29 1,66 1,98 2,36 2,62] Keressük meg a 0,975-höz tartozó t-értéket.
A szabadsági fok n-1=29.
A kapott t-érték 2,04.
Az átlagos rosttartalom 1,588% és 2,672% közé esik.
A 4%-nál nagyobb rosttartalom a mintában
vagyis 13,3%
Az arány becslésben tehát p=0,133 a konfidencia szint ugyanúgy 0,95.
Nézzük ki kicsoda.
, amiből alighanem így
[Szövegdoboz: ARÁNY INTERVALLUMBECSLÉSE konfidencia szint a minta alapján kapott valószínűség a minta elemszáma. a standard normális eloszlás valószí- nűséghez tartozó Z-értéke, lásd táblázat.]
A gyökös izét kiszámoljuk
Kikeressük a standard normális eloszlás táblázatból az 0,975-höz tartozó Z értéket
A 4%-nál nagyobb rosttartalom 95%-os konfidencia szinten 1,15% és 25,45% közé esik, vagyis legfeljebb a gyümölcslevek 25,4%-a tartalmaz 4%-nál nagyobb rostanyagot.
STATISZTIKAI BECSLÉSEK
Pontbecslés
Olyan esetekben, amikor valamiért nem tudjuk vagy nem akarjuk a teljes sokaságot megvizsgálni, hogy meghatározzuk a fontosabb statisztikai mutatóit, becslést alkalmazunk. A becslés lényege, hogy egy minta alapján próbálunk ezekre a mutatókra következtetni. Ha például egy TV csatorna szeretné tudni, hogy egy országban az emberek naponta átlagosan hány órát nézik műsoraikat, nyilván nem kérdezhetik meg erről egyesével az ország összes lakosát. Vesznek tehát mondjuk egy 100 főből álló mintát és a minta alapján próbálnak az összes lakosra érvényes TV-nézési szokásokra következtetni. Ezt a fajta következtetési módszert, amikor a konkrétból következtetünk az általánosra indukciónak nevezzük. Kiszámoljuk a 100 fős minta átlagát, szórását vagy egyéb mutatóit és aztán ebből akarjuk megtippelni a teljes sokaságra vonatkozó átlagot, szórást vagy egyéb mutatókat.
A kérdés az, hogy ha tudjuk a minta átlagát, szórását és egyéb mutatóit, akkor abból milyen következtetéseket vonhatunk le a teljes sokaságra.
minta
teljes sokaság
Átlag
= mintaátlag
= sokasági átlag
Szórás
s=minta szórás
=sokasági szórás
Értékösszeg
minta értékösszeg
sokasági értékösszeg
Stb.
Vajon mekkora a sansza, hogy a minta átlaga megegyezik a sokasági átlaggal? Vagy ha nem egyezik meg, akkor mégis milyen távol eshet tőle? Vajon mekkora a sansza, hogy a minta szórása megegyezik a sokasági szórással? Vagy ha nem egyezik meg, milyen összefüggés van közöttük?
Ahhoz, hogy ezekre a kérdésekre választ kapjunk, átmenetileg meg kell fordítanunk a következtetésünk irányát. A célunk az, hogy képesek legyünk következtetni a konkrétból az általánosba, de ehhez előbb meg kell vizsgálnunk azt, hogy mi mondható fordított irányban, amikor az általánosból következtetünk konkrétra. Vizsgálódásunkat egy nagyon egyszerű példával kezdjük.
A teljes sokaság legyen az
1;2;3
Ez szimbolizálja előbbi TV-nézős példánkban az ország összes lakosát, és vegyünk ebből két elemű visszatevéses mintát. Amikor az igazi becslést csináljuk, természetesen csak egyetlen mintánk lesz majd és abból az egyetlen mintából kell becslést adnunk mindenre, de most megnézhetjük az összes lehetséges mintát.
A feladatunk az, hogy a minták alapján adjunk becslést az 1;2;3 számok átlagára, maximumára és értékösszegére.
Az 1;2;3 számok átlaga 2 maximuma 3 értékösszege 6, célunk pedig az, hogy megnézzük, az egyes minták átlaga, maximuma és értékösszege mennyire képes ezeket megbecsülni.
Ha a minta az (1; 1) akkor az átlag 1 a maximum 1 az értékösszeg pedig 2 vagyis mindhárom becslésünk elég távol jár a valóságtól.
Ha az (1; 2) akkor az átlag 1,5 ami már közelebb van a tényleges átlaghoz, a maximum 2, ami szintén nem olyan rossz, az értékösszeg 3.
Ha a minta az (1; 3) akkor az átlag éppen ugyanannyi, mint a sokasági átlag, vagyis a becslésünk tökéletes. A maximum 3, ez szintén stimmel, egyedül az értékösszeg teljesít rosszul.
minta
átlag
max
értékösszeg
(1; 1)
1
1
2
(1; 2)
1,5
2
3
(1; 3)
2
3
4
(2; 1)
1,5
2
3
(2; 2)
2
2
4
(2; 3)
2,5
3
5
(3; 1)
2
3
4
(3, 2)
2,5
3
5
(3; 3)
3
3
6
Az átlagra adott becslés kilenc esetből háromszor megegyezik a tényleges átlaggal. Ez 33% ami nem kimondottan jó arány. Van viszont még két eset, amikor a minta átlaga 1,5 további két eset pedig, amikor 2,5 és ezek sincsenek olyan távol a tényleges 2-től. Viszonylag elfogadható becslést tehát hét minta szolgáltat, mivel pedig az összes eset kilenc, az arány nem is olyan rossz. A maximum becslésénél még jobb a helyzet, ott ugyanis a kilenc mintából ötször kaptuk a valódi értéket. A legrosszabbul az értékösszeg szerepelt, ez a kilencből mindössze egyszer stimmel.
A kérdés az, hogy egyáltalán mikor tekinthetünk egy becslést jónak. Nos a becslések sikerességének értékelésekor az egyik alapvető szempont a torzítatlanság.
A mintaátlagok nem adják meg ugyan mindig a tényleges sokasági átlagot, de körülötte ingadoznak. A kilenc esetből három éppen megegyezik a sokasági átlaggal, kettő egy picit kevesebb, kettő egy picit több, míg egy-egy esetben jóval kevesebb vagy jóval több. A kapott becslések tehát a becsülni kívánt sokasági átlag körül helyezkednek el. A maximum és az értékösszeg becslése viszont féloldalas, minden mintából számított érték vagy pont annyi vagy kisebb, mint a tényleges érték. A becsléseknél ezt a féloldalasságot nem szeretjük.
Egy becslést torzítatlannak nevezünk, ha az egyes mintákból kapott becslések várható értéke megegyezik a becsülni kívánt mennyiséggel. Ez a tulajdonság azt jelenti, hogy a becslés során kapott értékek a becsülni kívánt érték körül ingadoznak, és ez az ingadozás szimmetrikus. A torzítatlan becsléseket mindig előnyben részesítjük a torzítottakkal szemben.
Nézzük meg, hogy az előbbi becsléseink közül melyek torzítatlanok és melyek torzítottak.
Az átlag becslése esetében úgy kapunk várható értéket, hogy minden minta átlagát beszorozzuk az adott minta valószínűségével, majd ezeket összeadjuk. Mivel minden minta esélye 1/9 így minden átlagot 1/9-el kell szorozni. Íme:
Ez a várható érték tulajdonképpen nem más, mint a mintaátlagok átlaga. Kiszámolva azt kapjuk, hogy éppen 2 vagyis pont megegyezik a tényleges sokasági átlaggal. A becslés tehát torzítatlan.
Nézzük meg mi a helyzet a maximum becslésével. Itt is átlagoljuk a mintákból kapott értékeket:
A teljes sokaság maximuma nem 2,44 hanem 3 ezért a maximumra kapott becslésünk torzított.
Lássuk mi mondható az értékösszeg becslésre!
A teljes sokaság értékösszege nem 4 hanem 6 tehát ez a becslés is torzított.
A három becslésünk közül tehát egyedül az átlag becslése bizonyult torzítatlannak. Érdemes megfigyelni, hogy az egyes mintákból az átlagra kapott becslések, hogyan helyezkednek el a tényleges sokasági átlag körül. A kilencből három esetben a becslés éppen megegyezik a tényleges átlaggal. Két esetben picit kevesebb, kettőben picit több.
Végül egy-egy esetben már jóval kevesebb vagy jóval több.
Ábrázolva őket oszlopdiagramon, egy jellegzetes háromszög alakú eloszlás rajzolódik ki.
minta
átlag
(1; 1)
1
(1; 2)
1,5
(1; 3)
2
(2; 1)
1,5
(2; 2)
2
(2; 3)
2,5
(3; 1)
2
(3, 2)
2,5
(3; 3)
3
Ez a jellegzetes alak valójában a normális eloszlás harang alakú görbéje. Azért ilyen háromszög szerű, mert nagyon kicsi, mindössze három elemű a teljes sokaságunk.
Ha a minta elég nagy, akkor a mintaátlagok eloszlása közelít a normális eloszlás jellegzetes harang-görbéjéhez, még akkor is, ha az eredeti sokaság nem normális eloszlású. Erről szólnak a centrális határeloszlás tételek.
Nézzünk meg egy másik példát is. Ezúttal a teljes sokaság legyen az
1; 2; 3; 4
vagyis ez szimbolizálja most az összes TV-nézőt a minta pedig két elemű visszatevés nélküli.
A sokasági átlag
maximum=4 értékösszeg=10
Lássuk, hogyan becsülhetjük ezt meg a minták alapján.
Még egyszer hangsúlyozzuk, hogy most még úgy akarjuk megbecsülni az átlagot, maximumot és értékösszeget, hogy közben pontosan tudjuk ezeket a tényleges értékeket, ami azért nem olyan rizikós vállalkozás. Ráadásul lehetőségünk van megvizsgálni a létező összes mintát. Valójában később majd csak egy mintánk lesz és abból az egyetlen mintából kell megállapítanunk a teljes sokaságra vonatkozó mutatókat.
A két elemű visszatevés nélküli minták:
minta
átlag
max
értékösszeg
(1; 2)
1,5
2
3
(1; 3)
2
3
4
(1; 4)
2,5
4
5
(2; 3)
2,5
3
5
(2; 4)
3
4
6
(3; 4)
3,5
4
7
Nézzük meg, a mintaátlag torzítatlan becslést ad-e a sokasági átlagra.
A mintaátlagok várható érétke, vagyis a mintaátlagok átlaga éppen 2,5 ami a sokasági átlag. A becslés tehát torzítatlan.
Nem ez a helyzet a maximum becslésével. A minták maximumai most sem adnak torzítatlan becslést, megint féloldalasan helyezkednek el. A helyzet az, hogy a maximum becslése sosem lesz jó, a minta maximumból nem tudunk következtetni a teljes sokaság maximumára. Ha például felmérést szeretnénk készíteni Magyarország lakosságának életkoráról, minta alapján becsülhető az átlagéletkor és sok minden más, de a legidősebb lakos életkora nem. Gondoljunk például bele, hogy ezt a legidősebb lakost holnap elüti a villamos. Innentől kezdve már nem ő a legidősebb, de a minta – hacsak éppen nem volt ő is benne – ugyanaz marad, nem képes tehát a változást kimutatni. A sokasági maximum nem becsülhető mintavétellel.
Lássuk mi a helyzet az értékösszeggel.
A sokaság értékösszege ezzel szemben 10 tehát az értékösszegre kapott becslés sem torzítatlan. Ha belegondolunk, nem meglepő, hogy nem jó a becslés, hiszen egy minta mindig kevesebb elemből áll, mint a teljes sokaság. A minta elemeit összeadva nem csoda, ha kevesebbet kapunk, mint a teljes sokaság értékösszege. Ahhoz, hogy legyen sansza a minta értékösszegének utolérni a sokaság értékösszegét, valahogyan arányosítanunk kéne, ezzel kompenzálva a minta azon fogyatékosságát, hogy kevesebb elemből áll. Logikusnak tűnik, hogy ha a minta például a teljes sokaságnak mondjuk 10%-a, akkor a minta értékösszege is csak a teljes sokaság 10%-a. Az arányosítás tehát valami ilyesmi lehetne:
Sokasági értékösszeg becslése= minta értékösszege
N=teljes sokaság elemszáma n=minta elemszáma
Esetünkben N=4 és n=2 tehát a második tippünk az értékösszeg becslésére
minta
átlag
max
értékösszeg
1. tipp
2. tipp
(1; 2)
1,5
2
3
6
(1; 3)
2
3
4
8
(1; 4)
2,5
4
5
10
(2; 3)
2,5
3
5
10
(2; 4)
3
4
6
12
(3; 4)
3,5
4
7
14
Lássuk ez vajon torzítatlan-e!
A teljes sokaság értékösszege szintén 10 vagyis a becslés ezúttal torzítatlan.
Érdemes megfigyelni, hogy a becsülni kívánt mennyiséget nem biztos, hogy a mintában is ugyanúgy kell számolni, ahogyan a teljes sokaságban számolnánk. Az átlag becslésénél bevált, hogy ugyanazt csináltuk a mintaelemekkel, amit a teljes sokaságra is csinálnánk, de aztán jött az értékösszeg, ahol a jó becsléshez nem volt elég a minta értékösszege, szükség volt egy korrekciós tényezőre – az arányosításra.
A torzítatlanságon kívül azt is nagyra értékeljük egy becslésnél, ha várható értékéhez viszonyított ingadozása kicsi. Ezt az ingadozást méri a variancia. Ha ugyanarra a mennyiségre két torzítatlan becslésünk is van, akkor a kettő közül azt részesítjük előnyben, aminek a varianciája kisebb. Erről lesz szó a következőkben.
Minimális variancia, MSE
Az előzőekben láttuk, a becsülni kívánt mennyiségeket nem biztos, hogy a mintában is ugyanazzal a módszerrel érdemes számítani, ahogyan a teljes sokaság esetében tennénk. A sokasági átlag becslésére használhatjuk a minta átlagát, mediánját, a legnagyobb és legkisebb mintaelem számtani közepét, és így a becsülni kívánt mennyiségre több különböző becslést is kaphatunk. A kérdés az, hogy ha egy sokasági jellemzőre több becslés jöhet szóba, hogyan válasszunk közülük, vagyis mikor tekintünk egy becslést jónak, kettő közül melyiket tekintjük jobbnak és kijelenthetjük-e valamelyikről, hogy a legjobb?
Két alapvető szempont alapján szoktuk a becsléseket versenyeztetni. Az egyik, a már jól ismert torzítatlanság, vagyis a becslésnek az a tulajdonsága, hogy az összes lehetséges mintán vett becslések átlaga megegyezik a becsülni kívánt sokasági jellemzővel. A másik az úgynevezett minimális variancia kritérium.
A minimális variancia kritérium azt jelenti, hogy ha van két torzítatlan becslésünk, akkor a kettő közül azt tekintjük jobbnak, aminek az összes mintán vett értékeinek varianciája kisebb.
A torzítatlanság és a variancia alapján tehát négyféle csoportba sorolhatjuk a becsléseket.
Vannak olyan becslések, amelyek torzítatlanok, de varianciájuk nagy. Ezek a cél, vagyis a becsülni kívánt sokasági jellemző körül szóródnak, de a szóródás mértéke nagy.
Vannak olyan becslések, amik szintén torzítatlanok, vagyis szintén a cél körül szóródnak de varianciájuk kicsi.
Aztán vannak olyan becslések is, melyek torzítottak, de a varianciájuk kicsi.
Végül vannak, amik torzítottak és a varianciájuk nagy.
Jogosan vetődik föl a kérdés, hogy ha a becslés torzított ugyan, de varianciája kicsi, a becslés viszont torzítatlan, ám varianciája nagy, akkor vajon melyiket tekintjük közülük jobbnak. Az összehasonlításhoz egy mindkét tulajdonságot vizsgáló jellemzőt, az úgynevezett átlagos négyzetes hibát (Mean Square Error = MSE) használjuk.
Az első tag a varianciát, a második tag a várható értéktől való eltérést, vagyis a torzítottságot méri. Ha a becslés torzítatlan, így ez a második tag nulla. Két becslés közül azt részesítjük előnyben, amelyre MSE kisebb.
Az különbségre, vagyis a torzítás mértékére az angol bias szó alapján a jelölés van forgalomban. Használatos tehát az
Képlet is.
Az 1,2,3,10, mint teljes sokaság átlagára szeretnénk becslést adni kételemű visszatevés nélküli mintával. A tényleges átlag 1+2+3+10 osztva 4-gyel, ami egész pontosan 4.
Kétféle becslést fogunk egymással versenyeztetni. Az első becslés a szokásos számtani átlag:
A második becslés pedig egy súlyozott számtani átlag, ahol a minta kisebbik elemét
3-szoros súllyal vesszük:
Lássuk, melyik becslés jobb.
minta
(1; 2)
1,5
1,25
(1; 3)
2
1,5
(1; 10)
5,5
3,25
(2; 3)
2,5
2,25
(2; 10)
6
4
(3; 10)
6,5
4,75
Az első becslés összes mintán vett várható értéke 4, ami megegyezik a teljes sokaság átlagával, ez a becslés így torzítatlan. A második becslés torzított. A torzítatlan becsléseket előnyben részesítjük a torzítottakkal szemben, vagyis ez alapján az első becslés a jobb.
Ha viszont megnézzük, hogy milyen becsléseket ad az egyes mintákban a tényleges sokasági átlagra, ami ugyebár 4, mégsem tűnik olyan rossznak, sőt mintha még jobb is lenne -nél. Ennek oka, hogy varianciája kisebb.
A második becslés tehát torzított ugyan, de varianciája sokkal kisebb. Annyival kisebb, hogy a két becslés közül még a torzítottság ellenére is lesz a jobb.
Az MSE mutató tehát összemérhetővé teszi a torzítást és a varianciát. Két, egymással versenyző becslés közül azt tekintjük jobbnak, amelyre MSE kisebb. Ha mindkét becslés torzítatlan, akkor MSE éppen megegyezik a varianciával, így ebben az esetben továbbra is érvényben marad a minimális variancia kritérium. Ha azonban az egyik becslés, vagy akár mindkettő torzított, akkor a torzítottság mértéke és a variancia együttesen dönti el, hogy melyik becslés a jobb, a minimális variancia helyett a minimális MSE kritériumot alkalmazva.
Mintavételek típusai
A sokaság fontosabb statisztikai mutatóinak, más szóval paramétereinek megállapításához használt becsléseket tehát akkor tekintjük jónak, ha azok egyrészt torzítatlanok, másrészt ha a becsülni kívánt paraméter körüli szórásuk viszonylag kicsi.
Eddigi vizsgálódásaink egyik legfontosabb eredménye a mintaátlagok eloszlásának jellemzése. Ha a teljes sokaság átlaga és szórása pedig , akkor az ebből vett n elemű minták átlagai olyan eloszlással helyezkednek el, aminek átlaga szintén a szórása pedig
Ezt az utóbbit a minta standard hibájának szokás nevezni. A standard hiba tehát azt mondja meg, hogy a mintaátlagok mekkora szórással ingadoznak a tényleges sokasági átlag körül.
Fontos azt is megjegyezni, hogy bármilyen is az alapsokaság eloszlása, kis elemszámú minták esetén a mintaátlagok is ugyanolyan eloszlással helyezkednek el a sokasági átlag körül. Ha viszont a minta elemszáma nagy, akkor bármilyen is az alapsokaság eloszlása, a mintaátlagok eloszlása a normális eloszláshoz közelít. Ezen utóbbi tulajdonság, amit az úgynevezett Centrális határeloszlás tételek alapján tudunk, meghatározó fontosságú lesz a most következőkben, a becsléseknél is és később majd a hipotézisvizsgálat során.
Mielőtt rátérnénk a statisztikai becslések részletes vizsgálatára, érdemes még néhány elméleti jellegű kérdést tisztázni magával a mintavétellel kapcsolatban.
Az első ilyen kérdés a mintavétel során elkövethető hibák kérdése. Ezeket a hibákat alapvetően két osztályba, a mintavételi és az úgynevezett nemmintavételi hibák közé sorolhatjuk.
Nemmintavételi hibának számít például, ha egy felmérés során a válaszoló nem a valóságnak megfelelő válaszokat ad. Szintén nemmintavételi hiba az úgynevezett lefedési hiba, amikor bizonyos típusú elemek kimaradnak a mintavételből. A nemmintavételi hibák tehát a nem becslésből adódó hibák. Hiába kérdezzük meg a teljes lakosságot a TV-nézési szokásáról, ha mindenki letagadja az idióta sorozatokat. Vagy hiába készítünk teljes körű felmérést a
Mintavételi hibának azokat a hibákat nevezzük, amik kimondottan azért fordulnak elő, mert nem tudjuk, vagy nem akarjuk a teljes sokaságot vizsgálni. A mintavételi hiba tehát a sokaság eloszlásán és a mintavételi eljáráson kívül főleg a minta elemszáma határozza meg. Mivel pedig ezeket általában már a mintavételt megelőzően ismerjük, a mintavételi hibának megvan az a kellemes tulajdonsága, hogy legtöbbször előre megállapítható. Vagyis még el sem végeztük a mintavételt, de már tudjuk, hogy mekkora lesz a mintavétel során elkövetett hiba. Ez a kellemes tulajdonság lesz a kiindulópont a becslések és később a hipotézisvizsgálatok elméletének kiépítésében.
Szűkebb értelemben mintavételi hibának számít még az úgynevezett szelekciós torzítás, vagyis amikor a minta nem reprezentatív, a mintaelemek nem elég gondosan lettek kiválogatva és így a minta szerkezete eltér a teljes sokaság szerkezetétől. Ez a hiba nyilvánvalóan magából a mintavételből fakad, így szükségképpen mintavételi hibának kell tekintenünk, ám jellege mégis a nemmintavételi hibára emlékeztet. Egyfelől azért, mert gondosabban megválasztva a mintaelemeket a szelekciós torzítás csökkenthető, másrészt pedig azért, mert a többi nemmintavételi hibához hasonlóan előre nem tervezhető.
A nemmintavételi hibák és a szelekciós torzítás tehát alattomosan felbukkanó jelenségek, amiket a mintavétel alapos előkészítésével jó eséllyel csökkenteni lehet, de valós mértéküket szinte lehetetlen megmondani. Nemhogy előrejelezni nem tudjuk, legtöbbször még utólagos becslésük sem lehetséges.
A következő fontos kérdés magának a mintavételnek a módja.
FAE-minta: Független, azonos eloszlású elemekből álló minta. Minden visszatevéses mintavétel FAE-minta, illetve azok a visszatevés nélküli minták, ahol a sokaság végtelen, vagy véges ugyan, de a minta elemszáma a teljes sokasághoz képest elhanyagolható.
A lényeg itt a függetlenség, hogy minden mintaelem független a többitől. Bármi is az első mintaelem, a második is lehet ugyanaz, sőt a harmadik is, esetleg mindegyik. Ezt garantálja a visszatevéses mintavétel, illetve az, hogy ha a mintavétel nem visszatevéses a sokaság végtelen, tehát minden típusú elemből korlátlan mennyiség áll rendelkezésre. Ez lényegében akkor is teljesül, ha az alapsokaság ugyan véges, de a minta elemszáma hozzá képest elhanyagolható.
EV-minta: Egyszerű véletlen minta. Véges sokaságból visszatevés nélküli minta, ahol bármelyik elem kiválasztásának esélye azonos.
Ebben az esetben a mintaelemek nem függetlenek. Ha egy elemet kiválasztottunk, az elemek száma a sokaságban eggyel csökkent, ami hatással van a következő mintaelem kiválasztására. A véletlen szó itt a sokság bármely elemének azonos eséllyel történő kiválasztására utal.
Rétegzett minta: Az alapsokaságot először valamilyen ismérv alapján viszonylag homogén rétegekbe soroljuk be, majd ezekből a rétegekből veszünk FAE vagy EV mintát.
Ezt megtehetjük úgy is, hogy minden rétegből azonos számú mintaelemet veszünk, vagy úgy, hogy az egyes rétegekből vett minták elemszáma arányos az egyes rétegeknek a teljes sokaságban elfoglalt méretével.
Csoportos minták: A csoportos minták legegyszerűbb esete az úgynevezett egylépcsős minta. Ezt az eljárást homogén véges sokaságoknál alkalmazzuk. Lényege az, hogy a sokaság teljes listája nem áll rendelkezésünkre, vagy nehézkes lenne előállítani, de a sokaság jól meghatározható csoportokba tömörül és maguk a csoportok már könnyebben listázhatók. Az egylépcsős minta során magukat a csoportokat választjuk tehát ki, majd a kiválasztott csoport minden elemét megfigyeljük. Például kiválasztunk öt társasházat, ahol aztán az összes lakót megkérdezzük.
A kétlépcsős minta abban különbözik az egylépcsős mintától, hogy ha kiválasztottuk a csoportokat, utána nem teljes körű felmérést végzünk, hanem a csoportokon belül is mintákat vizsgálunk, legtöbbször EV-mintákat.
A differenciálegyenletek olyan egyenletek, amiben az ismeretlenek függvények.
Az egyenletben ezeknek a függvényeknek a különböző deriváltjai és hatványai szerepelnek.
Ha ez a bizonyos függvény egyváltozós, akkor a differenciálegyenletet közönséges differenciálegyenletnek nevezzük, ha a függvény többváltozós, akkor parciális differenciálegyenletnek.
A szereposztás a következő
A függvény változója
A függvény
röviden
És itt egy egyenlet
Rend
Azt mondja meg, hogy a függvény maximum hányadik deriváltja szerepel az egyenletben.
Linearitás
Ha az ismeretlen függvény és deriváltjai csak első fokon szerepelnek az egyenletben, akkor az egyenlet lineáris.
Itt például a rend 2.
Itt például a fokszám 3.
És most térjünk rá a legviccesebb kérdésre, a megoldásra.
A differenciálegyenleteket különböző típusok szerint fogjuk csoportosítani, aztán pedig megnézzük, hogy ezeket a típusokat hogyan kell megoldani.
Végül van itt még egy kis gubanc.
Bizonyos elvetemült fizikusok ugyanis nem x-el jelölik a változót hanem t-vel, és ilyenkor a függvény nem y, hanem x.
Ennek az a magyarázata, hogy a differenciálegyenletek gyakran olyan folyamatokat írnak le, ahol a változó az idő, aminek a jele t.
Ha a változót t-vel jelöljük és a függvényt x-el, nos akkor az egyenlet:
És a deriválás jele ilyenkor pont.
Most pedig lássuk, hogyan kell megoldani ezeket az egyenleteket.
Lássuk mit tehetnénk ezzel.
-t lecseréljük arra, hogy
Beszorzunk dx-el.
Most jön a szétválasztás: minden y-os dolgot a dy-os oldalra viszünk és minden x-eset a dx-es oldalra.
Mindkét oldalt integráljuk és megkapjuk a megoldást.
A +C ilyenkor elég csak az egyik oldalra.
ÁLTALÁNOS MEGOLDÁS:
Ha y konstans nulla, akkor itt nem oszthattunk volna vele.
Lássuk y=0 megoldás-e
Úgy tűnik igen.
PARTIKULÁRIS MEGOLDÁS:
A partikuláris megoldást úgy kapjuk, ha a C-t rögzítjük.
Mondjuk nagyon boldoggá tenne minket egy olyan megoldás, amikor y(0)=666
Van itt aztán egy másik egyenlet, nézzük meg ezt is.
Most pedig, megszabadulunk a logaritmusoktól.
Van egy ilyen, hogy
Így aztán pápá logaritmus.
Itt C valamilyen konstans, így ec egy másik valamilyen konstans, hívjuk D-nek.
Meg kell még néznünk, hogy az y=0 megoldás-e.
Úgy látszik igen.
A partikuláris megoldás most is azt jelenti, hogy D-t rögzítjük valamilyen számnak.
Mondjuk szeretnénk, hogy teljesüljön.
Itt van aztán egy viccesebb ügy.
Van egy ilyen, hogy így aztán pápá tangens.
Hát ez megvolna.
Most pedig lássunk egy újabb differenciálegyenlet-típust.
1.A Homogén fokszámú differenciálegyenlet
Kezdjük azzal, hogy tisztázzuk, mit is jelent a homogén fokszám.
Van itt egy ilyen
nos ez egy polinom, de nem ez az érdekes.
Ha ebben elvégezzük az helyettesítést,
akkor voila, miden tagban megjelenik .
Na ezt a remek adottságot nevezzük homogenitásnak.
Ez a polinom például nem homogén fokszámú:
Ha ugyanis akkor x-nek miden tagban más-más kitevője van.
Hát ennyit a homogén fokszámról és akkor lássuk, hogyan hasznosíthatnánk ezen ismereteinket a differenciálegyenletek megoldásánál.
Oldjuk meg ezt.
Az egyenlet nem szeparábilis, ha ugyanis leosztanánk -el…
akkor oldalán biztosan marad -es tag.
Ez pedig ártalmas a megoldás szempontjából.
Ha viszont nem osztunk le, akkor pedig oldalán marad y.
Szerencsére viszont a fokszám homogén.
A -es résznél is a fokszám kettő…
és a -os résznél is.
helyettesítés, röviden
Ez az egyenlet már szeparábilis, úgyhogy most jöhet a szétválasztás.
Megoldjuk a szeparábilis egyenletet, ahol y helyett most u-ra hajtunk.
És amikor u már megvan, visszacsináljuk y-ra.
Nézzünk meg egy másikat is.
Van egy ilyen, hogy így aztán pápá tangens.
Végülis miért ne néznénk meg még egy homogén fokszámú egyenletet.
Az egyenlet nem szeparábilis, viszont a fokszám homogén.
Úgy tűnik a fokszám 4.
Ez jó jel, jöhet a szokásos helyettesítés.
Most pedig megszabadulunk a logaritmusoktól.
2. Egzakt differenciálegyenlet
Ez az egyenlet akkor egzakt, ha…
létezik egy olyan függvény, hogy
Az egyenlet megoldása pedig éppen ez a bizonyos függvény:
Megoldani egy egzakt differenciálegyenletet tehát annyit jelent, hogy megtalálni ezt a bizonyos függvényt.
Előtte azonban nem árt tesztelni az egyenletet, hogy egzakt-e vagy sem.
Ezt kétféleképpen is megtehetjük.
Vagy deriválással, vagy integrálással.
Nos, mindez sokkal érthetőbb lesz, ha megnézzük a résztvevők családfáját.
Az egyenletben szereplő és függvényeknek azt kell tudniuk, hogy létezzen egy közös ősük, az .
Ezt integrálással deríthetjük ki.
De ugyanakkor azt is tudják, hogy van egy közös leszármazottjuk:
(rémes vérfertőzés)
Ezt deriválással ellenőrizhetjük.
Nos, deriválni jobb.
Így aztán először deriváljuk -t és -t, hogy kiderüljön, az egyenlet valóban egzakt-e,
utána pedig integráljuk őket, hogy megkapjuk a megoldást.
Remek terv, lássunk egy feladatot.
Van itt egy egyenlet:
Lássuk, vajon egzakt-e.
Az egyenlet akkor egzakt, ha
Nos úgy tűnik igen.
Az egzakt egyenletek megoldása ahol
A megoldást integrálással kapjuk:
x szerint integrálunk,
ilyenkor y úgy viselkedik, mint egy konstans.
De éppen azért, mert y úgy viselkedik, mint egy konstans, ez a bizonyos lehet, hogy nem egyszerűen csak , hanem y-t is tartalmaz.
Úgy bizonyosodhatunk meg a dologról, ha deriváljuk ezt y szerint és megnézzük mi jön ki.
Nos, elvileg így éppen -t kell kapnunk.
Most hasonlítsuk össze az eredetivel.
Úgy tűnik, hogy
Hát ez megvolna.
Megpróbálhatjuk felírni a megoldást explicit alakban is,
vagyis olyan alakban, hogy y ki van fejezve.
Sajnos ez nem mindig sikerül.
De most igen.
Lássunk egy másikat is.
Megnézzük egzakt-e.
A jelek szerint egzakt, úgyhogy jöhet a megoldás.
x szerint integrálunk,
ilyenkor y úgy viselkedik, mint egy konstans.
És itt jön ez a bizonyos , ami lehet, hogy nem egyszerűen csak , hanem y-t is tartalmaz.
Lássuk most éppen mi lesz.
Itt y nem fejezhető ki, tehát a megoldást nem tudjuk explicit alakban megadni.
Végezetül nézzünk meg még egy egyenletet.
Elsőként ellenőrizzük, hogy az egyenlet egzakt-e.
Hát ezek sajna nem egyenlők, így az egyenlet nem egzakt.
Lássuk, mit lehet tenni ilyen esetben.
Erről fog szólni a következő képsor.
Van itt ez az egyenlet
ami sajnos nem egzakt, mert
A feladatunk az, hogy valamilyen varázslat hatására egzakttá tegyük.
Mondjuk szorozzuk be az egyenletet x-el.
Lássuk, ez az x-el való beszorzás jót tett-e az egyenletnek.
A jelek szerint igen.
Ez már egy egzakt egyenlet, aminek a megoldása:
Végül kiderítjük mi lehet a .
Nos úgy tűnik hatásosnak bizonyult a beszorzás x-el.
Ez örvendetes, de fölmerül a kérdés, hogy miért éppen x-el szoroztunk be.
A válasz most jön.
Ha az egyenlet nem egzakt, akkor megpróbáljuk egzakttá tenni egy integráló tényező segítségével.
Az integráló tényező megtalálásához elsőként kiszámoljuk ezeket:
Aggodalomra semmim ok, hamarosan minden jóra fordul.
Ha ezek közül az első csak y-t tartalmaz,
vagy a második csak x-et tartalmaz,
nos olyankor van remény az integráló tényező megtalálására.
Most az elsőben van x és y is, tehát az számunkra nem hasznos.
De a második az jó.
Az integráló tényező megtalálása
Itt jön aztán egy másik egyenlet.
Megnézzük egzakt-e.
Nos nem igazán.
Úgyhogy jön az integráló tényező.
Az elsőben csak x-nek szabadna lennie…
szóval sajna nem jó.
A második bíztató…
Nos ez az egyenlet már egzakt.
Úgyhogy jöhet a megoldás:
Rossz hír. Ez egy parciális integrálás.
Na és még itt van ez a is.
Nos úgy látszik tehát csak valami konstans.
Íme, itt egy egyenlet.
Megnézzük egzakt-e.
A jelek szerint nem egzakt.
Na nem baj, akkor jön az integráló tényező.
Némi átalakítás után…
Nos, ez az egyenlet már egzakt.
Úgyhogy jöhet a megoldás:
Végül deriváljuk ezt y szerint, hogy kiderítsük mi a helyzet a -al.
Itt jön aztán még egy egyenlet:
Lássuk, egzakt-e.
Hát nem.
Na nem baj, akkor jön az integráló tényező.
Most mindegy melyiket használjuk.
De ez könnyebbnek látszik.
Most pedig jöhet a megoldás.
2. Egzakt differenciálegyenlet
Ez az egyenlet akkor egzakt, ha…
létezik egy olyan függvény, hogy
Az egyenlet megoldása pedig éppen ez a bizonyos függvény:
Megoldani egy egzakt differenciálegyenletet tehát annyit jelent, hogy megtalálni ezt a bizonyos függvényt.
Előtte azonban nem árt tesztelni az egyenletet, hogy egzakt-e vagy sem.
Ezt kétféleképpen is megtehetjük.
Vagy deriválással, vagy integrálással.
Nos, mindez sokkal érthetőbb lesz, ha megnézzük a résztvevők családfáját.
Az egyenletben szereplő és függvényeknek azt kell tudniuk, hogy létezzen egy közös ősük, az .
Ezt integrálással deríthetjük ki.
De ugyanakkor azt is tudják, hogy van egy közös leszármazottjuk:
(rémes vérfertőzés)
Ezt deriválással ellenőrizhetjük.
Nos, deriválni jobb.
Így aztán először deriváljuk -t és -t, hogy kiderüljön, az egyenlet valóban egzakt-e,
utána pedig integráljuk őket, hogy megkapjuk a megoldást.
Remek terv, lássunk egy feladatot.
Van itt egy egyenlet:
Lássuk, vajon egzakt-e.
Az egyenlet akkor egzakt, ha
Nos úgy tűnik igen.
Az egzakt egyenletek megoldása ahol
A megoldást integrálással kapjuk:
x szerint integrálunk,
ilyenkor y úgy viselkedik, mint egy konstans.
De éppen azért, mert y úgy viselkedik, mint egy konstans, ez a bizonyos lehet, hogy nem egyszerűen csak , hanem y-t is tartalmaz.
Úgy bizonyosodhatunk meg a dologról, ha deriváljuk ezt y szerint és megnézzük mi jön ki.
Nos, elvileg így éppen -t kell kapnunk.
Most hasonlítsuk össze az eredetivel.
Úgy tűnik, hogy
Hát ez megvolna.
Megpróbálhatjuk felírni a megoldást explicit alakban is,
vagyis olyan alakban, hogy y ki van fejezve.
Sajnos ez nem mindig sikerül.
De most igen.
Lássunk egy másikat is.
Megnézzük egzakt-e.
A jelek szerint egzakt, úgyhogy jöhet a megoldás.
x szerint integrálunk,
ilyenkor y úgy viselkedik, mint egy konstans.
És itt jön ez a bizonyos , ami lehet, hogy nem egyszerűen csak , hanem y-t is tartalmaz.
Lássuk most éppen mi lesz.
Itt y nem fejezhető ki, tehát a megoldást nem tudjuk explicit alakban megadni.
Végezetül nézzünk meg még egy egyenletet.
Elsőként ellenőrizzük, hogy az egyenlet egzakt-e.
Hát ezek sajna nem egyenlők, így az egyenlet nem egzakt.
Lássuk, mit lehet tenni ilyen esetben.
Erről fog szólni a következő képsor.
Van itt ez az egyenlet
ami sajnos nem egzakt, mert
A feladatunk az, hogy valamilyen varázslat hatására egzakttá tegyük.
Mondjuk szorozzuk be az egyenletet x-el.
Lássuk, ez az x-el való beszorzás jót tett-e az egyenletnek.
A jelek szerint igen.
Ez már egy egzakt egyenlet, aminek a megoldása:
Végül kiderítjük mi lehet a .
Nos úgy tűnik hatásosnak bizonyult a beszorzás x-el.
Ez örvendetes, de fölmerül a kérdés, hogy miért éppen x-el szoroztunk be.
A válasz most jön.
Ha az egyenlet nem egzakt, akkor megpróbáljuk egzakttá tenni egy integráló tényező segítségével.
Az integráló tényező megtalálásához elsőként kiszámoljuk ezeket:
Aggodalomra semmim ok, hamarosan minden jóra fordul.
Ha ezek közül az első csak y-t tartalmaz,
vagy a második csak x-et tartalmaz,
nos olyankor van remény az integráló tényező megtalálására.
Most az elsőben van x és y is, tehát az számunkra nem hasznos.
De a második az jó.
Az integráló tényező megtalálása
Itt jön aztán egy másik egyenlet.
Megnézzük egzakt-e.
Nos nem igazán.
Úgyhogy jön az integráló tényező.
Az elsőben csak x-nek szabadna lennie…
szóval sajna nem jó.
A második bíztató…
Nos ez az egyenlet már egzakt.
Úgyhogy jöhet a megoldás:
Rossz hír. Ez egy parciális integrálás.
Na és még itt van ez a is.
Nos úgy látszik tehát csak valami konstans.
Íme, itt egy egyenlet.
Megnézzük egzakt-e.
A jelek szerint nem egzakt.
Na nem baj, akkor jön az integráló tényező.
Némi átalakítás után…
Nos, ez az egyenlet már egzakt.
Úgyhogy jöhet a megoldás:
Végül deriváljuk ezt y szerint, hogy kiderítsük mi a helyzet a -al.
Itt jön aztán még egy egyenlet:
Lássuk, egzakt-e.
Hát nem.
Na nem baj, akkor jön az integráló tényező.
Most mindegy melyiket használjuk.
De ez könnyebbnek látszik.
Most pedig jöhet a megoldás.
2. Egzakt differenciálegyenlet
Ez az egyenlet akkor egzakt, ha…
létezik egy olyan függvény, hogy
Az egyenlet megoldása pedig éppen ez a bizonyos függvény:
Megoldani egy egzakt differenciálegyenletet tehát annyit jelent, hogy megtalálni ezt a bizonyos függvényt.
Előtte azonban nem árt tesztelni az egyenletet, hogy egzakt-e vagy sem.
Ezt kétféleképpen is megtehetjük.
Vagy deriválással, vagy integrálással.
Nos, mindez sokkal érthetőbb lesz, ha megnézzük a résztvevők családfáját.
Az egyenletben szereplő és függvényeknek azt kell tudniuk, hogy létezzen egy közös ősük, az .
Ezt integrálással deríthetjük ki.
De ugyanakkor azt is tudják, hogy van egy közös leszármazottjuk:
(rémes vérfertőzés)
Ezt deriválással ellenőrizhetjük.
Nos, deriválni jobb.
Így aztán először deriváljuk -t és -t, hogy kiderüljön, az egyenlet valóban egzakt-e,
utána pedig integráljuk őket, hogy megkapjuk a megoldást.
Remek terv, lássunk egy feladatot.
Van itt egy egyenlet:
Lássuk, vajon egzakt-e.
Az egyenlet akkor egzakt, ha
Nos úgy tűnik igen.
Az egzakt egyenletek megoldása ahol
A megoldást integrálással kapjuk:
x szerint integrálunk,
ilyenkor y úgy viselkedik, mint egy konstans.
De éppen azért, mert y úgy viselkedik, mint egy konstans, ez a bizonyos lehet, hogy nem egyszerűen csak , hanem y-t is tartalmaz.
Úgy bizonyosodhatunk meg a dologról, ha deriváljuk ezt y szerint és megnézzük mi jön ki.
Nos, elvileg így éppen -t kell kapnunk.
Most hasonlítsuk össze az eredetivel.
Úgy tűnik, hogy
Hát ez megvolna.
Megpróbálhatjuk felírni a megoldást explicit alakban is,
vagyis olyan alakban, hogy y ki van fejezve.
Sajnos ez nem mindig sikerül.
De most igen.
Lássunk egy másikat is.
Megnézzük egzakt-e.
A jelek szerint egzakt, úgyhogy jöhet a megoldás.
x szerint integrálunk,
ilyenkor y úgy viselkedik, mint egy konstans.
És itt jön ez a bizonyos , ami lehet, hogy nem egyszerűen csak , hanem y-t is tartalmaz.
Lássuk most éppen mi lesz.
Itt y nem fejezhető ki, tehát a megoldást nem tudjuk explicit alakban megadni.
Végezetül nézzünk meg még egy egyenletet.
Elsőként ellenőrizzük, hogy az egyenlet egzakt-e.
Hát ezek sajna nem egyenlők, így az egyenlet nem egzakt.
Lássuk, mit lehet tenni ilyen esetben.
Erről fog szólni a következő képsor.
Van itt ez az egyenlet
ami sajnos nem egzakt, mert
A feladatunk az, hogy valamilyen varázslat hatására egzakttá tegyük.
Mondjuk szorozzuk be az egyenletet x-el.
Lássuk, ez az x-el való beszorzás jót tett-e az egyenletnek.
A jelek szerint igen.
Ez már egy egzakt egyenlet, aminek a megoldása:
Végül kiderítjük mi lehet a .
Nos úgy tűnik hatásosnak bizonyult a beszorzás x-el.
Ez örvendetes, de fölmerül a kérdés, hogy miért éppen x-el szoroztunk be.
A válasz most jön.
Ha az egyenlet nem egzakt, akkor megpróbáljuk egzakttá tenni egy integráló tényező segítségével.
Az integráló tényező megtalálásához elsőként kiszámoljuk ezeket:
Aggodalomra semmim ok, hamarosan minden jóra fordul.
Ha ezek közül az első csak y-t tartalmaz,
vagy a második csak x-et tartalmaz,
nos olyankor van remény az integráló tényező megtalálására.
Most az elsőben van x és y is, tehát az számunkra nem hasznos.
De a második az jó.
Az integráló tényező megtalálása
Itt jön aztán egy másik egyenlet.
Megnézzük egzakt-e.
Nos nem igazán.
Úgyhogy jön az integráló tényező.
Az elsőben csak x-nek szabadna lennie…
szóval sajna nem jó.
A második bíztató…
Nos ez az egyenlet már egzakt.
Úgyhogy jöhet a megoldás:
Rossz hír. Ez egy parciális integrálás.
Na és még itt van ez a is.
Nos úgy látszik tehát csak valami konstans.
Íme, itt egy egyenlet.
Megnézzük egzakt-e.
A jelek szerint nem egzakt.
Na nem baj, akkor jön az integráló tényező.
Némi átalakítás után…
Nos, ez az egyenlet már egzakt.
Úgyhogy jöhet a megoldás:
Végül deriváljuk ezt y szerint, hogy kiderítsük mi a helyzet a -al.
Itt jön aztán még egy egyenlet:
Lássuk, egzakt-e.
Hát nem.
Na nem baj, akkor jön az integráló tényező.
Most mindegy melyiket használjuk.
De ez könnyebbnek látszik.
Most pedig jöhet a megoldás.
Elsőrendű lineáris differenciálegyenlet
Az elsőrendű lineáris egyenlet általános alakja úgy néz ki, hogy van benne egy és van benne egy elsőfokú .
Az egyenlet megoldása vicces lesz, egy kis bűvészkedésre lesz szükség.
Beszorozzuk az egyenletet egy függvénnyel,
és ennek hatására, bal oldalon a szorzat függvény deriválási szabályát vizionáljuk.
Egy kis gubanc azért adódik ezzel, az eleje ugyanis stimmel,
de a vége…
nos ahhoz az kell, hogy
Ez egy könnyű szeparábilis egyenlet, amit meg is oldunk.
Válasszuk a pluszosat.
A megoldást tehát úgy kezdjük, hogy beszorozzuk az egyenletet ezzel a bizonyos -el, és így a bal oldalon egy szorzat deriváltja jeleneik meg.
Ez tehát az első lépés.
Kiszámoljuk a függvényt:
Beszorozzuk az egyenletet -el, hogy a bal oldal egy szorzat deriváltja legyen.
Aztán pedig integrálunk.
Végül mindkét oldalt integráljuk.
Lássunk erre egy példát.
Itt jön a függvény:
Lássuk hogyan tudnánk integrálni a –et.
Nos, valahogy így:
Csak van itt egy kis gond, ugyanis
De ezen lehet segíteni.
Válasszuk mondjuk a pluszosat.
Most, hogy végre megvan a függvény, jöhet a beszorzás.
És most álljunk meg egy picit.
Az egyenlet bal oldala hiszen ezen fáradoztunk eddig.
Ez igazán remek, most már csak integrálni kell…
és kész.
Nézzünk meg egy másikat is.
Lássuk -et:
A jelek szerint tehát be kell szorozni x-el.
Nos, így éppen visszakaptuk az eredeti egyenletet, de aggodalomra semmi ok, már jó úton vagyunk.
És most jöhet az integrálás.
Hát ezt is megoldottuk.
Végül itt jön még egy egyenlet.
És most jöhet a beszorzás.
Elsőrendű lineáris állandó együtthatós differenciálegyenlet
A most következő típus speciális esete a lineáris elsőrendű egyenleteknek.
Azért hívják állandó együtthatósnak, mert a függvény ilyenkor valamilyen konstans.
Erre a speciális esetre nézünk meg egy teljesen új megoldási módszert.
Megoldhatnánk persze az egyenletet úgy is, ahogyan az előző képsorban tettük, de most egy sokkal viccesebb megoldás jön.
Első lépésként megoldjuk az úgynevezett homogén egyenletet, ami ez:
Ez egy nagyon egyszerű egyenlet
A homogén egyenlet:
A homogén megoldás:
Az egyenlet általános megoldása úgy jön ki, hogy a homogén megoldáshoz hozzáadjuk a partikuláris megoldást.
Ez a bizonyos partikuláris megoldás mindig a jobb oldalon lévő függvény alapján derül ki egy próbafüggvény módszernek nevezett nagyon vicces eljárással.
A partikuláris megoldást próbafüggvény módszerrel keressük meg:
másodfokú polinom:
exponenciális kifejezés:
szinusz vagy koszinusz:
Van itt ez az egyenlet:
Most elkezdjük keresni a partikuláris megoldást.
Az, hogy pontosan mi is lesz ez a partikuláris megoldás, nos ez mindig a jobb oldali függvénytől függ.
A jelek szerint, most szinusz és koszinusz lesz a partikuláris megoldásban:
Ezt behelyettesítjük az eredeti egyenletbe.
Aztán kiderítjük, hogy mennyi A és B.
A partikuláris megoldás most polinom-típusú lesz.
Ezt behelyettesítjük az eredeti egyenletbe és kiderítjük, hogy mennyi A, B és C.
Aztán kiderítjük, hogy mennyi A és B.
Azokban az esetekben, amikor a partikuláris megoldás exponenciális kifejezéseket is tartalmaz, nos olyankor adódhatnak bizonyos problémák.
Erről szól a következő képsor.
Ha a partikuláris megoldás tartalmaz –es tagot, nos akkor a megoldás során adódhatnak bizonyos problémák.
Első lépésként megoldjuk az úgynevezett homogén egyenletet, ami ez:
Aztán rátérünk a partikuláris megoldásra.
Ezt behelyettesítjük az eredeti egyenletbe:
És most lássuk mi az a rezonancia.
Ez olyankor fordul elő, amikor a partikuláris megoldásban szerepel és a kitevője éppen megegyezik a homogén megoldás kitevőjével.
Jelenleg a kitevők nem egyeznek meg, tehát nincsen rezonancia.
De most már van.
Lássuk, mi történik ilyenkor.
Vagyis éppen megegyezik a homogén megoldással.
Ezt nevezzük rezonanciának.
És ilyenkor bejön ide egy x.
Nézzünk meg egy másikat is.
A homogén megoldás a szokásos:
A partikuláris megoldásban lesz egy elsőfokú kifejezés,
egy
és egy másik ahol rezonancia van.
Elsőrendű lineáris állandó együtthatós differenciálegyenlet
A most következő típus speciális esete a lineáris elsőrendű egyenleteknek.
Azért hívják állandó együtthatósnak, mert a függvény ilyenkor valamilyen konstans.
Erre a speciális esetre nézünk meg egy teljesen új megoldási módszert.
Megoldhatnánk persze az egyenletet úgy is, ahogyan az előző képsorban tettük, de most egy sokkal viccesebb megoldás jön.
Első lépésként megoldjuk az úgynevezett homogén egyenletet, ami ez:
Ez egy nagyon egyszerű egyenlet
A homogén egyenlet:
A homogén megoldás:
Az egyenlet általános megoldása úgy jön ki, hogy a homogén megoldáshoz hozzáadjuk a partikuláris megoldást.
Ez a bizonyos partikuláris megoldás mindig a jobb oldalon lévő függvény alapján derül ki egy próbafüggvény módszernek nevezett nagyon vicces eljárással.
A partikuláris megoldást próbafüggvény módszerrel keressük meg:
másodfokú polinom:
exponenciális kifejezés:
szinusz vagy koszinusz:
Van itt ez az egyenlet:
Most elkezdjük keresni a partikuláris megoldást.
Az, hogy pontosan mi is lesz ez a partikuláris megoldás, nos ez mindig a jobb oldali függvénytől függ.
A jelek szerint, most szinusz és koszinusz lesz a partikuláris megoldásban:
Ezt behelyettesítjük az eredeti egyenletbe.
Aztán kiderítjük, hogy mennyi A és B.
A partikuláris megoldás most polinom-típusú lesz.
Ezt behelyettesítjük az eredeti egyenletbe és kiderítjük, hogy mennyi A, B és C.
Aztán kiderítjük, hogy mennyi A és B.
Azokban az esetekben, amikor a partikuláris megoldás exponenciális kifejezéseket is tartalmaz, nos olyankor adódhatnak bizonyos problémák.
Erről szól a következő képsor.
Ha a partikuláris megoldás tartalmaz –es tagot, nos akkor a megoldás során adódhatnak bizonyos problémák.
Első lépésként megoldjuk az úgynevezett homogén egyenletet, ami ez:
Aztán rátérünk a partikuláris megoldásra.
Ezt behelyettesítjük az eredeti egyenletbe:
És most lássuk mi az a rezonancia.
Ez olyankor fordul elő, amikor a partikuláris megoldásban szerepel és a kitevője éppen megegyezik a homogén megoldás kitevőjével.
Jelenleg a kitevők nem egyeznek meg, tehát nincsen rezonancia.
De most már van.
Lássuk, mi történik ilyenkor.
Vagyis éppen megegyezik a homogén megoldással.
Ezt nevezzük rezonanciának.
És ilyenkor bejön ide egy x.
Nézzünk meg egy másikat is.
A homogén megoldás a szokásos:
A partikuláris megoldásban lesz egy elsőfokú kifejezés,
egy
és egy másik ahol rezonancia van.
Az egyenlet homogén megoldása, Az inhomogén rész megoldása, Próbafüggvény-módszer, Partikuláris megoldás, Az általános megoldás.
Másodrendű lineáris állandó együtthatós homogén differenciálegyenlet
Íme itt van ez az egyenlet.
Az eddigi módszereinkkel várhatóan nem fogunk jelentős sikereket elérni ennek az egyenletnek a megoldásában, ez az egyenlet ugyanis másodrendű.
Nos ez, nem egy bíztató jel a megoldás szempontjából.
Az ilyen egyenleteket általában elég nehéz megoldani.
De szerencsére ez a típus kivétel.
Lássuk mit kell tenni vele.
Ez az egyenlet általános alakja, és a dolog úgy áll, hogy az ilyen egyenleteknek a megoldása mindig valami
Helyettesítsük be ezt az egyenletbe és nézzük meg mi történik.
Ezt az egyenletet karakterisztikus egyenletnek nevezzük.
A differenciálegyenlet megoldásához ezt a másodfokú egyenletet kell megoldanunk.
A differenciálegyenlet megoldása:
Ha a karakterisztikus egyenletnek két különböző valós megoldása van és akkor
Ha a karakterisztikus egyenletnek egy valós megoldása van, akkor
Ha a karakterisztikus egyenletnek két különböző komplex megoldása van
És most lássuk a megoldást.
A karakterisztikus egyenlet:
Úgy tűnik, ezt meg is oldottuk. Nézzünk meg egy másikat is.
Itt jön a karakterisztikus egyenlet:
Hát ez se volt túl nehéz.
Végül nézzük meg a harmadik típust.
Nos itt van egy kis gond.
Negatív szám van a gyök alatt, ami azt jelenti, hogy a karakterisztikus egyenletnek nincs valós megoldása.
Komplex megoldása viszont van, amihez mindössze annyit kell tudnunk, hogy
Most pedig lássuk a megoldást.
A helyzet akkor válik izgalmasabbá, ha az egyenlet inhomogén.
Lássuk, mi történik olyankor.
A homogén egyenlet és megoldása:
Ha két valós megoldása van:
Ha egy valós megoldása van:
Ha két komplex megoldása van:
Partikuláris megoldás (próbafüggvény módszer)
Van itt ez az egyenlet, ami inhomogén.
Ilyenkor először megoldjuk a homogén egyenletet,
utána pedig próbafüggvény módszerrel megkeressük a partikuláris megoldást.
A homogén egyenlet megoldásához megoldjuk a szokásos
karakterisztikus egyenletet.
És most jöhet a partikuláris megoldás.
Ez a bizonyos partikuláris megoldás mindig a jobb oldalon lévő függvény alapján derül ki.
Ez a jobb oldali függvény most éppen egy polinom, így aztán a partikuláris megoldást is ilyen alakban keressük.
De lehetne a jobb oldali függvény exponenciális,
vagy éppen trigonometrikus.
A partikuláris megoldás
Lássuk mit kapunk, ha behelyettesítjük az eredeti egyenletbe:
És az általános megoldás:
Itt van aztán ez a másik inhomogén egyenlet.
Van azonban itt még egy kis bökkenő.
Ugyanúgy ahogyan az elsőrendű egyenleteknél, itt is lehet rezonancia.
A rezonancia akkor fordul elő, ha a homogén megoldás egyik tagja megegyezik a partikuláris megoldás egyik tagjával.
Most tehát nincs rezonancia,
de a következő képsorban lesz…
A másodrendű egyenleteknél ez a rezonancia kicsit komplikáltabb ügy, mint annak idején az elsőrendű egyenleteknél.
Van itt ez az egyenlet:
A homogén egyenlet megoldása:
És most jöhet a partikuláris megoldás.
Ezt mindig a jobb oldalon lévő függvény alapján találjuk ki.
A homogén megoldás egyik tagja most megegyezik a partikuláris megoldás egyik tagjával, így aztán sajna rezonancia van.
A konstans szorzó ilyenkor nem számít.
És a rezonancia miatt ide még bejön egy x.
Most kiszámoljuk a partikuláris megoldás első és második deriváltját.
Aztán ezeket behelyettesítjük az eredeti egyenletbe.
Amikor karakterisztikus egyenletnek csak egy valós megoldása van, olyankor kétszeres rezonancia is lehet.
Megjelent a rezonancia.
Így aztán a partikuláris megoldásban megint kelleni fog egy x-es szorzó.
Ám ekkor a második taggal lesz rezonancia…
így aztán kell még egy x-es szorzó.
Ezt hívjuk kettős rezonanciának.
A megoldás innentől a szokásos.
Szokásosan unalmas.
Ezért most ne oldjuk meg, hanem inkább nézzük meg milyen rezonancia lehet akkor, amikor a karakterisztikus egyenletnek két komplex gyöke van.
Van itt ez a két egyenlet:
A karakterisztikus egyenletek:
A komplex megoldáshoz annyit kell tudnunk, hogy
Ezekben az esetekben rezonancia olyankor fordul elő, ha
És ilyenkor a próbafüggvény:
Másodrendű lineáris állandó együtthatós homogén differenciálegyenlet
Íme itt van ez az egyenlet.
Az eddigi módszereinkkel várhatóan nem fogunk jelentős sikereket elérni ennek az egyenletnek a megoldásában, ez az egyenlet ugyanis másodrendű.
Nos ez, nem egy bíztató jel a megoldás szempontjából.
Az ilyen egyenleteket általában elég nehéz megoldani.
De szerencsére ez a típus kivétel.
Lássuk mit kell tenni vele.
Ez az egyenlet általános alakja, és a dolog úgy áll, hogy az ilyen egyenleteknek a megoldása mindig valami
Helyettesítsük be ezt az egyenletbe és nézzük meg mi történik.
Ezt az egyenletet karakterisztikus egyenletnek nevezzük.
A differenciálegyenlet megoldásához ezt a másodfokú egyenletet kell megoldanunk.
A differenciálegyenlet megoldása:
Ha a karakterisztikus egyenletnek két különböző valós megoldása van és akkor
Ha a karakterisztikus egyenletnek egy valós megoldása van, akkor
Ha a karakterisztikus egyenletnek két különböző komplex megoldása van
És most lássuk a megoldást.
A karakterisztikus egyenlet:
Úgy tűnik, ezt meg is oldottuk. Nézzünk meg egy másikat is.
Itt jön a karakterisztikus egyenlet:
Hát ez se volt túl nehéz.
Végül nézzük meg a harmadik típust.
Nos itt van egy kis gond.
Negatív szám van a gyök alatt, ami azt jelenti, hogy a karakterisztikus egyenletnek nincs valós megoldása.
Komplex megoldása viszont van, amihez mindössze annyit kell tudnunk, hogy
Most pedig lássuk a megoldást.
A helyzet akkor válik izgalmasabbá, ha az egyenlet inhomogén.
Lássuk, mi történik olyankor.
A homogén egyenlet és megoldása:
Ha két valós megoldása van:
Ha egy valós megoldása van:
Ha két komplex megoldása van:
Partikuláris megoldás (próbafüggvény módszer)
Van itt ez az egyenlet, ami inhomogén.
Ilyenkor először megoldjuk a homogén egyenletet,
utána pedig próbafüggvény módszerrel megkeressük a partikuláris megoldást.
A homogén egyenlet megoldásához megoldjuk a szokásos
karakterisztikus egyenletet.
És most jöhet a partikuláris megoldás.
Ez a bizonyos partikuláris megoldás mindig a jobb oldalon lévő függvény alapján derül ki.
Ez a jobb oldali függvény most éppen egy polinom, így aztán a partikuláris megoldást is ilyen alakban keressük.
De lehetne a jobb oldali függvény exponenciális,
vagy éppen trigonometrikus.
A partikuláris megoldás
Lássuk mit kapunk, ha behelyettesítjük az eredeti egyenletbe:
És az általános megoldás:
Itt van aztán ez a másik inhomogén egyenlet.
Van azonban itt még egy kis bökkenő.
Ugyanúgy ahogyan az elsőrendű egyenleteknél, itt is lehet rezonancia.
A rezonancia akkor fordul elő, ha a homogén megoldás egyik tagja megegyezik a partikuláris megoldás egyik tagjával.
Most tehát nincs rezonancia,
de a következő képsorban lesz…
A másodrendű egyenleteknél ez a rezonancia kicsit komplikáltabb ügy, mint annak idején az elsőrendű egyenleteknél.
Van itt ez az egyenlet:
A homogén egyenlet megoldása:
És most jöhet a partikuláris megoldás.
Ezt mindig a jobb oldalon lévő függvény alapján találjuk ki.
A homogén megoldás egyik tagja most megegyezik a partikuláris megoldás egyik tagjával, így aztán sajna rezonancia van.
A konstans szorzó ilyenkor nem számít.
És a rezonancia miatt ide még bejön egy x.
Most kiszámoljuk a partikuláris megoldás első és második deriváltját.
Aztán ezeket behelyettesítjük az eredeti egyenletbe.
Amikor karakterisztikus egyenletnek csak egy valós megoldása van, olyankor kétszeres rezonancia is lehet.
Megjelent a rezonancia.
Így aztán a partikuláris megoldásban megint kelleni fog egy x-es szorzó.
Ám ekkor a második taggal lesz rezonancia…
így aztán kell még egy x-es szorzó.
Ezt hívjuk kettős rezonanciának.
A megoldás innentől a szokásos.
Szokásosan unalmas.
Ezért most ne oldjuk meg, hanem inkább nézzük meg milyen rezonancia lehet akkor, amikor a karakterisztikus egyenletnek két komplex gyöke van.
Van itt ez a két egyenlet:
A karakterisztikus egyenletek:
A komplex megoldáshoz annyit kell tudnunk, hogy
Ezekben az esetekben rezonancia olyankor fordul elő, ha
És ilyenkor a próbafüggvény:
Másodrendű lineáris állandó együtthatós homogén differenciálegyenlet
Íme itt van ez az egyenlet.
Az eddigi módszereinkkel várhatóan nem fogunk jelentős sikereket elérni ennek az egyenletnek a megoldásában, ez az egyenlet ugyanis másodrendű.
Nos ez, nem egy bíztató jel a megoldás szempontjából.
Az ilyen egyenleteket általában elég nehéz megoldani.
De szerencsére ez a típus kivétel.
Lássuk mit kell tenni vele.
Ez az egyenlet általános alakja, és a dolog úgy áll, hogy az ilyen egyenleteknek a megoldása mindig valami
Helyettesítsük be ezt az egyenletbe és nézzük meg mi történik.
Ezt az egyenletet karakterisztikus egyenletnek nevezzük.
A differenciálegyenlet megoldásához ezt a másodfokú egyenletet kell megoldanunk.
A differenciálegyenlet megoldása:
Ha a karakterisztikus egyenletnek két különböző valós megoldása van és akkor
Ha a karakterisztikus egyenletnek egy valós megoldása van, akkor
Ha a karakterisztikus egyenletnek két különböző komplex megoldása van
És most lássuk a megoldást.
A karakterisztikus egyenlet:
Úgy tűnik, ezt meg is oldottuk. Nézzünk meg egy másikat is.
Itt jön a karakterisztikus egyenlet:
Hát ez se volt túl nehéz.
Végül nézzük meg a harmadik típust.
Nos itt van egy kis gond.
Negatív szám van a gyök alatt, ami azt jelenti, hogy a karakterisztikus egyenletnek nincs valós megoldása.
Komplex megoldása viszont van, amihez mindössze annyit kell tudnunk, hogy
Most pedig lássuk a megoldást.
A helyzet akkor válik izgalmasabbá, ha az egyenlet inhomogén.
Lássuk, mi történik olyankor.
A homogén egyenlet és megoldása:
Ha két valós megoldása van:
Ha egy valós megoldása van:
Ha két komplex megoldása van:
Partikuláris megoldás (próbafüggvény módszer)
Van itt ez az egyenlet, ami inhomogén.
Ilyenkor először megoldjuk a homogén egyenletet,
utána pedig próbafüggvény módszerrel megkeressük a partikuláris megoldást.
A homogén egyenlet megoldásához megoldjuk a szokásos
karakterisztikus egyenletet.
És most jöhet a partikuláris megoldás.
Ez a bizonyos partikuláris megoldás mindig a jobb oldalon lévő függvény alapján derül ki.
Ez a jobb oldali függvény most éppen egy polinom, így aztán a partikuláris megoldást is ilyen alakban keressük.
De lehetne a jobb oldali függvény exponenciális,
vagy éppen trigonometrikus.
A partikuláris megoldás
Lássuk mit kapunk, ha behelyettesítjük az eredeti egyenletbe:
És az általános megoldás:
Itt van aztán ez a másik inhomogén egyenlet.
Van azonban itt még egy kis bökkenő.
Ugyanúgy ahogyan az elsőrendű egyenleteknél, itt is lehet rezonancia.
A rezonancia akkor fordul elő, ha a homogén megoldás egyik tagja megegyezik a partikuláris megoldás egyik tagjával.
Most tehát nincs rezonancia,
de a következő képsorban lesz…
A másodrendű egyenleteknél ez a rezonancia kicsit komplikáltabb ügy, mint annak idején az elsőrendű egyenleteknél.
Van itt ez az egyenlet:
A homogén egyenlet megoldása:
És most jöhet a partikuláris megoldás.
Ezt mindig a jobb oldalon lévő függvény alapján találjuk ki.
A homogén megoldás egyik tagja most megegyezik a partikuláris megoldás egyik tagjával, így aztán sajna rezonancia van.
A konstans szorzó ilyenkor nem számít.
És a rezonancia miatt ide még bejön egy x.
Most kiszámoljuk a partikuláris megoldás első és második deriváltját.
Aztán ezeket behelyettesítjük az eredeti egyenletbe.
Amikor karakterisztikus egyenletnek csak egy valós megoldása van, olyankor kétszeres rezonancia is lehet.
Megjelent a rezonancia.
Így aztán a partikuláris megoldásban megint kelleni fog egy x-es szorzó.
Ám ekkor a második taggal lesz rezonancia…
így aztán kell még egy x-es szorzó.
Ezt hívjuk kettős rezonanciának.
A megoldás innentől a szokásos.
Szokásosan unalmas.
Ezért most ne oldjuk meg, hanem inkább nézzük meg milyen rezonancia lehet akkor, amikor a karakterisztikus egyenletnek két komplex gyöke van.
Van itt ez a két egyenlet:
A karakterisztikus egyenletek:
A komplex megoldáshoz annyit kell tudnunk, hogy
Ezekben az esetekben rezonancia olyankor fordul elő, ha
És ilyenkor a próbafüggvény:
HIPOTÉZISVIZSGÁLAT
Egy csokigyárban 100 grammos csokoládékat készítenek, 3 gramm szórással.
Álláspontjuk szerint a csokik valóban 100 grammosak, ám fölmerült a gyanú, hogy az valójában kicsit kevesebb és így a vásárlók panaszt tettek. Az ügy tisztázásának érdekében bírósághoz fordul az egyik vásárló, aki azzal vádolja a csokigyárat, hogy hamis adatokat tüntetnek föl a csomagoláson. A bíróság szakértőt rendel ki, aki 150 elemű mintát vesz a csokiból. A kérdés az, hogy egy ilyen minta hogyan hasznosítható a vitás helyzet tisztázására.
A becsléseknél már foglalkoztunk azzal a ténnyel, hogy az n elemű minták átlagai a tényleges sokasági átlag körül közel normális eloszlással helyezkednek el, még akkor is, ha az alapsokaság ugyan nem normális eloszlású, de a minta elemszáma viszonylag nagy.
A gondolatmenet a következő.
Tegyük föl, hogy a csokigyárnak igaza van és tényleg 100 gramm egy tábla csoki.
Ekkor az előbbiek miatt a 150 elemű minták átlagai a 100 gramm körül lényegében normális eloszlással helyezkednek el 100 gramm átlaggal és hát ugye a szórás
Ha a csoki valóban 100 gramm, akkor a minták 90%-a 100 gramm körüli kékkel jelölt részbe esik, és csak 10%-uk a sárgával jelölt részbe.
Mielőtt a vizsgálat eredménye megérkezne, a következő ajánlattal áll elő a csokigyárat perlő vásárló.
Ha a mintaátlag a kék részbe esik, nem kételkedik tovább és elfogadja, hogy a csokigyárnak igaza van. De ha a sárgával jelölt részbe esik, aminek az esélye, ha a csoki tényleg 100 grammos, csak 10%, nos akkor a csokigyárnak el kell ismernie, hogy meg-hamisította a csomagolást.
A csokigyár nem fogadja el az ajánlatot, mert abban az esetben, ha igaza van, akkor is 10%-os eséllyel mégis elítélik. Éppen ezért a következő módosítással áll elő.
Legyen a sárga rész csak 5%, a kék rész pedig 95%, így ha igazuk van és a csoki tényleg 100 gramm, csak 5% eséllyel büntetik őket igazságtalanul, ami már nem nagy rizikó.
Az alku végül nem jött össze, így a döntést a bíróságnak kell meghoznia.
Világos, hogy a döntés kétféle lehet, vagy elítélik a csokigyárat vagy nem. Az is világos, hogy a csokigyár vagy bűnös vagy nem. Végül pedig az ítélet vagy hibás vagy nem. A bíróság is úgy látja helyesnek, hogy ha a minta átlaga a sárga részbe esik, akkor elítéli, ha a kék részbe esik, akkor felmenti a csokigyárat. A kérdés a sárga rész arányának megválasztása. Az egyszerűség kedvéért hívjuk a kék részt elfogadási tartománynak a sárga részt pedig kritikus tartománynak.
Ha a sárga rész kicsi, mondjuk csak 1%, akkor minimális az esélye, hogy tévesen ítélik el, ugyanakkor magának az elítélésnek az esélye is minimális. Vagyis nagyonis megeshet, hogy tévesen mentik fel.
Ha a sárga rész nagy, mondjuk 15%, akkor nagy az esélye, éppen 15%, hogy elítélik annak ellenére, hogy ártatlan, ugyanakkor csökken – de nem tudni mekkora – annak az esélye, hogy tévesen felmentik.
Ha a csokigyárat elítélik, annak ellenére, hogy ártatlan, azt elsőfajú hibának nevezzük. Ennek valószínűsége a sárgával jelölt rész, vagyis a harang görbe kritikus tartományba eső részének nagysága. Ezt a valószínűséget hívjuk szignifikanciaszintnek és -val jelöljük.
Ha a csokigyárat felmentik, pedig bűnös, azt másodfajú hibának nevezzük. A másodfajú hiba nagysága azonban nem a kék rész. Ha a csoki tényleges tömege mondjuk csak 50 gramm, akkor a mintaátlagok valójában az 50 gramm körül helyezkednek el normális eloszlással. Felmentő ítélet akkor születik, ha a mintaátlag az eredetileg megállapított elfogadási tartományba esik, de ennek valószínűségét már az új eloszlás alapján állapítjuk meg, hiszen az mutatja a valós helyzetet. Ez a valószínűség a pirossal jelölt rész. A másodfajú hiba valószínűsége .
Sajnos azonban általában nem meghatározható, hiszen, ha a csoki tényleges tömege nem 50 gramm, hanem 70 gramm, akkor a piros rész aránya ugyanezen a szignifikanciaszinten más lesz. Ha a tényleges tömeg 90 gramm, akkor megint más.
Az elsőfajú hiba elkövetésének valószínűsége tehát megmondható, ezt hívjuk szignifikanciaszintnek, a másodfajú hiba valószínűségét viszont többnyire homály fedi. Érdemes látni, hogy és egymással ellentétes kapcsolatban van.
Ha a szignifikancia szint 1%, vagyis az elsőfajú hiba esélye nagyon kicsi, akkor a piros rész, vagyis a másodfajú hiba valószínűsége jó nagy.
Ha a szignifikanciaszint magasabb, mondjuk 5%, akkor az elsőfajú hiba esélye nagyobb, éppen 5%, de a másodfajú hiba elkövetésének valószínűsége kisebb lesz.
Ha a szignifikanciaszint magas, mondjuk 10%-os, akkor az elsőfajú hiba esélye még nagyobb, de a másodfajú hiba esélye még kisebb.
Éppen ezért a szignifikanciaszintet mindig úgy érdemes megválasztani, hogy mérlegeljük, az elsőfajú, vagy a másodfajú hiba elkövetése okoz-e nagyobb problémát. Ha az elsőfajú hibát szeretnénk jobban elkerülni, akkor a szignifikanciaszintet alacsonynak, míg ha a másodfajú hibát, akkor magasnak célszerű megválasztani.
Ezzel a hipotézisvizsgálat működésének elvét áttekintettük, már csak annyi dolgunk van, hogy mindezt kicsit formalizáljuk.
A hipotézisvizsgálat lépései
A sokaságokra vonatkozó különféle feltevéseket hipotéziseknek, ezen hipotézisek helyességének mintavételi eljárásokon alapuló vizsgálatát hipotézisvizsgálatoknak nevezzük. Ahogyan azt előző példánkban már láthattuk, egy hipotézisvizsgálat eredménye sohasem az, hogy az adott hipotézis igaz vagy nem igaz, mindössze annyi, hogy a hipotézis mennyire hihető egy adott mintavételi eljárás tükrében. A hihetőség megítélésére szolgáló eljárásokat statisztikai próbáknak nevezzük.
Minden hipotézisvizsgálat menete ugyanaz, a különböző próbák csupán technikai elemeikben térnek el egymástól. A csokigyár példájánál maradva nézzük végig a hipotézisvizsgálatok lépéseit.
Egy csokigyárban 100 grammos csokoládékat készítenek, a csokik tömege normális eloszlású valószínűségi változó 3 gramm szórással. A csokigyár azt állítja, hogy az csoki valóban 100 grammos, ám fölmerültek bizonyos kételyek a szavahihetőségükkel kapcsolatban. Előfordulhat ugyanis, hogy a csoki valójában kevesebb, mint 100 gramm, így egy 150 elemű minta alapján szeretnénk eldönteni a csokigyár állításának helyességét hipotézisvizsgálat segítségével.
ELSŐ LÉPÉS: A HIPOTÉZIS MEGFOGALMAZÁSA
Minden hipotézisvizsgálat két egymásnak ellentmondó felvetés felírásával kezdődik. Az egyiket nullhipotézisnek nevezzük és -al jelöljük, a másikat pedig ellenhipotézisnek és jele . A két hipotézis egyidejű felírására azért van szükség, mert az a hipotézisvizsgálat módja, hogy ezeket az állításokat versenyeztetjük egymással, és a kettő közül azt fogjuk igaznak tekinteni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál.
Példánkban a csokigyár által felállított nullhipotézis az, hogy a csoki tömege 100 gramm:
:
Az ellenhipotézis pedig az, hogy a csoki nem 100 gramm:
:
Egy hipotézist egyszerű hipotézisnek nevezünk, ha megvalósulása a sokaság eloszlását egyértelművé teszi. Példánkban az egyféleképpen megvalósuló egyszerű hipotézis, a végtelensokféleképpen megvalósuló pedig összetett hipotézis. Az összetett hipotézisek mindig egyszerű hipotézisek halmazaiként állnak elő.
A nullhipotézist és az ellenhipotézist úgy kell megfogalmaznunk, hogy egymásnak ellentmondjanak és együttesen az összes leh etőséget kimerítsék. Ez azt jelenti, hogy ha a nullhipotézis
:
akkor az ellenhipotézis
:
Ha azt a gyanúnkat akarjuk megfogalmazni, hogy a csoki 100 grammnál kevesebb, akkor ezt az ellenhipotézisben kell megtennünk, a nullhipotézisben ugyanis mindig szerepelnie kell egyenlőségnek is.
Az ellenhipotézisben fogalmazzuk meg tehát azon aggodalmunkat, hogy a csoki 100 grammnál kevesebb, vagyis : az ennek megfelelő nullhipotézis pedig az, hogy a csoki 100 gramm vagy annál több.
A megfelelő hipotézispár tehát ilyenkor
:
:
Ebben az esetben a nullhipotézis és az ellenhipotézis is összetett hipotézis.
Mivel a klasszikus hipotézisvizsgálat egyszerű nullhipotézisek használatát igényli, azokban az esetekben, amikor és is összetett, szükségünk van egy úgynevezett technikai nullhipotézisre, amit -vel jelölünk. Ha bal oldali vagy jobb oldali ellenhipotézis, akkor a -nek legkevésbé ellentmondó egyszerű hipotézist technikai nullhipotézisnek nevezzük. Ilyen esetekben ezt a technikai nullhipotézist használjuk a próba elvégzése során.
Nézzük meg ezeket a csokigyáras példánk segítségével.
Ha a nullhipotézis egyszerű hipotézis, akkor nincs szükség technikai nullhipotézisre.
:
:
Ha a nullhipotézis összetett hipotézis, akkor két esettel foglalkozunk:
Amikor bal oldali ellenhipotézis, a megfelelő hipotézispár
:
:
és a -nek legkevésbé ellentmondó
-beli hipotézis :
Amikor jobb oldali ellenhipotézis, a megfelelő hipotézispár
:
:
és a -nek legkevésbé ellentmondó
-beli hipotézis :
MÁSODIK LÉPÉS: A PRÓBAFÜGGVÉNY KIVÁLASZTÁSA
A próbafüggvény a mintaelemeknek egy olyan függvénye, amelynek eloszlása igazságát feltételezve pontosan ismert, így egy konkrét minta alapján lehetővé teszi a hipotézis helyességének ellenőrzését. Kiválasztása magától a hipotézistől, illetve a mintavétel módjától függ. Léteznek a sokasági átlaggal, a sokasági szórással, a sokaság eloszlásával és még rengeteg más tulajdonságával kapcsolatos hipotézisekhez tartozó próbafüggvények. Ezekkel részletesen majd később foglalkozunk.
Most térjünk rá konkrét példánk vizsgálatára. A csokik tömege normális eloszlású, =3 gramm szórással, a minta elemszáma pedig n=150. Nos ilyenkor a mintaátlagok szintén normális eloszlásúak, átlaguk megegyezik a sokasági átlaggal, szórásuk pedig
Ezt a centrális határeloszlás tételek alapján tudjuk, de ha az elnevezés nagyon rémisztő, akkor egyszerűen csak tudjuk és kész.
Ha a nullhipotézis igazságát feltételezzük, vagyis úgy gondoljuk, hogy a csoki tömege , akkor az n=150 elemű minták átlagai olyan normális eloszlás szerint helyezkednek el, amelynek átlaga 100 és szórása 0,245. Ez lesz a próbafüggvény.
:
:
Amikor bal oldali ellenhipotézis,
a megfelelő hipotézispár
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis
ugyanaz marad.
Amikor jobb oldali ellenhipotézis,
a megfelelő hipotézispár
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis
ugyanaz marad.
HARMADIK LÉPÉS: SZIGNIFIKANCIASZINT ÉS KRITIKUS TARTOMÁNY
Most, hogy felállítottuk a nullhipotézist és megvan a hozzá tartozó próbafüggvény, magának a hipotézisvizsgálatnak az elvégzése nagyon egyszerű.
A próbafüggvény értéktartományát alkalmas osztópontokkal két diszjunkt tartományra, az elfogadási és a kritikus tartományra osztjuk. Ha eredményünk majd az elfogadási tartományba fog esni, akkor ezt a tényt a nullhipotézist igazoló jelnek fogjuk tekinteni, ha pedig a kritikus tartományba, akkor a nullhipotézist elvetjük. Az elfogadási tartomány határait úgy választjuk meg, hogy a nullhipotézis fennállása esetén a próbafüggvény előre megadott nagy valószínűséggel ebbe a tartományba essen. Ezt az előre megadott nagy valószínűséget -val jelöljük.
Az elfogadási tartományba esés valószínűsége tehát igen magas , míg a kritikus tartományba esés valószínűsége . Ezt az alacsony valószínűséget szignifikancia szintnek nevezzük. Jellemzően legtöbbször használt értékei 0,01 vagy 0,05 vagy 0,1 amit százalékban szokás megadni, tehát 1% vagy 5% vagy 10%.
Az elfogadási és a kritikus tartomány határán helyezkednek el az úgynevezett kritikus értékek. A kritikus értékeket megegyezés szerint mindig a kritikus tartományba soroljuk.
Ábráinkon a próbafüggvényt a normális eloszlás jellegzetes függvényével szimbolizáljuk, de másfajta próbafüggvények is léteznek.
Ha a nullhipotézistől mindkét
irányban történő eltérés a
hipotézis helytelenségét jelenti,
akkor a kritikus tartomány
kétoldali. Ilyenkor a túl kicsi vagy
a túl nagy értékek egyaránt
a nullhipotézis helytelenségét
jelentik. Kétoldali kritikus
tartomány esetén két kritikus
érték is van, egy alsó és egy
felső kritikus érték.
Ezeket és jelöli
Bal vagy jobb oldali, tehát egyoldali kritikus tartományra olyan esetekben van szükség, amikor a nullhipotézis helytelenségét vagy a kiugróan magas vagy a kiugróan alacsony értékek jelzik.
Bal oldali kritikus tartomány
Esetén a kritikus érték és
jobb oldali az elfogadási
tartomány.
Jobb oldali kritikus tartomány
esetén pedig a kritikus érték
és ilyenkor bal oldali az
elfogadási tartomány.
Nézzük meg az elfogadási és a kritikus tartományokat a csokigyárról szóló példánkban. Legyen a szignifikancia szint mondjuk 5%.
Ekkor tehát .
Ha nullhipotézisünk az, hogy csoki valóban 100 gramm és ezt azzal a hipotézissel versenyeztetjük, hogy a csoki nem 100 gramm, akkor hipotézisünk helytelenségét jelentik a kiugróan alacsony, de a kiugróan magas értékek is. Ilyenkor kétoldali kritikus tartomány lesz két kritikus értékkel.
:
:
A kritikus értékeket általában
majd táblázatokból kell kikeresnünk,
most ezek és .
Ha azt a gyanúnkat akarjuk megfogalmazni, hogy a csoki 100 grammosnál kisebb, akkor ezt az ellenhipotézisben kell megtennünk, a nullhipotézisben ugyanis mindig szerepelnie kell egyenlőségnek is. Az, hogy a csoki 100 grammnál kisebb tehát egy bal oldali ellenhipotézis, a hozzá tartozó nullhipotézis pedig az, hogy a csoki legalább 100 gramm. Ilyenkor egyoldali, mégpedig bal oldali kritikus tartományunk lesz.
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis ugyanaz marad.
Most csak bal oldali kritikus
érték lesz .
Ha azt akarjuk megfogalmazni, hogy a csoki több mint 100 gramm, ezt is csak az ellenhipotézisbe csomagolva tehetjük meg. A nullhipotézis ekkor az, hogy a csoki nem több, mint 100 gramm, az ellenhipotézis pedig az, hogy több, mint 100 gramm, és egyoldali, mégpedig jobb o ldali kritikus tartományunk lesz.
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis ugyanaz marad.
Most csak jobb oldali kritikus
érték lesz .
NEGYEDIK LÉPÉS: MINTAVÉTEL ÉS DÖNTÉS
Világos, hogy maga a mintavétel csak az elfogadási és kritikus tartomány meghatározása után történhet. Ha ugyanis ezek határait akkor jelölnénk ki, amikor már megvan a minta eredménye, könnyen kísértésbe eshetünk, hogy a határokat úgy húzzuk meg, hogy a nekünk tetsző hipotézis kerüljön ki győztesként.
A mintavétel eredményének ismeretében a hipotézisről való döntés gondolatmenete mindig ugyanaz.
Ha a mintavétellel kapott eredményünk szerint a próbafüggvény az elfogadási tartományba esik, akkor a nullhipotézist tekintjük igaznak, a ellenhipotézist pedig elvetjük.
Ha viszont a próbafüggvény a minta alapján a kritikus tartományba esik, akkor a nullhipotézist vetjük el és a ellenhipotézist tekintjük igaznak.
A gondolatmenet lényege a következő. Ha feltesszük, hogy a nullhipotézis igaz, akkor a próbafüggvény csak nagyon kis valószínűséggel kerül a kritikus tartományba, vagyis csak nagyon kis valószínűséggel eshet meg az, hogy a hipotézis igaz, de azt mégis elvetjük. Ezt a kis valószínűséget hívjuk egyébként szignifikancia szintnek.
Ha tehát a próba elvégzése során a próbafüggvény mégis a kritikus tartományba esik, akkor kételkedni kezdünk a nullhipotézisben, és az ellenhipotézist tekintjük helyesnek.
Természetesen ezek csak feltevések, tehát bárhogy döntünk is, előfordulhat, hogy hibát követünk el. Hibát követünk el akkor is, ha a nullhipotézis helyes, ám a próbafüggvény mégis a kritikus tartományba esik, így elvetjük. És hibát követünk el akkor is, ha a nullhipotézis nem helyes, de a próbafüggvény mégis az elfogadási tartományba esik, ezért elfogadjuk. A kétféle hiba természetének megértéséhez térjünk vissza a csokigyár példájához.
Legyen a nullhipotézis az, hogy a csoki tömege 100 gramm, az ezzel versenyző ellenhipotézis pedig az, hogy a csoki nem 100 gramm, tehát vagy több vagy kevesebb.
:
:
A szignifikancia szint
Ha a nullhipotézis igaz, vagyis a csoki tömege tényleg 100 gramm, akkor a minták átlagai olyan normális eloszlás szerint helyezkednek el, aminek átlaga 100 és szórása
ahol ez a sokasági szórás, n=150 ez a minta elemszáma.
Ha a nullhipotézis igaz, akkor a mintaátlagok tényleg ezen eloszlás szerint helyezkednek el, vagyis tényleg eséllyel esnek a kék részbe és eséllyel a sárgába.
Ha a mintaátlag a kék részbe vagyis az elfogadási tartományba esik, akkor a nullhipotézist elfogadjuk, és mivel az igaz, döntésünk helyes.
Ha a mintaátlag a sárga részbe, vagyis a kritikus tartományba esik akkor a nullhipotézist nem fogadjuk el, de mivel az igaz, ezzel hibát követünk el. Ezt a hibát nevezzük elsőfajú hibának.
Az elsőfajú hibát tehát akkor követjük el, ha a nullhipotézis igaz, de tragikus véletlen folytán a próbafüggvény mégis a kritikus tartományba esik és ezért elvetjük. Ennek valószínűsége jól láthatóan a sárgával jelzett rész vagyis éppen , tehát a szignifikancia szin t.
Most térjünk rá arra, hogy mi van abban az esetben, amikor a nullhipotézis nem igaz.
Az csoki tömege tehát nem 100 gramm, hanem 80 gramm vagy 110 gramm vagy bármennyi. Legyen mondjuk a tényleges tömeg 50 gramm. Ebben az esetben a mintaátlagok eloszlása ugyanúgy normális eloszlású csak éppen nem a 100 körül, hanem az 50 körül.
A mintaátlagok tényleges eloszlását tehát ez az utóbbi görbe adja meg. Annak valószínűségét, hogy olyan mintánk lesz, ami a kék részbe, vagyis az elfogadási tartományba esik, szintén ez az új függvény adja meg. Ezt ábránkon pirossal jelöljük. A pirossal jelölt rész tehát az, amikor nem vetjük el a nullhipotézist, mert az elfogadási tartományba esik, de valójában az hamis. Ezzel szintén hibát követünk el. Ezt a hibát nevezzük másodfajú hibának. A másodfajú hiba elkövetésének valószínűsége .
Míg az elsőfajú hiba elkövetésének valószínűsége ismert, hiszen ez éppen a szignifikanciaszint, addig a másodfajú hiba valószínűségét általában homály fedi. Ez ugyanis a tényleges helyzettől függ, amit sajnálatosan nem ismerünk. Ha a tényleges tömeg ugyanis nem 50 gramm, hanem mondjuk 60 gramm, akkor a tényleges eloszlás jobbra tolódik, megnövelve ezáltal a piros rész, így a másodfajú hiba elkövetésének valószínűségét.
Az elsőfajú hiba elkövetésének valószínűsége és a másodfajú hiba valószínűsége egymással ellentétes.
Ha a szignifikanciaszintet, vagyis -t csökkentjük, ezáltal a vagyis a másodfajú hiba valószínűsége megnő. Alacsony szignifikanciaszint mellett tehát olyan hipotéziseket érdemes vizsgálni, ahol a kétféle hibázási lehetőség közül az elsőfajú hiba elkövetésének esélyét szeretnénk kisebbnek tudni. Ez olyan esetekben kívánatos, amikor a hipotézis téves elvetése nagyobb károkat okoz, mint esetleges hibás megtartása.
Ha a szignifikancia szintet növeljük, ezáltal nő az elsőfajú hiba valószínűsége, viszont ezzel együtt csökken a másodfajú hiba valószínűsége. Magas szignifikancia szintet tehát akkor érdemes használni, hogyha a másodfajú hiba esélyét szeretnénk csökkenteni, még azon az áron is, hogy esetlegesen elvetjük a nullhipotézist, pedig az helyes.
Magának a hipotézisvizsgálatnak a menete minden esetben ugyanezekből a lépésekből fog állni, a különböző próbák csupán technikai elemeikben térnek majd el egymástól. Ezek közül a próbák közül nézzük meg most a legfontosabbakat.
A próbák áttekintése
A statisztikai próbákat két nagy típusba sorolhatjuk. Vannak az úgynevezett paraméteres próbák, amik egy sokaság – esetleg több sokaság – valamilyen paraméterével kapcsolatos hipotézissel foglalkoznak. Ilyen paraméter tipikusan az átlag a szórás és az arány, de természetesen bármilyen más paramétert is vizsgálhatunk. A másik nagy csoport a nemparaméteres próbák, amik a sokaság eloszlására, vagy a sokaságon belüli ismérvek eloszlásának egyezőségére, esetleg azok függetlenségére irányuló hipotézisekkel kapcsolatos próbák.
A paraméteres és a nemparaméteres próbákon belül megkülönböztetünk egy mintás, két mintás és több mintás próbákat.
Minta
Paraméteres
próbák
Nemparaméteres
próbák
Átlag
Arány
Szórás
Eloszlás
NAGY MINTA, BÁRMILYEN ELOSZLÁSÚ SOKASÁGRA
Függetlenség
Egy
mintás
Aszimptotikus
Z-próba
Z-próba
Illeszkedés-
vizsgálat:
-próba
Függetlenség-
vizsgálat:
CSAK NORMÁ-LIS ELOSZLÁSÚ SOKASÁGRA
-próba
Z-próba
t-próba
-próba
NAGY MINTA, BÁRMILYEN ELOSZLÁSÚ SOKASÁGRA
Két
mintás
Aszimptotikus
Z-próba
Z-próba
Homogenitás-
vizsgálat:
-próba
Z-próba
t-próba
F-próba
CSAK NORMÁ-LIS ELOSZLÁSÚ SOKASÁGRA
Több
mintás
Variancia-
analízis
Bartlett
Sokasági átlagra vonatkozó hipotézis, Z-próba
Egy fagyiárus 150 grammos gombócokban árulja a fagyit, ami normális eloszlású, 5 gramm szórással. A vásárlók többségének fogalma sincs róla, hogy mi az a normális eloszlás, abban viszont szinte biztosak, hogy a fagyis az utóbbi időben kisebb gombócokat ad.
Ellenőrizzük a hipotézist 5%-os szignifikanciaszinten egy 60 elemű minta alapján, ahol a gombócok átlagosan 149 grammosak voltak.
A hipotézis egy sokaság paraméterére, az átlagra vonatkozik. A sokaság normális eloszlású, szórása ismert. Az ilyen esetekben Z-próbát használunk.
Z-próba: A sokaság normális eloszlású, szórása , a sokaság átlagára
vonatkozik, a minta elemszáma n.
Kritikus értékek szignifikanciaszint esetén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDA LI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ha azt a vásárlói panaszt akarjuk megfogalmazni, hogy a gombócok 150 grammnál kisebbek, akkor ezt csak az ellenhipotézisbe csomagolva tehetjük meg, mivel a hipotézisvizsgálat úgy működik, hogy a nullhipotézisnek mindenképpen tartalmaznia kell az egyenlőséget is. A nullhipotézis tehát
: és az ellenhipotézis lesz a panasznak megfelelő állítás, hogy : , a technikai nullhipotézis pedig : . Ilyenkor csak bal oldali kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk. Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni. Ha nem így tennénk, könnyen előfordulhatna, hogy addig-addig változtatunk a nullhipotézisen, míg végül elfogadjuk vagy – vagy ha az áll érdekünkben, elvetjük.
Sokasági átlagra vonatkozó hipotézis, t-próba
Egy városban naponta átlag 12-en haláloznak el különböző légúti megbetegedésekben, számuk normális eloszlású. A város mellett épült szemétégető szerint ez a szám a baleset óta nem emelkedett.
Ellenőrizzük a hipotézist 5%-os szignifikanciaszinten, ha öt véletlenül választott nap légúti megbetegedésekben elhalálozottak száma 10, 13, 19, 11, 8.
A hipotézis egy sokaság paraméterére, az átlagra vonatkozik. A sokaság normális eloszlású, szórása nem ismert. Az ilyen esetekben t-próbát használunk.
t-próba: A sokaság normális eloszlású, szórása nem ismert, a sokaság
átlagára vonatkozik, a minta elemszáma n.
Kritikus értékek szignifikanciaszint esetén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDA LI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
A szórás
ami az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ha az ellenhipotézisben azt az aggodalmunkat akarjuk megfogalmazni, hogy nőtt az elhalálozottak száma, akkor
: nullhipotézis esetén az ellenhipotézis : , a technikai nullhipotézis pedig : . Ilyenkor csak jobb oldali kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
Sokasági átlagra vonatkozó hipotézis,
aszimptotikus Z-próba
Egy koporsókészítő arra lett figyelmes, hogy az utóbbi időben több faanyagot kell használnia koporsóihoz, kliensei túlsúlyának következtében. Mielőtt azonban emiatt árat emelne, meg akar győződni róla, hogy a korábban 75 kg-os átlag valóban megváltozott-e. Készít hát egy 100 elemből álló felmérést, aminek átlaga 76 kg, szórása pedig 12 kg.
Nullhipotézisnek azt választva, hogy az elhalálozottak 75 kilónál nem kövérebbek, mi mondható 5%-os szignifikanciaszinten?
A hipotézis egy sokaság paraméterére, az átlagra vonatkozik. A sokaság tetszőleges eloszlású, szórása nem ismert. Az ilyen esetekben Aszimptotikus Z-próbát használunk.
Aszimptotikus Z-próba: A sokaság tetszőleges eloszlású, szórása nem ismert, a sokaság átlagára vonatkozik, a minta n elemű, elemszáma nagy.
Kritikus értékek szignifikanciaszint esetén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
Ha a nullhipotézis : , akkor az ellenhipotézis : , a technikai
nullhipotézis pedig : . Ilyenkor csak jobb oldali kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján és
ami az elfogadási tartományba esik.
A : nullhipotézis tehát igaznak bizonyul, a hipotézist alacsony
szignifikanciaszinten elfogadjuk, az ellenhipotézist pedig elvetjük.
Nem állítható tehát a minta alapján megalapozottan, hogy a koporsókészítő kliensei kövérebbek lennének.
Ha a nullhipotézis : , akkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján és
ami az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
Sokasági arányra vonatkozó hipotézis, Z-próba
Egy légitársaság a túlsúlyos utasok pótdíjfizetését tervezi bevezetni.
Más légitársaságoknál ugyanis az derült ki, hogy a légi utasok 60%-a 90kg feletti. Akkor érdemes a pótdíjfizetéssel bajlódni, ha ez az arány náluk is legalább 60%.
Vizsgáljuk meg a hipotézist 5%-os szignifikanciaszinten.
A vizsgálathoz egy véletlenszerűen választott járat 150 utasának adatai alapján végezzük, ahol ez az arány 52%.
A hipotézis egy sokaság paraméterére, egy arányra vonatkozik. A sokaság tetszőleges eloszlású. Az ilyen esetekben Z-próbát használunk.
Z-próba: A sokaság tetszőleges eloszlású, egy sokasági arányra vonatkozik, a minta n elemű, elemszáma nagy.
Kritikus értékek szignifikanciaszint es etén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDA LI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami nem az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elvetjük.
Ha a nullhipotézis az, hogy a túlsúlyosok aránya 60% feletti, akkor
: az ellenhipotézis : , a technikai nullhipotézis pedig : . Ilyenkor csak bal oldali kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományon kívül esik.
A hipotézist alacsony szignifikanciaszinten elvetjük.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
Sokasági varianciára vonatkozó hipotézis, -próba
Egy gyógyszergyárban rendszeresen ellenőrzik, hogy a tablettákba kerülő 500 mg hatóanyag szórása a megengedett 6 mg-tól eltér-e. A hatóanyag mennyisége normális eloszlásnak tekinthető.
Egyik nap az öt megvizsgált tabletta hatóanyagtartalma 490, 501, 507, 496, 502.
10%-os szignifikanciaszinten megegyezik-e a szórás a megengedett 6 mg-mal?
A hipotézis egy sokaság paraméterére, a szórásra vonatkozik. A sokaság normális eloszlású. Az ilyen esetekben -próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
Ha a nullhipotézis akkor : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=5 így a szabadságfok v=n-1=4.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
-eloszlás
0,05
0,95
szabadság-
fok=v
4
0,71
9,49
A minta alapján
Ami az elfogadási tartományba esik, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
Ha a nullhipotézis az, hogy a szórás legfeljebb 6 mg akkor a ellenhipotézis: és ilyenkor jobb oldali kritikus tartományunk lesz.
A minta elemszáma n=5 így a szabadságfok v=n-1=4.
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
-eloszlás
0,9
szabadság-
fok=v
4
7,78
A minta alapján
ami az elfogadási tartományba esik, a hipotézist tehát elfogadjuk.
Illeszkedésvizsgálat, -próba
A statisztika vizsgán maximum 100 pont érhető el. Az egyik vizsgán 80 hallgató vett részt, eredményeik:
pontszám
0-20
12
21-40
16
41-60
25
61-80
18
81-100
9
10%-os szignifikanciaszinten tekinthető-e a vizsgázók pontszáma egyenletes eloszlásúnak? Tekinthető-e normális eloszlásúnak?
A hipotézis a sokaság eloszlására vonatkozik. Az eljárást illeszkedésvizsgálatnak nevezzük és -próbát használunk.
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Ha a nullhipotézis az, hogy az elért pontszám egyenletes eloszlású, akkor minden osztályközben ugyanakkora a valószínűség. Mivel pedig öt osztályköz van, .
pontszám
Egyenletes eloszlást
feltételezve
0-20
12
0,2
21-40
16
0,2
41-60
25
0,2
61-80
18
0,2
81-100
9
0,2
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most nem határoztunk meg a mintából semmilyen paramétert, így . Ekkor
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A jobb oldali kritikus érték
A minta alapján
Ez nagyobb, mint a jobb oldali kritikus érték, tehát a nullhipotézist elvetjük. 10%-os szignifikanciaszinten nem állíthatjuk, hogy a pontszámok eloszlása egyenletes.
Lássuk, lehet-e normális eloszlású!
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Most válasszuk a felső határokat.
Pontszám
0-20
12
-1,19
0,1151
21-40
16
-0,37
0,3632
41-60
25
0,453
0,6736
61-80
18
1,27
0,8944
81-100
9
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályközig az összeshez tartoznak. Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
A 21-40 osztályköznél tehát
A 41-60 osztályköznél tehát
pontszám
Normális eloszlást
feltételezve
0-20
12
-1,19
0,1151
0,1151
21-40
16
-0,37
0,3632
0,2481
41-60
25
0,453
0,6736
0,3104
61-80
18
1,27
0,8944
0,2208
81-100
9
0,1056
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez kisebb, mint a kritikus érték, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
Függetlenségvizsgálat, -próba
Vizsgáljuk meg, hogy van-e szignifikáns kapcsolat egy ország lakosainak jövedelmi viszonyai és bevándorló-ellenessége között az alábbi felmérés alapján:
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
18
35
37
90
közepes
32
48
30
110
magas
18
20
12
50
összesen
68
103
79
250
Szignifikanciaszint legyen 10%-os.
A hipotézis a sokaságon belül két ismérv függetlenségének vizsgálatára irányuló vizsgálat. Az eljárást függetlenségvizsgálatnak nevezzük és -próbát használunk.
FÜGGETLENSÉGVIZSGÁLAT, -próba: A sokaságon belül két ismérv függetlenségére irányuló vizsgálat. : a két ismérv független, az ellenhipotézis pedig, : a két ismérv közti kapcsolat sztochasztikus vagy függvényszerű.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n, a minta alapján készített kontingencia tábla sorainak száma r, oszlopainak száma c.
Ahol a szabadságfok .
A kontingencia tábla sorainak száma r=3 ( az összesen sor nyilvánvalóan nem számít ) oszlopainak száma pedig c=3, így a szabadságfok
A jobb oldali kritikus érték
Az ügymenet megkönnyítése érdekében készítünk egy -os táblázatot.
Ez pontosan úgy készül, mint ahogyan az asszociációs kapcsolat vizsgálatakor, vagyis
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
24,48
36,72
28,44
90
közepes
29,92
45,32
34,76
110
magas
13,6
20,6
15,8
50
összesen
68
103
79
250
A kapott érték nagyobb a kritikus értéknél, így a nullhipotézist elvetjük.
10%-os szignifikanciaszinten tehát nem független a jövedelem és a bevándorlókról való vélekedés.
Nézzük meg, hogy ekkor vajon szignifikánsan eltér-e a bevándorlókról való vélekedés az alacsony és a magas jövedelműek körében. Ehhez két sokaságban valamely változó eloszlásának egyezőségét kell megvizsgálnunk, amit homogenitásvizsgálatnak nevezünk.
Ez jön most.
Homogenitásvizsgálat, -próba
Vizsgáljuk meg, hogy szignifikánsan eltér-e a bevándorlókról való vélekedés az alacsony és a magas jövedelműek körében. Ehhez két sokaságban valamely változó eloszlásának egyezőségét kell megvizsgálnunk, amit homogenitásvizsgálatnak nevezünk.
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
17
35
38
90
közepes
33
48
29
110
magas
18
20
12
50
összesen
68
103
79
250
Ebben az esetben két eloszlás egyezőségét kell vizsgálnunk. Maguknak az eloszlásoknak a típusáról itt tehát nem állítunk semmit, kizárólag azt vizsgáljuk, hogy egyezőek-e vagy sem. A nullhipotézis mindig az lesz, hogy a két eloszlás azonos, míg a ellenhipotézis az, hogy a két eloszlás nem azonos.
HOMOGENITÁSVIZSGÁLAT, -próba: Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. : a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, : a két eloszlás nem egyező.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. Mintát ezúttal mindkét sokaságból veszünk, az X sokaságból vett minta elemszáma az Y sokaságból vett mintáé mindkét mintában az osztályközök száma k.
Ahol a szabadságfok .
Az alacsony és a magas jövedelműeknél is három osztályközünk van, így k=3 a szabadságfok pedig v=k-1=2.
A jobb oldali kritikus érték
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
17
35
38
90
közepes
33
48
29
110
magas
18
20
12
50
összesen
68
103
79
250
A próbafüggvény
6,76
A kapott érték a kritikus értéknél nagyobb, a két eloszlás, és így a két jövedelmi osztály bevándorlókról való vélekedés a minta alapján szignifikánsan különböző.
Két sokaság átlagának eltérésére vonatkozó hipotézis, Z-próba
Ásványvizeket előállító cég a már meglévő mellett új kutat tervez megnyitni. Ismert, hogy a víz ásványianyag-tartalma normális eloszlású, a régi kút esetében 12 mg, míg az új, valamivel mélyebb kút esetében 7 mg szórással.
A régi kútból származó 10 elemű független egy literes minta átlagosan 678 mg ásványianyagot tartalmaz, az új kútból vett 10 elemű független minta pedig átlagosan 689 mg-ot. Vizsgáljuk meg, hogy szignifikánsan megegyezik-e a két kútból származó víz átlagos ásványianyag-tartalma. A szignifikanciaszint legyen 5%.
A két sokaságból egymástól függetlenül vett két minta alapján szeretnénk ellenőrizni a : hipotézist, ahol tetszőleges, de előre megadott érték. Ha a nullhipotézis az, hogy a két átlag megegyezik, akkor ez a érték nulla.
A nullhipotézis helyességét ezúttal is más-más próbafüggvénnyel vizsgáljuk attól függően, hogy mit tudunk a két sokaságról.
Ha mindkét sokaság normális eloszlású, és mindkét sokaság szórása ismert, akkor kétmintás Z-próbát használunk.
Ha mindkét sokaság normális eloszlású, szórásaik nem ismertek, de annyit tudunk róluk, hogy megegyeznek, akkor kétmintás t-próbát használunk.
itt s=a két sokaság becsült szórása, amit egyformának tekintünk,
Ha a két sokaságról csak annyit tudunk, hogy mindkettő szórása véges, és mindkét minta elemszáma elég nagy, akkor kétmintás aszimptotikus Z-próbát használunk.
Most mindkét sokaság normális eloszlású és ismerjük mindkét sokaság szórását, ezért kétmintás Z-próbát használunk.
Kétmintás Z-próba: Mindkét sokaság normális eloszlású, szórásaik ismertek, és .
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és .
A nullhipotézis az, hogy a két kútból származó víz átlagos ásványianyag-tartalma megegyezik. : ekkor az ellenhipotézis :
Kétoldali kritikus tartomány és két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományon kívül esik, a két forrásból származó víz ásványianyag-tartalma tehát szignifikánsan eltér.
Két sokaság átlagának eltérésére vonatkozó hipotézis, t-próba
Egy üzemben több gépen töltenek 75 ml-es tubusokba fogkrémet, a tubusokba töltött fogkrém mennyisége normális eloszlású, a gépek szórása feltehetően egyforma.
Ellenőrizzük 10%-os szignifikanciaszinten, hogy az átlagosan a tubusokba töltött fogkrém mennyisége is egyforma, ha a két gépről az alábbi 12 elemű minták állnak rendelkezésre:
Egyik gép
76
71
75
74
76
76
74
75
77
75
75
75
Másik gép
75
75
74
77
73
73
76
77
76
73
75
74
A két sokaságból egymástól függetlenül vett két minta alapján szeretnénk ellenőrizni a : hipotézist, ahol tetszőleges, de előre megadott érték. Ha a nullhipotézis az, hogy a két átlag megegyezik, akkor ez a érték nulla.
A nullhipotézis helyességét ezúttal is más-más próbafüggvénnyel vizsgáljuk attól függően, hogy mit tudunk a két sokaságról.
Ha mindkét sokaság normális eloszlású, és mindkét sokaság szórása ismert, akkor kétmintás Z-próbát használunk.
Ha mindkét sokaság normális eloszlású, szórásaik nem ismertek, de annyit tudunk róluk, hogy megegyeznek, akkor kétmintás t-próbát használunk.
itt s=a két sokaság becsült szórása, amit egyformának tekintünk,
Ha a két sokaságról csak annyit tudunk, hogy mindkettő szórása véges, és mindkét minta elemszáma elég nagy, akkor kétmintás aszimptotikus Z-próbát használunk.
Kétmintás t-próba: A két sokaság normális eloszlású és szórásaik egyformák.
itt
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és , a szabadságfok
most
A nullhipotézis az, hogy a két gépen a tubusokba töltött fogkrém átlaga megegyezik
: és : . Ekkor két kritikus érték lesz:
A szabadságfok =12+12-2=22
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományba esik, az átlagok egyezését 10%-os szignifikanciaszinten elfogadjuk.
Két sokaság átlagának eltérésére vonatkozó hipotézis, aszimptotikus Z-próba
Az ÖBB vasúttársaság vonalain közlekedő nappali és Euronight vonatok közlekedésének paramétereit hasonlították össze. Állapítsuk meg a megvizsgált 400 járat alapján, van-e szignifikáns eltérés a kétféle vonattípus 500 kilométerre eső átlagos késése között. Megalapozott-e az az állítás 5%-os szignifikanciaszinten, hogy az Euronight vonatok 500 kilométeren átlagosan 15 perccel többet késnek?
Késés, perc
(500 km távolságon)
Nappali
Euronight
0-15
220
50
16-30
25
64
31-45
4
24
46-60
1
12
össz
250
150
A két sokaságból egymástól függetlenül vett két minta alapján szeretnénk ellenőrizni a : hipotézist, ahol tetszőleges, de előre megadott érték. Ha a nullhipotézis az, hogy a két átlag megegyezik, akkor ez a érték nulla.
A nullhipotézis helyességét ezúttal is más-más próbafüggvénnyel vizsgáljuk attól függően, hogy mit tudunk a két sokaságról.
Ha mindkét sokaság normális eloszlású, és mindkét sokaság szórása ismert, akkor kétmintás Z-próbát használunk.
Ha mindkét sokaság normális eloszlású, szórásaik nem ismertek, de annyit tudunk róluk, hogy megegyeznek, akkor kétmintás t-próbát használunk.
itt s=a két sokaság becsült szórása, amit egyformának tekintünk,
Ha a két sokaságról csak annyit tudunk, hogy mindkettő szórása véges, és mindkét minta elemszáma elég nagy, akkor kétmintás aszimptotikus Z-próbát használunk.
Az két sokaság eloszlásáról és azok szórásairól nem tudunk semmit, ezért kétmintás aszimptotikus Z-próbát használunk.
Kétmintás aszimptotikus Z-próba: A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és .
Ha a nullhipotézis az, hogy az Euronight vonatok 15 perccel többet késnek, : akkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományon kívül esik, a hipotézist tehát 5%-os szignifikanciaszinten elvetjük.
Ha a nullhipotézisben azt fogalmazzuk meg, hogy az Euronight vonatok legalább 10 perccel többet késnek, : akkor egyoldali kritikus tartományunk lesz.
A technikai nullhipotézis: :
BAL OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
Ez igencsak a kritikus tartományba esik, így a hipotézist elfogadjuk.
Két sokaság arányának eltérésére vonatkozó hipotézis, Z-próba
Egy párt népszerűségét két közvéleménykutató is felmérte. Az egyik 32%-os, a másik 36%-os támogatottságot mért, mindkettő 500 fős felmérés alapján.
Szignifikánsan eltérnek-e az eredmények? A szignifikanciaszint legyen 5%.
Kétmintás Z-próba: Két sokaság sokasági arányának összehasonlítására irányuló próba.
speciális esetben
ahol és a minták elemszáma.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
Abban az esetben, ha a próbafüggvényt célszerű alkalmazni, itt
és
A nullhipotézis legyen az, hogy a két felmérés eredménye megegyezik.
: ekkor az ellenhipotézis :
Kétoldali kritikus tartomány és két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értékét a szemléltetés kedvéért mindkét módon kiszámoljuk.
A kimondottan erre az esetre használatos próbafüggvényt nézzük meg először.
ekkor
Ez az elfogadási tartományba esik, a két közvéleménykutató eredménye tehát nem tér el szignifikánsan egymástól.
Ha a másik próbafüggvényt használjuk,
Ami látszik, hogy picit nagyobb értéket ad, de most még ez is bőven az elfogadási tartományba esik.
Két sokaság szórásának eltérésére vonatkozó hipotézis, F-próba
Egy gazdaságban kétféle paradicsomot termesztenek, mindkettő átmérője lényegében normális eloszlású. A génmódosított paradicsom átmérőjének szórása egy 10 elemű minta alapján 5 milliméter, míg a hagyományos paradicsom esetében egy 8 elemű minta alapján ez 12 milliméter.
Szignifikánsan eltérnek-e a szórások, ha a szignifikanciaszint 10%?
F-próba: Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis :
az F-eloszlás két szabadságfoka és , ahol és a két minta elemszáma. Célszerű 1-es sokaságnak mindig a nagyobb szórással rendelkezőt nevezni.
A kritikus értékek az összefüggés alapján:
BAL OLDALI KRITIKUS TARTOMÁNY ESETÉN:
KÉTOLDALI KRITIKUS TARTOMÁNY ESETÉN: ÉS
JOBB OLDALI KRITIKUS TARTOMÁNY ESETÉN:
Az 1-es sokaság legyen a nagyobb szórással rendelkező hagyományos paradicsom. Ekkor
így
így
A nullhipotézis : vagyis kétoldali kritikus tartományunk és így két kritikus értékünk lesz, amiket az F-eloszlás táblázatából keresünk ki.
A szignifikanciaszint , ekkor a k
és
A minta alapján
Ez az elfogadási tartományon kívül esik, a génmódosított paradicsom szórása így szignifikánsan eltér a hagyományos paradicsom szórásától.
Varianciaanalízis
Nevével ellentétben ez a próba több sokaság várható értékének összehasonlítására vonatkozó próba. A nullhipotézis: , míg az ellenhipotézis az, hogy van olyan amire .
Például a naponta átlagosan TV-nézéssel töltött időt szeretnénk összehasonlítani a különböző iskolai végzettségűek körében, vagyis arra vagyunk kíváncsiak, hogy az iskolai végzettség hatással van-e a TV előtt töltött időre. A vizsgált részsokaságok a 8 általánost végzettek, a középfokú végzettségűek, és az egyetemi végzettségűek. A minta a következő:
Iskolai
végzettség
TV-nézéssel töltött
idő naponta (perc)
elemszám
8 általános
65; 43; 87; 105; 109; 56;
130; 88; 68; 70; 95
11
középfokú
48; 68; 72; 55; 43; 92;
87; 93; 65
9
egyetemi
35; 65; 42; 54; 28; 73; 54
7
összesen
27
5%-os szignifikanciaszinten egyformának tekinthető-e az átlagosan TV-nézéssel töltött idő?
VARIANCIAANALÍZIS: Több sokaság várható értékének összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású és azonos szórású.
A nullhipotézis: , vagyis az, hogy a várható értékek az összes sokaságra (M db) megegyeznek, míg az ellenhipotézis az, hogy van olyan amire .
A részsokaságokból vett minták, a részsokaságok száma M.
minta
elemszám
átlag
szórás
1-es részsokaság
2-es részsokaság
j-edik részsokaság
összesen
A próbafüggvény
A két szabadságfok és , a próba jobb oldali kritikus értékkel hajtandó végre:
JOBB OLDALI KRITIKUS ÉRTÉK:
VARIANCIAANALÍZIS-TÁBLÁZAT
SZÓRÓDÁS
OKA
ELTÉRÉS-
NÉGYZETÖSSZEG
SZABADSÁG-
FOK
ÁTLAGOS
NÉGYZETÖSSZEG
F
p-ÉRTÉK
Részsokaságra
bontás miatt
Részsokaságon
belüli hiba
össz.
A próba elvégzésének feltétele, hogy minden sokaság normális eloszlású és azonos szórású legyen. Most tételezzük föl, hogy ezek a feltételek teljesülnek. Kiszámoljuk a minta részátlagait és rész-szórásait, majd az SSK és SSB eltérés-négyzetösszegeket.
minta
elemszám
átlag
szórás
8 általános
11
középfokú
9
egyetemi
7
összesen
27
A szabadságfok és a próbafüggvény
A 5%-os szignifikanciaszinthez tartozó jobb oldali kritikus érték:
A próbafüggvény érték a kritikus tartományba esik, így a hipotézist 5%-os szignifikanciaszinten elvetjük, a különböző iskolai végzettségűek naponta átlagosan TV-nézéssel töltött ideje szignifikánsan nem egyezik meg.
VARIANCIAANALÍZIS-TÁBLÁZAT
SZÓRÓDÁS
OKA
ELTÉRÉS-
NÉGYZETÖSSZEG
SZABADSÁG-
FOK
ÁTLAGOS
NÉGYZETÖSSZEG
F
Részsokaságra
bontás miatt
Részsokaságon
belüli hiba
össz.
Bartlett-próba
Az előző példánknál maradva a naponta átlagosan TV-nézéssel töltött időt szeretnénk összehasonlítani a különböző iskolai végzettségűek körében, de most arra vagyunk kíváncsiak, hogy vajon ugyanakkora-e a szórás az egyes részsokaságokban.
A minta ugyanaz, mint az előbb:
Iskolai
végzettség
TV-nézéssel töltött
idő naponta (perc)
elemszám
8 általános
65; 43; 87; 105; 109; 56;
130; 88; 68; 70; 95
11
középfokú
48; 68; 72; 55; 43; 92;
87; 93; 65
9
egyetemi
35; 65; 42; 54; 28; 73; 54
7
összesen
27
5%-os szignifikanciaszinten egyformának tekinthető-e a TV-nézéssel töltött idő szórása?
Bartlett-próba: Több sokaság szórásának összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású.
A nullhipotézis: , vagyis az, hogy az összes sokaság (M db) szórása megegyezik, míg az ellenhipotézis az, hogy van olyan amire .
A részsokaságokból vett minták, a részsokaságok száma M.
minta
elemszám
átlag
szórás
1-es részsokaság
2-es részsokaság
j-edik részsokaság
összesen
A próbafüggvény
A próbafüggvény M-1 szabadságfokú eloszlást követ.
a j-edik részsokaság szabadságfoka, tehát és
és pedig a részsokaságok szórásai.
A próba jobb oldali kritikus értékkel hajtandó végre:
Kiszámoljuk a minta részátlagait és részszórásait, majd az SSB
eltérés-négyzetösszeget.
minta
elemszám
átlag
szórás
8 általános
11
középfokú
9
egyetemi
7
összesen
27
A próbafüggvény tehát:
A kritikus értéket az M-1 szabadságfokú szabadságfok eloszlásból keressük ki, a szignifikanciaszint 5%, tehát
A jobb oldali kritikus érték ekkor 5,99
A próbafüggvény érték ennél kisebb, vagyis a szórások egyezéséről szóló hipotézist 5%-os szignifikanciaszinten elfogadjuk.
8.1. Egy üzemben 5kg-os mosóporokat töltenek 21 gramm szórással és lényegében normális eloszlással. Az egyik gép által csomagolt mosóporok közül egy 41 elemű minta átlaga 4980 gramm, szórása 25 gramm.
5%-os szignifikanciaszinten megfelel-e a gép beállítása a szabványnak?
Először a szórásra vonatkozó hipotézist ellenőrizzük. Ha ugyanis az helyesnek bizonyul, és megfelel a szabvány 21 grammnak, akkor ezt felhasználhatjuk az átlagra vonatkozó hipotézisünkhöz, és alkalmazhatjuk a Z-próbát, amihez szükséges a sokaság szórásának ismerete. Ha viszont a szórásra vonatkozó hipotézisünk megbukik, akkor az átlag esetében azt nem vesszük figyelembe, és t-próbát használunk.
A szórás vizsgálatánál -próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=41 így a szabadságfok v=41-1=40.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
Ami az elfogadási tartományba esik, a szórás tehát megfelel az előírtaknak.
Z-próba: A sokaság normális eloszlású, szórása , a sokaság átlagára
vonatkozik, a minta elemszáma n.
Az átlagra vonatkozó hipotézis az, hogy a mosópor mennyisége 5 kg, ami alighanem 5000 gramm: : , az ellenhipotézis pedig : .
Ilyenkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ez az érték jócskán a kritikus tartományba esik, a gép beállítása semmilyen szignifikanciaszinten nem felel meg a szabványnak.
8.2. Egy üzemben literenként 300 mg C-vitamint adagolnak a dobozos narancslevekhez, közelítőleg normális eloszlással, 20 mg szórással. Egy szállítmányból vett 50 elemű minta átlagosan 310 mg C-vitamint tartalmazott, 22 mg szórással.
10%-os szignifikanciaszinten a szállítmány megfelelt-e a szabványnak?
Először a szórásra vonatkozó hipotézist ellenőrizzük. Ha ugyanis az helyesnek bizonyul, és megfelel a szabvány 20 mg-nak akkor ezt felhasználhatjuk az átlagra vonatkozó hipotézisünkhöz, és alkalmazhatjuk a Z-próbát, amihez szükséges a sokaság szórásának ismerete. Ha viszont a szórásra vonatkozó hipotézisünk megbukik, akkor az átlag esetében azt nem vesszük figyelembe, és t-próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=50 így a szabadságfok v=50-1=49.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
Ami az elfogadási tartományba esik, vagyis a szórás megfelel az előírtaknak. Elfogadjuk tehát, hogy a szórás 20mg, vagyis használhatjuk az átlag teszteléséhez a Z-próbát.
Z-próba: A sokaság normális eloszlású, szórása , a sokaság átlagára
vonatkozik, a minta elemszáma n.
Az átlagra vonatkozó hipotézis az, hogy a C-vitamin literenkénti mennyisége 300 mg, vagyis : , az ellenhipotézis pedig : .
Ilyenkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ez az érték jócskán a kritikus tartományba esik, a szállítmány nem felel meg a szabványnak.
8.3. Egy ásványvíz literenként 650 mg oldott ásványianyagot tartalmaz, 5 mg szórással. Az ásványianyag-tartalom eloszlása normálisnak tekinthető.
Ellenőrizzük a megadott paraméterek helyességét 10%-os szignifikanciaszinten az alábbi 6 elemű, egyenként egy literes minta alapján: 648 mg, 658 mg, 642 mg, 643 mg, 654 mg, 661 mg.
Először a szórásra vonatkozó hipotézist ellenőrizzük. Ha ugyanis az helyesnek bizonyul, és valóban 5 mg, akkor ezt felhasználhatjuk az átlagra vonatkozó hipotézisünkhöz, és alkalmazhatjuk a Z-próbát, amihez szükséges a sokaság szórásának ismerete. Ha viszont a szórásra vonatkozó hipotézisünk megbukik, akkor az átlag esetében azt nem vesszük figyelembe, és t-próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=6 így a szabadságfok v=6-1=5.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
és
A kapott érték az elfogadási tartományon kívül esik, tehát a minta alapján a szórásra vonatkozó 5 mg-os értéket nem tekintjük helyesnek.
Az átlagra vonatkozó hipotézisünk vizsgálatánál így nem használjuk föl a szórásra vonatkozó 5 mg-os adatot, helyette a szórást ismeretlennek tekintve t-próbát használunk.
t-próba: A sokaság normális eloszlású, szórása nem ismert, a sokaság
átlagára vonatkozik, a minta elemszáma n.
: nullhipotézis esetén az ellenhipotézis : ,
ilyenkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
a szórás pedig
ami az elfogadási tartományba esik.
Ha az ellenhipotézisben azt az aggodalmunkat akarjuk megfogalmazni, hogy nőtt az elhalálozottak száma, akkor
: nullhipotézis esetén az ellenhipotézis : , a technikai nullhipotézis pedig : . Ilyenkor csak jobb oldali kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
8.4. Korábbi felmérések szerint, egy múzeum látogatóinak 65%-a nő.
Egy véletlenszerűen választott nap 300 látogatója közül 207 nő volt.
Ellenőrizzük a nők arányára vonatkozó állítást 10%-os szignifikanciaszinten. Mekkora az a legkisebb szignifikanciaszint, amelyen a nullhipotézis, vagyis az, hogy a látogatók 68%-a nő, még éppen elvethető?
Z-próba: A sokaság tetszőleges eloszlású, egy sokasági arányra vonatkozik, a minta n elemű, elemszáma nagy.
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami az elfogadási tartományba esik.
A hipotézist 10%-os szignifikanciaszinten elfogadjuk.
Ahhoz, hogy a nullhipotézist elvessük, az 1,45 próbafüggvény-értéknek az elfogadási tartományon kívül kell esnie, ami szélső helyzetben éppen
jobb oldali kritikus értéket jelenti, ami a standard-normális eloszlás táblázata alapján
és ekkor
Kétoldali kritikus tartomány esetén nagyon magas, 14,7%-os a legkisebb olyan szignifikanciaszint, amin a hipotézist elvethetjük.
8.5. Egy vizsgán maximum 100 pont érhető el. Az egyik vizsgán 80 hallgató vett részt, eredményeik:
pontszám
0-20
12
21-40
16
41-60
25
61-80
18
81-100
9
10%-os szignifikanciaszinten tekinthető-e a vizsgázók pontszáma egyenletes eloszlásúnak? Tekinthető-e normális eloszlásúnak?
A hipotézis a sokaság eloszlására vonatkozik. Az eljárást illeszkedésvizsgálatnak nevezzük és -próbát használunk.
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Ha a nullhipotézis az, hogy az elért pontszám egyenletes eloszlású, akkor minden osztályközben ugyanakkora a valószínűség. Mivel pedig öt osztályköz van, .
pontszám
Egyenletes eloszlást
feltételezve
0-20
12
0,2
21-40
16
0,2
41-60
25
0,2
61-80
18
0,2
81-100
9
0,2
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most nem határoztunk meg a mintából semmilyen paramétert, így . Ekkor
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A jobb oldali kritikus érték
A minta alapján
Ez nagyobb, mint a jobb oldali kritikus érték, tehát a nullhipotézist elvetjük. 10%-os szignifikanciaszinten nem állíthatjuk, hogy a pontszámok eloszlása egyenletes.
Lássuk, lehet-e normális eloszlású!
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Most válasszuk a felső határokat.
Pontszám
0-20
12
-1,19
0,1151
21-40
16
-0,37
0,3632
41-60
25
0,453
0,6736
61-80
18
1,27
0,8944
81-100
9
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályközig az összeshez tartoznak. Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
A 21-40 osztályköznél tehát
A 41-60 osztályköznél tehát
pontszám
Normális eloszlást
feltételezve
0-20
12
-1,19
0,1151
0,1151
21-40
16
-0,37
0,3632
0,2481
41-60
25
0,453
0,6736
0,3104
61-80
18
1,27
0,8944
0,2208
81-100
9
0,1056
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez kisebb, mint a kritikus érték, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
8.6. A naponta olvasással eltöltött időről terveznek egy felmérést készíteni Német-országban. A népesség korcsoportonkénti megoszlásával egybevetve tekinthető-e reprezentatívnak a felméréshez használt minta 10%-os szignifikanciaszinten?
Életkor
Népesség
(%)
Minta
(db)
0-14
13,5
18
15-34
25
22
35-64
41,5
27
65-
20
13
összesen
100
80
A nullhipotézis legyen az, hogy a minta reprezentatív, vagyis a lakosság életkor szerinti megoszlása a mintában megegyezik a valós értékekkel. A hipotézis a sokaság eloszlására vonatkozik. Az eljárást illeszkedésvizsgálatnak nevezzük és -próbát használunk. A százalékos adatokat átalakítjuk valószínűségekre.
Életkor
Népesség
(%)
Minta
(db)
0-14
0,135
18
15-34
0,250
22
35-64
0,415
27
65-
0,200
13
összesen
1,000
80
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Most az osztályközök száma k=4, a mintából becsült paraméterek száma pedig b=0, mivel nem becsültünk semmit a mintából. A szabadságfok v=k-b-1=4-0-1=3.
A jobb oldali kritikus érték
A minta alapján
Ez nagyobb, mint a kritikus érték, a nullhipotézist tehát elvetjük. A minta 10%-os szignifikanciaszinten nem tekinthető reprezentatívnak.
8.7. Egy légitársaság felmérést készít az utasok testsúlyával kapcsolatban. Korábbi évek adatai alapján az utasok testsúly szerinti eloszlása közelítőleg normális, 81 kg-os átlaggal és 16 kg szórással.
Ellenőrizzük az eloszlásra és a paraméterekre vonatkozó hipotéziseket az alábbi 141 elemű minta segítségével 5%-os szignifikanciaszinten.
Testtömeg
(kg)
Utasok száma
0-50
13
51-70
23
71-90
56
91-110
38
111-
11
összesen
141
Elsőként az eloszlásra vonatkozó hipotézist ellenőrizzük, ha ugyanis ezt elfogadjuk, és a sokaság eloszlását normálisnak tekintjük, jóval kellemesebb lesz a többi hipotézis vizsgálata. Elvetése esetén marha nagy gondban leszünk például a szórásra vonatkozó állítással, azt ugyanis csak jó közelítéssel normális eloszlású sokaságokra alkalmazhatjuk. Node reméljük a legjobbakat!
A normális eloszlásra vonatkozó hipotézisünket illeszkedésvizsgálattal teszteljük és
-próbát használunk.
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Testtömeg
(kg)
Utasok száma
0-50
13
51-70
23
71-90
56
91-110
38
111-
11
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Most válasszuk a felső határokat.
Testtömeg
(kg)
Utasok száma
0-50
13
-1,26
0,1056
51-70
23
-0,42
0,3446
71-90
56
0,41
0,6554
91-110
38
1,24
0,8944
111-
11
1,0000
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályközig az összeshez tartoznak. Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
A 51-70 osztályköznél tehát
A 71-90 osztályköznél tehát
Testtömeg
(kg)
Utasok száma
Normális eloszlást
feltételezve
0-50
13
-1,26
0,1056
0,1056
51-70
23
-0,42
0,3446
0,2390
71-90
56
0,41
0,6554
0,3108
91-110
38
1,24
0,8944
0,2390
111-
11
1,0000
0,1056
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez bizony nagyobb, mint a kritikus érték, a hipotézist tehát 5%-os szignifikanciaszinten elvetjük, a minta alapján az utasok testsúly szerinti eloszlása nem tekinthető normális eloszlásúnak.
Térjünk rá a paraméterek vizsgálatára. A szórással kapcsolatos hipotézisünket csak normális eloszlás esetén tudtuk volna vizsgálni, így sajnálatos módon ez most kimarad. Az átlaggal kapcsolatos hipotézist aszimptotikus Z-próbával vizsgáljuk a minta nagy elemszámának köszönhetően.
Aszimptotikus Z-próba: A sokaság tetszőleges eloszlású, szórása nem ismert, a sokaság átlagára vonatkozik, a minta n elemű, elemszáma nagy.
A nullhipotézis az, hogy az utasok átlagosan 81 kg-osak.
: , az ellenhipotézis pedig : .
Kétoldali kritikus tartomány és két kritikus érték lesz.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami bőven az elfogadási tartományba esik.
A hipotézist 5%-os szignifikanciaszinten elfogadjuk.
8.8. Egy felmérés során 400 férfit és 400 nőt vizsgáltak meg, hogy megállnak-e kocsijukkal a zebránál, ha a gyalogos a járdán várakozik. A férfiak közül 310-en, a nők közül 215-en álltak meg.
Független-e a nemtől a zebránál való megállás 5%-os szignifikanciaszinten?
Ellenőrizzük azt a hipotézist, hogy a nők a zebránál kevésbé engedik át a gyalogosokat 5%-os szignifikanciaszinten.
FÜGGETLENSÉGVIZSGÁLAT, -próba: A sokaságon belül két ismérv függetlenségére irányuló vizsgálat. : a két ismérv független, az ellenhipotézis pedig, : a két ismérv közti kapcsolat sztochasztikus vagy függvényszerű.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n, a minta alapján készített kontingencia tábla sorainak száma r, oszlopainak száma c.
Ahol a szabadságfok .
megáll
nem áll meg
össz
nő
215
185
400
férfi
310
90
400
össz
525
275
800
A kontingencia tábla sorainak száma r=2 ( az összesen sor nyilvánvalóan nem számít ) oszlopainak száma pedig c=2, így a szabadságfok
A jobb oldali kritikus érték
Az ügymenet megkönnyítése érdekében készítünk egy -os táblázatot.
Ez pontosan úgy készül, mint ahogyan az asszociációs kapcsolat vizsgálatakor, vagyis
megáll
nem áll meg
össz
nő
262,5
137,5
400
férfi
262,5
137,5
400
össz
525
275
800
A kapott érték határozottan nagyobb a kritikus értéknél, így függetlenségről szóló nullhipotézist minden szignifikanciaszinten elvetjük.
Térjünk rá annak a hipotézisnek a vizsgálatára, hogy a nők kisebb arányban állnak meg a zebránál.
megáll
nem áll meg
össz
nő
215
185
400
férfi
310
90
400
össz
525
275
800
Kétmintás Z-próba: Két sokaság sokasági arányának összehasonlítására irányuló próba.
speciális esetben
ahol és a minták elemszáma.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
: ekkor az ellenhipotézis : és itt az ellenhipotézist szeretnénk igazolni.
Egyoldali kritikus tartomány és egy kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény
A kapott eredmény minden szignifikanciaszinten az ellenhipotézist igazolja, vagyis a férfiak nagyobb arányban állnak meg a zebránál.
8.9. Egy várostól északra és nyugatra lavinafogó véderdők találhatók. A faállomány állapotának felméréséhez mindkét véderdőben véletlenszerűen kiválasztottak 150 fenyőt, a minták eredményét tartalmazza az alábbi táblázat.
Eltér-e szignifikánsan a két véderdőben a fák átlagos életkora? Szignifikánsan egyformának tekinthetők-e a két véderdő faállománya? A szignifikanciaszint legyen 5%.
Fák életkora
(év)
Északi
véderdő
Nyugati
véderdő
0-10
13
8
11-20
28
32
21-50
67
58
51-100
31
42
101-
11
10
összesen
150
150
Kétmintás aszimptotikus Z-próba: A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és .
Válasszuk nullhipotézisnek azt, hogy a két véderdő átlagos életkora megegyezik,
: az ellenhipotézis pedig :
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományba esik, a véderdők átlagéletkora szignifikánsan megegyezik.
A faállományok összehasonlítására homogenitásvizsgálatot alkalmazunk.
HOMOGENITÁSVIZSGÁLAT, -próba: Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. : a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, : a két eloszlás nem egyező.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. Mintát ezúttal mindkét sokaságból veszünk, az X sokaságból vett minta elemszáma az Y sokaságból vett mintáé mindkét mintában az osztályközök száma k.
Ahol a szabadságfok .
Mindkét véderdő esetében öt osztályköz van, így k=5 a szabadságfok pedig v=k-1=4.
A jobb oldali kritikus érték
Fák életkora
(év)
Északi
véderdő
Nyugati
véderdő
0-10
13
8
11-20
28
32
21-50
67
58
51-100
31
42
101-
11
10
összesen
150
150
A próbafüggvény
3,81
Ez a kritikus értéknél kisebb, így 5%-os szignifikanciaszinten a két véderdő faállományának életkor szerinti megoszlása megegyezik.
8.10. A nem munkával töltött aktív tevékenység (kertészkedés, sportolás, stb.) megoszlása Magyarországon és Németországban egy-egy 100 elemű minta alapján:
Nem munkával töltött
aktív tevékenység
időtartama naponta
(perc)
HU
DE
0-50
43
10
51-100
30
35
101-150
16
27
151-200
8
20
201-250
3
8
10%-os szignifikanciaszinten a minta alapján azonosak-e a szokások a két országban?
HOMOGENITÁSVIZSGÁLAT, -próba: Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. : a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, : a két eloszlás nem egyező.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. Mintát ezúttal mindkét sokaságból veszünk, az X sokaságból vett minta elemszáma az Y sokaságból vett mintáé mindkét mintában az osztályközök száma k.
Ahol a szabadságfok .
Az osztályközök száma öt, a szabadságfok tehát v=k-1=5-1=4.
A jobb oldali kritikus érték
Nem munkával töltött
aktív tevékenység
időtartama naponta
(perc)
HU
DE
0-50
43
10
51-100
30
35
101-150
16
27
151-200
8
20
201-250
3
8
A próbafüggvény
31,16
Ez a kritikus értéknél jóval nagyobb, a két eloszlás szignifikánsan eltér.
8.11. Egy tehenészetben a tehenek tejének zsírtartalmát vizsgálták. A későbbi hasznosítás során nem kedvező, ha a zsírtartalom szórása 10%-nál nagyobb. Literenkénti 5 grammos átlagos zsírtartalommal számolva és feltételezve annak normális eloszlását, szignifikánsan eltér-e a tehenek tejének zsírtartalma a megengedett 10%-tól az alábbi 10 elemű minta alapján?
A tehén
sorszáma
Zsírtartalom
(gramm/liter)
17.
4,7
19.
4,9
34.
5,6
36.
4,3
37.
5,1
38.
5,4
57.
6,1
58.
5,8
63.
4,2
64.
4,2
A szignifikanciaszint legyen 5%.
A minta átlaga
gramm
A minta szórása
A megengedett szórás 10%-os, vagyis 0,5 gramm.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=10 így a szabadságfok v=10-1=9.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
A kapott érték az elfogadási tartományba esik, a tehenek tejének zsírtartalma így a minta alapján megfelel a további hasznosításra.
8.12. Egy első osztályú almaszállítmányban az almák tömegének átlaga 110 gramm, megengedett szórása 20 gramm lehet. Ellenőrizzük 85 elemű minta alapján, hogy egy adott szállítmány megfelel-e az előírásoknak. Az almák méretének eloszlását nem ismerjük, a szignifikanciaszint legyen 10%.
alma tömege
(gramm)
50-69
12
70-89
16
90-109
25
110-129
24
130-159
8
Elsőként megvizsgáljuk, hogy az almák méretének eloszlása tekinthető-e normális eloszlásnak. Ha ugyanis nem, akkor marha nagy gondban leszünk a szórásra vonatkozó állítás vizsgálatával, azt ugyanis csak jó közelítéssel normális eloszlású sokaságokra alkalmazhatjuk. Node reméljük a legjobbakat!
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Célszerűbb azonban a felső határokat választani.
alma tömege
(gramm)
50-69
12
-1,292
0,0968
70-89
16
-0,458
0,3264
90-109
25
0,375
0,6461
110-129
24
1,208
0,8849
130-159
8
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályköz alsó határáig tartozó valószínűségek. Azért az alsó határig, mert az alsó határokat standardizáltuk.
Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
Az 50-69 osztályköznél tehát mert itt nincs előző
A 70-89 osztályköznél
A 90-109 osztályköznél
alma tömege
(gramm)
Normális eloszlást
feltételezve
50-69
12
-1,292
0,0968
0,0968
70-89
16
-0,458
0,3264
0,2296
90-109
25
0,375
0,6461
0,3197
110-129
24
1,208
0,8849
0,2388
130-159
8
0,1151
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez kisebb, mint a kritikus érték, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
Térjünk rá a paraméterek vizsgálatára. Mivel az eloszlás normális, a szórásra vonatkozó hipotézisre alkalmazhatjuk a -próbát.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=85 így a szabadságfok v=85-1=84.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
A kapott érték az elfogadási tartományon kívül esik, a szórás a minta alapján a megengedettnél nagyobb.
Térjünk rá az átlag ellenőrzésére. Mivel a szórás a jelek szerint egyáltalán nem az előírt 20 gramm, ezért az átlagra vonatkozó hipotézis vizsgálatánál a tényleges szórást ismeretlennek tekintve, a minta szórására hagyatkozunk.
t-próba: A sokaság normális eloszlású, szórása nem ismert, a sokaság
átlagára vonatkozik, a minta elemszáma n.
A nullhipotézis : gramm, az ellenhipotézis pedig : gramm
A szabadságfok v=n-1=85-1=84
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
Ez bőven az elfogadási tartományon kívül esik, tehát az átlagos tömeg sem felel meg a szabványnak.
8.13. Kétféle juhfajta, a német húsmerinó és az Új-Zélandi Romney gyapjújának finomságát vizsgáltuk meg. A német húsmerinó gyapjújának finomsága egy ötelemű minta alapján 26 mikron, 27 mikron, 22 mikron, 28 mikron, 30 mikron.
Az Új-Zélandi Romney gyapjúját egy hatelemű mintával vizsgáltuk, ennek eredménye
30 mikron, 28 mikron, 32 mikron, 33 mikron, 29 mikron, 30 mikron.
Ellenőrizzük 10%-os szignifikanciaszinten, az alábbi állításokat:
a) A Romney gyapjának szálvastagsága nagyobb
b) A Romney gyapjának szálvastagsága 4 mikronnal nagyobb
c) A kétféle juh gyapjú-szálvastagságának szórása megegyezik
Elsőként a szórásokra vonatkozó állítást vizsgáljuk.
F-próba: Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis :
az F-eloszlás két szabadságfoka és , ahol és a két minta elemszáma. Célszerű 1-es sokaságnak mindig a nagyobb szórással rendelkezőt nevezni.
A kritikus értékek az összefüggés alapján:
BAL OLDALI KRITIKUS TARTOMÁNY ESETÉN:
KÉTOLDALI KRITIKUS TARTOMÁNY ESETÉN: ÉS
JOBB OLDALI KRITIKUS TARTOMÁNY ESETÉN:
Az 1-es sokaság legyen a nagyobb szórással rendelkező német merinó. Ekkor
így
így
A nullhipotézis : vagyis kétoldali kritikus tartományunk és így két kritikus értékünk lesz, amiket az F-eloszlás táblázatából keresünk ki.
A szignifikanciaszint , ekkor
és
A minta alapján
Ez az elfogadási tartományba esik, a kétféle juh gyapjú-szálvastagságának tehát a minta alapján szignifikánsan ugyanakkora a szórása.
Most térjünk rá az átlagokkal kapcsolatos állításokra. Mivel a szórások megegyeznek, használhatunk t-próbát.
A német húsmerinó gyapjának átlagos szálvastagsága legyen a a másiké pedig a . Azt az állítást, hogy a Romney gyapjának szálvastagsága nagyobb, úgy írhatjuk fel, hogy:
Átrendezve
Mivel ebben az állításban nincs megengedve az egyenlőség, ez nullhipotézis nem lehet, csak ellenhipotézis, mert a nullhipotézisben mindig szerepelnie kell egyenlőségnek is. Így hát akkor ez az ellenhipotézis:
A hozzá tartozó nullhipotézis pedig
Az átlagok tesztelésére, mivel a juhok gyapjú-vastagságának szórása nem ismert, ezt csak a mintából fogjuk tudni kiszámolni, ezért t-próbát használunk.
Kétmintás t-próba:
itt
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és , a szabadságfok
A minták alapján
Német merinó:
Új-Zélandi Romney:
most
A próbafüggvény értéke:
A nullhipotézis az, hogy tehát bal oldali elfogadási tartomány lesz, amihez jobb oldali kritikus érték tartozik.
A szabadságfok =5+6-2=9
JOBB OLDALI KRITIKUS ÉRTÉK:
A próbafüggvény értéke nem esik bele az elfogadási tartományba, így a nullhipotézist elvetjük, és ezzel egyidejűleg a ellenhipotézist elfogadjuk. Vagyis 10%-os szignifikanciaszinten kijelenthető, hogy tehát a Romney juh gyapjának átlagos szálvastagsága nagyobb.
Vizsgáljuk meg 10%-os szignifikanciaszinten azt az állítást, hogy a Romney gyapjának szálvastagsága 4 mikronnal nagyobb.
Ekkor a
próbafüggvényben annyi változás történik mindössze, hogy .
A nullhipotézis most az, hogy az átlagok eltérése éppen 4, tehát
Most kétoldali kritikus tartomány lesz, a szabadságfok továbbra is
=12+12-2=22
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
Ebbe a próbafüggvény értéke beleesik, tehát elfogadjuk azt az állítást, hogy a Romney átlagos szálvastagsága 4 mikronnal nagyobb.
8.14. 200 fő részvételével tesztelték egy vitaminkészítmény hatékonyságát. 100-an rendszeresen szedték a készítményt, míg a másik 100 résztvevő egyáltalán nem szedett semmit, vagy másfajta vitaminokat szedett. Az évente betegség miatt kieső munkanapok számát hasonlították össze a két csoportban, ezek eloszlását normális eloszlásúnak tekinthetjük. 5%-os szignifikanciaszinten mi mondható az alábbi állításokról?
csoportok
Betegség miatt kieső munkanapok
átlaga
szórása
Szedték a
készítményt
7,2
3,7
Nem szedték a
készítményt
7,8
3,4
Megegyezik-e a két csoportban a kieső munkanapok átlaga és szórása?
Szignifikánsan eltér-e a betegség miatt kieső munkanapok száma a két csoportban?
Az átlag vizsgálatával kezdünk. Sajnos azonban csak a minta szórásai állnak rendelkezésre, így nem használhatunk Z-próbát. Ugyanakkor a minta elemszáma elég nagy, tehát aszimptotikus Z-próbát fogunk használni.
Kétmintás aszimptotikus Z-próba: A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és .
A nullhipotézis az, hogy a készítmény nincs hatással a betegség miatt kimaradó munkanapok számára, így az mindkét csoportban megegyezik.
:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományba esik, így a nullhipotézist elfogadjuk, a két csoport átlaga megegyezik, a készítmény hatása 5%-os szignifikanciaszinten nem kimutatható.
Vizsgáljuk meg a szórásokat is.
F-próba: Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis :
az F-eloszlás két szabadságfoka és , ahol és a két minta elemszáma. Célszerű 1-es sokaságnak mindig a nagyobb szórással rendelkezőt nevezni.
A kritikus értékek az összefüggés alapján:
KÉTOLDALI KRITIKUS TARTOMÁNY ESETÉN: ÉS
Mindkét csoport elemszáma 100:
így
így
A nullhipotézis : vagyis kétoldali kritikus tartományunk és így két kritikus értékünk lesz, amiket az F-eloszlás táblázatából keresünk ki.
A szignifikanciaszint , ekkor
és
A minta alapján
Ez az elfogadási tartományba esik, így a két csoport szórása a minta alapján ugyancsak megegyezik.
Annak vizsgálatára, hogy szignifikánsan eltér-e a betegség miatt kieső munkanapok száma a két csoportban, varianciaanalízist használunk.
VARIANCIAANALÍZIS: Több sokaság várható értékének összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású és azonos szórású.
A nullhipotézis: , vagyis az, hogy a várható értékek az összes sokaságra (M db) megegyeznek, míg az ellenhipotézis az, hogy van olyan amire .
A részsokaságokból vett minták, a részsokaságok száma M.
minta
elemszám
átlag
szórás
1-es részsokaság
2-es részsokaság
j-edik részsokaság
összesen
A próbafüggvény
A két szabadságfok és , a próba jobb oldali kritikus értékkel hajtandó végre:
JOBB OLDALI KRITIKUS ÉRTÉK:
VARIANCIAANALÍZIS-TÁBLÁZAT
SZÓRÓDÁS
OKA
ELTÉRÉS-
NÉGYZETÖSSZEG
SZABADSÁG-
FOK
ÁTLAGOS
NÉGYZETÖSSZEG
F
p-ÉRTÉK
Részsokaságra
bontás miatt
Részsokaságon
belüli hiba
össz.
A próba elvégzésének feltétele, hogy minden sokaság normális eloszlású és azonos szórású legyen. Most tételezzük föl, hogy ezek a feltételek teljesülnek. Kiszámoljuk a minta részátlagait és rész-szórásait, majd az SSK és SSB eltérés-négyzetösszegeket.
minta
elemszám
átlag
szórás
Szedték a
készítményt
100
Nem szedték a
készítményt
100
összesen
200
A szabadságfok és a próbafüggvény
A 5%-os szignifikanciaszinthez tartozó jobb oldali kritikus érték:
A próbafüggvény érték az elfogadási tartományba esik, így a minta alapján azt kell állítanunk, hogy nincs eltérés a kétféle csoportban a megbetegedés miatt kieső munkanapok száma között.
Most egy nagyon vicces dolgot fogunk csinálni. Egy olyan polinomot fogunk gyártani, ami előre megadott pontokon megy át. Ezeket a polinomokat interpolációs polinomnak nevezzük. Íme, itt vannak a pontok. Vagy épp ezek. Vagy ezek. A dolog lényege, hogy bárhol lehetnek, és bármennyi. Minél több pontunk van, a polinom fokszáma annál nagyobb lesz. Kezdetnek most elég ez a három. Azt a polinom-függvényt fogjuk megalkotni, ami 1-ben 3-at vesz föl… 2-ben 5-öt… és 4-ben 1-et. Először egy olyan polinomot fogunk gyártani, ami 1-ben 3-at vesz föl és a másik két helyen nullát. Ehhez mindössze annyit kell megértenünk, hogy ez a polinom: Itt nulla. Meg itt… Meg itt, meg itt. És, ha azt szeretnénk, hogy még 6-ban is nulla legyen… Hát, éppen arról is lehet beszélni. Az a polinom-függvény, ami 1-ben 3-at vesz föl és a másik két helyen nullát, valahogy így fog kinézni. De sajnos van egy kis gond. Ha behelyettesítjük az 1-et… akkor nem jön ki a 3. Eddig jó. Most gyártani fogunk egy másik polinom-függvényt, ami 1-ben és 4-ben nulla… De ha 2-t helyettesítünk bele, akkor van egy kis gond. Nem az jön ki, ami nekünk kéne. Ezt a kis problémát így tudjuk megoldani. Ha most ebbe helyettesítjük be a 2-t… Nem túl meglepő módon az jön ki, hogy 1. Mondjuk, jobb lenne, ha az jönne ki, hogy 5. Hát, ezen könnyen lehet segíteni. Ezzel megalkottuk azt a polinom-függvényt, ami 1-ben és 4-ben nullát vesz föl, 2-ben pedig a függvényérték 5. És végül itt jön az a polinom-függvény, ami 1-ben és 2-ben nulla, 4-ben pedig 1-et vesz föl. Eddig ott járunk, hogy 1-ben és 2-ben nulla. De 4-ben sajnos… Hát nem baj, akkor jön megint az előző trükk. És ha most helyettesítjük be a 4-et… Akkor már az jön ki, hogy 1. És az pont jó is. Nézzük, mi történik, ha ezt a három polinomot összeadjuk. Az így kapott polinom éppen azt tudja, amit kell. 1-ben 3-at vesz föl, 2-ben 5-öt, és 4-ben 1-et. Lássunk még egy ilyet. Gyártsunk egy olyan polinom-függvényt, ami 1-ben 4-et, 2-ben 3-at és 4-ben 2-t vesz föl. Az első polinom a másik két helyen nulla… ha pedig x1-et helyettesítjük be, akkor 4-et kall kapnunk. Az második polinom is a másik két helyen nulla… és x2-ben 3-at kell kapnunk. Végül itt jön a harmadik polinom. Az első két helyen nullát vesz föl… ha 4-et helyettesítünk bele, akkor pedig 2-t. Az interpolációs polinomok világában ez a módszer az egyik legegyszerűbb. És úgy hívják, hogy Lagrange-féle interpolációs polinom. Most pedig lássuk, mi történik akkor, ha nem három, hanem négy pont van.
Egy olyan polinomot fogunk gyártani, ami előre megadott pontokon megy át. Ezeket a polinomokat interpolációs polinomnak nevezzük. Interpolációs polinomból többféle is van. Az egyik legegyszerűbb a Lagrange-féle interpolációs polinom. Szintén könnyen használható és elterjedt a Newton-interpoláció és a Hermite-interpoláció is. Mindegyikre fogunk nézni egy-egy példát. Íme, itt vannak a pontok. Vagy épp ezek. Vagy ezek. A dolog lényege, hogy bárhol lehetnek, és bármennyi. Minél több pontunk van, a polinom fokszáma annál nagyobb lesz. Kezdetnek most elég ez a három. Azt a polinom-függvényt fogjuk megalkotni, ami 1-ben 3-at vesz föl… 2-ben 5-öt… és 4-ben 1-et. Először egy olyan polinomot fogunk gyártani, ami 1-ben 3-at vesz föl és a másik két helyen nullát. Ehhez mindössze annyit kell megértenünk, hogy ez a polinom: Itt nulla. Meg itt… Meg itt, meg itt. És, ha azt szeretnénk, hogy még 6-ban is nulla legyen… Hát, éppen arról is lehet beszélni. Az a polinom-függvény, ami 1-ben 3-at vesz föl és a másik két helyen nullát, valahogy így fog kinézni. De sajnos van egy kis gond. Ha behelyettesítjük az 1-et… akkor nem jön ki a 3. Eddig jó. Most gyártani fogunk egy másik polinom-függvényt, ami 1-ben és 4-ben nulla… De ha 2-t helyettesítünk bele, akkor van egy kis gond. Nem az jön ki, ami nekünk kéne. Ezt a kis problémát így tudjuk megoldani. Ha most ebbe helyettesítjük be a 2-t… Nem túl meglepő módon az jön ki, hogy 1. Mondjuk, jobb lenne, ha az jönne ki, hogy 5. Hát, ezen könnyen lehet segíteni. Ezzel megalkottuk azt a polinom-függvényt, ami 1-ben és 4-ben nullát vesz föl, 2-ben pedig a függvényérték 5. És végül itt jön az a polinom-függvény, ami 1-ben és 2-ben nulla, 4-ben pedig 1-et vesz föl. Eddig ott járunk, hogy 1-ben és 2-ben nulla. De 4-ben sajnos… Hát nem baj, akkor jön megint az előző trükk. És ha most helyettesítjük be a 4-et… Akkor már az jön ki, hogy 1. És az pont jó is. Nézzük, mi történik, ha ezt a három polinomot összeadjuk. Az így kapott polinom éppen azt tudja, amit kell. 1-ben 3-at vesz föl, 2-ben 5-öt, és 4-ben 1-et. Lássunk még egy ilyet. Gyártsunk egy olyan polinom-függvényt, ami 1-ben 4-et, 2-ben 3-at és 4-ben 2-t vesz föl. Az első polinom a másik két helyen nulla… ha pedig x1-et helyettesítjük be, akkor 4-et kall kapnunk. Az második polinom is a másik két helyen nulla… és x2-ben 3-at kell kapnunk. Végül itt jön a harmadik polinom. Az első két helyen nullát vesz föl… ha 4-et helyettesítünk bele, akkor pedig 2-t. Az interpolációs polinomok világában ez a módszer az egyik legegyszerűbb. És úgy hívják, hogy Lagrange-féle interpolációs polinom. Most pedig lássuk, mi történik akkor, ha nem három, hanem négy pont van. Gyártsunk egy olyan polinom-függvényt, ami 1-ben 3-at, 2-ben 6-ot, 4-ben 2-t és 5-ben 4-et vesz föl. Először egy olyan polinomot fogunk gyártani, ami a másik három helyen nulla… és 1-ben pedig 3-at vesz föl. Aztán itt jön ez, ami 2-ben 6-ot vesz föl, a másik három helyen pedig nullát. Végül még kellenek nekünk ezek is. Azt a polinomot, amely x1-ben y1-et, x2-ben y2-t és így tovább xn-ben yn értéket vesz föl általánosan így tudjuk legyártani: Ennek a polinomnak a fokszáma n-1 és Lagrange-féle interpolációs polinomnak nevezzük. A képlet így első ránézésre megjegyezhetetlennek tűnik… de azért van remény. Itt az első tagban pont az x1-es tényező hiányzik. Ez a fura jel itt azt jelenti, hogy produktum, vagyis össze kell szorozni. Az n-edik tagban pedig az xn-es tényezők hiányoznak. Na, és ezek vannak összeadva 1-től n-ig. Hát ez csodás. De ami még ennél is csodálatosabb, hogy nem csak Lagrange-féle interpolációs polinomok léteznek.
Gyártsunk egy olyan polinom-függvényt, ami 1-ben 3-at, 2-ben 6-ot, 4-ben 2-t és 5-ben 4-et vesz föl. Itt jön most egy másik módszer, ami első ránézésre bonyolultabbnak tűnik, mint a Lagrange-polinom... De második ránézésre kiderül, hogy könnyebb. Ezt a módszert Newton-interpolációnak hívják és a lényege a következő. Elkészítjük ezeket a Newton-együtthatókat. És most már csak ezekre lesz szükség. Ez a polinom pontosan megegyezik a Lagrange interpolációval keletkező polinommal. Viszont megvan az a kellemes tulajdonsága, hogy könnyebb összevonni. Hát ezt tudja a Newton-interpoláció.
Itt jön egy újabb módszer interpolációs polinomok gyártására. Ez a módszer abban különbözik az előző kettőtől, hogy az x1, x2, xn helyeken nem csak az eredeti polinom-függvény értékeit, hanem a deriváltjait is nézzük.
Gyártsunk például egy olyan f(x) polinom-függvényt, ami a következőket tudja:
A keresett polinom-függvény ötödfokú lesz.
Azért, mert hat interpolációs pont van megadva és a polinom fokszáma mindig eggyel kisebb, mint az interpolációs pontok száma.
Ezt a nagyon remek egyenletrendszert kell már csak megoldanunk, és kész is.
Az ilyen egyenletrendszereket megoldani rémesen unalmas.
Ezzel foglalkozik a lineáris algebra.
Megoldhatjuk például Gauss eliminációval, vagy elemi bázistranszformációval is.
És a megoldás…
Hát ezt tudja a csodálatos Hermite interpoláció.
A Laplace transzformációnál csak egy rosszabb dolog létezik…
az inverz Laplace transzformáció.
Van nekünk itt egy Laplace transzformáltunk,
és ebből kéne valahogyan kideríteni azt, hogy mi volt az eredeti függvény.
Nos ez.
Itt jön egy nehezebb.
Még talán erre hasonlít a legjobban…
Kéne viszont az n! a számlálóba.
De az igazi rémtörténetek csak most jönnek.
Lássuk, mi történik ezzel:
Nos, ez attól függ, hogy a nevezőt szorzattá lehet-e alakítani.
Most úgy tűnik nem, ugyanis negatív van a gyök alatt.
Ilyenkor egy másik nagyon remek dolgot csinálunk: teljes négyzetté egészítünk ki.
Most nézzük mi van a másikkal:
És most elkezdünk nézelődni, hátha megtaláljuk ezeket valahol a Laplace transzformáltak között.
Nos, lássuk csak…
Ez majdnem jó.
De csak majdnem, a számlálóban ugyanis van még nekünk egy .
Ez a másik viszont jó lesz…
egy kis rásegítéssel.
Azokban az esetekben, amikor a nevező szorzattá alakítható egy másik nagyon izgalmas tevékenységbe vágunk bele…
amit parciális törtekre bontásnak hívnak.
Most pedig tényleg jó lenne végre megtudni, hogy mire használhatnánk ezt az egészet.
Nos, ezzel fogjuk folytatni…
És most lássuk, mire jó a Laplace transzformáció.
A Laplace transzformált segítségével megszüntethető a globális felmelegedés.
Ja, mégse...
viszont meg tudunk oldani vele differenciálegyenleteket.
Itt egy egyenlet, és most megoldjuk a Laplace transzformálás segítségével.
Vesszük mindkét oldal Laplace transzformáltját.
Az y Laplace transzformáltja legyen Y.
A kérdés, hogy mi lesz Laplace transzformáltja.
Nos ez:
Ha most valahogyan vissza tudnánk Laplace transzformálni Y-t, akkor meg is lenne a megoldás.
Ehhez inverz Laplace transzformációra lesz szükségünk, amit parciális törtekre bontás segítségével fogunk csinálni.
Kétféle típusú parciális tört van:
Most mindegyik tényező elsőfokú, így mindegyik parciális tört az első típusú.
Itt az idő, hogy megnézzük hogyan működik a három legfontosabb diszkrét eloszlás, a hipergeometriai, a binomiális és a Poisson eloszlás.
Nézzünk mindegyikhez egy kis mesét.
Ez tulajdonképpen az a történet, hogy egy dobozban van 30 golyó, amiből 12 piros.
Kiveszünk 7 darabot és mi a valószínűsége, hogy 2 piros?
Itt már más a helyzet, ugyanis nem pontosan 12, hanem átlag 12 balesetes nap van.
Ez Poisson pedig még izgalmasabb lesz. A kérdés mindhárom mesében ugyanaz, hogy mekkora a P(X=2) valószínűség. A válasz viszont már mindegyik mesében más lesz. Az első két mesében X a balesetes napok száma, a harmadikban pedig a balesetek száma.
Ebben a két történetben az a közös, hogy egyikben sem tudjuk, hány baleset történik a 30 nap alatt pontosan, csak azt tudjuk, hogy várhatóan mennyi. Amiben viszont eltérnek egymástól, hogy az egyikben X a balesetes napok száma, a másikban viszont a balesetek száma. Ez egy döntő különbség.
ISMERT,HOGY MENNYI AZ ÖSSZES ELEM ÉS AZ ÖSSZES SELEJT: HIPERGEOMETRIAI
ELOSZLÁS
CSAK VALAMI %-OS IZÉ ISMERT,
A VÁRHATÓ, AZ ÁTLAG, AZ ARÁNY, A VALÓSZÍNŰSÉG: BINOMIÁLIS
ELOSZLÁS vagy POISSON
ELOSZLÁS
Ez a bizonyos λ tehát a Poisson eloszlás várható értéke.
A várható értéket megnézhetjük a másik két eloszlásnál is. Ott erre külön képletek vannak.
Nézzük meg a szórásokat is. Erre mindegyik eloszlásnál külön képlet van forgalomban.
Most pedig lássuk a valószínűségeket.
Az X valószínűségi változó n és p paraméterű binomiális eloszlást követ – vagy rövidebben binomiális eloszlású – pontosan akkor, ha
[\bold P (X=k) = \binom{n}{k} p^k (1-p)^{n-k}, \quad k=0, 1, 2, ... , n \quad ,]
ahol 0 < p < 1. Azt, hogy az X valószínűségi változó n és p paraméterű binomiális eloszlást követ, a következő módon szoktuk jelölni: X ∼ B(n,p). Speciálisan, ha X ∼ B(1,p), akkor X-et Bernoulli-eloszlásúnak nevezzük.
A valószínűségszámításban és a statisztikában a Poisson-eloszlás egy diszkrét valószínűségi eloszlás, a binomiális eloszlás határeloszlása. Kifejezi az adott idő alatt ismert valószínűséggel megtörténő események bekövetkezésének számát
Az X valószínűségi változó λ paraméterű Poisson-eloszlást követ – vagy rövidebben: Poisson-eloszlású – pontosan akkor, ha
[\bold P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}, \quad k=0, 1, 2, ... \quad]
ahol λ > 0 konstans.
A binomiális eloszlás
Egy dobókockával négyszer egymás után dobunk. Mi a valószínűsége, hogy mind a négy dobás egyes? Annak a valószínűsége, hogy egy dobás egyes világos, hogy 1/6. Ha tehát mind a négy dobás egyes, akkor ennek valószínűsége:
Mekkora annak a valószínűsége, hogy a négy dobásból csak két dobás egyes? Ekkor az egyes dobás valószínűsége még mindig 1/6, míg annak a valószínűsége, hogy a dobás nem egyes 5/6. A kapott eredmény tehát
ez az eredmény azonban hibás! Azért hibás, mert ugyan négy darab 1-est csak egyféleképpen tudunk dobni – történetesen, hogy mindegyik dobás 1-es – ám két 1-est és két nem 1-est jóval többféleképpen. A négy hely közül azt a kettőt, ahol az 1-es lesz hatféleképpen lehet kiválasztani, a helyes megoldás tehát
Ez a sajnálatos körülmény azonban jelentős fennakadásokat okozhat a feladatok megoldásánál. Az emberek legnagyobb része ugyanis hajlamos elfelejteni ezt a kis kellemetlenséget, hogy kell az a bizonyos 6-os szorzó, vagy ha épp emlékszik is rá, hogy kell oda még valami, miért pont 6-os. Hogy mindezen szörnyűségeket elkerüljük, megalkotunk egy képletet direkt az ilyen esetekre. A képlet a következő:
Egy esemény bekövetkezésére van n darab független lehetőség. Az esemény minden egyes alkalommal vagy bekövetkezik vagy nem. A bekövetkezés valószínűsége minden egyes alkalommal p. Annak valószínűsége, hogy az n darab lehetőség közül éppen x-szer következik be:
Nézzünk néhány feladatot.
Egy nap 0,2 valószínűséggel esik az eső. Mi a valószínűsége, hogy egy hét alatt három nap esik?
Azonosítsuk be, hogy ki kicsoda. Egy héten maximum hét nap lehet, így a lehetőségek száma hét: n=7 Az esős napok száma három, vagyis x=3, annak a valószínűsége pedig, hogy egy nap esik, p=0,2. Ekkor:
Egy üzletben 100 vásárlóból átlag 7-en reklamálnak. Mi a valószínűsége, hogy ha 10-en állnak sorba, akkor 2-en fognak reklamálni?
a)Mi a valószínűsége, hogy a 10 emberből legfeljebb ketten reklamálnak?
b)Mi a valószínűsége, hogy a 10 emberből legalább ketten reklamálnak?
Ha 10-en állnak sorba, akkor a reklamálók száma maximum 10, ezek szerint n=10. A képletben p mindig 1 db bekövetkezés valószínűsége. Most tehát p annak a valószínűsége, hogy 1 db ember reklamál. Ha 100 vásárlóból 7-en reklamálnak, akkor a vásárlók 7%-a reklamál, vagyis p=0,7. Annak valószínűsége, hogy éppen ketten reklamálnak:
a) annak valószínűsége, hogy legfeljebb ketten reklamálnak
ezeket egyesével mind kiszámoljuk.
b) Most számoljuk ki annak valószínűségét, hogy a 10 emberből legalább ketten reklamálnak. Ekkor nem lenne célravezető, hogy
ez ugyanis kicsit sok számolással jár. Helyette a komplementer eseményt fogjuk számolni. Történetesen azt, hogy kettőnél kevesebb ember reklamál, ami azt jelenti, hogy vagy nulla, vagy egy ember reklamál.
ez jóval kellemesebb.
100 emberből átlag 80-nak van bankkártyája. Egy bevásárlóközpontban egy adott időpontban 1000 ember vásárol. Várhatóan hány rendelkezik bankkártyával? Ha 10-en állnak sorba, mi a valószínűsége, hogy 7 embernek lesz bankkártyája? Mi a valószínűsége, hogy van olyan ember, akinek van bankkártyája?
A 10 sorba álló mindegyike rendelkezhet bankkártyával, az összes lehetőség száma így n=10. annak valószínűsége, hogy valakinek van bankkártyája 0,8 hiszen 100 emberből átlag 80-nak van, ami 80%-ot jelent. Annak valószínűsége, hogy a sorba állók közül 7-nek van:
Az, hogy van olyan ember akinek van bankkártyája, azt jelenti, hogy legalább egy embernek van, vagyis
Ezt kiszámolhatjuk úgy, hogy
ám ez roppant időigényes lenne, ezért helyette
Módszert alkalmazzuk. Ekkor
Az USA déli államainak kőolaj ellátásához a Mexikói-öbölbe telepített 30 olajfúró toronyból legalább 27-nek kell zavartalanul működnie. A működésben kisebb zavar 0,02 valószínűséggel fordul elő. Mi a valószínűsége, hogy egy nap zavartalan lesz az ellátás?
Az ellátás akkor zavartalan, ha legalább 27 olajfúró torony működik. Ennek valószínűségét kell kiszámolnunk. Itt n=30, p=0,98, tehát:
Az előző képsorban megkezdtük a barátkozást a három legfontosabb diszkrét eloszlással, most pedig nézzünk néhány feladatot.
Egy bankba óránként átlag 24 ügyfél érkezik.
a)Mi a valószínűsége, hogy 7 perc alatt éppen 2-en érkeznek?
b)Mi a valószínűsége, hogy 7 perc alatt legfeljebb 2-en érkeznek?
c)Mi a valószínűsége, hogy 5 perc alatt legalább 2-en érkeznek?
Óránként átlag 24 ügyfél érkezik, de ez csak egy átlag. Vagyis megeshet, hogy egyik órában nem jön senki, a másikban pedig 50-en. Az ügyfelek száma tehát nem korlátos, akármennyi lehet. Na azért nem valószínű, hogy a következő 7 percben 7 milliárd ügyfél érkezik, de ki tudja. Ha még emlékszünk a balesetes példára, balesetes nap biztosan csak 7 darab lehet egy héten, de baleset lehet akár 7 milliárd is. Az ügyfelek száma a bankban tehát nem a balesetes nap, hanem a baleset.
Ez tehát egy POISSON ELOSZLÁS így szükségünk van a várható értékre.
Ha óránként 24 ügyfél érkezik, akkor percenként 24/60=0,4 és 7 perc alatt 7-szer annyi: 2,8.
Öt perc alatt várhatóan nem ugyanannyi ügyfél érkezik, mint 7 perc alatt, ezért a várható értéket itt más lesz.
Ha óránként 24 ügyfél érkezik, akkor percenként 24/60=0,4 és 5 perc alatt 5-ször annyi, vagyis éppen 2.
azt jelenti, hogy
Ami egy kicsit sok, ezért inkább a komplementerrel számoljunk.
Egy bizonyos évszakban minden nap 0,2 valószínűséggel esik eső. Mi a valószínűsége, hogy egy héten három nap esik?
X=esős napok száma
Ez biztosan korlátos, mert egy héten maximum 7 esős nap lehet.
Egy autópályán 100 autóból átlag 12-nél találnak valamilyen szabálytalanságot. 10 autót véletlenszerűen megállítva mi a valószínűsége, hogy
a) pontosan két autónál lesz valamilyen szabálytalanság?
b) legfeljebb két autónál lesz szabálytalanság?
c) legalább két autónál lesz szabálytalanság?
d) két egymást követő autó szabálytalan?
X=szabálytalan autó
10 autót állítanak meg, ezért meglepő lenne, ha mondjuk 13 lenne szabálytalan.
A szabálytalan autók száma tehát korlátos, maximum 10 lehet.
p=annak valószínűsége, hogy egy autó szabálytalan.
Ha 100 autóból 12 szabálytalan, akkor az autók 12%-a szabálytalan, így
Ez így kicsit sok lesz, úgyhogy inkább a komplementerrel számolunk.
Egy autó p=0,12 valószínűséggel szabálytalan. És a másik is.
A közúti ellenőrzés során óránként átlag 8 autónál találnak valamilyen szabálytalanságot. Mi a valószínűsége, hogy
a) negyed óra alatt háromnál?
b) fél óra alatt legfeljebb kettőnél?
X=szabálytalan autó
X itt is a szabálytalan autók száma, ahogyan az előbb.
De az előbb az volt, hogy a 10 megállított autóból hány szabálytalan, most meg, hogy negyed óra alatt hány szabálytalan.
10 autóból legrosszabb esetben is csak 10 lehet szabálytalan, de negyed óra alatt bármennyi.
Most tehát X nem korlátos, így POISSON ELOSZLÁS.
Ha óránként 8 autó szabálytalan, akkor negyed óra alatt a negyede: 8/4=2
Fél óra alatt kétszer annyi szabálytalan autó várható.
Végül itt jön egy olyan eset, amiben mindhárom eloszlás felbukkan majd.
Ehhez csinálnunk kell egy kis helyet.
Egy szövet anyagában átlag 10 méterenként van apró hiba.
a) Mi a valószínűsége, hogy egy 6 méteres darab hibátlan?
b) Mi a valószínűsége, hogy ha 30 méternyi szövetet 6 méteres darabokra vágnak,
akkor pontosan két hibás darab lesz?
c) Egy 120m-es szövetet 6 méteres darabokra vágtak föl és így 9 hibás darab keletkezett. Ha 5 darabot kiválasztunk, mi a valószínűsége, hogy 2 hibás?
X=hibák száma
Ha azt szeretnénk, hogy hibátlan legyen, akkor a hibák száma alighanem nulla.
Átlag 10 méterenként van 1 hiba.
De ez nem azt jelenti, hogy a szövetet úgy gyártják, hogy na megint lement a 10 méter, akkor tegyünk be egy hibát.
A hibák tehát teljesen kiszámíthatatlan módon helyezkednek el, így 10 méteren előfordulhat akár 2 hiba is, sőt 13, sőt bármennyi.
Ez tehát egy POISSON ELOSZLÁS és ha 10 méteren van átlag 1 hiba, akkor 6 méteren 0,6:
Y=hibás darabok száma
Hiba lehet bármennyi, de hibás darab maximum 5, tehát Y korlátos.
Itt p annak a valószínűsége, hogy egy darab hibás.
Lássuk csak, mekkora lehet annak a valószínűsége, hogy egy darab hibás.
Az előző kérdés az volt, hogy egy darab milyen valószínűséggel hibátlan.
Nos akkor hibás:
Ha 120 méternyi szövetet 6 méteres részekre vágnak, akkor 20 darab keletkezik.
Úgy hozta a sors, hogy ezek közül 9 hibás.
Kiválasztunk 5 darabot.
Z=hibás darabok száma
Folytonos valószínűségi változók többnyire időt, távolságot, meg olyanokat mérnek, hogy hány kiló, hány liter, stb. Természetükből adódóan itt nincs értelme olyat kérdezni, hogy mekkora a valószínűség, mert minden ilyen valószínűség nulla. Ez könnyen igazolható, ha mondjuk ellátogatunk egy olyan kocsmába, ahol sört csapolnak. Vagy több sört fogunk kapni, vagy általában inkább kevesebbet, de, hogy pont annyit nem, amennyi elő van írva, az biztos. Nos nem ez a legegzaktabb magyarázat erre a jelenségre, de jegyezzük meg, hogy folytonos valószínűségi változók esetén csak intervallumokat van értelme kérdezni, hogy vagy vagy
A valószínűségeket az eloszlásfüggvény vagy a sűrűségfüggvény segítségével tudjuk kiszámolni, és többnyire mi döntjük el, hogy melyiket használjuk. Azok, akik leküzdhetetlen vágyat éreznek az integrálás iránt, nos ők használják bátran a sűrűségfüggvényt, de szenvedéseink mértéke kisebb, ha az eloszlásfüggvényt használjuk.
1. lépés, hogy a valószínűséget átalakítjuk eloszlásfüggvényre, a 2. lépés pedig az, hogy megkeressük a konkrét eloszlásfüggvényt. EGYENLETES ELOSZLÁS
Valaki egy telefonhívást vár, ami 2 és 7 óra között érkezik, minden időpontban ugyanakkora valószínűséggel. Mekkora a valószínűsége, hogy 4ig hívják?
X=hány óra van
Az egyenletes eloszlás eloszlásfüggvénye
most a=10 és b=15
Az, hogy délig hívják:
EXPONENCIÁLIS ELOSZLÁS
Egy bankba általában 12 ügyfél érkezik óránként. Mekkora valószínűséggel telik el 10 perc úgy, hogy nem jön senki?
X=eltelt idő, perc
0 10 perc
Ha 10 percig nem jön senki, akkor a két ügyfél között eltelt idő 10 percnél több.
, tehát a
valószínűséget szeretnénk kiszámolni.
Várhatóan 12 ügyfél érkezik óránként, ezért az ügyfelek közt eltelt idő 60/12=5 perc,
vagyis a várható érték
perc és így
Az exponenciális eloszlás eloszlásfüggvénye
most
Az, hogy 10 percig nem jön senki:
NORMÁLIS ELOSZLÁS
Egy bankban az ügyfelek napi száma normális eloszlású, 560 fő várható értékkel és 40 fő szórással.
Ez azt jelenti, hogy az esetek nagy részében az ügyfelek száma napi 560 fő körül van, de előfordulhat, hogy azért több, vagy pedig, hogy kevesebb.
Az viszont már ritka, hogy sokkal több vagy sokkal kevesebb.
A normális eloszlás sűrűségfüggvénye
Ez egy nagyon remek függvény, csak sajnos van vele egy kis gond.
Nem tudjuk integrálni. Úgy értem nem ma, hanem egyáltalán.
Nem baj, mert a valószínűségeket eddig sem a sűrűségfüggvénnyel, hanem az eloszlásfüggvénnyel számoltuk ki.
Csak sajnos van egy kis gond. Eloszlásfüggvény ugyanis nincs.
Ezt a kis kellemetlenséget úgy tudjuk kiiktatni, hogy bevezetünk egy speciális normális eloszlást, aminek a várható értéke nulla, a szórása pedig egy.
Ezt standard normális eloszlásnak nevezzük.
A standard normális eloszlás sűrűségfüggvénye
eloszlásfüggvénye pedig egy táblázat formájában létező függvény, aminek jele .
Lássuk a táblázatot.
Nos mindjárt két táblázat is van. De aggodalomra semmi ok, a két táblázat lényegében ugyanaz, mindjárt meglátjuk.
A standard normális eloszlás sűrűségfüggvénye az úgynevezett Gauss-görbe.
Az első táblázat az eloszlásfüggvény értékeit tartalmazza, vagyis azt, hogy mekkora a görbe alatti terület mínusz végtelentől z-ig.
Ha z=0 akkor ez pont a fele a teljes területnek.
Mivel a sűrűségfüggvények görbe alatti területe 1, ezért a fele 0.5
Ha z egy picit nagyobb, mint 0,
akkor a terület is egy picit nagyobb.
Itt jön aztán a másik táblázat, ami csak abban különbözik az előzőtől, hogy a területek 0-tól kezdődnek.
A területek így éppen 0.5-el kisebbek, mint a másikban.
Teljesen mindegy, hogy egy feladat megoldásánál melyik táblázatot használjuk, de ha választani lehet, inkább az elsőt érdemes.
Végül van itt még egy dolog.
tehát a rajzon ez a terület.
pedig ez a terület.
Ha megfigyeljük, ezek éppen a teljes területté egészítik ki egymást.
.
Hát ez remek, és akkor most folytassuk a feladat megoldását.
Most egy olyan normális eloszlásunk van, ahol a várható érték 560 a szórás pedig 40.
Annak valószínűsége, hogy egy adott napon az ügyfelek száma 616-nál kevesebb:
Ha az első táblázatot használjuk, akkor éppen a keresett valószínűséget kapjuk.
Ha a másodikat, akkor még 0.5-öt hozzá kell adni.
Nézzünk meg még egy ilyet.
Mekkora valószínűséggel lesz az ügyfelek száma 480-nál kevesebb?
A folytonos valószínűségi változók többnyire időt, távolságot, meg olyanokat mérnek, hogy hány kiló, hány liter, stb.
Természetükből adódóan itt nincs értelme olyat kérdezni, hogy mekkora a P(X=a) valószínűség, mert minden ilyen valószínűség nulla.
Ez könnyen igazolható, ha mondjuk ellátogatunk egy olyan kocsmába, ahol sört csapolnak. Vagy több sört fogunk kapni, vagy általában inkább kevesebbet, de, hogy pont annyit nem, amennyi elő van írva, az biztos. Nos nem ez a legegzaktabb magyarázat erre a jelenségre, de jegyezzük meg, hogy folytonos valószínűségi változók esetén csak intervallumokat van értelme kérdezni, hogy P(X<a) vagy P(X>a) vagy P(a<X<b)
A valószínűségeket az eloszlásfüggvény vagy a sűrűségfüggvény segítségével tudjuk kiszámolni, és többnyire mi döntjük el, hogy melyiket használjuk. Azok, akik leküzdhetetlen vágyat éreznek az integrálás iránt, nos ők használják bátran a sűrűségfüggvényt, de szenvedéseink mértéke kisebb, ha az eloszlásfüggvényt használjuk.
1. lépés, hogy a valószínűséget átalakítjuk eloszlásfüggvényre, a 2. lépés pedig az, hogy megkeressük a konkrét eloszlásfüggvényt.
A POISSON ELOSZLÁS ÉS AZ EXPONENCIÁLIS ELOSZLÁS KAPCSOLATA
Egy benzinkúthoz óránként átlag 12 autó érkezik.
1. Mekkora a valószínűsége, hogy 10 perc alatt három autó érkezik?
2. Mekkora a valószínűsége, hogy két autó érkezése közt legalább 10 perc telik el?
Az első kérdés az autók számáról, míg a második az érkezésük közt eltelt időről szól.
Az autók száma diszkrét eloszlás, és mivel érkezhet bármennyi, ezért Poisson, az eltelt idő folytonos eloszlás és történetesen exponenciális.
1. X=autók száma 10 perc alatt, darab, POISSON
A várható érték óránként 12 autó, tehát 1 perc alatt 12/60=0,2 és 10 perc alatt darab
2. Y=autók közt eltelt idő, perc, EXPONENCIÁLIS
A várható érték óránként 12 autó, tehát az átlagosan eltelt idő 60/12=5 perc perc
Mindkét eloszlás ugyanazt a történetet írja le, csak az egyik a bekövetkezések számát vizsgálja, a másik pedig a köztük eltelt időt.
Így hát ennek a bizonyos -nak mindkét helyen történő rejtélyes felbukkanása sem pusztán a véletlen műve. A két valójában ugyanaz.
Ehhez azt kell megértenünk, hogy Poisson-eloszlás várható értéke függ a vizsgált időtartamtól,
Hosszabb idő alatt többen jönnek, rövidebb idő alatt kevesebben.
Mondjuk 10 perc alatt , de 15 perc alatt már .
Az exponenciális eloszlás várható értéke viszont a várhatóan eltelt idő, ami 5 perc, és ez nem függ a vizsgált időtartamtól.
Fél óra alatt ugyanúgy átlagosan 5 percenként érkeznek az autók, mint 20 perc alatt. Itt tehát a mindig ugyanannyi.
Ha pedig a Poisson eloszlásnál éppen akkora időtartamot nézünk, ami az exponenciális eloszlásnál az idő múlásának a mértékegysége, akkor a két mindig megegyezik.
Nézzük meg mi a helyzet ezzel a konkrét példánk esetében.
Ha az exponenciális eloszlásnál az eltelt időt percben mérjük, akkor a várható érték 5 perc és így .
Most számoljuk ki a -t a Poisson-eloszlásnál egy perces időtartamra.
Óránként 12-en jönnek, tehát egy perc alatt 12/60=0,2 vagyis , a két tehát megegyezik.
Ha az exponenciális eloszlásnál az eltelt időt mondjuk órában mérjük, akkor az 5 perces várható érték, lássuk csak 5 perc = 5/60 óra, tehát úgy durván 0,083 óra.
Ekkor .
Most számoljuk ki a -t a Poisson-eloszlásnál egy órás időtartamra.
Mivel a feladat úgy szólt, hogy óránként 12-en jönnek, a jelek szerint
.
A két tehát ilyenkor is megegyezik.
X = bekövetkezések száma adott idő alatt
Y = két bekövetkezés között eltelt idő
Egy földterületen átlagosan 16 havonta van a Richter-skála szerinti 5-ösnél erősebb földrengés.
a) Mi a valószínűsége, hogy egy év alatt két ilyen földrengés is van?
b) Mi a valószínűsége, hogy két ilyen földrengés közt legalább három év telik el?
X = erősebb földrengések száma egy év alatt
Lássuk hány földrengés van évente. Egy év 12 hónap, a földrengések pedig 16 havonta vannak.
Egy év alatt tehát földrengés van.
Y = a földrengések között eltelt idő
X Poisson eloszlású és a földrengések száma, Y viszont exponenciális eloszlású és a földrengések közt eltelt idő.
A várható érték tehát most nem azt jelenti, hogy várhatóan hány földrengés van, hanem azt, hogy várhatóan hány hónap telik el köztük.
3 év = 36 hónap
Na ennyi elég is volt az exponenciális eloszlásból.
Egy mobiltelefon élettartama exponenciális eloszlású, 4 év várható élettartammal.
a) Mekkora a valószínűsége, hogy legalább 3 évig működik?
b) Mekkora a valószínűsége, hogy 3 évnél tovább, de 5-nél kevesebb ideig működik?
c) Mi a valószínűsége, hogy ha már 3 éve működik, a következő 2 évben elromlik?
A folytonos valószínűségi változók többnyire időt, távolságot, meg olyanokat mérnek, hogy hány kiló, hány liter, stb.
Természetükből adódóan itt nincs értelme olyat kérdezni, hogy mekkora a P(X=a) valószínűség, mert minden ilyen valószínűség nulla.
Ez könnyen igazolható, ha mondjuk ellátogatunk egy olyan kocsmába, ahol sört csapolnak. Vagy több sört fogunk kapni, vagy általában inkább kevesebbet, de, hogy pont annyit nem, amennyi elő van írva, az biztos. Nos nem ez a legegzaktabb magyarázat erre a jelenségre, de jegyezzük meg, hogy folytonos valószínűségi változók esetén csak intervallumokat van értelme kérdezni, hogy P(X<a) vagy P(X>a) vagy P(a<X<b)
A valószínűségeket az eloszlásfüggvény vagy a sűrűségfüggvény segítségével tudjuk kiszámolni, és többnyire mi döntjük el, hogy melyiket használjuk. Azok, akik leküzdhetetlen vágyat éreznek az integrálás iránt, nos ők használják bátran a sűrűségfüggvényt, de szenvedéseink mértéke kisebb, ha az eloszlásfüggvényt használjuk.
Most pedig nézzünk meg néhány exponenciális eloszlással kapcsolatos rémtörténetet. Az exponenciális eloszlás az egyik legfontosabb folytonos eloszlás, az exponenciális eloszlású valószínűségi változó általában időt és távolságot mér. Itt jön az első exponenciális eloszlásos feladat megoldása:
Itt is van az első:
Egy készülék élettartama exponenciális eloszlású valószínűségi változó 5 év szórással.
Mekkora a valószínűsége, hogy egy ilyen készülék legfeljebb 8 évig működik?
Hát ez elég könnyű volt. Lássunk egy nehezebbet.
Egy bankban, az esetek negyedében fordul elő, hogy egy ügyfelet 10 percen belül nem követ másik.
Mi a valószínűsége, hogy 20 percig nem jön senki?
Egy óra alatt várhatóan hány ügyfél érkezik?
A jelek szerint várhatóan 7,215 percenként érkeznek ügyfelek.
Egy óra alatt ügyfél érkezik.
Egy üzletben 10 perc alatt átlagosan 5 vevő fordul meg. A vevők érkezése között eltelt idő exponenciális eloszlású valószínűségi változó. 10.00-kor érkezik egy vevő. Mi a valószínűsége, hogy a következő vevő 10.12 és 10.15 között érkezik?
Átlagosan 2 perc telik el a vevők érkezése között:
Egy készülék élettartama exponenciális eloszlású valószínűségi változó, annak valószínűsége, hogy legalább 6 évig működik .
Hány éves legyen a garancia idő, ha a termékek legfeljebb 20%-a hibásodhat meg garanciaidőn belül?
X=hány évig működik
y év garancia
A jelek szerint tehát legfeljebb 0,669 év garanciaidőre van szükség.
Ez nap.
A normális eloszlás
A normális eloszlás az egyik legfontosabb valószínűségi eloszlás. Általában a dolgok mennyiségbeli eloszlását írja le. Például egy repülőtér napi forgalma, egy iskolában a hallgatók magassága, egy palackozó üzemben a palackokba töltött folyadék mennyisége mind-mind normális eloszlásúnak tekinthető. A normális eloszlás eloszlásfüggvényének grafikonja igen jellegzetes, kinézetre olyan, az óriáskígyó, amikor lenyelte az elefántot. A görbét harang-görbének vagy Gauss-görbének szokás nevezni, a görbét leíró függvény pedig:
Itt a normális eloszlás várható értéke, pedig a szórása. A várható érték mindig a függvény grafikonjának legmagasabb pontjánál van, ez egyúttal a leggyakoribb érték, vagyis a módusz. A sűrűségfüggvény segítségével számoljuk ki a valószínűségeket, úgy, hogy meghatározzuk a függvény görbe alatti területét.
Nézzünk egy példát! Normális eloszlású például az 1,5 literes ásványvizes üvegben a beletöltött víz mennyisége. A palackozó gép azonban nem képes minden egyes üvegbe pontosan 1,5 liter vizet tölteni, az egyikbe egy kicsivel többet, a másikba egy kicsivel kevesebbet tölt. Ezt az ingadozást írja le a szórás. Legyen most a szórás 30 ml.
A normális eloszlás várható értéke tehát , szórása pedig, a 30 millilitert átváltva literre .
Számoljuk most ki annak a valószínűségét, hogy egy üvegben a beletöltött víz mennyisége kevesebb, mint 1,56 liter. Jelöljük x-el az üvegbe töltött víz mennyiségét. Amit ki kell számolnunk:
Rajzoljuk föl a normális eloszlás sűrűségfüggvényét. A maximuma 1,5-nél lesz, a grafikon valami ilyesmi:
Rajzoljuk most be azt is, amit ki szeretnénk számolni, nevezetesen, hogy egy üvegben a beletöltött víz mennyisége kevesebb, mint 1,56 liter. A keresett valószínűség éppen a görbe alatti terület lesz.
Ahhoz, hogy ezt a területet képesek legyünk meghatározni, szükségünk van egy táblázatra, amely minden egyes x értékhez megadja a hozzá tartozó görbe alatti területet. Azonban lehetetlen minden egyes normális eloszláshoz, vagyis minden egyes lehetséges várható értékhez és szóráshoz külön táblázatot készíteni. A problémát úgy oldhatjuk meg, ha készítünk csak egy táblázatot, méghozzá egy igen speciális normális eloszláshoz, a többi normális eloszlást pedig megpróbáljuk erre az egyre visszavezetni. Ezt a speciális normális eloszlást standard normális eloszlásnak nevezzük.
A standard normális eloszlás várható értéke E(x)=0, szórása pedig D(x)=1. Sűrűségfüggvénye a megszokott harang alakú görbe:
Hogyan lehet ekkor egy általános normális eloszlásból standard normális eloszlást csinálni? Valahogy el kell érni, hogy a normális eloszlású x várható értéke ne legyen, hanem nulla, a szórása pedig ne legyen, hanem egy.
A módszert standardizálásnak nevezzük, és lényege a következő. Az x értékeiből kivonjuk a várható értékét, majd az így kapott értéket elosztjuk a szórással. A kapott standard értékeket z-nek nevezzük. Ez sokkal egyszerűbb, mint amilyen bonyolultnak hangzik:
Ha azt akarjuk kiszámolni, hogy egy palackban 1,56 liternél kevesebb víz van, akkor itt x=1,56. A várható érték 1,5 a szórás pedig 0,03 volt, így a képlet szerint
Mit is jelent ez? Eddig, amikor még normális eloszlásunk volt, annak a valószínűségét akartuk kiszámolni, hogy x<1,56. Most, a standard normális eloszlás esetén már a z<2 kell nekünk. Ezt rajzoljuk be a standard normális eloszlás grafikonjára:
[Szövegdoboz: z<2]
A keresett valószínűség a bejelölt terület. Az, hogy mekkora ez a terület, egy táblázatból nézhetjük meg, ami a standard normális eloszlás eloszlástáblázata. Íme a táblázat:
z
z
0
0,5000
1,05
0,8531
0,05
0,5199
1,1
0,8643
0,1
0,5398
1,15
0,8749
0,15
0,5596
1,2
0,8849
0,2
0,5793
1,25
0,8944
0,25
0,5987
1,3
0,9032
0,3
0,6179
1,35
0,9115
0,35
0,6368
1,4
0,9192
0,4
0,6554
1,45
0,9265
0,45
0,6736
1,5
0,9332
0,5
0,6915
1,55
0,9394
0,55
0,7088
1,6
0,9452
0,6
0,7257
1,65
0,9505
0,65
0,7422
1,7
0,9554
0,7
0,7580
1,75
0,9599
0,75
0,7734
1,8
0,9641
0,8
0,7881
1,85
0,9678
0,85
0,8023
1,9
0,9713
0,9
0,8159
1,95
0,9744
0,95
0,8289
2
0,9772
1
0,8413
2,05
0,9798
A táblázatnak két kellemetlen tulajdonsága van. Az egyik, hogy a z értékekhez tartozó valószínűségek mindig a z-től balra eső területet adják meg, a tőle jobbra esőt nem. Ez azonban nem olyan tragikus, mivel tudjuk, hogy a teljes görbe alatti terület éppen egy. Ha tehát a jobbra eső területre van szükségünk, azt úgy kapjuk meg, hogy 1-ből kivonjuk a táblázatban szereplő értéket. Például, ha z=1, akkor az 1-től balra eső terület 0,8413 ez az, amit kikeresünk a táblázatból. Az 1-től jobbra eső terület ekkor 1-0,8413 ami 0,1587.
A táblázat másik kellemetlen tulajdonsága, hogy csak pozitív z értékeket tartalmaz. Ez azért probléma, mert sokszor adódik majd úgy, hogy z negatív. Hogy ebben az esetben mi a teendő, majd meglátjuk.
Térjünk most vissza a feladatunkhoz. Az eredeti feladat az volt, hogy kiszámoljuk a valószínűséget. Aztán standardizáltunk:
És így már a P(z<2) amire szükségünk van. Ha rápillantunk a táblázatra, megkapjuk, hogy p(z<2)=0,9772.
Nézzünk meg néhány feladatot!
Egy bizonyos vonatjáraton 560 ülőhely áll rendelkezésre. A vonat átlagos kihasználtsága 400 ülőhely, a szórás 100, az utas szám normális eloszlású. Indulás előtt szeretnénk a vonatra 4 jegyet váltani. Mi a valószínűsége, hogy nem lesz elegendő szabad hely?
Akkor nem lesz elegendő hely négy ember számára, ha a vonatra jegyet váltó utasok 560-nál többen vannak. Ennek valószínűségét kell kiszámolnunk.
A várható érték megegyezik a vonat átlagos kihasználtságával, ami 400, a szórás pedig 100, tehát és . Standardizálunk.
A normális eloszlásban még p(560<x) kellett, most már p(1,6<z)
[Szövegdoboz: 1,6
A táblázatból kikeressük az 1,6-hoz tartozó értéket, ami 0,9452. Most azonban nekünk nem a balra, hanem a jobbra eső terület kell, ami 1-0,9452=0,0548. Ez a feladat megoldása. Annak esélye, hogy nem kapunk jegyet 5% körüli.
Egy repülőtéren jelenleg öt kifutópálya üzemel, amely óránként maximum 12 tranzakcióra (gép indítására vagy fogadására) alkalmas. A repülőtéren ezen tranzakciók száma normális eloszlású óránként átlag 40, a szórás 20. Mekkora valószínűséggel alakul ki torlódás? Egyik nap, havazás miatt csak 3 pálya működik. Mi a valószínűsége, hogy nem kell törölni járatot?
Akkor alakul ki torlódás, ha nem elég a rendelkezésre álló öt kifutópálya sem. Mivel pályánként 12 tranzakció lehetséges, ez öt pályánál 60 tranzakció. Akkor nem elég az öt pálya, ha a gépek száma 60<x. Ennek valószínűsége:
Standardizálunk. A várható érték 40 gép, a szórás 20, tehát és .
A normális eloszlásban még p(60<x) kellett, most már p(1<z)
Kikeressük a táblázatból az 1-hez tartozó értéket, ami 0,8413. Nekünk azonban most a jobbra eső terület kell, ami 1-0,8413=0,1587.
[Szövegdoboz: 1
Ha egyik nap a havazás miatt csak három pálya használható, akkor ez 3szor 12 vagyis 36 gép fogadására alkalmas. Akkor nem kell járatot törölni, ha a gépek száma az adott órában maximum 36. Ennek a valószínűségét kell kiszámolnunk:
Standardizálunk. A várható érték 40 gép, a szórás 20, tehát és .
A normális eloszlásban még p(x<36) kellett, most már p(z<-0,2)
És itt jön a táblázat másik kellemetlen tulajdonsága, nevezetesen az, hogy nem tartalmaz negatív értékeket. A -0,2-t tehát sajnálatos módon nem fogjuk benne megtalálni. Ilyenkor a teendő a következő.
Amit valójában ki szeretnénk számolna, a p(z<-0,2) valószínűség, ami rajzban így fest:
[Szövegdoboz: z<-0,2]
Mivel azonban negatív számok nincsenek a táblázatban, az egészet tükrözzük, és így kapjuk, hogy
[Szövegdoboz: 0,2
Most megkeressük a 0,2-höz tartozó értéket a táblázatban. Ez 0,5793. Eredetileg nekünk a bal oldali terület kellett, ám a tükrözés után ez átkerült jobb oldalra. A táblázatból kapott 0,5793 a 0,2-től balra eső terület, ami nem kell. Ami kell, az 1-0,5793=0,4207. Tehát 42% esély van rá, hogy nem kell az adott órában járatot törölni.
Egy metróállomáson három mozgójárda segíti az átszállást. Minden járda óránként 2500 utast tud továbbítani. Az utasok óránkénti száma normális eloszlású, várható értéke 6000, szórása 1000. Mi a valószínűsége, hogy a forgalom miatt nem elég két járdát üzemeltetni? Elvileg naponta átlagosan hány órán keresztül kell a torlódás elkerülése érdekében mind a három járdát üzemeltetni? Mekkora valószínűséggel alakul ki torlódás annak ellenére, hogy mind a három járda működik?
Akkor nem elég két járdát üzemeltetni, ha a forgalom nagyobb, mint amit két járda képes lebonyolítani. Ha járdánként 2500 utas továbbítható egy óra alatt, akkor két járda maximum 5000 utast tud szállítani. Akkor nem elég a két járda, ha az utasok száma 5000<x. ennek valószínűsége:
Standardizálunk. A várható érték 6000 utas a szórás 1000, tehát és .
A normális eloszlásban még p(5000<x) kellett, most már p(-1<z)
[Szövegdoboz: -1
Sajnálatos módon a -1 nem található meg a táblázatban, ezért az egészet tükrözzük:
[Szövegdoboz: z<1]
Ez már megtalálható a táblázatban, és a z=1-hez tartozó érték pont jó is, hiszen a nekünk kellő terület pont balra esik. A táblázatból kinézzük: 0,8413. Az esetek 84%-ban szükség van mindhárom járdára.
Mindhárom járda működése esetén akkor alakul ki torlódás, ha az utasok száma meghaladja a három járda által továbbítani képes 7500-as számot:
Standardizálunk:
[Szövegdoboz: 1,5
Kikeressük a táblázatból az 1,5-höz tartozó értéket, ami 0,9332. Nekünk azonban
nem az 1,5-től balra eső területre van szükségünk, így a megoldás 1-0,9332 vagyis 0,0668 lesz. Mindössze 7% körüli az esélye, hogy mind a három járdát működtetik és mégis torlódás alakul ki.
Egy almafajta átmérője átlag 12 cm, a szórás 4 cm. Az alma nem hozható kiskereskedelmi forgalomba, ha átmérője 5 cm-nél kisebb, vagy 16 cm-nél nagyobb. Egy 10.000 darabos szállítmányból várhatóan hány darab alma hozható forgalomba?
Annak valószínűségét kell kiszámolnunk, hogy egy alma jó, ami annyit tesz:
Ezt rajzoljuk be a sűrűségfüggvény grafikonjába.
[Szövegdoboz: 5 16]
Standardizálunk.
Most a várható érték a szórás pedig . Ekkor az eredeti normális eloszlásban még a standardizálás után viszont
Vagyis amit berajzolunk a standard normális eloszlás sűrűségfüggvényének grafikonjára.
[Szövegdoboz: -1,4 0,8]
A keresett területet úgy fogjuk kiszámolni, hogy a 0,8-tól balra eső területből kivonjuk a -1,4-től balra eső területet.
[Szövegdoboz: 0,8]
[Szövegdoboz: -1,4]
Ezeket a területeket a táblázatból kapjuk meg. Az egyik 0,7881, míg a másik a szokásos tükrözéses procedúra után 0,0808. A keresett valószínűség a kettő különbsége:
0,7881-0,0808=0,7073.
Egy üzlet napi forgalma közelítőleg normális eloszlású valószínűségi változó. A vásárlók átlagos száma 568 fő, a szórás 16 fő. Mekkora valószínűséggel lesz egy adott napon a vevők száma legfeljebb 600 fő?
Nos ennél a pontnál három eset lehetséges.
Az első és egyben nem túl valószínű eset az, hogy valóban érdekel minket, hogy mekkora ez a valószínűség.
Ez annyira ritka, hogy el is felejthetjük.
A második lehetőség, hogy ez valamilyen idióta feladat, amit meg kell oldanunk, de nem adtak mellé eloszlástáblázatot.
Jó hír, ebben az esetben kész, ez a megoldás.
És, hogy mi is az eloszlástáblázat? Nos ez.
Ebben a táblázatban kell megtalálnunk a keresett valószínűséget akkor, ha a feladat mellé adnak nekünk egy ilyet is. Ez volna a harmadik eset.
Megkeressük a táblázatban a 2-t.
Meg is van. Mindjárt kétszer is.
Sajna ugyanis ilyen normális eloszlás táblázatból kétfél van forgalomban.
De mielőtt elhatalmasodna rajtunk a kétségbeesés, vessünk azért egy pillantást a táblázatokra.
A két táblázat lényegében ugyanaz, csak a jobb oldaliban minden érték 0,5-tel kevesebb.
Ha a bal oldali táblázatot használjuk, akkor kész is. Ez a szám a megoldás.
Ha a jobb oldalit, akkor is kész, csak még hozzá kell adni 0,5-öt.
És, hogy honnét tudjuk, melyik típusú táblázatunk van?
Nos, nagyon egyszerű. Abban a táblázatban, ahol nem kell hozzáadni semmit, ott minden szám 0,5 és 1 között van.
A másikban pedig 0 és 0,5 között.
Hát ez jó, és akkor nézzünk meg egy másik feladatot is.
Egy határátkelőhelyen a várakozási idő normális eloszlású valószínűségi változó, 18 perc várható értékkel. Annak valószínűsége, hogy az átkelésig legfeljebb 6 percet kell várni
Mekkora valószínűséggel tart legfeljebb 20 percig a várakozás?
Mekkora a valószínűsége, hogy 10 percnél több, de 20 percnél kevesebb ideig kell várni?
Minden normális eloszlásos feladat megoldásánál szükségünk van a várható értékre és a szórásra.
Most a várható értéket tudjuk, de a szórást nem.
Úgyhogy lépéseket teszünk a szórás kiszámolásának érdekében.
Van egy remek képletünk azokra az esetekre, amikor itt negatív szám van.
Íme itt is van.
És most végre válaszolhatunk a kérdésekre.
Egy palackozó üzemben 1 literes ásványvizeket töltenek, közelítőleg normális eloszlással. Annak valószínűsége, hogy az üvegbe töltött víz a várhatótól legfeljebb 25 milliliterrel eltér
Mekkora a szórás?
Van egy ilyen, hogy
Olyan viszont nincs, hogy ha akkor mi van…
Így aztán szükségessé válnak bizonyos átalakítások.
Az exponenciális eloszlásnak van egy furcsa tulajdonsága.
Egy olyan tulajdonsága, amivel Bob sajnos nem rendelkezik.
Ezt a tulajdonságot örökifjú tulajdonságnak nevezzük.
Bob esetében, aki nem rendelkezik ezzel a tulajdonsággal, ha szeretnénk megtudni mekkora valószínűséggel hal meg egy év leforgása alatt, akkor tudnunk kell, hogy hány éves.
Nem ugyanakkora ugyanis egy éven belüli halálának esélye 10 évesen, mint 60 évesen vagy épp 102 évesen. Ahogy az idő múlik, Bob bizony egyre nagyobb eséllyel hal meg, mert nem örökifjú.
Az exponenciális eloszlás viszont az.
Ez azt jelenti, hogy mindegy, eltelt-e már az a három év.
Azt akár le is tagadhatjuk.
A feltételben szereplő 3 év mintha nem is létezne.
Egy mobiltelefon élettartama exponenciális eloszlású, 4 év várható élettartammal.
a) Mekkora a valószínűsége, hogy legalább 3 évig működik?
b) Mekkora a valószínűsége, hogy 3 évnél tovább, de 5-nél kevesebb ideig működik?
c) Mi a valószínűsége, hogy ha már 3 éve működik, a következő 2 évben elromlik?
Az utolsó kérdés vicces lesz.
Próbáljuk meg kideríteni, hogy mi az amiben eltér az előzőtől.
Ehhez rajzolgassunk egy kicsit.
Tudjuk, hogy már 3 éve működik,
tehát valahol itt romlik el.
De még 5 éven belül.
Nos ez eddig élénken emlékeztet az előző kérdésre.
Hogy jobban megértsük mi is a különbség a két kérdés között vegyük például Bobot.
Megpróbáljuk megjósolni, hogy vajon mekkora a valószínűsége annak, hogy Bob a 70-edik és a 71-edik születésnapja között fog elhalálozni.
A kérdés az, hogy ez a valószínűség vajon nagy vagy kicsi. Nos ez attól függ.
Ha Bob születése pillanatában jósoljuk meg, hogy mekkora a valószínűséggel fog a 70-edik és a 71-edik születésnapja közt meghalni, akkor ez a valósszínűség kicsi.
Azért kicsi, mert Bobbal addig még bármi történhet, például 5 éves korában elüti egy busz, vagy 60 évesen infarktust kap…
Ugyanakkor, ha Bob már éppen 70 éves és születésnapja alkalmából megjósoljuk neki, hogy mekkora sansza van a következő egy évben meghalni, akkor biztosíthatjuk róla, hogy ennek valószínűsége igen nagy.
Nos éppen ez a különbség a kétféle kérdés között.
Mindkét esetben a 3 és 5 közötti elromlásról szól a kérdés,
csak az egyik esetben a születés pillanatában tesszük föl a kérdést,
a másik esetben pedig már 3 évnyi működés után.
ez volt az első kérdés
ha még emlékszünk
Végül itt jön még egy vicces ügy.
Egy biztosítónál naponta átlagosan 5 kárbejelentés érkezik lakásbiztosítással kapcsolatban.
a) Mi a valószínűsége, hogy egy nap a várhatónál kevesebb érkezik?
b) Mi a valószínűsége, hogy egy héten három nap lesz a várhatónál kevesebb bejelentés?
X=kárbejelentések száma
Bármikor előfordulhat, hogy a földönkívüliek megtámadják a Földet és ilyenkor a lakás kárbejelentések száma napi egymillió is lehet. Vagyis X nem korlátos.
Y= napok száma
amikor az átlagnál kevesebb a bejelentés
Egy héten maximum hét nap van, így Y korlátos.
Nézzük mi az amit tudunk:
annak valószínűsége, hogy egy nap az átlagnál kevesebb a bejelentés
5.7.
Egy bankba az esetek 0,3%-ában nem érkezik ügyfél egy óra alatt. Az ügyfelek száma Poisson eloszlású.
a) Mekkora az ügyfelek várható száma óránként?
b)
X = ügyfelek száma
Nincs ügyfél az esetek 0,3%-ában
Nekünk a kitevőben lévő -ra van szükségünk.
Úgy tudjuk onnan lecsalogatni, hogy vesszük mindkét oldal e alapú logaritmusát.
Van egy ilyen, hogy
Úgyhogy pápá
Ezzel megvolnánk.
Várhatóan 5,81 ügyfél van óránként.
Pontosan 5,81 ügyfél persze nem fog érkezni, legfeljebb a hullaházba.
Ezt úgy kell érteni, hogy átlagosan 5,81 ügyfél.
Nézzük mi van a másik kérdéssel.
Az kevésbé jól néz ki.
X az ügyfelek számát jelenti.
Ha az ügyfelek még életben vannak akkor ez csak egész szám lehet.
5.8.
Egy újságárus óránként 48 darab újságot szokott eladni, amiből átlag 36 napilap. Mi a valószínűsége, hogy
a) 10 perc alatt legfeljebb 2 napilapot ad el?
b) 5 perc alatt éppen 7 újságot ad el?
c) a 7 eladott újságból 4 napilap?
X = eladott napilapok száma 10 perc alatt
X nem korlátos, ha megérkezik a turistacsoport Kínából akik mind ki vannak éhezve egy kis napilapra akkor az újságárus akár 1000 darabot is eladhat.
Az átlagos eladás óránként 36 napilap ami 10 perc alatt a hatoda:
Y= eladott újságok száma 5 perc alatt
Ez is Poisson eloszlás.
A várható érték óránként 48 darab, 5 perc alatt pedig:
Z = a 7 eladott újságból a napilapok száma
Nem tudjuk, hogy összesen hány újság és hány napilap van.
De azt tudjuk, hogy 48 újságból átlag 36 napilap, ami 75%
5.9.
Annak valószínűsége, hogy egy hírlapárus negyedóra alatt egyetlen lapot sem tud eladni
a) Mennyit szokott eladni átlagosan óránként?
b) Mekkora valószínűséggel ad el félóra alatt 10 darabot?
c) Legfeljebb milyen hosszú ideig nem tud eladni egyetlen lapot sem legalább 0,6 valószínűséggel?
X = eladott újságok száma
Ezek az újságárusok mindig Poisson eloszlással árulják az újságokat.
egyet sem tud eladni valószínűséggel
Várhatóan 6 darabot ad el negyedóra alatt.
Akkor óránként feltehetően négyszer annyit ad el: 24 darabot.
Lássuk csak, fél óra alatt várhatóan 12 darabot ad el:
Fogalmunk sincs, hogy milyen hosszú ideig nem tud eladni egyetlen újságot sem. Legyen ez az idő t.
Nos ez remek, már csak az a kérdés, hogy akkor most mi van.
Amit kaptunk, a Poisson eloszlás várható értéke t idő alatt.
Vagyis várhatóan ennyi újságot vesznek t idő alatt.
Mennyi vajon a t?
15 perc alatt 6 darabot vesznek, t idő alatt 0,511 darabot.
Legfeljebb 1,2775 perc telik el úgy, hogy még legalább 60% eséllyel nem vesznek újságot.
5.10.
Egy bizonyos hónap 30 napjából átlag 12 nap szokott esni. Mi a valószínűsége, hogy egy héten három nap esik?
X = esős napok száma
Összes nap 30 amiből esős 12:
A vizsgált napok száma 7 és ebből esnie kell háromszor:
De sajnos van egy kis gond.
A 30 napból ugyanis átlag 12 nap szokott esni, ami azt jelenti, hogy például idén eshet 25 napon keresztül is vagy csak 5 napig.
Fogalmunk sincs tehát róla, hogy hány esős nap van, csak az átlagot ismerjük.
Mivel azonban X korlátos, hiszen egy héten maximum 7 nap eshet, ez egy Binomiális eloszlás lesz.
5.11.
Egy könyvben 100 oldalon átlag 80 nyomdahiba található. Mi a valószínűsége, hogy 10 egymást követő oldalon 7 hiba lesz?
X = hibák száma
Összes oldal 100 ahol 80 hiba található:
A vizsgált oldalak száma 10 és itt 7 hibának kell lennie:
De sajnos van egy kis gond.
A 100 oldalon ugyanis átlag 80 hiba szokott lenni, ami azt jelenti, hogy például lehet 150 darab is vagy éppen csak 25.
Fogalmunk sincs tehát róla, hogy hány hiba van, csak az átlagot ismerjük.
A vizsgált 10 oldalból hibás oldal maximum 10 lehet, viszont hiba lehet bármennyi.
X a hibák száma, ezért nem korlátos.
hiba várható 1 oldalon
5.12.
Egy vizsgán a hallgatóknak általában 60%-a megbukik. Egy nap 10-en vizsgáznak, mi a valószínűsége, hogy
a) legfeljebb 2-en mennek át?
b) legalább 2-en mennek át?
X = hányan mennek át
Mivel 10-en vizsgáznak, 10-nél többen biztosan nem mennek át.
Lássuk csak mi az amit tudunk:
Van itt azonban egy kis probléma.
X azt jelenti, hogy hányan mennek át, így aztán ez a bizonyos p is annak a valószínűsége kell, hogy legyen, hogy valaki átmegy.
Az X-nek és a p-nek tehát mindig ugyanarra kell vonatkoznia.
Semmi baj nincs azzal, hogy p annak a valószínűsége, hogy egy vizsgázó megbukik, de akkor X-nek a megbukott hallgatók számát kell jelenti.
Mivel most X azt jelenti, hogy hányan mennek át, ezért p is annak a valószínűsége, hogy valaki átmegy.
5.13.
Az X valószínűségi változó egyenletes eloszlású, várható értéke 10, szórása .
Mekkora a , a és a valószínűség?
Az egyenletes eloszlás várható értéke:
És a szórása:
Ez egy egyenletrendszer.
Ha a két egyenletet összeadjuk,
Most pedig lássuk az eloszlásfüggvényt.
5.14.
Egy tűzoltóságra átlagosan kétóránként érkezik riasztás. Mi a valószínűsége, hogy
a) 8 óra alatt legfeljebb 2 riasztás érkezik?
b) egy 800-kor érkező riasztás után a következő 930 és 1000 között érkezik?
X = riasztások száma
A riasztások száma diszkrét eloszlás és lássuk csak…
8 óra alatt lehet bármennyi, tehát Poisson.
Kétóránként szokott riasztás érkezni, tehát 8 óra alatt várhatóan 4 riasztás lesz.
Y = a riasztások közt eltelt idő
Az eltelt idő folytonos eloszlás és exponenciális.
Általában 2 óra szokott eltelni a riasztások közt, tehát a várható érték 2 óra.
EXP
5.15.
Egy ügyfélszolgálatra érkező segélyhívások száma Poisson-eloszlású, a köztük eltelt idő exponenciális eloszlású valószínűségi változó, annak valószínűsége, hogy 5 perc alatt érkezik hívás
a) Hány hívás érkezik átlagosan óránként?
b) Mekkora a valószínűsége, hogy fél óra alatt legalább három hívás érkezik?
c) Mekkora a valószínűsége, hogy két hívás közt legalább 10 perc telik el?
X = hívások száma
5 perc alatt érkezik hívás
Ha 5 perc alatt akkor egy óra alatt
És fél óra alatt
Y = a hívások közt eltelt idő
Ez a menet közben hajlamos mindig megváltozni.
Lássuk most éppen mennyi.
Ha fél óra alatt 12 hívás jön,
akkor a hívások között 5 perc szokott eltelni:
Azokat az összegeket, amiket úgy kapunk, hogy végtelen sok valós számot adunk össze végtelen sornak nevezzük.
Ez itt például egy végtelen sor:
Az összeadásban szereplő tagokat képzeljük el úgy, mint egy bolha ugrásait a számegyenesen.
A sor összege az a szám ahova a bolha ugrásai során eljut.
Most egy fáradékony bolhával van dolgunk, ugrásai egyre rövidülnek.
Mindig fele akkorát ugrik, mint ami még a hátralévő út a 2-ig, így véges sok ugrással sosem érheti el a 2-t, mert
Ha viszont az ugrások száma végtelen, akkor a bolha éppen eljut a 2-be.
Van itt aztán egy másik bolha is, ez egyáltalán nem fáradékony, viszont meglehetősen összevissza ugrál.
Először ugrik 1-et, majd vissza 1-et.
Utána megint ugrik 1-et, majd megint vissza…
Nos ez a bolha nem jut el sehova, ha az ugrások száma végtelen.
Mindig épp valahol úton lesz a 0 és az 1 között.
És itt egy harmadik, ahol az ugrások mindig megduplázódnak.
Konvergensnek nevezzük azokat a sorokat, ahol a bolha ugrásai során eljut egy konkrét számhoz. Azt a számot pedig ahova eljut, a sor összegének nevezzük.
Ha a bolha ugrásai során nem jut el sehova, vagy éppen plusz vagy mínusz végtelenbe jut el, akkor a sor divergens.
A sorokkal kapcsolatban kétféle kérdés merülhet föl.
Az egyik, hogy konvergens-e vagy divergens a sor. Erre viszonylag könnyen tudunk válaszolni úgynevezett konvergencia kritériumok segítségével.
A másik kérdés, hogy ha a sor konvergens, akkor mi az összege, vagyis hova tart a bolha. Nos ez egy jóval nehezebb kérdés és erre csak elég speciális sorok esetében tudunk megnyugtató választ adni.
Ilyen speciális sor például a mértani sor, amilyenek ezek a bolhás esetek is itt balra.
Lássuk, hogyan kell kiszámolni a mértani sorok összegét.
Azokat a sorokat nevezzük mértani sornak, amelyek így néznek ki, mint ez:
Itt és konkrét számok.
Ha akkor a mértani sor konvergens és összege
Ha akkor a sor divergens
divergens
Íme itt egy példa:
Mindig az első tag lesz a1,
a q pedig az, aki az n-ediken van.
A sor konvergens.
A sor divergens.
Itt van aztán egy másik.
Nos, ezek a mértani sorok nem túl izgalmasak. De néhányat még talán megnézhetünk.
de mivel a -2 a nevezőben van…
És most jöhetnek a konvergencia kritériumok.
Itt az ideje, hogy a végtelen sorok konvergenciáját kicsit precízebben is definiáljuk és megalkossunk egy bolhák nélküli definíciót.
Valójában azonban csak a bolha szót fogjuk kicserélni egy tudományosabban hangzóra.
Bevezetjük a részletösszeg-sorozat fogalmát.
A részletösszeg-sorozat jele és első tagja a bolha első ugrása, vagyis .
A második tagja az első két ugrás összege.
A harmadik tag az első három ugrás összege.
Vagyis pontosan azt mondja meg, hogy éppen hol jár a bolha.
És ahova tart, nos egészen pontosan oda tart a bolha is.
Tehát a bolha uticélja vagyis a sor összege éppen az sn határértéke.
Nos ez a precíz definíció.
Egy végtelen sor akkor konvergens, ha a részletösszeg-sorozata konvergens és ekkor a sor összege:
És most lássuk, hogyan tudjuk eldönteni, hogy egy sor konvergens-e vagy divergens.
Ez egy viszonylag könnyen megválaszolható kérdés és az úgynevezett konvergencia kritériumok fognak nekünk ebben segíteni.
Az első ilyen kritérium annyit mond, hogy ha a bolha nem fáradékony, akkor a sor biztosan divergens.
Vagyis, ha az ugrások hossza nem tart nullához, akkor a sor divergens.
Lássunk egy példát. Itt van mondjuk ez a sor:
Az állítás megfordítása viszont nem igaz, vagyis annak ellenére, hogy
divergens.
Vagyis nem minden fáradékony bolha konvergens.
A zavarodott fáradékony bolhák viszont garantáltan konvergensek. Erre jött rá Leibniz.
Legyen pozitív tagú sorozat. Ekkor a
végtelen sort Leibniz-típusú sornak nevezzük.
Minden Leibniz-sor konvergens. A magyarázat a következő.
A bolha első ugrása bármekkora lehet.
A második ugrás az előzőnél kisebb és ellentétes irányú.
Aztán megint kisebbet ugrik és megint a másik irányba.
Így szépen lassan bezárja magát és eljut uticéljához, ami a sor összege.
A sor abszolút konvergens, ha a sor is konvergens.
Vannak olyan sorok, amik konvergensek ugyan, de nem abszolút konvergensek.
A Leibniz-sorok között ez gyakran előfordul. Itt van például ez:
Nos ez egy Leibniz-sor, tehát konvergens…
de nem abszolút konvergens, mert
ez utóbbi pedig, ha még emlékszünk rá divergens.
Hát ez igazán érdekes volt, most pedig következzen két nagyon gyakran használt konvergencia kritérium.
Itt jön erre egy példa:
ezért a sor konvergens, sőt abszolút konvergens.
Itt van aztán egy másik:
Ajjaj. Hát ebből most nem tudtunk meg semmit.
De még van remény, próbáljuk ki ezt:
Lássunk egy példát a hányados kritériumra is:
Az n!-ról érdemes tudni, hogy
Döntsük el, hogy konvergensek-e a következő végtelen sorok.
Kezdjük az elsővel. Itt alkalmazzuk a hányados kritériumot. Azért a hányadost, mert a faktoriális nem szereti a gyök kritériumot.
Nos ez úgy tűnik konvergens.
Lássuk a következőt.
Itt a gyök kritérium jót fog tenni majd a kitevőknek.
Ez is konvergens. Lássuk mi a helyzet a harmadikkal.
Próbálkozzunk itt is a gyök kritériummal.
Rossz hír, ezek a sorozatok sajna 1-hez tartanak:
Ennek végzetes következményei vannak, ugyanis olyankor, amikor a határérték 1, a gyök kritérium csődöt mond.
Próbálkozhatnánk esetleg a hányados kritériummal is, de azzal sem jönne ki semmi.
Leibniz sem segíthet, és sajna ez sem, ugyanis ha valaki utánaszámol,
Így aztán jelenleg semmilyen eszközünk nincs, amivel ennek a sornak a konvergenciáját megnyugtató módon tisztázhatnánk.
De szerencsére még van remény, erről fog szólni a következő képsor.
Itt jön egy újabb konvergencia kritérium. Ezt a kritériumot kimondottan olyan sorokra érdemes használni, mint amilyen ez:
A számláló és a nevező is egy polinom.
azokban az esetekben az összehasonlító kritériumot érdemes használni.
Éppen itt is jön:
Ha és nem negatív tagú sorok, és egy bizonyos tagtól akkor
konvergens is konvergens
divergens is divergens
Ezen kívül azt is érdemes tudni, hogy a
típusú sor konvergens, ha és divergens, ha .
Most, hogy mindezt megtudtuk, lássuk konvergens-e ez a sor.
Feltehetően igen.
De lássuk az összehasonlító kritériumot.
Úgy tudjuk igazolni, hogy a sor konvergens, ha felülről becsüljük egy másik konvergens sorral.
Úgy kell felülről becsülni, hogy a számlálót növeljük, a nevezőt pedig csökkentjük.
De nem bízzuk a dolgot a véletlenre.
A számlálóban és a nevezőben is vigyázni kell, hogy a legerősebb tagon ne változtassunk.
A számlálót úgy növeljük, hogy mindenkit lecserélünk a legerősebbre.
A nevezőt meg úgy csökkentjük, hogy csak a legerősebb tagot tartjuk meg.
Az eredeti sort felülről becsültük egy olyan sorral, ami konvergens, ezért az eredeti sor is konvergens.
Nézzünk meg egy másikat is.
Konvergens-e a következő sor?
Nos megint az összehasonlító kritériumot hívjuk segítségül.
A hangok azt mondják, hogy ezúttal a sor divergens lesz.
Így most alulról kell becsülni… ráadásul szintén divergenssel.
Nagyon nem is kell megerőltetnünk a fantáziánkat.
Nos ez divergens, tehát az eredeti sor is divergens.
Végül lássunk egy bonyolultabbat.
Így aztán megint alulról kell becsülni:
A számlálót csökkentjük,
a nevezőt pedig növeljük.
SZÜKSÉGES FELTÉTEL
Ha akkor divergens.
LEIBNIZ-SOROK
A sor mindig konvergens, ha
de nem mindig abszolút konvergens.
GYÖK KRITÉRIUM
Ha akkor abszolút konvergens
Ha akkor divergens
Ha akkor nem tudni mi van
HÁNYADOS KRITÉRIUM
Ha akkor absz. konvergens
Ha akkor divergens
Ha akkor nem tudni mi van
A mértani soroknál már nagy sikereket értünk el a sorösszeg meghatározásában. Itt az idő, hogy egy újabb speciális sor, az úgynevezett teleszkopikus sor összegét is kiszámoljuk.
A sor összege ezek szerint egy.
Nos ez a megoldás nem teljesen precíz, de a részletösszeg-sorozat segítségével precízzé tudjuk tenni.
Itt jön egy másik:
A nevezőt szorzattá alakítjuk, aztán megint bűvészmutatványok következnek.
Az egyenlőség mindkét oldalán ugyanannyi n-nek kell lennie.
A bal oldalon nulla darab van…
így a jobb oldalon is.
A konstans tag is mindkét oldalon ugyanaz kell, hogy legyen.
Jöjjön aztán egy kellemetlenebb ügy.
Megint először parciális törtekre bontunk.
Az egyenlőség mindkét oldalán ugyanannyi n2-nek kell lennie.
A bal oldalon nulla darab van…
így a jobb oldalon is.
Nos, aztán n-ből is nulla darab van bal oldalon.
Ezért jobb oldalon is.
A konstans tag is mindkét oldalon ugyanaz kell, hogy legyen.
Végül még egy trükk. A középső tagot kettébontjuk és nem is véletlenül. Azért bontjuk ketté, hogy neki is 1/2 legyen a számlálója és így jobban szeressék őt a többiek.
Most pedig jöhet a részletösszeg-sorozat.
És még egy érdekesség:
Itt is a parciális törtekre bontás módszerét használjuk, mégpedig úgy, hogy ahol a különbség első tagjában n-1 van, ott a második tagban n van.
Erre azért van szükség, hogy a felbontás során teleszkopikus összeget kapjunk.
És most jöhet a részletösszeg-sorozat.
Azokat a végtelen sorokat, amelyek így néznek ki, hatványsornak nevezzük:
Itt van például egy hatványsor.
És derítsük ki, hogy mely x-ekre konvergens.
A hatványsoroknál általában a gyök kritérium szokott beválni.
Ha akkor
és itt úgy viselkedik, mint egy konstans, vagyis sajátmagához tart.
A sor akkor konvergens, ha ez kisebb, mint 1.
A sárgával jelölt tartományban helyezkednek el azok az x-ek amelyekre a sor konvergens.
Ezt hívjuk konvergencia-tartománynak.
Az pedig a konvergencia-sugár.
A kérdés, hogy vajon konvergens-e a sor a konvergencia-tartomány végpontjaiban?
Nos, ezt mindig még külön meg kell vizsgálni.
A jelek szerint ez egy Leibniz-sor, tehát konvergens.
Most lássuk a másik végpontot.
Nos, itt a sor divergens.
-t a hatványsor középpontjának nevezzük.
-ban a hatványsor mindig abszolút konvergens.
Az pont sugarú környezetét konvergencia tartománynak nevezzük.
A konvergencia tartomány belső pontjaiban a hatványsor abszolút konvergens, a végpontokat pedig külön kell vizsgálni.
Lássuk mi a helyzet ezzel:
Megint gyök kritérium:
És most jöhetnek a végpontok.
Az ebben a végpontban kapott sor konvergens, sőt abszolút konvergens.
A másik végpontban szintén.
Itt jön aztán egy olyan hatványsor, amire nem lesz jó a gyök kritérium.
Az miatt itt a hányados kritérium lesz a nyerő.
Írhatunk x helyére bármilyen számot, ez mindig teljesülni fog.
A jelek szerint tehát a sor miden x-re konvergens.
Megismerkedünk a valószínűségszámítás alapjaival, hogy mik azok a valószínűségek, hogyan kell őket kiszámolni, megnézzük mi az a klasszikus valószínűség és, hogy még milyen nem klasszikus valószínűségek lehetnek. Kezdjük egy nagyon egyszerű dologgal. Ezek tulajdonképpen a középiskolás matematika tananyag összefoglalását és átismétlését jelentik. A középiskolás matek addig jut el, hogy klasszikus valószínűségszámítás a kedvező/összes módszerrel, illetve minimálisan érinti a függetlenség, kizáróság témáját. Mi a középiskolai matekot elég hamar magunk mögött hagyva egészen valószínűségszámítás feladatokkal fogunk majd foglalkozni. Kezdjük is. Van egy dobókockánk, dobunk vele egyszer és nézzük meg milyen események történhetnek.
Lehet, hogy 1-est dobunk.
Aztán az is lehet, hogy 2-est.
Aztán az is lehet, hogy mielőtt megállna a kocka egy meteorit csapódik a földbe és a kockával együtt az egész emberiséget elpusztítja.
Nos ebben az esetben a dobás érvénytelen. Mi most kezdetben csak azokkal a lehetőségekkel fogunk foglalkozni, amikor a dobás érvényes, vagyis a hat szám közül valamelyik.
Ezt klasszikus valószínűségszámításnak nevezzük és egy ideig ezzel fogunk foglalkozni, a meteoritok majd csak később jönnek.
Összesen tehát hat darab eset van. Ezeket az eseményeket elemi eseményeknek nevezzük.
Vannak olyan események is amik több elemi eseményből épülnek föl. Ilyen például az, hogy párosat dobunk.
Vagy, hogy 2-nél nagyobbat.
Az eseményeket az ABC nagy betűivel jelöljük.
Minden eseménynek van egy valószínűsége, amit úgy kapunk meg, hogy megszámoljuk hány elemi eseményből áll és ezt elosztjuk az összes elemi esemény számával.
Így aztán minden valószínűség egy 0 és 1 közti szám.
A meglévő eseményeinkből újabb eseményeket készíthetünk.
Lássuk mekkora ezeknek a valószínűsége.
Nos ezeket érdemes megjegyezni, most pedig folytassuk valami érdekesebbel.
Az A és B eseményt egymástól függetlennek nevezünk, ha teljesül rájuk, hogy
Az előző dobókockás példánkban az A esemény az volt, hogy párosat dobunk, a B esemény pedig az, hogy 2-nél nagyobbat. Nézzük meg, hogy ezek függetlenek-e.
Ez jónak tűnik, úgyhogy az A és B események tehát függetlenek.
Itt van aztán egy C esemény is.
Nézzük meg, hogy vajon B és C függetlenek-e.
Hát nem.
Az A és B eseményt kizárónak nevezünk, ha
Nézzük meg mi a helyzet a példánkban szereplő eseményekkel.
Nos úgy látszik ezek nem kizárók.
A és C viszont kizárók.
Egy biztosítónál az ügyfelek 70%-ának van autóbiztosítása, 60%-ának lakásbiztosítása és 90%-uknak a kettő közül legalább az egyik.
Legyen az A esemény, hogy egy ügyfélnek van autóbiztosítása a B esemény pedig, hogy van lakásbiztosítása. Független-e a két esemény?
A két esemény akkor független, ha
Nos lássuk csak mennyi lehet .
A jelek szerint tehát nem függetlenek.
És egyébként nem is kizárók, mert
Egy másik biztosítónál az ügyfelek 80%-ának van autóbiztosítása és az ügyfelek 20%-a rendelkezik lakásbiztosítással úgy, hogy autóbiztosítása nincsen.
Hány százalékuknak van lakásbiztosítása, ha az autó és lakásbiztosítás egymástól független?
Nos van egy ilyen, hogy
Tehát az ügyfelek 2/3-ának vagyis 66%-nak van lakásbiztosítása.
Ez igazán remek, most pedig folytassuk valami egészen érdekessel.
Fatal error: Allowed memory size of 201326592 bytes exhausted (tried to allocate 32 bytes) in /home/maths/public_html/live/includes/database/database.inc on line 2171
Megismerkedünk a valószínűségszámítás alapjaival, hogy mik azok a valószínűségek, hogyan kell őket kiszámolni, megnézzük mi az a klasszikus valószínűség és, hogy még milyen nem klasszikus valószínűségek lehetnek. A középiskolai matek felelevenítésével kezdjük, ahol elvileg mindenki tanult valószínűségszámítást. De csak elvileg, éppen ezért teljesen az alapoktól kezdünk és nem építünk a középiskolai matematika tanulmányokra. Kezdjük tehát a középiskolai matematika tananyag összefoglalását és átismétlését. A középiskolás matek addig jut el, hogy klasszikus valószínűségszámítás a kedvező/összes módszerrel, illetve minimálisan érinti a függetlenség, kizáróság témáját. Mi a középiskolai matekot elég hamar magunk mögött hagyva egészen valószínűségszámítás feladatokkal fogunk majd foglalkozni. Kezdjük is.A meglévő eseményeinkből újabb eseményeket készíthetünk.
Lássuk mekkora ezeknek a valószínűsége.
Nos ezeket érdemes megjegyezni, most pedig folytassuk valami érdekesebbel.
Az A és B eseményt egymástól függetlennek nevezünk, ha teljesül rájuk, hogy
Az előző dobókockás példánkban az A esemény az volt, hogy párosat dobunk, a B esemény pedig az, hogy 2-nél nagyobbat. Nézzük meg, hogy ezek függetlenek-e.
Ez jónak tűnik, úgyhogy az A és B események tehát függetlenek.
Itt van aztán egy C esemény is.
Nézzük meg, hogy vajon B és C függetlenek-e.
Hát nem.
Az A és B eseményt kizárónak nevezünk, ha
Nézzük meg mi a helyzet a példánkban szereplő eseményekkel.
Nos úgy látszik ezek nem kizárók.
A és C viszont kizárók.
Egy biztosítónál az ügyfelek 70%-ának van autóbiztosítása, 60%-ának lakásbiztosítása és 90%-uknak a kettő közül legalább az egyik.
Legyen az A esemény, hogy egy ügyfélnek van autóbiztosítása a B esemény pedig, hogy van lakásbiztosítása. Független-e a két esemény?
A két esemény akkor független, ha
Nos lássuk csak mennyi lehet .
A jelek szerint tehát nem függetlenek.
És egyébként nem is kizárók, mert
Egy másik biztosítónál az ügyfelek 80%-ának van autóbiztosítása és az ügyfelek 20%-a rendelkezik lakásbiztosítással úgy, hogy autóbiztosítása nincsen.
Hány százalékuknak van lakásbiztosítása, ha az autó és lakásbiztosítás egymástól független?
Nos van egy ilyen, hogy
Tehát az ügyfelek 2/3-ának vagyis 66%-nak van lakásbiztosítása.
Ez igazán remek, most pedig folytassuk valami egészen érdekessel.
Van egy dobókockánk, amivel egyszer dobunk. Az A esemény legyen az, hogy páratlant dobunk, a B esemény pedig az, hogy 3-nál nagyobbat.
Az A esemény valószínűségét a szokásos módon kapjuk meg.
Megszámoljuk hány esetben következik be és ezt elosztjuk az összes eset számával.
Eddig ebben nincsen semmi izgalmas.
Az izgalmak most jönnek.
A középiskolai matek felelevenítésével kezdjük, ahol elvileg mindenki tanult valószínűségszámítást. De csak elvileg, éppen ezért teljesen az alapoktól kezdünk és nem építünk a középiskolai matematika tanulmányokra. Kezdjük tehát a középiskolai matematika tananyag összefoglalását és átismétlését.
Nézzük meg, hogy vajon mekkora lesz az A esemény valószínűsége akkor, ha a B eseményről tudjuk, hogy biztosan bekövetkezik.
Nos ekkor összesen csak 3 eset van, mert a B esemény biztosan bekövetkezik,
a kedvező eset pedig a páratlan dobás, ami ezek közül egy.
Ez az új valószínűség tehát 1/3 és a következő jelölés van rá forgalomban:
ami kérdés tuti
Ezt úgy mondjuk, hogy A feltéve B és arra a kérdésre ad választ, hogy mekkora sansza van az A eseménynek akkor, ha a B esemény biztosan bekövetkezik.
FELTÉTELES VALÓSZÍNŰSÉG
Az A esemény valószínűsége , ha a B esemény biztosan bekövetkezik:
Nézzük mire lehet mindezt használni.
Egy városban 1000 emberből átlag 350-en dohányoznak, 120-an rendelkeznek valamilyen keringési problémával és 400-an vannak, akik a kettő közül legalább az egyik csoportba tartoznak.
A reggeli hírműsorokat egy felmérés szerint a TV nézők 30%-a nézi. A reggeli és esti hírműsorok közül legalább az egyiket a TV nézők 90%-a megnézi
Ha egy lakosnak keringési problémái vannak, mekkora a valószínűsége, hogy dohányzik?
A=dohányzik
B=keringési probléma
Lássuk a feladatot.
Keringési probléma biztos, dohányzás kérdéses.
Vannak aztán itt ezek a képletek.
Egy keringési problémával rendelkező lakos tehát 0,583 valószínűséggel dohányzik.
Itt jön egy másik nagyon izgalmas történet.
A reggeli és esti hírműsorok közül legalább az egyiket egy felmérés szerint a TV nézők 90%-a megnézi. Aki az esti hírműsort nézi 20% eséllyel már reggel is nézett hírműsort. A reggeli hírműsorokat az összes TV néző 30%-a nézi.
Mi a valószínűsége, hogy ha valaki reggel néz hírműsort akkor este is?
A=reggel néz
B=este néz
Próbáljuk meg felírni a kérdést:
reggel néz: biztos
este néz:kérdéses
Eddig jó.
Lássuk mi az amit tudunk.
este tuti
reggel 20% eséllyel
Vannak aztán itt ezek a képletek.
A reggeli és esti hírműsorok közül legalább az egyiket a TV nézők 90%-a megnézi.
Itt az ideje, hogy készítsünk egy rövid kombinatorikai összefoglalót. A középiskolai matek felelevenítésével kezdjük, ahol elvileg mindenki tanult valószínűségszámítást és kombinatorikát. De csak elvileg, éppen ezért teljesen az alapoktól kezdünk és nem építünk a középiskolai matematika tanulmányokra. Kezdjük tehát a középiskolai matematika tananyag összefoglalását és átismétlését.
Van n darab elem
mindet kiválasztjuk
kiválasztunk közülük k darabot
a sorrend számít
a sorrend nem számít
PERMUTÁCIÓ
n darab különböző elem permutációinak száma n faktoriális:
mese:
Hányféleképpen ülhet le öt ember egymás mellé egy padon?
VARIÁCIÓ
n darab különböző elemből kiválasztott k darab elem permutációinak száma.
Hányféleképpen ülhet le öt ember közül három egymás mellé egy padon?
KOMBINÁCIÓ
n darab különböző elem közül kiválasztott k darab elem kombinációinak száma.
Hányféleképpen választhatunk ki öt ember közül hármat?
Ez mind nagyon szép. Most pedig lássunk néhány kombinatorika feladatot megoldással. Mindegyik feladat egyszerű középiskolai matek feladat, egyik sem nehezebb, mint amilyennel a matek érettségin találkozhatunk. Nekünk azért fontosak ezek a kombinatorika feladatok, mert sok izgalmas dolog épül majd az alap kombinatorikára és az alap középiskolai matek tudásra. Lássuk.
Egy 52 lapos francia kártyából kihúzunk 5 lapot.
Mi a valószínűsége, hogy az első és a harmadik lap ász?
kedvező eset
összes eset
Kezdjük az összes esettel.
Az 52 lap közül választunk ki 5 darabot. A kérdés az, hogy számít-e a sorrend
vagy nem.
Mivel a szövegben ilyenek vannak, hogy első lap, meg harmadik lap, a jelek szerint számít a sorrend.
Most lássuk a kedvező eseteket.
Az első lap ász, ez négyféle lehet.
A következő lap elvileg bármi lehet a maradék 51 lapból.
Aztán a harmadik lapnak megint ásznak kell lennie.
Lássuk csak hány ász van még.
Fogalmunk sincs. Ha ugyanis a második helyre is ászt raktunk, akkor már csak kettő.
De ha a második helyre nem, akkor három.
Ez bizony probléma.
A kedvező eset számolásánál mindig a kívánsággal kell kezdeni.
Most tehát azzal, hogy az első lap ász és a harmadik lap is ász.
Utána jöhetnek a többi lapok.
Van még 50 darab lap a második helyre.
Aztán még 49 és 48.
Mi a valószínűsége, hogy csak az első és a harmadik lap ász?
Most is számít a sorrend.
Az összes eset ugyanannyi,mint az előbb.
Lássuk mi van a kedvezőkkel.
Megint a kívánsággal kezdünk.
De most csak ez a két ász van, tehát a második lap nem lehet ász.
Így csak 48 féle lehet.
Aztán 47 és 46.
Mi a valószínűsége, hogy a lapok közt két ász lesz?
Itt nem számít a sorrend ezért kombinációt használunk.
A 4 ászból ki kell húznunk kettőt.
Aztán pedig kell még 3 lap ami már nem ász.
Hát ez remek. Végül nézzünk meg még egy feladatot.
Egy kosárlabdacsapat 9 játékosból áll, közülük öten vannak egyszerre a pályán.
Mekkora a valószínűsége, hogy a két legjobb játékos egyszerre van a pályán?
A kiválasztás sorrendje nem számít, csak az, hogy kiket választunk a pályára.
Így aztán kombinációra lesz szükség.
Nézzük mennyi eset van összesen.
A 9 játékosból kell kiválasztanunk ötöt.
A kedvező amikor a két legjobb a pályán van, vagyis őket mindenképp kiválasztjuk,
és még hármat.
Mi a valószínűsége, hogy a két legjobb játékos közül csak az egyik van a pályán?
Az összes eset itt is ugyanannyi.
A kedvező pedig amikor a két legjobb játékosból választunk egyet
és a többi tehetségtelen amatőr közül még négyet.
Ha egy kombinatorika feladatot nem tudunk megoldani, akkor fordítsuk meg a hozzárendelést. megálló utas Szóval, itt vannak az utasok: És az első utas leszállhat ötféle helyen… a második utas is leszállhat ötféle helyen, és így tovább. Végül itt jön még egy izgalmas ügy. Egy nyereményjátékon 20 ember között kisorsolnak 5 ajándékot. Hányféleképpen lehetséges ez, ha a)A nyeremények különbözőek, és egy ember csak egyet kaphat? Az első embernek adhatunk ötféle ajándékot. A másodiknak már csak négyfélét… De van itt egy kis gond. Egyáltalán nem biztos, hogy az első ember kapott ajándékot. És, ha nem kapott, akkor a második ember ötfélét kaphat. Megint jönnek a kérdőjelek. És ez bizony nem jó jel… Úgyhogy fordítsuk meg a hozzárendelést. ember nyeremény Az első nyereményt adhatjuk 20-féle embernek. A második nyereményt már csak 19-nek. És így tovább… b)A nyeremények különbözőek, de egy ember többet is kaphat? Az első nyereményt adhatjuk 20-féle embernek. És az összes többit is. c)A nyeremények egyformák, de egy ember csak egyet kaphat? Az első nyereményt adhatjuk 20-féle embernek. Csakhogy itt most nincs első nyeremény. Mert mindegyik nyeremény egyforma. Ezért nem számít a nyeremények sorrendje. Az egyforma ajándékok miatt nem számít a sorrend. Vagyis ez egy kombináció lesz, ahol 20 emberből választunk ki 5 embert. Ezt számológéppel az nCr gomb lenyomásával tudjuk kiszámolni: Egy dominókészlet azonos méretű dominókból áll. Minden dominó egyik oldala egy vonallal két részre van osztva. Az egyes részeken elhelyezett pöttyök száma 0-tól 6-ig bármi lehet. Minden lehetséges párosításnak léteznie kell, de két egyforma nem lehet egy készletben. Hány darabból áll egy dominókészlet? Íme, épp itt van egy dominó a készletből. Az első fontos észrevétel, hogy ha megfordítjuk... attól ez még ugyanaz a darab dominó marad. A második fontos észrevétel, hogy vannak olyan dominók is, amiket eszünkbe se jut megfordítani. Mert mindkét oldaluk egyforma. Most nézzük, melyikből hány darab van. Ezekből van 7 darab… Ezek meg itt olyanok, hogy az egyik mezőben nem ugyanaz a szám van, mint a másikban. A felső szám még 0-tól 6-ig bármi lehet, ez összesen 7-féle lehetőség, az alsó viszont nem lehet ugyanolyan, mint a felső, ezért az csak 6-féle. De valójában csak fele ennyi eset van, mert bármelyiket megfordítva ugyanazt a dominót kapjuk. Több váratlan fordulat már nincs, a készlet 21+7=28 darab dominóból áll.
Még mindig a középiskolai matek felelevenítésével foglalkozunk, ahol elvileg mindenki tanult valószínűségszámítást és kombinatorikát. De csak elvileg, éppen ezért teljesen az alapoktól kezdünk és nem építünk a középiskolai matematika tanulmányokra. Tíztagú társaság raftingolni indul egy ötszemélyes egy háromszemélyes és egy kétszemélyes csónakkal.
Hányféleképpen ülhetnek a csónakokba, ha a csónakokon belül a helyek között nem teszünk különbséget?
Mi a helyzet akkor, ha két adott ember egy csónakba akar kerülni?
Ilyenkor az szokott lenni, hogy egynek vesszük őket…
Így aztán 9 elemet kell elhelyezni.
Csak hát az a baj, hogy ha ezt az 5 elemet választjuk…
akkor az hat ember és nem férnek el.
Hát jó, akkor válasszunk csak 4-et, hogy biztosan beférjenek.
Csak hát az a baj, hogy ha ezt a 4 elemet választjuk…
akkor az tényleg csak 4 ember, vagyis marad egy üres hely.
Úgy tűnik sehogyan sem akar ez kijönni.
A problémát az okozza, hogy két embert egynek vettünk.
Az „egynek vesszük” elv tökéletesen jól működik olyankor, amikor csak sorba akarjuk rakni az elemeket.
De nem működik olyankor, amikor kiválasztunk.
Ilyenkor esetekre kell bontani.
Hány olyan szám keletkezik, amelyben két páros és két práratlan számjegy szerepel?
Először kiválasztjuk a számjegyeket…
aztán sorba rakjuk.
Hány olyan szám készíthető amiben szerepel a 9-es számjegy?
Az előző módszer itt is működik.
Egy másik jó ötlet, hogy vesszük az összes esetet…
és levonjuk belőle azokat amikor nincs 9-es.
Két dobókockával egyszerre dobunk. Mi a valószínűsége, hogy
mindkét dobás páros?
legfeljebb az egyik dobás páros?
a dobott pontok szorzata páros?
a dobott pontok összege páros?
a dobott pontok összege legalább 10?
a dobott pontok szorzata 6?
Ha két kockával dobunk, akkor az egyik kockával is hatfélét tudunk dobni…
meg a másikkal is.
Az összes eset tehát 36.
Összes eset:
Most pedig lássuk a valószínűségeket.
egyik kocka: páros
másik kocka: páros
egyik kocka: páros
másik kocka: nem páros
vagy fordítva
vagy
mindkét dobás páratlan
A dobott pontok szorzata akkor lesz páros, ha mindkét dobás páros…
vagy pedig az egyik páros, a másik páratlan.
Végülis mindig páros lesz a szorzat, kivéve olyankor, amikor mindkét dobás páratlan.
Itt jön erre egy másik megoldás is.
Végülis mindig páros lesz a szorzat, kivéve olyankor, amikor mindkét dobás páratlan.
mindkettő
páratlan
Két szám összege akkor páros, ha mindkettő páros…
vagy mindkettő páratlan.
Lássuk, hogyan is lesz a pontok összege 10.
A kérdés úgy szól, hogy legalább 10, tehát az is jó, ha az összeg 11.
És az is jó, ha 12.
Ez hat darab lehetőség.
Nézzük, mikor lesz a szorzat 6.
Van itt ez a két doboz. Az egyikben 4 darab kártya van, a másikban pedig 5.
Véletlenszerűen húzunk mindkét dobozból egy-egy kártyát.
Mi a valószínűsége, hogy a kihúzott kártyákon lévő számok szorzata negatív?
Akkor lesz a szorzat negatív, ha az egyik kártyán pozitív szám van…
és a másikon negatív.
Vagy fordítva.
Az összes eset pedig…
Mi a valószínűsége, hogy a kihúzott kártyákon lévő számok összege páratlan?
Akkor lesz az összeg páratlan, ha az egyik kártyán páros szám van…
a másikon pedig páratlan.
Vagy fordítva.
Öt kockával egyszerre dobunk. Mekkora valószínűséggel lesz mind az öt dobás 1-es?
Annak a valószínűsége, hogy egy dobás 1-es:
Ha van még egy 1-es, akkor ennek az esélye szintén
A két 1-es egyszerre pedig:
A dobások egymástól függetlenek és ilyenkor a valószínűségeket össze kell szorozni.
Aztán, ha dobunk még egy 1-est…
Annak a sansza, hogy mind az öt dobás 1-es:
Most nézzük, mi a valószínűsége annak, hogy öt kockával dobva egyik dobás sem 1-es.
Ez annak a valószínűsége, hogy egy dobás nem 1-es.
Aztán a következő dobás sem 1-es…
és egyik sem.
Végül számoljuk ki annak a valószínűségét, hogy öt kockával dobva legalább egy dobás 1-es.
Ez azt jelenti, hogy vagy egy darab 1-es van…
vagy két darab…
vagy három, vagy négy, vagy öt.
Ezt így külön-külön kiszámolni eléggé sok szenvedéssel járna.
Aki nem annyira szeret szenvedni, jegyezze meg, hogy
Hát, ennyit a kockákról.
Egy városban 0,2 a valószínűsége annak, hogy egy nap esik az eső. Mekkora a valószínűsége, hogy egy héten mindennap esik?
Mekkora a valószínűsége, hogy egy héten egyik nap sem esik?
Mekkora a valószínűsége, hogy egy héten legalább egy nap esik?
Egy vizsga 100 vizsgázóból átlag 26-nak nem sikerül. Egyik nap 12-en vizsgáznak. Mi a valószínűsége, hogy legalább egy vizsgázónak nem sikerül a vizsga?
Itt van például Bob.
Nézzük, mekkora a valószínűsége, hogy nem sikerül a vizsgája.
Annak a sansza pedig, hogy sikerül…
Most pedig jön a szokásos trükk:
Most pedig nézzünk, hogy milyen izgalmak várhatók ebben a várható érték témában.
Itt is jön az első, számoljuk ki, hogy hány esős napra számítsunk egy nyaralóhelyen, hogyha öt napig vagyunk ott és ezek a kilátások…
5% esélye van annak, hogy mindegyik nap esni fog.
Aztán 7% az esélye, hogy csak 4 nap fog esni, és így tovább…
Az esős napok számának várható értéke:
a hét napos ott tartózkodásunk alatt.
át napos tartózkodásunk alatt várhatóan hány esős napra készüljünk.Egy vadrezervátumban 3 hím oroszlán él. Az illegális vadászat miatt 40% eséllyel 5 éven belül mindegyik elpusztul, 30% eséllyel 2 oroszlán pusztul el és 20% eséllyel egy. Ha átköltöztetik az oroszlánokat egy biztonságosabb területre, akkor a tapasztalatok szerint az állatok harmada pusztul el a költöztetés miatt, a többiek életben maradnak. Átköltöztessük-e az oroszlánokat, ha azt szeretnénk, hogy 5 év múlva a lehető legtöbben legyenek életben?
Hogyha költöznek az oroszlánok…
akkor várhatóan 2 marad életben.
Ha nem költöznek…
40% az esélye, hogy nulla darab oroszlán lesz.
30% eséllyel egy darab…
20% eséllyel kettő…
És úgy tűnik 10% eséllyel mindhárom oroszlán életben marad.
Most pedig lássuk, hogy várhatóan hány élő oroszlánunk lesz…
A jelek szerint a költözés jobb hatással van az oroszlánok életben maradására.
Várhatóan 2,19 nap fog esni.
Na persze nem mindegy, hogy mekkora a szórás.
Nézzük meg.
Nézzünk meg egy másik nagyon izgalmas történetet is.
Van négy dobókockánk.
Ha az első kockával 1-est dobunk, akkor
Végül itt jön egy nagyon izgalmas történet négy dobókockával.
Ha az első kockával 1-est dobunk, akkor nyerünk 1 dollárt.
Ha a dobás nem 1-es, akkor dobhatunk a második kockával.
Ha a második kockával 1-est dobunk, a nyeremény 20 dollár.
Hogyha azzal sem 1-est dobunk, akkor jöhet a harmadik kocka.
Ha a harmadik kockával végre 1-est dobunk, a nyeremény 30 dollár.
De ha azzal se, akkor dobhatunk a negyedik kockával is.
Hogyha ez végre 1-es, a nyeremény 40 dollár.
Ha ez sem egyes, akkor vége a játéknak és nem nyertünk semmit.
És még csak most jön a kérdés…
Ha 8 dollárba kerül, hogy játszhassunk egy ilyen játékot, megéri-e játszani?
Vagyis a játék várható nyereménye vajon több vagy kevesebb, mint 8 dollár?
Hát, nézzük meg.
Akkor nyerünk 10 dollárt, ha elsőre 1-est dobunk.
Annak a sansza, hogy az első dobás nem 1-es 5/6.
A második dobás 1/6 eséllyel lesz 1-es.
De az is lehet, hogy nem 1-es.
Hogyha a harmadik dobás végre 1-es, akkor 30 dollárt nyerünk.
De előfordulhat, hogy az sem 1-es.
Aztán jön a mindent eldöntő negyedik dobás.
És most lássuk a várható nyereményt.
0,167
0,139
0,116
0,096
0,482
Hogyha 8 dollárba kerül a játék, akkor játékonként átlagosan 11,77 – 8 = 3,77 dollárt nyerünk.
Nekünk tehát megéri…
Annak viszont, akinek a játékot üzemelteti veszteséges.
Kéne szólni neki, hogy 11,77 dollárnál drágábban árulja…