Hipotézisvizsgálat
Elfogadási tartomány
Az elfogadási tartomány az a tartomány, ahová ha a próba értéke kerül, akkor a nullhipotézist elfogadjuk.
Kritikus tartomány
A kritikus tartomány az a tartomány, ahová ha a próba értéke kerül, akkor a nullhipotézist elvetjük.
Szignifikanciaszint
A szignifikanciaszint a hibás döntés valószínűsége.
Hipotézis vizsgálat lépései
ELSŐ LÉPÉS: A HIPOTÉZIS MEGFOGALMAZÁSA
Minden hipotézisvizsgálat két egymásnak ellentmondó felvetés felírásával kezdődik. Az egyiket nullhipotézisnek nevezzük és $H_0$-al jelöljük, a másikat pedig ellenhipotézisnek és jele $H_1$.
MÁSODIK LÉPÉS: A PRÓBAFÜGGVÉNY KIVÁLASZTÁSA
A próbafüggvények kiválasztása magától a hipotézistől, illetve a mintavétel módjától is függ.
HARMADIK LÉPÉS: SZIGNIFIKANCIASZINT ÉS KRITIKUS TARTOMÁNY
Ha a próbafüggvény értéke az elfogadási tartományba fog esni, akkor ezt a tényt a nullhipotézist igazoló jelnek fogjuk tekinteni. Hogyha pedig a kritikus tartományba, akkor a nullhipotézist elvetjük.
NEGYEDIK LÉPÉS: MINTAVÉTEL ÉS DÖNTÉS
Ha a mintavétellel kapott eredményünk szerint a próbafüggvény az elfogadási tartományba esik, akkor a $H_0$ nullhipotézist tekintjük igaznak, a $H_1$ ellenhipotézist pedig elvetjük.
Ha viszont a próbafüggvény a minta alapján a kritikus tartományba esik, akkor a $H_0$ nullhipotézist vetjük el és a $H_1$ ellenhipotézist tekintjük igaznak.
Z-próba
A sokaság normális eloszlású, szórása $\sigma$, $H_0$ a sokaság átlagára vonatkozik, a minta elemszáma $n$.
\( Z = \frac{\overline{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}} \)
t-próba
A sokaság normális eloszlású, szórása nem ismert, $H_0$ a sokaság átlagára vonatkozik, a minta elemszáma $n$.
\( t= \frac{\overline{x}-\mu_0}{\frac{s}{\sqrt{n}}} \)
Aszimptotikus Z-próba
A sokaság tetszőleges eloszlású, szórása nem ismert, $H_0$ a sokaság átlagára vonatkozik, a minta $n$ elemű, elemszáma nagy.
\( Z = \frac{\overline{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}} \)
Z-próba sokasági arányra
A sokaság tetszőleges eloszlású, $H_0$ a sokasági arányra vonatkozik, a minta $n$ elemű, elemszáma nagy.
\( Z = \frac{P-P_0}{\sqrt{\frac{P_0(1-P_0)}{n}}} \)
Khi-négyzet próba
A sokaság normális eloszlású, $H_0$ a sokasági szórásra vonatkozik, a minta $n$ elemű.
\( \chi^2 = \frac{(n-1)\cdot s^2}{\sigma_0^2} \)
Khi-négyzet próba illeszkedésvizsgálat
A sokaság eloszlására irányuló vizsgálat.
$H_0$: mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a $P_i$ érték.
Az ellenhipotézis pedig, $H_1$: van olyan osztályköz, ami nem az adott eloszlásnak megfelelő $P_i$ érték. A próbát $\chi_{1-\alpha}^2(v)$ jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma $n$.
\( \chi^2(v)= \sum_{i=1}^k \frac{(f_i-n p_i)^2}{nP_i} \)
ahol a $v$ szabadságfok: $v=k-b-1$.
Itt $k=$ az osztályközök száma és $b=$ az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg.
Khi-négyzet próba függetlenség vizsgálat
A sokaságon belül két ismérv függetlenségére irányuló vizsgálat. $H_0$: a két ismérv független, az ellenhipotézis pedig, $H_1$: a két ismérv közti kapcsolat sztochasztikus vagy függvényszerű.
A próbát $\chi_{1- \alpha}^2(v)$ jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma $n$, a minta alapján készített kontingencia tábla sorainak száma $r$, oszlopainak száma $c$.
\( \chi^2(v) = \sum \frac{(n_{ij}-n_{ij}^{*})^2}{n_{ij}^{*}} \)
ahol a $v$ szabadságfok $v=(r-1)(c-1)$.
Khi-négyzet próba homogenitásvizsgálat
Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. $H_0$: a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, $H_1$: a két eloszlás nem egyező.
A próbát $\chi_{1-\alpha}^2(v)$ jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. Mintát ezúttal mindkét sokaságból veszünk, az $X$ sokaságból vett minta elemszáma $n_X$ az $Y$ sokaságból vett mintáé $n_Y$ mindkét mintában az osztályközök száma $k$.
\( \chi^2(v) = n_X \cdot n_Y \cdot \sum_{i=1}^{k} \frac{1}{n_{Xi}+n_{Yi}} \cdot \left( \frac{n_{Xi}}{n_X} - \frac{n_{Yi}{n_Y} \right)^2 \)
ahol a $v$ szabadságfok $v=k-1$.
Kétmintás Z-próba
Mindkét sokaság normális eloszlású, szórásaik $\sigma_X$ és $\sigma_Y$.
\( Z = \frac{(\overline{y}-\overline{x})-\delta_0}{\sqrt{\frac{\sigma_Y^2}{n_Y}+\frac{\sigma_X^2}{n_X}}} \)
A nullhipotézis: $H_0$: $\mu_X - \mu_Y = \delta_0$, ahol $\delta$ tetszőleges, de előre megadott érték. A minták elemszáma $n_X$ és $n_Y$.
Kétmintás t-próba
A két sokaság normális eloszlású és szórásaik egyformák.
\( t(v) = \frac{(\overline{y}-\overline{x})-\delta_0}{s\cdot \sqrt{\frac{1}{n_Y}+\frac{1}{n_X}}} \)
itt $s^2=\frac{(n_X-1)s_X^2+(n_Y-1)s_Y^2}{n_X+n_Y-2} $
A nullhipotézis $H_0$: $\mu_X-\mu_Y=\delta_0$, ahol $\delta$ tetszőleges, de előre megadott érték.
A minták elemszáma $n_X$ és $n_Y$, szórása $s_X$ és $s_Y$, a szabadságfok $v=n_Y+n_X-2$
Kétmintás aszimptotikus Z-próba
A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
\( Z =\frac{(\overline{y}-\overline{x})-\delta_0}{\sqrt{ \frac{s_Y^2 }{ n_Y } + \frac{s_X^2}{n_X} }} \)
A nullhipotézis $H_0$ : $\mu_X-\mu_Y=\delta_0$, ahol $\delta$ tetszőleges, de előre megadott érték.
A minták elemszáma $n_X$ és $n_Y$, szórása $s_X$ és $s_Y$.
F-próba
Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis $H_0$: $\sigma_1^2 = \sigma_2^2$
\( F = \frac{s_1^2}{s_2^2} \qquad F_{1-p}(v1; v2) = \frac{1}{F_p(v_2;v_1)} \)
Az F-eloszlás két szabadságfoka
$v_1 = n_1-1$ és $v_2=n_2-1$
Bal oldali kritikus érték: $ \frac{1}{F_{1-\alpha}(v_2;v_1)} $
Jobb oldali kritikus érték: $F_{1-\alpha}(v_1; v_2 )$
Kétoldali kritikus érték:
$\frac{1}{F_{1-\frac{\alpha}{2}}(v_2; v_1)}$ és $F_{1-\frac{\alpha}{2}}(v_1 ; v_2)$
Varianciaanalízis
Több sokaság várható értékének összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású és azonos szórású.
A $H_0$ nullhipotézis: $\mu_1 = \mu_2 = \mu_3 = \dots = \mu_M = \mu$, vagyis az, hogy a várható értékek az összes sokaságra (M db) megegyeznek, míg az ellenhipotézis az, hogy van olyan $\mu_j$ amire $\mu_j \neq \mu$.
Bartlett-próba
A Bartlett-próba több sokaság szórásának összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású.
A $H_0$ nullhipotézis: $\sigma_1 = \sigma_2 = \sigma_3 = \dots = \sigma_M = \sigma$, vagyis az, hogy az összes sokaság (M db.) szórása megegyezik, míg az ellenhipotézis az, hogy van olyan $\sigma_j$, amire $\sigma_j \neq \sigma$.
\( SSB = \sum_{j=1}^{M} (n_j-1)s_j^2 \qquad s_b = \frac{SSB}{n-M} \)
A próbafüggvény
\( B^2 = \frac{1}{c} \left( v\cdot \ln{s_b^2} - \sum_{j=1}^{M} v_j \ln{s_j^2}\right) \)
\( c= 1 + \frac{1}{3(M-1)} \left( \sum_{j=1}^{M} \frac{1}{v_j}-\frac{1}{v} \right) \)
Jobb oldali kritikus érték: $\chi_{1-\alpha}^2(M-1)$
Egy fagyiárus 150 grammos gombócokban árulja a fagyit, ami normális eloszlású, 5 gramm szórással. A vásárlók többségének fogalma sincs róla, hogy mi az a normális eloszlás, abban viszont szinte biztosak, hogy a fagyis az utóbbi időben kisebb gombócokat ad.
Ellenőrizzük a hipotizést 5%-os szignifikanciaszinten egy 60 elemű minta alapján, ahol a gombócok átlagosan 149 grammosak voltak.
Egy városban naponta átlag 12-en haláloznak el különböző légúti megbetegedésekben, számuk normális eloszlású. A város mellett épült szemétégető szerint ez a szám a baleset óta nem emelkedett.
Ellenőrizzük a hipotézist 5%-os szignifikanciaszinten, ha öt véletlen választott nap légúti megbetegedésekben elhalálozottak száma 10, 13, 19, 11, 8.
Egy koporsókészítő arra lett figyelmes, hogy az utóbbi időben több faanyagot kell használnia a koporsóihoz, kliensei túlsúlyának következtében. Mielőtt azonban emiatt árat emelne, meg akar győződni róla, hogy a korábban 85 kg-os átlag valóban megváltozott-e. Készít hát egy 100 elemből álló felmérést, aminek átlaga 86 kg, szórása pedig 12 kg.
Nullhipotézisnek azt választva, hogy az elhalálozottak 85 kilónál nem kövérebbek, mi mondható 5%-os szignifikanciaszinten?
Egy légitársaság a túlsúlyos utasok pótdíjbefizetését tervezi bevezetni. Más légitársaságoknál ugyanis az derült ki, hogy a légiutasok 60%-a 90 kg feletti. Akkor érdemes a pótdíjfizetéssel bajlódni, ha ez az arány náluk legalább 60%.
Vizsgáljuk meg a hipotézist 5%-os szignifikanciaszinten.
A vizsgálathoz egy véletlenszerűen választott járat 150 utasának adatai alapján végezzük, ahol ez az arány 52%.
Egy gyógyszergyárban rendszeresen ellenőrzik, hogy a tablettákba kerülő 500 mg hatóanyag szórása a megengedett 6 mg-tól eltér-e. A hatóanyag mennyisége normális eloszlásnak tekinthető.
Egyik nap az öt megvizsgált tabletta hatóanyagtartalma 490, 501, 507, 496, 502.
10%-os szignifikanciaszinten megegyezik-e a szórás a megengedett 6 mg-mal?
A statisztika vizsgán maximum 100 pont érhető el. Az egyik vizsgán 80 hallgató vett részt, eredményeik:
pontszám | \( f_i \) |
0-20 | 12 |
21-40 | 16 |
41-60 | 25 |
61-80 | 18 |
81-100 | 9 |
10%-os szignifikanciaszinten tekinthető-e a vizsgázók pontszáma egyenletes eloszlásúnak? Tekinthető-e normális eloszlásúnak?
Vizsgáljuk meg, hogy van-e szignifikáns kapcsolat egy ország lakosainak jövedelmi viszonyai és bevándorló-ellensége között az alábbi felmérés alapján:
Jövedelem | A bevándorlók | össz | ||
nem zavarják | közömbös | zavarják | ||
alacsony | 18 | 35 | 37 | 90 |
közepes | 32 | 48 | 30 | 110 |
magas | 18 | 20 | 12 | 50 |
összesen | 68 | 103 | 79 | 250 |
A szignifikanciaszint legyen 10%-os.
Vizsgáljuk meg, hogy szignifikánsan eltér-e a bevándorlókról való vélekedés az alacsony és a magas jövedelműek körében. Ehhez két sokaságban valamely változó eloszlásának egyezőségét kell megvizsgálnunk, amit homogenitásvizsgálatnak nevezünk.
Jövedelem | A bevándorlók | össz | ||
nem zavarják | közömbös | zavarják | ||
alacsony | 17 | 35 | 38 | 90 |
közepes | 33 | 48 | 29 | 110 |
magas | 18 | 20 | 12 | 50 |
összesen | 68 | 103 | 79 | 250 |
Ásványvizeket előállító cég a már meglévő mellett új kutat tervez megnyitni. Ismert, hogy a víz ásványianyag-tartalma normális eloszlású, a régi kút esetében 12 mg, míg az új, valamivel mélyebb kút esetében 7 mg szórással.
A régi kútból származó 10 elemű független egy literes minta átlagosan 678 mg ásványianyagot tartalmaz, az új kútból vett 10 elemű független minta pedig átlagosan 689 mg-ot. Vizsgáljuk meg, hogy szignifikánsan megegyezik-e a két kútból származó víz átlagos ásványianyag-tartalma. A szignifikanciaszint legyen 5%.
Egy üzemben több gépen töltenek 75 ml-es tubusokba fogkrémet, a tubusokba töltött fogkrém mennyisége normális eloszlású, a gépek szórása feltehetően egyforma.
Ellenőrizzük 10%-os szignifikanciaszinten, hogy az átlagosan a tubusokba töltött fogkrém mennyisége is egyforma, ha a két gépről az alábbi 12 elemű minták állnak rendelkezésre:
Egyik gép | 76 | 71 | 75 | 74 | 76 | 76 | 74 | 75 | 77 | 75 | 75 | 75 |
Másik gép | 75 | 75 | 74 | 77 | 73 | 73 | 76 | 77 | 76 | 73 | 75 | 74 |
Az ÖBB vasúttársaság vonalain közlekedő Railjet és Nightjet vonatok közlekedésének paramétereit hasonlították össze. Állapítsuk meg a megvizsgált 400 járat alapján, van-e szignifikáns eltérés a kétféle vonattípus 500 kilométerre eső átlagos késése között. Megalapozott-e az az állítás 5%-os szignifikanciaszinten, hogy a Nightjet vonatok 500 kilométeren átlagosan 15 perccel többet késnek?
Késés, perc (500 km távolságon) |
Railjet | Nightjet |
0-15 | 220 | 50 |
16-30 | 25 | 64 |
31-45 | 4 | 24 |
46-60 | 1 | 12 |
össz | 250 | 150 |
Egy párt népszerűségét két közvéleménykutató is felmérte. Az egyik 32%-os, a másik 36%-os támogatottságot mért, mindkettő 500 fős felmérés alapján. Szignifikánsan eltérnek-e az eredmények? A szignifikanciaszint legyen 5%.
Egy gazdaságban kétféle paradicsomot termesztenek, mindkettő átmérője lényegében normális eloszlású. A génmódosított paradicsom átmérőjének szórása egy 10 elemű minta alapján 5 milliméter, míg a hagyományos paradicsom esetében egy 8 elemű minta alapján ez 12 milliméter.
Szignifikánsan eltérnek-e a szórások, ha a szignifikanciaszint 10%?
Vizsgáljuk meg 5%-os szignifikanciaszinten azt a hipotézist, hogy a különböző iskolai végzettséggel rendelkező emberek átlagosan ugyanannyi időt töltenek naponta TV-nézéssel.
Iskolai végzettség |
TV-nézéssel töltött idő naponta (perc) |
elemszám |
8 általános | 65; 43; 87; 105; 109; 56; 130; 88; 68; 70 | 11 |
középfokú | 48; 68; 72; 55; 43; 92; 87; 93; 65 | 9 |
egyetemi | 35; 65; 42; 54; 28; 73; 54 | 7 |
összesen | 27 |
5%-os szignifikanciaszinten egyformának tekinthető-e a TV-nézéssel töltött idő szórása?
Iskolai végzettség |
TV-nézéssel töltött idő naponta (perc) |
elemszám |
8 általános | 65; 43; 87; 105; 109; 56; 130; 88; 68; 70 | 11 |
középfokú | 48; 68; 72; 55; 43; 92; 87; 93; 65 | 9 |
egyetemi | 35; 65; 42; 54; 28; 73; 54 | 7 |
összesen | 27 |
Egy üzemben 5 kg-os mosóporokat töltenek 21 gramm szórással és lényegében normális eloszlással. Az egyik gép által csomagolt mosóporok közül egy 41 elemű minta átlaga 4980 gramm, szórása 25 gramm. 5%-os szignifikanciaszinten megfelele-e a gép beállítása a szabványnak?
Egy üzemben literenként 300 mg C-vitamint adagolnak a dobozos narancslevekhez, közelítőleg normális eloszlással, 20 mg szórással. Egy szállítmányból vett 50 elemű minta átlagosan 310 mg C-vitamint tartalmazott, 22 mg szórással. 10%-os szignifikanciaszinten a szállítmány megfelelt-e a szabványnak?
Egy ásványvíz literenként 650 mg oldott ásványianyagot tartalmaz, 5 mg szórással. Az ásványianyag-tartalom eloszlása normálisnak tekinthető. Ellenőrizzük a megadott paraméterek helyességét 10%-os szignifikanciaszinten az alábbi 6 elemű, egyenként egy literes minta alapján: 648 mg, 658 mg, 642 mg, 643 mg, 654 mg, 661 mg.
Korábbi felmérések szerint, egy múzeum látogatóinak 65%-a nő. Egy véletlenszerűen választott nap 300 látogatója közül 207 nő volt. Ellenőrizzük a nők arányára vonatkozó állítást 10%-os szignifikancia szinten. Mekkora az a legkisebb szignifikanciaszint, amelyen nullhipotézis, vagy az, hogy a látogatók 65%-a nő, még éppen elvethető?
A naponta olvasással eltöltött időről terveznek egy felmérést készíteni Németországban. A népesség korcsoportonkénti megoszlásával egybevetve tekinthető-e reprezentatívnak a felméréshez használt minta 10%-os szignifikanciaszinten?
Életkor | Népesség (%) | Minta (db) |
0-14 | 13,5 | 18 |
15-34 | 25 | 22 |
35-64 | 41,5 | 27 |
65- | 20 | 13 |
összesen | 100 | 80 |
Egy légitársaság felmérést készít az utasok testsúlyával kapcsolatban. Korábbi évek adatai alapján az utasok testsúly szerinti eloszlása közelítőleg normális, 81 kg-os átlaggal és 16 kg szórással. Ellenőrizzük az eloszlásra és a paraméterekre vonatkozó hipotéziseket az alábbi 141 elemű minta segítségével 5%-os szignifikanciaszinten.
Testtömeg (kg) | Utasok száma |
0-50 | 13 |
51-70 | 23 |
71-90 | 56 |
91-110 | 38 |
111- | 11 |
összesen | 141 |
Egy felmérés során 400 férfit és 400 nőt vizsgáltak meg, hogy megállnak-e kocsijukkal a zebránál, ha a gyalogos a járdán várakozik. A férfiak közül 310-en, a nők közül 215-en álltak meg.
Független-e a nemtől a zebránál való megállás 5%-os szignifikanciaszinten? Ellenőrizzük a hipotizést, hogy a nők a zebránál kevésbé engedik át a gyalogosokat 5%-os szignifikanciaszinten.
Egy várostól északra és nyugatra lavinafogó véderdők találhatók. A faállomány állapotának felméréséhez mindkét véderdőben véletlenszerűen kiválasztottak 150 fenyőt, a minták eredményt tartalmazza az alábbi táblázat.
Fák életkora (év) | Északi véderdő | Nyugati véderdő |
0-10 | 13 | 8 |
11-20 | 28 | 32 |
21-50 | 67 | 58 |
51-100 | 31 | 42 |
101- | 11 | 10 |
összesen | 150 | 150 |
Eltér-e szignifikánsan a két véderdőben a fák átlagos életkora? Szignifikánsan egyformának tekinthetők-e a két véderdő faállománya? A szignifikanciaszint legyen 5%.
A nem munkával töltött aktív tevékenység (kertészkedés, sportolás, stb.) megoszlása Magyarországon és Németországban egy-egy 100 elemű minta alapján:
Nem munkával töltött aktív tevékenység időtartama naponta (perc) |
HU | DE |
0-50 | 43 | 10 |
51-100 | 30 | 35 |
101-150 | 16 | 27 |
151-200 | 8 | 20 |
201-250 | 3 | 8 |
10%-os szignifikanciaszinten a minta alapján azonosak-e a szokások a két országban?
Egy tehenészetben a tehenek tejének zsírtartalmát vizsgálták. A későbbi hasznosítás során nem kedvező, ha a zsírtartalom szórása 10%-nál nagyobb. Literenkénti 5 grammos átlagos zsírtartalommal számolva és feltételezve annak normális eloszlását, szignifikánsan eltér-e a tehenek tejének zsírtartalma a megengedett 10%-tól az alábbi 10 elemű minta alapján?
A szignifikanciaszint legyen 5%.
A tehén sorszáma | Zsírtartalom (gramm/liter) |
17. | 4,7 |
19. | 4,9 |
34. | 5,6 |
36. | 4,3 |
37. | 5,1 |
38. | 5,4 |
57. | 6,1 |
58. | 5,8 |
63. | 4,2 |
64. | 4,2 |
Egy elsőosztályú almaszállítmányban az almák tömegének átlaga 110 gramm, megengedett szórása 20 gramm lehet. Ellenőrizzük 85 elemű minta alapján, hogy egy adott szállítmány megfelel-e az előírásoknak. Az almák méretének eloszlását nem ismerjük, a szignifikanciaszint legyen 10%.
alma tömege (gramm) |
\( f_i \) |
50-69 | 12 |
70-89 | 16 |
90-109 | 25 |
110-129 | 24 |
130-159 | 8 |
A naponta utazással eltöltött időt vizsgálták középiskolásak és egyetemisták körében. A középiskolások utazással töltött ideje egy 60 elemű minta alapján naponta átlag 83 perc, a szórás 17 perc. Ugyanez az egyetemistáknál a következőképpen alakult:
Utazással töltött idő (perc) |
Válaszolók száma |
-50 | 12 |
51-100 | 36 |
101-200 | 24 |
201- | 8 |
5%-os szignifikanciaszinten megegyezik-e a két csoportban a naponta utazással töltött idő átlaga és szórása? Szignifikánsan eltér-e az utazással eltöltött idő a két csoportban?
200 fő részvételével tesztelték egy vitaminkészítmény hatékonyságát. 100-an rendszeresen szedték a készítményt, míg a másik 100 résztvevő egyáltalán nem szedett semmit, vagy másfajta vitaminokat szedett. Az évente betegség miatt kieső munkanapok számát hasonlították össze a két csoportban, ezek eloszlását normális eloszlásúnak tekinthetjük. 5%-os szignifikanciaszinten mi mondható az alábbi állításokról?
csoportok | Betegség miatt kieső munkanapok | |
átlaga | szórása | |
Szedték a készítményt | 7,2 | 3,7 |
Nem szedték a készítményt | 7,8 | 3,4 |
Megegyezik-e a két csoportban a kieső munkanapok átlaga és szórása?
Szignifikánsan eltér-e a betegség miatt kieső munkanapok száma a két csoportban?
Egy gyártósor gumicukrokat tölt zacskóba. A zacskóknak azonos arányban kell tartalmaznia kék, piros, zöld, sárga és fehér színű gumicukrokat. Ellenőrizzük a 4 zacskó megvizsgálásával egy 80 elemű minta alapján, hogy 5%-os szignifikanciaszinten, hogy a gép megfelel-e a szabványnak.
szín | db |
Kék | 24 |
Piros | 16 |
Zöld | 12 |
Sárga | 18 |
Fehér | 10 |
HIPOTÉZISVIZSGÁLAT
Egy csokigyárban 100 grammos csokoládékat készítenek, 3 gramm szórással.
Álláspontjuk szerint a csokik valóban 100 grammosak, ám fölmerült a gyanú, hogy az valójában kicsit kevesebb és így a vásárlók panaszt tettek. Az ügy tisztázásának érdekében bírósághoz fordul az egyik vásárló, aki azzal vádolja a csokigyárat, hogy hamis adatokat tüntetnek föl a csomagoláson. A bíróság szakértőt rendel ki, aki 150 elemű mintát vesz a csokiból. A kérdés az, hogy egy ilyen minta hogyan hasznosítható a vitás helyzet tisztázására.
A becsléseknél már foglalkoztunk azzal a ténnyel, hogy az n elemű minták átlagai a tényleges sokasági átlag körül közel normális eloszlással helyezkednek el, még akkor is, ha az alapsokaság ugyan nem normális eloszlású, de a minta elemszáma viszonylag nagy.
A gondolatmenet a következő.
Tegyük föl, hogy a csokigyárnak igaza van és tényleg 100 gramm egy tábla csoki.
Ekkor az előbbiek miatt a 150 elemű minták átlagai a 100 gramm körül lényegében normális eloszlással helyezkednek el 100 gramm átlaggal és hát ugye a szórás
Ha a csoki valóban 100 gramm, akkor a minták 90%-a 100 gramm körüli kékkel jelölt részbe esik, és csak 10%-uk a sárgával jelölt részbe.
Mielőtt a vizsgálat eredménye megérkezne, a következő ajánlattal áll elő a csokigyárat perlő vásárló.
Ha a mintaátlag a kék részbe esik, nem kételkedik tovább és elfogadja, hogy a csokigyárnak igaza van. De ha a sárgával jelölt részbe esik, aminek az esélye, ha a csoki tényleg 100 grammos, csak 10%, nos akkor a csokigyárnak el kell ismernie, hogy meg-hamisította a csomagolást.
A csokigyár nem fogadja el az ajánlatot, mert abban az esetben, ha igaza van, akkor is 10%-os eséllyel mégis elítélik. Éppen ezért a következő módosítással áll elő.
Legyen a sárga rész csak 5%, a kék rész pedig 95%, így ha igazuk van és a csoki tényleg 100 gramm, csak 5% eséllyel büntetik őket igazságtalanul, ami már nem nagy rizikó.
Az alku végül nem jött össze, így a döntést a bíróságnak kell meghoznia.
Világos, hogy a döntés kétféle lehet, vagy elítélik a csokigyárat vagy nem. Az is világos, hogy a csokigyár vagy bűnös vagy nem. Végül pedig az ítélet vagy hibás vagy nem. A bíróság is úgy látja helyesnek, hogy ha a minta átlaga a sárga részbe esik, akkor elítéli, ha a kék részbe esik, akkor felmenti a csokigyárat. A kérdés a sárga rész arányának megválasztása. Az egyszerűség kedvéért hívjuk a kék részt elfogadási tartománynak a sárga részt pedig kritikus tartománynak.
Ha a sárga rész kicsi, mondjuk csak 1%, akkor minimális az esélye, hogy tévesen ítélik el, ugyanakkor magának az elítélésnek az esélye is minimális. Vagyis nagyonis megeshet, hogy tévesen mentik fel.
Ha a sárga rész nagy, mondjuk 15%, akkor nagy az esélye, éppen 15%, hogy elítélik annak ellenére, hogy ártatlan, ugyanakkor csökken – de nem tudni mekkora – annak az esélye, hogy tévesen felmentik.
Ha a csokigyárat elítélik, annak ellenére, hogy ártatlan, azt elsőfajú hibának nevezzük. Ennek valószínűsége a sárgával jelölt rész, vagyis a harang görbe kritikus tartományba eső részének nagysága. Ezt a valószínűséget hívjuk szignifikanciaszintnek és -val jelöljük.
Ha a csokigyárat felmentik, pedig bűnös, azt másodfajú hibának nevezzük. A másodfajú hiba nagysága azonban nem a kék rész. Ha a csoki tényleges tömege mondjuk csak 50 gramm, akkor a mintaátlagok valójában az 50 gramm körül helyezkednek el normális eloszlással. Felmentő ítélet akkor születik, ha a mintaátlag az eredetileg megállapított elfogadási tartományba esik, de ennek valószínűségét már az új eloszlás alapján állapítjuk meg, hiszen az mutatja a valós helyzetet. Ez a valószínűség a pirossal jelölt rész. A másodfajú hiba valószínűsége .
Sajnos azonban általában nem meghatározható, hiszen, ha a csoki tényleges tömege nem 50 gramm, hanem 70 gramm, akkor a piros rész aránya ugyanezen a szignifikanciaszinten más lesz. Ha a tényleges tömeg 90 gramm, akkor megint más.
Az elsőfajú hiba elkövetésének valószínűsége tehát megmondható, ezt hívjuk szignifikanciaszintnek, a másodfajú hiba valószínűségét viszont többnyire homály fedi. Érdemes látni, hogy és egymással ellentétes kapcsolatban van.
Ha a szignifikancia szint 1%, vagyis az elsőfajú hiba esélye nagyon kicsi, akkor a piros rész, vagyis a másodfajú hiba valószínűsége jó nagy.
Ha a szignifikanciaszint magasabb, mondjuk 5%, akkor az elsőfajú hiba esélye nagyobb, éppen 5%, de a másodfajú hiba elkövetésének valószínűsége kisebb lesz.
Ha a szignifikanciaszint magas, mondjuk 10%-os, akkor az elsőfajú hiba esélye még nagyobb, de a másodfajú hiba esélye még kisebb.
Éppen ezért a szignifikanciaszintet mindig úgy érdemes megválasztani, hogy mérlegeljük, az elsőfajú, vagy a másodfajú hiba elkövetése okoz-e nagyobb problémát. Ha az elsőfajú hibát szeretnénk jobban elkerülni, akkor a szignifikanciaszintet alacsonynak, míg ha a másodfajú hibát, akkor magasnak célszerű megválasztani.
Ezzel a hipotézisvizsgálat működésének elvét áttekintettük, már csak annyi dolgunk van, hogy mindezt kicsit formalizáljuk.
A hipotézisvizsgálat lépései
A sokaságokra vonatkozó különféle feltevéseket hipotéziseknek, ezen hipotézisek helyességének mintavételi eljárásokon alapuló vizsgálatát hipotézisvizsgálatoknak nevezzük. Ahogyan azt előző példánkban már láthattuk, egy hipotézisvizsgálat eredménye sohasem az, hogy az adott hipotézis igaz vagy nem igaz, mindössze annyi, hogy a hipotézis mennyire hihető egy adott mintavételi eljárás tükrében. A hihetőség megítélésére szolgáló eljárásokat statisztikai próbáknak nevezzük.
Minden hipotézisvizsgálat menete ugyanaz, a különböző próbák csupán technikai elemeikben térnek el egymástól. A csokigyár példájánál maradva nézzük végig a hipotézisvizsgálatok lépéseit.
Egy csokigyárban 100 grammos csokoládékat készítenek, a csokik tömege normális eloszlású valószínűségi változó 3 gramm szórással. A csokigyár azt állítja, hogy az csoki valóban 100 grammos, ám fölmerültek bizonyos kételyek a szavahihetőségükkel kapcsolatban. Előfordulhat ugyanis, hogy a csoki valójában kevesebb, mint 100 gramm, így egy 150 elemű minta alapján szeretnénk eldönteni a csokigyár állításának helyességét hipotézisvizsgálat segítségével.
ELSŐ LÉPÉS: A HIPOTÉZIS MEGFOGALMAZÁSA
Minden hipotézisvizsgálat két egymásnak ellentmondó felvetés felírásával kezdődik. Az egyiket nullhipotézisnek nevezzük és -al jelöljük, a másikat pedig ellenhipotézisnek és jele . A két hipotézis egyidejű felírására azért van szükség, mert az a hipotézisvizsgálat módja, hogy ezeket az állításokat versenyeztetjük egymással, és a kettő közül azt fogjuk igaznak tekinteni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál.
Példánkban a csokigyár által felállított nullhipotézis az, hogy a csoki tömege 100 gramm:
:
Az ellenhipotézis pedig az, hogy a csoki nem 100 gramm:
:
Egy hipotézist egyszerű hipotézisnek nevezünk, ha megvalósulása a sokaság eloszlását egyértelművé teszi. Példánkban az egyféleképpen megvalósuló egyszerű hipotézis, a végtelensokféleképpen megvalósuló pedig összetett hipotézis. Az összetett hipotézisek mindig egyszerű hipotézisek halmazaiként állnak elő.
A nullhipotézist és az ellenhipotézist úgy kell megfogalmaznunk, hogy egymásnak ellentmondjanak és együttesen az összes leh etőséget kimerítsék. Ez azt jelenti, hogy ha a nullhipotézis
:
akkor az ellenhipotézis
:
Ha azt a gyanúnkat akarjuk megfogalmazni, hogy a csoki 100 grammnál kevesebb, akkor ezt az ellenhipotézisben kell megtennünk, a nullhipotézisben ugyanis mindig szerepelnie kell egyenlőségnek is.
Az ellenhipotézisben fogalmazzuk meg tehát azon aggodalmunkat, hogy a csoki 100 grammnál kevesebb, vagyis : az ennek megfelelő nullhipotézis pedig az, hogy a csoki 100 gramm vagy annál több.
A megfelelő hipotézispár tehát ilyenkor
:
:
Ebben az esetben a nullhipotézis és az ellenhipotézis is összetett hipotézis.
Mivel a klasszikus hipotézisvizsgálat egyszerű nullhipotézisek használatát igényli, azokban az esetekben, amikor és is összetett, szükségünk van egy úgynevezett technikai nullhipotézisre, amit -vel jelölünk. Ha bal oldali vagy jobb oldali ellenhipotézis, akkor a -nek legkevésbé ellentmondó egyszerű hipotézist technikai nullhipotézisnek nevezzük. Ilyen esetekben ezt a technikai nullhipotézist használjuk a próba elvégzése során.
Nézzük meg ezeket a csokigyáras példánk segítségével.
Ha a nullhipotézis egyszerű hipotézis, akkor nincs szükség technikai nullhipotézisre.
:
:
Ha a nullhipotézis összetett hipotézis, akkor két esettel foglalkozunk:
Amikor bal oldali ellenhipotézis, a megfelelő hipotézispár
:
:
és a -nek legkevésbé ellentmondó
-beli hipotézis :
Amikor jobb oldali ellenhipotézis, a megfelelő hipotézispár
:
:
és a -nek legkevésbé ellentmondó
-beli hipotézis :
MÁSODIK LÉPÉS: A PRÓBAFÜGGVÉNY KIVÁLASZTÁSA
A próbafüggvény a mintaelemeknek egy olyan függvénye, amelynek eloszlása igazságát feltételezve pontosan ismert, így egy konkrét minta alapján lehetővé teszi a hipotézis helyességének ellenőrzését. Kiválasztása magától a hipotézistől, illetve a mintavétel módjától függ. Léteznek a sokasági átlaggal, a sokasági szórással, a sokaság eloszlásával és még rengeteg más tulajdonságával kapcsolatos hipotézisekhez tartozó próbafüggvények. Ezekkel részletesen majd később foglalkozunk.
Most térjünk rá konkrét példánk vizsgálatára. A csokik tömege normális eloszlású, =3 gramm szórással, a minta elemszáma pedig n=150. Nos ilyenkor a mintaátlagok szintén normális eloszlásúak, átlaguk megegyezik a sokasági átlaggal, szórásuk pedig
Ezt a centrális határeloszlás tételek alapján tudjuk, de ha az elnevezés nagyon rémisztő, akkor egyszerűen csak tudjuk és kész.
Ha a nullhipotézis igazságát feltételezzük, vagyis úgy gondoljuk, hogy a csoki tömege , akkor az n=150 elemű minták átlagai olyan normális eloszlás szerint helyezkednek el, amelynek átlaga 100 és szórása 0,245. Ez lesz a próbafüggvény.
:
:
Amikor bal oldali ellenhipotézis,
a megfelelő hipotézispár
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis
ugyanaz marad.
Amikor jobb oldali ellenhipotézis,
a megfelelő hipotézispár
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis
ugyanaz marad.
HARMADIK LÉPÉS: SZIGNIFIKANCIASZINT ÉS KRITIKUS TARTOMÁNY
Most, hogy felállítottuk a nullhipotézist és megvan a hozzá tartozó próbafüggvény, magának a hipotézisvizsgálatnak az elvégzése nagyon egyszerű.
A próbafüggvény értéktartományát alkalmas osztópontokkal két diszjunkt tartományra, az elfogadási és a kritikus tartományra osztjuk. Ha eredményünk majd az elfogadási tartományba fog esni, akkor ezt a tényt a nullhipotézist igazoló jelnek fogjuk tekinteni, ha pedig a kritikus tartományba, akkor a nullhipotézist elvetjük. Az elfogadási tartomány határait úgy választjuk meg, hogy a nullhipotézis fennállása esetén a próbafüggvény előre megadott nagy valószínűséggel ebbe a tartományba essen. Ezt az előre megadott nagy valószínűséget -val jelöljük.
Az elfogadási tartományba esés valószínűsége tehát igen magas , míg a kritikus tartományba esés valószínűsége . Ezt az alacsony valószínűséget szignifikancia szintnek nevezzük. Jellemzően legtöbbször használt értékei 0,01 vagy 0,05 vagy 0,1 amit százalékban szokás megadni, tehát 1% vagy 5% vagy 10%.
Az elfogadási és a kritikus tartomány határán helyezkednek el az úgynevezett kritikus értékek. A kritikus értékeket megegyezés szerint mindig a kritikus tartományba soroljuk.
Ábráinkon a próbafüggvényt a normális eloszlás jellegzetes függvényével szimbolizáljuk, de másfajta próbafüggvények is léteznek.
Ha a nullhipotézistől mindkét
irányban történő eltérés a
hipotézis helytelenségét jelenti,
akkor a kritikus tartomány
kétoldali. Ilyenkor a túl kicsi vagy
a túl nagy értékek egyaránt
a nullhipotézis helytelenségét
jelentik. Kétoldali kritikus
tartomány esetén két kritikus
érték is van, egy alsó és egy
felső kritikus érték.
Ezeket és jelöli
Bal vagy jobb oldali, tehát egyoldali kritikus tartományra olyan esetekben van szükség, amikor a nullhipotézis helytelenségét vagy a kiugróan magas vagy a kiugróan alacsony értékek jelzik.
Bal oldali kritikus tartomány
Esetén a kritikus érték és
jobb oldali az elfogadási
tartomány.
Jobb oldali kritikus tartomány
esetén pedig a kritikus érték
és ilyenkor bal oldali az
elfogadási tartomány.
Nézzük meg az elfogadási és a kritikus tartományokat a csokigyárról szóló példánkban. Legyen a szignifikancia szint mondjuk 5%.
Ekkor tehát .
Ha nullhipotézisünk az, hogy csoki valóban 100 gramm és ezt azzal a hipotézissel versenyeztetjük, hogy a csoki nem 100 gramm, akkor hipotézisünk helytelenségét jelentik a kiugróan alacsony, de a kiugróan magas értékek is. Ilyenkor kétoldali kritikus tartomány lesz két kritikus értékkel.
:
:
A kritikus értékeket általában
majd táblázatokból kell kikeresnünk,
most ezek és .
Ha azt a gyanúnkat akarjuk megfogalmazni, hogy a csoki 100 grammosnál kisebb, akkor ezt az ellenhipotézisben kell megtennünk, a nullhipotézisben ugyanis mindig szerepelnie kell egyenlőségnek is. Az, hogy a csoki 100 grammnál kisebb tehát egy bal oldali ellenhipotézis, a hozzá tartozó nullhipotézis pedig az, hogy a csoki legalább 100 gramm. Ilyenkor egyoldali, mégpedig bal oldali kritikus tartományunk lesz.
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis ugyanaz marad.
Most csak bal oldali kritikus
érték lesz .
Ha azt akarjuk megfogalmazni, hogy a csoki több mint 100 gramm, ezt is csak az ellenhipotézisbe csomagolva tehetjük meg. A nullhipotézis ekkor az, hogy a csoki nem több, mint 100 gramm, az ellenhipotézis pedig az, hogy több, mint 100 gramm, és egyoldali, mégpedig jobb o ldali kritikus tartományunk lesz.
:
:
a próbafüggvényt ilyenkor a
technikai nullhipotézis
:
alapján írjuk föl, vagyis ugyanaz marad.
Most csak jobb oldali kritikus
érték lesz .
NEGYEDIK LÉPÉS: MINTAVÉTEL ÉS DÖNTÉS
Világos, hogy maga a mintavétel csak az elfogadási és kritikus tartomány meghatározása után történhet. Ha ugyanis ezek határait akkor jelölnénk ki, amikor már megvan a minta eredménye, könnyen kísértésbe eshetünk, hogy a határokat úgy húzzuk meg, hogy a nekünk tetsző hipotézis kerüljön ki győztesként.
A mintavétel eredményének ismeretében a hipotézisről való döntés gondolatmenete mindig ugyanaz.
Ha a mintavétellel kapott eredményünk szerint a próbafüggvény az elfogadási tartományba esik, akkor a nullhipotézist tekintjük igaznak, a ellenhipotézist pedig elvetjük.
Ha viszont a próbafüggvény a minta alapján a kritikus tartományba esik, akkor a nullhipotézist vetjük el és a ellenhipotézist tekintjük igaznak.
A gondolatmenet lényege a következő. Ha feltesszük, hogy a nullhipotézis igaz, akkor a próbafüggvény csak nagyon kis valószínűséggel kerül a kritikus tartományba, vagyis csak nagyon kis valószínűséggel eshet meg az, hogy a hipotézis igaz, de azt mégis elvetjük. Ezt a kis valószínűséget hívjuk egyébként szignifikancia szintnek.
Ha tehát a próba elvégzése során a próbafüggvény mégis a kritikus tartományba esik, akkor kételkedni kezdünk a nullhipotézisben, és az ellenhipotézist tekintjük helyesnek.
Természetesen ezek csak feltevések, tehát bárhogy döntünk is, előfordulhat, hogy hibát követünk el. Hibát követünk el akkor is, ha a nullhipotézis helyes, ám a próbafüggvény mégis a kritikus tartományba esik, így elvetjük. És hibát követünk el akkor is, ha a nullhipotézis nem helyes, de a próbafüggvény mégis az elfogadási tartományba esik, ezért elfogadjuk. A kétféle hiba természetének megértéséhez térjünk vissza a csokigyár példájához.
Legyen a nullhipotézis az, hogy a csoki tömege 100 gramm, az ezzel versenyző ellenhipotézis pedig az, hogy a csoki nem 100 gramm, tehát vagy több vagy kevesebb.
:
:
A szignifikancia szint
Ha a nullhipotézis igaz, vagyis a csoki tömege tényleg 100 gramm, akkor a minták átlagai olyan normális eloszlás szerint helyezkednek el, aminek átlaga 100 és szórása
ahol ez a sokasági szórás, n=150 ez a minta elemszáma.
Ha a nullhipotézis igaz, akkor a mintaátlagok tényleg ezen eloszlás szerint helyezkednek el, vagyis tényleg eséllyel esnek a kék részbe és eséllyel a sárgába.
Ha a mintaátlag a kék részbe vagyis az elfogadási tartományba esik, akkor a nullhipotézist elfogadjuk, és mivel az igaz, döntésünk helyes.
Ha a mintaátlag a sárga részbe, vagyis a kritikus tartományba esik akkor a nullhipotézist nem fogadjuk el, de mivel az igaz, ezzel hibát követünk el. Ezt a hibát nevezzük elsőfajú hibának.
Az elsőfajú hibát tehát akkor követjük el, ha a nullhipotézis igaz, de tragikus véletlen folytán a próbafüggvény mégis a kritikus tartományba esik és ezért elvetjük. Ennek valószínűsége jól láthatóan a sárgával jelzett rész vagyis éppen , tehát a szignifikancia szin t.
Most térjünk rá arra, hogy mi van abban az esetben, amikor a nullhipotézis nem igaz.
Az csoki tömege tehát nem 100 gramm, hanem 80 gramm vagy 110 gramm vagy bármennyi. Legyen mondjuk a tényleges tömeg 50 gramm. Ebben az esetben a mintaátlagok eloszlása ugyanúgy normális eloszlású csak éppen nem a 100 körül, hanem az 50 körül.
A mintaátlagok tényleges eloszlását tehát ez az utóbbi görbe adja meg. Annak valószínűségét, hogy olyan mintánk lesz, ami a kék részbe, vagyis az elfogadási tartományba esik, szintén ez az új függvény adja meg. Ezt ábránkon pirossal jelöljük. A pirossal jelölt rész tehát az, amikor nem vetjük el a nullhipotézist, mert az elfogadási tartományba esik, de valójában az hamis. Ezzel szintén hibát követünk el. Ezt a hibát nevezzük másodfajú hibának. A másodfajú hiba elkövetésének valószínűsége .
Míg az elsőfajú hiba elkövetésének valószínűsége ismert, hiszen ez éppen a szignifikanciaszint, addig a másodfajú hiba valószínűségét általában homály fedi. Ez ugyanis a tényleges helyzettől függ, amit sajnálatosan nem ismerünk. Ha a tényleges tömeg ugyanis nem 50 gramm, hanem mondjuk 60 gramm, akkor a tényleges eloszlás jobbra tolódik, megnövelve ezáltal a piros rész, így a másodfajú hiba elkövetésének valószínűségét.
Az elsőfajú hiba elkövetésének valószínűsége és a másodfajú hiba valószínűsége egymással ellentétes.
Ha a szignifikanciaszintet, vagyis -t csökkentjük, ezáltal a vagyis a másodfajú hiba valószínűsége megnő. Alacsony szignifikanciaszint mellett tehát olyan hipotéziseket érdemes vizsgálni, ahol a kétféle hibázási lehetőség közül az elsőfajú hiba elkövetésének esélyét szeretnénk kisebbnek tudni. Ez olyan esetekben kívánatos, amikor a hipotézis téves elvetése nagyobb károkat okoz, mint esetleges hibás megtartása.
Ha a szignifikancia szintet növeljük, ezáltal nő az elsőfajú hiba valószínűsége, viszont ezzel együtt csökken a másodfajú hiba valószínűsége. Magas szignifikancia szintet tehát akkor érdemes használni, hogyha a másodfajú hiba esélyét szeretnénk csökkenteni, még azon az áron is, hogy esetlegesen elvetjük a nullhipotézist, pedig az helyes.
Magának a hipotézisvizsgálatnak a menete minden esetben ugyanezekből a lépésekből fog állni, a különböző próbák csupán technikai elemeikben térnek majd el egymástól. Ezek közül a próbák közül nézzük meg most a legfontosabbakat.
A próbák áttekintése
A statisztikai próbákat két nagy típusba sorolhatjuk. Vannak az úgynevezett paraméteres próbák, amik egy sokaság – esetleg több sokaság – valamilyen paraméterével kapcsolatos hipotézissel foglalkoznak. Ilyen paraméter tipikusan az átlag a szórás és az arány, de természetesen bármilyen más paramétert is vizsgálhatunk. A másik nagy csoport a nemparaméteres próbák, amik a sokaság eloszlására, vagy a sokaságon belüli ismérvek eloszlásának egyezőségére, esetleg azok függetlenségére irányuló hipotézisekkel kapcsolatos próbák.
A paraméteres és a nemparaméteres próbákon belül megkülönböztetünk egy mintás, két mintás és több mintás próbákat.
Minta
Paraméteres
próbák
Nemparaméteres
próbák
Átlag
Arány
Szórás
Eloszlás
NAGY MINTA, BÁRMILYEN ELOSZLÁSÚ SOKASÁGRA
Függetlenség
Egy
mintás
Aszimptotikus
Z-próba
Z-próba
Illeszkedés-
vizsgálat:
-próba
Függetlenség-
vizsgálat:
CSAK NORMÁ-LIS ELOSZLÁSÚ SOKASÁGRA
-próba
Z-próba
t-próba
-próba
NAGY MINTA, BÁRMILYEN ELOSZLÁSÚ SOKASÁGRA
Két
mintás
Aszimptotikus
Z-próba
Z-próba
Homogenitás-
vizsgálat:
-próba
Z-próba
t-próba
F-próba
CSAK NORMÁ-LIS ELOSZLÁSÚ SOKASÁGRA
Több
mintás
Variancia-
analízis
Bartlett
Sokasági átlagra vonatkozó hipotézis, Z-próba
Egy fagyiárus 150 grammos gombócokban árulja a fagyit, ami normális eloszlású, 5 gramm szórással. A vásárlók többségének fogalma sincs róla, hogy mi az a normális eloszlás, abban viszont szinte biztosak, hogy a fagyis az utóbbi időben kisebb gombócokat ad.
Ellenőrizzük a hipotézist 5%-os szignifikanciaszinten egy 60 elemű minta alapján, ahol a gombócok átlagosan 149 grammosak voltak.
A hipotézis egy sokaság paraméterére, az átlagra vonatkozik. A sokaság normális eloszlású, szórása ismert. Az ilyen esetekben Z-próbát használunk.
Z-próba: A sokaság normális eloszlású, szórása , a sokaság átlagára
vonatkozik, a minta elemszáma n.
Kritikus értékek szignifikanciaszint esetén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDA LI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ha azt a vásárlói panaszt akarjuk megfogalmazni, hogy a gombócok 150 grammnál kisebbek, akkor ezt csak az ellenhipotézisbe csomagolva tehetjük meg, mivel a hipotézisvizsgálat úgy működik, hogy a nullhipotézisnek mindenképpen tartalmaznia kell az egyenlőséget is. A nullhipotézis tehát
: és az ellenhipotézis lesz a panasznak megfelelő állítás, hogy : , a technikai nullhipotézis pedig : . Ilyenkor csak bal oldali kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk. Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni. Ha nem így tennénk, könnyen előfordulhatna, hogy addig-addig változtatunk a nullhipotézisen, míg végül elfogadjuk vagy – vagy ha az áll érdekünkben, elvetjük.
Sokasági átlagra vonatkozó hipotézis, t-próba
Egy városban naponta átlag 12-en haláloznak el különböző légúti megbetegedésekben, számuk normális eloszlású. A város mellett épült szemétégető szerint ez a szám a baleset óta nem emelkedett.
Ellenőrizzük a hipotézist 5%-os szignifikanciaszinten, ha öt véletlenül választott nap légúti megbetegedésekben elhalálozottak száma 10, 13, 19, 11, 8.
A hipotézis egy sokaság paraméterére, az átlagra vonatkozik. A sokaság normális eloszlású, szórása nem ismert. Az ilyen esetekben t-próbát használunk.
t-próba: A sokaság normális eloszlású, szórása nem ismert, a sokaság
átlagára vonatkozik, a minta elemszáma n.
Kritikus értékek szignifikanciaszint esetén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDA LI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
A szórás
ami az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ha az ellenhipotézisben azt az aggodalmunkat akarjuk megfogalmazni, hogy nőtt az elhalálozottak száma, akkor
: nullhipotézis esetén az ellenhipotézis : , a technikai nullhipotézis pedig : . Ilyenkor csak jobb oldali kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
Sokasági átlagra vonatkozó hipotézis,
aszimptotikus Z-próba
Egy koporsókészítő arra lett figyelmes, hogy az utóbbi időben több faanyagot kell használnia koporsóihoz, kliensei túlsúlyának következtében. Mielőtt azonban emiatt árat emelne, meg akar győződni róla, hogy a korábban 75 kg-os átlag valóban megváltozott-e. Készít hát egy 100 elemből álló felmérést, aminek átlaga 76 kg, szórása pedig 12 kg.
Nullhipotézisnek azt választva, hogy az elhalálozottak 75 kilónál nem kövérebbek, mi mondható 5%-os szignifikanciaszinten?
A hipotézis egy sokaság paraméterére, az átlagra vonatkozik. A sokaság tetszőleges eloszlású, szórása nem ismert. Az ilyen esetekben Aszimptotikus Z-próbát használunk.
Aszimptotikus Z-próba: A sokaság tetszőleges eloszlású, szórása nem ismert, a sokaság átlagára vonatkozik, a minta n elemű, elemszáma nagy.
Kritikus értékek szignifikanciaszint esetén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
Ha a nullhipotézis : , akkor az ellenhipotézis : , a technikai
nullhipotézis pedig : . Ilyenkor csak jobb oldali kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján és
ami az elfogadási tartományba esik.
A : nullhipotézis tehát igaznak bizonyul, a hipotézist alacsony
szignifikanciaszinten elfogadjuk, az ellenhipotézist pedig elvetjük.
Nem állítható tehát a minta alapján megalapozottan, hogy a koporsókészítő kliensei kövérebbek lennének.
Ha a nullhipotézis : , akkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján és
ami az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
Sokasági arányra vonatkozó hipotézis, Z-próba
Egy légitársaság a túlsúlyos utasok pótdíjfizetését tervezi bevezetni.
Más légitársaságoknál ugyanis az derült ki, hogy a légi utasok 60%-a 90kg feletti. Akkor érdemes a pótdíjfizetéssel bajlódni, ha ez az arány náluk is legalább 60%.
Vizsgáljuk meg a hipotézist 5%-os szignifikanciaszinten.
A vizsgálathoz egy véletlenszerűen választott járat 150 utasának adatai alapján végezzük, ahol ez az arány 52%.
A hipotézis egy sokaság paraméterére, egy arányra vonatkozik. A sokaság tetszőleges eloszlású. Az ilyen esetekben Z-próbát használunk.
Z-próba: A sokaság tetszőleges eloszlású, egy sokasági arányra vonatkozik, a minta n elemű, elemszáma nagy.
Kritikus értékek szignifikanciaszint es etén
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDA LI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami nem az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elvetjük.
Ha a nullhipotézis az, hogy a túlsúlyosok aránya 60% feletti, akkor
: az ellenhipotézis : , a technikai nullhipotézis pedig : . Ilyenkor csak bal oldali kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományon kívül esik.
A hipotézist alacsony szignifikanciaszinten elvetjük.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
Sokasági varianciára vonatkozó hipotézis, -próba
Egy gyógyszergyárban rendszeresen ellenőrzik, hogy a tablettákba kerülő 500 mg hatóanyag szórása a megengedett 6 mg-tól eltér-e. A hatóanyag mennyisége normális eloszlásnak tekinthető.
Egyik nap az öt megvizsgált tabletta hatóanyagtartalma 490, 501, 507, 496, 502.
10%-os szignifikanciaszinten megegyezik-e a szórás a megengedett 6 mg-mal?
A hipotézis egy sokaság paraméterére, a szórásra vonatkozik. A sokaság normális eloszlású. Az ilyen esetekben -próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
KÉTOLDALI KRITIKUS TARTOMÁNY
:
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS ÉRTÉK:
BAL OLDALI KRITIKUS TARTOMÁNY
: :
:
BAL OLDALI KRITIKUS ÉRTÉK:
JOBB OLDALI KRITIKUS TARTOMÁNY
: :
:
JOBB OLDALI KRITIKUS ÉRTÉK:
Ha a nullhipotézis akkor : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=5 így a szabadságfok v=n-1=4.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
-eloszlás
0,05
0,95
szabadság-
fok=v
4
0,71
9,49
A minta alapján
Ami az elfogadási tartományba esik, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
Ha a nullhipotézis az, hogy a szórás legfeljebb 6 mg akkor a ellenhipotézis: és ilyenkor jobb oldali kritikus tartományunk lesz.
A minta elemszáma n=5 így a szabadságfok v=n-1=4.
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
-eloszlás
0,9
szabadság-
fok=v
4
7,78
A minta alapján
ami az elfogadási tartományba esik, a hipotézist tehát elfogadjuk.
Illeszkedésvizsgálat, -próba
A statisztika vizsgán maximum 100 pont érhető el. Az egyik vizsgán 80 hallgató vett részt, eredményeik:
pontszám
0-20
12
21-40
16
41-60
25
61-80
18
81-100
9
10%-os szignifikanciaszinten tekinthető-e a vizsgázók pontszáma egyenletes eloszlásúnak? Tekinthető-e normális eloszlásúnak?
A hipotézis a sokaság eloszlására vonatkozik. Az eljárást illeszkedésvizsgálatnak nevezzük és -próbát használunk.
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Ha a nullhipotézis az, hogy az elért pontszám egyenletes eloszlású, akkor minden osztályközben ugyanakkora a valószínűség. Mivel pedig öt osztályköz van, .
pontszám
Egyenletes eloszlást
feltételezve
0-20
12
0,2
21-40
16
0,2
41-60
25
0,2
61-80
18
0,2
81-100
9
0,2
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most nem határoztunk meg a mintából semmilyen paramétert, így . Ekkor
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A jobb oldali kritikus érték
A minta alapján
Ez nagyobb, mint a jobb oldali kritikus érték, tehát a nullhipotézist elvetjük. 10%-os szignifikanciaszinten nem állíthatjuk, hogy a pontszámok eloszlása egyenletes.
Lássuk, lehet-e normális eloszlású!
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Most válasszuk a felső határokat.
Pontszám
0-20
12
-1,19
0,1151
21-40
16
-0,37
0,3632
41-60
25
0,453
0,6736
61-80
18
1,27
0,8944
81-100
9
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályközig az összeshez tartoznak. Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
A 21-40 osztályköznél tehát
A 41-60 osztályköznél tehát
pontszám
Normális eloszlást
feltételezve
0-20
12
-1,19
0,1151
0,1151
21-40
16
-0,37
0,3632
0,2481
41-60
25
0,453
0,6736
0,3104
61-80
18
1,27
0,8944
0,2208
81-100
9
0,1056
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez kisebb, mint a kritikus érték, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
Függetlenségvizsgálat, -próba
Vizsgáljuk meg, hogy van-e szignifikáns kapcsolat egy ország lakosainak jövedelmi viszonyai és bevándorló-ellenessége között az alábbi felmérés alapján:
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
18
35
37
90
közepes
32
48
30
110
magas
18
20
12
50
összesen
68
103
79
250
Szignifikanciaszint legyen 10%-os.
A hipotézis a sokaságon belül két ismérv függetlenségének vizsgálatára irányuló vizsgálat. Az eljárást függetlenségvizsgálatnak nevezzük és -próbát használunk.
FÜGGETLENSÉGVIZSGÁLAT, -próba: A sokaságon belül két ismérv függetlenségére irányuló vizsgálat. : a két ismérv független, az ellenhipotézis pedig, : a két ismérv közti kapcsolat sztochasztikus vagy függvényszerű.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n, a minta alapján készített kontingencia tábla sorainak száma r, oszlopainak száma c.
Ahol a szabadságfok .
A kontingencia tábla sorainak száma r=3 ( az összesen sor nyilvánvalóan nem számít ) oszlopainak száma pedig c=3, így a szabadságfok
A jobb oldali kritikus érték
Az ügymenet megkönnyítése érdekében készítünk egy -os táblázatot.
Ez pontosan úgy készül, mint ahogyan az asszociációs kapcsolat vizsgálatakor, vagyis
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
24,48
36,72
28,44
90
közepes
29,92
45,32
34,76
110
magas
13,6
20,6
15,8
50
összesen
68
103
79
250
A kapott érték nagyobb a kritikus értéknél, így a nullhipotézist elvetjük.
10%-os szignifikanciaszinten tehát nem független a jövedelem és a bevándorlókról való vélekedés.
Nézzük meg, hogy ekkor vajon szignifikánsan eltér-e a bevándorlókról való vélekedés az alacsony és a magas jövedelműek körében. Ehhez két sokaságban valamely változó eloszlásának egyezőségét kell megvizsgálnunk, amit homogenitásvizsgálatnak nevezünk.
Ez jön most.
Homogenitásvizsgálat, -próba
Vizsgáljuk meg, hogy szignifikánsan eltér-e a bevándorlókról való vélekedés az alacsony és a magas jövedelműek körében. Ehhez két sokaságban valamely változó eloszlásának egyezőségét kell megvizsgálnunk, amit homogenitásvizsgálatnak nevezünk.
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
17
35
38
90
közepes
33
48
29
110
magas
18
20
12
50
összesen
68
103
79
250
Ebben az esetben két eloszlás egyezőségét kell vizsgálnunk. Maguknak az eloszlásoknak a típusáról itt tehát nem állítunk semmit, kizárólag azt vizsgáljuk, hogy egyezőek-e vagy sem. A nullhipotézis mindig az lesz, hogy a két eloszlás azonos, míg a ellenhipotézis az, hogy a két eloszlás nem azonos.
HOMOGENITÁSVIZSGÁLAT, -próba: Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. : a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, : a két eloszlás nem egyező.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. Mintát ezúttal mindkét sokaságból veszünk, az X sokaságból vett minta elemszáma az Y sokaságból vett mintáé mindkét mintában az osztályközök száma k.
Ahol a szabadságfok .
Az alacsony és a magas jövedelműeknél is három osztályközünk van, így k=3 a szabadságfok pedig v=k-1=2.
A jobb oldali kritikus érték
Jövedelem
A bevándorlók
össz
Nem zavarják
közömbös
zavarják
alacsony
17
35
38
90
közepes
33
48
29
110
magas
18
20
12
50
összesen
68
103
79
250
A próbafüggvény
6,76
A kapott érték a kritikus értéknél nagyobb, a két eloszlás, és így a két jövedelmi osztály bevándorlókról való vélekedés a minta alapján szignifikánsan különböző.
Két sokaság átlagának eltérésére vonatkozó hipotézis, Z-próba
Ásványvizeket előállító cég a már meglévő mellett új kutat tervez megnyitni. Ismert, hogy a víz ásványianyag-tartalma normális eloszlású, a régi kút esetében 12 mg, míg az új, valamivel mélyebb kút esetében 7 mg szórással.
A régi kútból származó 10 elemű független egy literes minta átlagosan 678 mg ásványianyagot tartalmaz, az új kútból vett 10 elemű független minta pedig átlagosan 689 mg-ot. Vizsgáljuk meg, hogy szignifikánsan megegyezik-e a két kútból származó víz átlagos ásványianyag-tartalma. A szignifikanciaszint legyen 5%.
A két sokaságból egymástól függetlenül vett két minta alapján szeretnénk ellenőrizni a : hipotézist, ahol tetszőleges, de előre megadott érték. Ha a nullhipotézis az, hogy a két átlag megegyezik, akkor ez a érték nulla.
A nullhipotézis helyességét ezúttal is más-más próbafüggvénnyel vizsgáljuk attól függően, hogy mit tudunk a két sokaságról.
Ha mindkét sokaság normális eloszlású, és mindkét sokaság szórása ismert, akkor kétmintás Z-próbát használunk.
Ha mindkét sokaság normális eloszlású, szórásaik nem ismertek, de annyit tudunk róluk, hogy megegyeznek, akkor kétmintás t-próbát használunk.
itt s=a két sokaság becsült szórása, amit egyformának tekintünk,
Ha a két sokaságról csak annyit tudunk, hogy mindkettő szórása véges, és mindkét minta elemszáma elég nagy, akkor kétmintás aszimptotikus Z-próbát használunk.
Most mindkét sokaság normális eloszlású és ismerjük mindkét sokaság szórását, ezért kétmintás Z-próbát használunk.
Kétmintás Z-próba: Mindkét sokaság normális eloszlású, szórásaik ismertek, és .
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és .
A nullhipotézis az, hogy a két kútból származó víz átlagos ásványianyag-tartalma megegyezik. : ekkor az ellenhipotézis :
Kétoldali kritikus tartomány és két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományon kívül esik, a két forrásból származó víz ásványianyag-tartalma tehát szignifikánsan eltér.
Két sokaság átlagának eltérésére vonatkozó hipotézis, t-próba
Egy üzemben több gépen töltenek 75 ml-es tubusokba fogkrémet, a tubusokba töltött fogkrém mennyisége normális eloszlású, a gépek szórása feltehetően egyforma.
Ellenőrizzük 10%-os szignifikanciaszinten, hogy az átlagosan a tubusokba töltött fogkrém mennyisége is egyforma, ha a két gépről az alábbi 12 elemű minták állnak rendelkezésre:
Egyik gép
76
71
75
74
76
76
74
75
77
75
75
75
Másik gép
75
75
74
77
73
73
76
77
76
73
75
74
A két sokaságból egymástól függetlenül vett két minta alapján szeretnénk ellenőrizni a : hipotézist, ahol tetszőleges, de előre megadott érték. Ha a nullhipotézis az, hogy a két átlag megegyezik, akkor ez a érték nulla.
A nullhipotézis helyességét ezúttal is más-más próbafüggvénnyel vizsgáljuk attól függően, hogy mit tudunk a két sokaságról.
Ha mindkét sokaság normális eloszlású, és mindkét sokaság szórása ismert, akkor kétmintás Z-próbát használunk.
Ha mindkét sokaság normális eloszlású, szórásaik nem ismertek, de annyit tudunk róluk, hogy megegyeznek, akkor kétmintás t-próbát használunk.
itt s=a két sokaság becsült szórása, amit egyformának tekintünk,
Ha a két sokaságról csak annyit tudunk, hogy mindkettő szórása véges, és mindkét minta elemszáma elég nagy, akkor kétmintás aszimptotikus Z-próbát használunk.
Kétmintás t-próba: A két sokaság normális eloszlású és szórásaik egyformák.
itt
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és , a szabadságfok
most
A nullhipotézis az, hogy a két gépen a tubusokba töltött fogkrém átlaga megegyezik
: és : . Ekkor két kritikus érték lesz:
A szabadságfok =12+12-2=22
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományba esik, az átlagok egyezését 10%-os szignifikanciaszinten elfogadjuk.
Két sokaság átlagának eltérésére vonatkozó hipotézis, aszimptotikus Z-próba
Az ÖBB vasúttársaság vonalain közlekedő nappali és Euronight vonatok közlekedésének paramétereit hasonlították össze. Állapítsuk meg a megvizsgált 400 járat alapján, van-e szignifikáns eltérés a kétféle vonattípus 500 kilométerre eső átlagos késése között. Megalapozott-e az az állítás 5%-os szignifikanciaszinten, hogy az Euronight vonatok 500 kilométeren átlagosan 15 perccel többet késnek?
Késés, perc
(500 km távolságon)
Nappali
Euronight
0-15
220
50
16-30
25
64
31-45
4
24
46-60
1
12
össz
250
150
A két sokaságból egymástól függetlenül vett két minta alapján szeretnénk ellenőrizni a : hipotézist, ahol tetszőleges, de előre megadott érték. Ha a nullhipotézis az, hogy a két átlag megegyezik, akkor ez a érték nulla.
A nullhipotézis helyességét ezúttal is más-más próbafüggvénnyel vizsgáljuk attól függően, hogy mit tudunk a két sokaságról.
Ha mindkét sokaság normális eloszlású, és mindkét sokaság szórása ismert, akkor kétmintás Z-próbát használunk.
Ha mindkét sokaság normális eloszlású, szórásaik nem ismertek, de annyit tudunk róluk, hogy megegyeznek, akkor kétmintás t-próbát használunk.
itt s=a két sokaság becsült szórása, amit egyformának tekintünk,
Ha a két sokaságról csak annyit tudunk, hogy mindkettő szórása véges, és mindkét minta elemszáma elég nagy, akkor kétmintás aszimptotikus Z-próbát használunk.
Az két sokaság eloszlásáról és azok szórásairól nem tudunk semmit, ezért kétmintás aszimptotikus Z-próbát használunk.
Kétmintás aszimptotikus Z-próba: A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és .
Ha a nullhipotézis az, hogy az Euronight vonatok 15 perccel többet késnek, : akkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományon kívül esik, a hipotézist tehát 5%-os szignifikanciaszinten elvetjük.
Ha a nullhipotézisben azt fogalmazzuk meg, hogy az Euronight vonatok legalább 10 perccel többet késnek, : akkor egyoldali kritikus tartományunk lesz.
A technikai nullhipotézis: :
BAL OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
Ez igencsak a kritikus tartományba esik, így a hipotézist elfogadjuk.
Két sokaság arányának eltérésére vonatkozó hipotézis, Z-próba
Egy párt népszerűségét két közvéleménykutató is felmérte. Az egyik 32%-os, a másik 36%-os támogatottságot mért, mindkettő 500 fős felmérés alapján.
Szignifikánsan eltérnek-e az eredmények? A szignifikanciaszint legyen 5%.
Kétmintás Z-próba: Két sokaság sokasági arányának összehasonlítására irányuló próba.
speciális esetben
ahol és a minták elemszáma.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
Abban az esetben, ha a próbafüggvényt célszerű alkalmazni, itt
és
A nullhipotézis legyen az, hogy a két felmérés eredménye megegyezik.
: ekkor az ellenhipotézis :
Kétoldali kritikus tartomány és két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értékét a szemléltetés kedvéért mindkét módon kiszámoljuk.
A kimondottan erre az esetre használatos próbafüggvényt nézzük meg először.
ekkor
Ez az elfogadási tartományba esik, a két közvéleménykutató eredménye tehát nem tér el szignifikánsan egymástól.
Ha a másik próbafüggvényt használjuk,
Ami látszik, hogy picit nagyobb értéket ad, de most még ez is bőven az elfogadási tartományba esik.
Két sokaság szórásának eltérésére vonatkozó hipotézis, F-próba
Egy gazdaságban kétféle paradicsomot termesztenek, mindkettő átmérője lényegében normális eloszlású. A génmódosított paradicsom átmérőjének szórása egy 10 elemű minta alapján 5 milliméter, míg a hagyományos paradicsom esetében egy 8 elemű minta alapján ez 12 milliméter.
Szignifikánsan eltérnek-e a szórások, ha a szignifikanciaszint 10%?
F-próba: Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis :
az F-eloszlás két szabadságfoka és , ahol és a két minta elemszáma. Célszerű 1-es sokaságnak mindig a nagyobb szórással rendelkezőt nevezni.
A kritikus értékek az összefüggés alapján:
BAL OLDALI KRITIKUS TARTOMÁNY ESETÉN:
KÉTOLDALI KRITIKUS TARTOMÁNY ESETÉN: ÉS
JOBB OLDALI KRITIKUS TARTOMÁNY ESETÉN:
Az 1-es sokaság legyen a nagyobb szórással rendelkező hagyományos paradicsom. Ekkor
így
így
A nullhipotézis : vagyis kétoldali kritikus tartományunk és így két kritikus értékünk lesz, amiket az F-eloszlás táblázatából keresünk ki.
A szignifikanciaszint , ekkor a k
és
A minta alapján
Ez az elfogadási tartományon kívül esik, a génmódosított paradicsom szórása így szignifikánsan eltér a hagyományos paradicsom szórásától.
Varianciaanalízis
Nevével ellentétben ez a próba több sokaság várható értékének összehasonlítására vonatkozó próba. A nullhipotézis: , míg az ellenhipotézis az, hogy van olyan amire .
Például a naponta átlagosan TV-nézéssel töltött időt szeretnénk összehasonlítani a különböző iskolai végzettségűek körében, vagyis arra vagyunk kíváncsiak, hogy az iskolai végzettség hatással van-e a TV előtt töltött időre. A vizsgált részsokaságok a 8 általánost végzettek, a középfokú végzettségűek, és az egyetemi végzettségűek. A minta a következő:
Iskolai
végzettség
TV-nézéssel töltött
idő naponta (perc)
elemszám
8 általános
65; 43; 87; 105; 109; 56;
130; 88; 68; 70; 95
11
középfokú
48; 68; 72; 55; 43; 92;
87; 93; 65
9
egyetemi
35; 65; 42; 54; 28; 73; 54
7
összesen
27
5%-os szignifikanciaszinten egyformának tekinthető-e az átlagosan TV-nézéssel töltött idő?
VARIANCIAANALÍZIS: Több sokaság várható értékének összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású és azonos szórású.
A nullhipotézis: , vagyis az, hogy a várható értékek az összes sokaságra (M db) megegyeznek, míg az ellenhipotézis az, hogy van olyan amire .
A részsokaságokból vett minták, a részsokaságok száma M.
minta
elemszám
átlag
szórás
1-es részsokaság
2-es részsokaság
j-edik részsokaság
összesen
A próbafüggvény
A két szabadságfok és , a próba jobb oldali kritikus értékkel hajtandó végre:
JOBB OLDALI KRITIKUS ÉRTÉK:
VARIANCIAANALÍZIS-TÁBLÁZAT
SZÓRÓDÁS
OKA
ELTÉRÉS-
NÉGYZETÖSSZEG
SZABADSÁG-
FOK
ÁTLAGOS
NÉGYZETÖSSZEG
F
p-ÉRTÉK
Részsokaságra
bontás miatt
Részsokaságon
belüli hiba
össz.
A próba elvégzésének feltétele, hogy minden sokaság normális eloszlású és azonos szórású legyen. Most tételezzük föl, hogy ezek a feltételek teljesülnek. Kiszámoljuk a minta részátlagait és rész-szórásait, majd az SSK és SSB eltérés-négyzetösszegeket.
minta
elemszám
átlag
szórás
8 általános
11
középfokú
9
egyetemi
7
összesen
27
A szabadságfok és a próbafüggvény
A 5%-os szignifikanciaszinthez tartozó jobb oldali kritikus érték:
A próbafüggvény érték a kritikus tartományba esik, így a hipotézist 5%-os szignifikanciaszinten elvetjük, a különböző iskolai végzettségűek naponta átlagosan TV-nézéssel töltött ideje szignifikánsan nem egyezik meg.
VARIANCIAANALÍZIS-TÁBLÁZAT
SZÓRÓDÁS
OKA
ELTÉRÉS-
NÉGYZETÖSSZEG
SZABADSÁG-
FOK
ÁTLAGOS
NÉGYZETÖSSZEG
F
Részsokaságra
bontás miatt
Részsokaságon
belüli hiba
össz.
Bartlett-próba
Az előző példánknál maradva a naponta átlagosan TV-nézéssel töltött időt szeretnénk összehasonlítani a különböző iskolai végzettségűek körében, de most arra vagyunk kíváncsiak, hogy vajon ugyanakkora-e a szórás az egyes részsokaságokban.
A minta ugyanaz, mint az előbb:
Iskolai
végzettség
TV-nézéssel töltött
idő naponta (perc)
elemszám
8 általános
65; 43; 87; 105; 109; 56;
130; 88; 68; 70; 95
11
középfokú
48; 68; 72; 55; 43; 92;
87; 93; 65
9
egyetemi
35; 65; 42; 54; 28; 73; 54
7
összesen
27
5%-os szignifikanciaszinten egyformának tekinthető-e a TV-nézéssel töltött idő szórása?
Bartlett-próba: Több sokaság szórásának összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású.
A nullhipotézis: , vagyis az, hogy az összes sokaság (M db) szórása megegyezik, míg az ellenhipotézis az, hogy van olyan amire .
A részsokaságokból vett minták, a részsokaságok száma M.
minta
elemszám
átlag
szórás
1-es részsokaság
2-es részsokaság
j-edik részsokaság
összesen
A próbafüggvény
A próbafüggvény M-1 szabadságfokú eloszlást követ.
a j-edik részsokaság szabadságfoka, tehát és
és pedig a részsokaságok szórásai.
A próba jobb oldali kritikus értékkel hajtandó végre:
Kiszámoljuk a minta részátlagait és részszórásait, majd az SSB
eltérés-négyzetösszeget.
minta
elemszám
átlag
szórás
8 általános
11
középfokú
9
egyetemi
7
összesen
27
A próbafüggvény tehát:
A kritikus értéket az M-1 szabadságfokú szabadságfok eloszlásból keressük ki, a szignifikanciaszint 5%, tehát
A jobb oldali kritikus érték ekkor 5,99
A próbafüggvény érték ennél kisebb, vagyis a szórások egyezéséről szóló hipotézist 5%-os szignifikanciaszinten elfogadjuk.
8.1. Egy üzemben 5kg-os mosóporokat töltenek 21 gramm szórással és lényegében normális eloszlással. Az egyik gép által csomagolt mosóporok közül egy 41 elemű minta átlaga 4980 gramm, szórása 25 gramm.
5%-os szignifikanciaszinten megfelel-e a gép beállítása a szabványnak?
Először a szórásra vonatkozó hipotézist ellenőrizzük. Ha ugyanis az helyesnek bizonyul, és megfelel a szabvány 21 grammnak, akkor ezt felhasználhatjuk az átlagra vonatkozó hipotézisünkhöz, és alkalmazhatjuk a Z-próbát, amihez szükséges a sokaság szórásának ismerete. Ha viszont a szórásra vonatkozó hipotézisünk megbukik, akkor az átlag esetében azt nem vesszük figyelembe, és t-próbát használunk.
A szórás vizsgálatánál -próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=41 így a szabadságfok v=41-1=40.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
Ami az elfogadási tartományba esik, a szórás tehát megfelel az előírtaknak.
Z-próba: A sokaság normális eloszlású, szórása , a sokaság átlagára
vonatkozik, a minta elemszáma n.
Az átlagra vonatkozó hipotézis az, hogy a mosópor mennyisége 5 kg, ami alighanem 5000 gramm: : , az ellenhipotézis pedig : .
Ilyenkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ez az érték jócskán a kritikus tartományba esik, a gép beállítása semmilyen szignifikanciaszinten nem felel meg a szabványnak.
8.2. Egy üzemben literenként 300 mg C-vitamint adagolnak a dobozos narancslevekhez, közelítőleg normális eloszlással, 20 mg szórással. Egy szállítmányból vett 50 elemű minta átlagosan 310 mg C-vitamint tartalmazott, 22 mg szórással.
10%-os szignifikanciaszinten a szállítmány megfelelt-e a szabványnak?
Először a szórásra vonatkozó hipotézist ellenőrizzük. Ha ugyanis az helyesnek bizonyul, és megfelel a szabvány 20 mg-nak akkor ezt felhasználhatjuk az átlagra vonatkozó hipotézisünkhöz, és alkalmazhatjuk a Z-próbát, amihez szükséges a sokaság szórásának ismerete. Ha viszont a szórásra vonatkozó hipotézisünk megbukik, akkor az átlag esetében azt nem vesszük figyelembe, és t-próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=50 így a szabadságfok v=50-1=49.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
Ami az elfogadási tartományba esik, vagyis a szórás megfelel az előírtaknak. Elfogadjuk tehát, hogy a szórás 20mg, vagyis használhatjuk az átlag teszteléséhez a Z-próbát.
Z-próba: A sokaság normális eloszlású, szórása , a sokaság átlagára
vonatkozik, a minta elemszáma n.
Az átlagra vonatkozó hipotézis az, hogy a C-vitamin literenkénti mennyisége 300 mg, vagyis : , az ellenhipotézis pedig : .
Ilyenkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ez az érték jócskán a kritikus tartományba esik, a szállítmány nem felel meg a szabványnak.
8.3. Egy ásványvíz literenként 650 mg oldott ásványianyagot tartalmaz, 5 mg szórással. Az ásványianyag-tartalom eloszlása normálisnak tekinthető.
Ellenőrizzük a megadott paraméterek helyességét 10%-os szignifikanciaszinten az alábbi 6 elemű, egyenként egy literes minta alapján: 648 mg, 658 mg, 642 mg, 643 mg, 654 mg, 661 mg.
Először a szórásra vonatkozó hipotézist ellenőrizzük. Ha ugyanis az helyesnek bizonyul, és valóban 5 mg, akkor ezt felhasználhatjuk az átlagra vonatkozó hipotézisünkhöz, és alkalmazhatjuk a Z-próbát, amihez szükséges a sokaság szórásának ismerete. Ha viszont a szórásra vonatkozó hipotézisünk megbukik, akkor az átlag esetében azt nem vesszük figyelembe, és t-próbát használunk.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=6 így a szabadságfok v=6-1=5.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
és
A kapott érték az elfogadási tartományon kívül esik, tehát a minta alapján a szórásra vonatkozó 5 mg-os értéket nem tekintjük helyesnek.
Az átlagra vonatkozó hipotézisünk vizsgálatánál így nem használjuk föl a szórásra vonatkozó 5 mg-os adatot, helyette a szórást ismeretlennek tekintve t-próbát használunk.
t-próba: A sokaság normális eloszlású, szórása nem ismert, a sokaság
átlagára vonatkozik, a minta elemszáma n.
: nullhipotézis esetén az ellenhipotézis : ,
ilyenkor két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
a szórás pedig
ami az elfogadási tartományba esik.
Ha az ellenhipotézisben azt az aggodalmunkat akarjuk megfogalmazni, hogy nőtt az elhalálozottak száma, akkor
: nullhipotézis esetén az ellenhipotézis : , a technikai nullhipotézis pedig : . Ilyenkor csak jobb oldali kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami így is az elfogadási tartományba esik.
A hipotézist alacsony szignifikanciaszinten elfogadjuk.
Ugyanazt a mintát azonban mindig csak egy hipotézis ellenőrzésére szabad használni.
8.4. Korábbi felmérések szerint, egy múzeum látogatóinak 65%-a nő.
Egy véletlenszerűen választott nap 300 látogatója közül 207 nő volt.
Ellenőrizzük a nők arányára vonatkozó állítást 10%-os szignifikanciaszinten. Mekkora az a legkisebb szignifikanciaszint, amelyen a nullhipotézis, vagyis az, hogy a látogatók 68%-a nő, még éppen elvethető?
Z-próba: A sokaság tetszőleges eloszlású, egy sokasági arányra vonatkozik, a minta n elemű, elemszáma nagy.
: nullhipotézis esetén két kritikus érték lesz:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami az elfogadási tartományba esik.
A hipotézist 10%-os szignifikanciaszinten elfogadjuk.
Ahhoz, hogy a nullhipotézist elvessük, az 1,45 próbafüggvény-értéknek az elfogadási tartományon kívül kell esnie, ami szélső helyzetben éppen
jobb oldali kritikus értéket jelenti, ami a standard-normális eloszlás táblázata alapján
és ekkor
Kétoldali kritikus tartomány esetén nagyon magas, 14,7%-os a legkisebb olyan szignifikanciaszint, amin a hipotézist elvethetjük.
8.5. Egy vizsgán maximum 100 pont érhető el. Az egyik vizsgán 80 hallgató vett részt, eredményeik:
pontszám
0-20
12
21-40
16
41-60
25
61-80
18
81-100
9
10%-os szignifikanciaszinten tekinthető-e a vizsgázók pontszáma egyenletes eloszlásúnak? Tekinthető-e normális eloszlásúnak?
A hipotézis a sokaság eloszlására vonatkozik. Az eljárást illeszkedésvizsgálatnak nevezzük és -próbát használunk.
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Ha a nullhipotézis az, hogy az elért pontszám egyenletes eloszlású, akkor minden osztályközben ugyanakkora a valószínűség. Mivel pedig öt osztályköz van, .
pontszám
Egyenletes eloszlást
feltételezve
0-20
12
0,2
21-40
16
0,2
41-60
25
0,2
61-80
18
0,2
81-100
9
0,2
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most nem határoztunk meg a mintából semmilyen paramétert, így . Ekkor
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A jobb oldali kritikus érték
A minta alapján
Ez nagyobb, mint a jobb oldali kritikus érték, tehát a nullhipotézist elvetjük. 10%-os szignifikanciaszinten nem állíthatjuk, hogy a pontszámok eloszlása egyenletes.
Lássuk, lehet-e normális eloszlású!
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Most válasszuk a felső határokat.
Pontszám
0-20
12
-1,19
0,1151
21-40
16
-0,37
0,3632
41-60
25
0,453
0,6736
61-80
18
1,27
0,8944
81-100
9
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályközig az összeshez tartoznak. Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
A 21-40 osztályköznél tehát
A 41-60 osztályköznél tehát
pontszám
Normális eloszlást
feltételezve
0-20
12
-1,19
0,1151
0,1151
21-40
16
-0,37
0,3632
0,2481
41-60
25
0,453
0,6736
0,3104
61-80
18
1,27
0,8944
0,2208
81-100
9
0,1056
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez kisebb, mint a kritikus érték, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
8.6. A naponta olvasással eltöltött időről terveznek egy felmérést készíteni Német-országban. A népesség korcsoportonkénti megoszlásával egybevetve tekinthető-e reprezentatívnak a felméréshez használt minta 10%-os szignifikanciaszinten?
Életkor
Népesség
(%)
Minta
(db)
0-14
13,5
18
15-34
25
22
35-64
41,5
27
65-
20
13
összesen
100
80
A nullhipotézis legyen az, hogy a minta reprezentatív, vagyis a lakosság életkor szerinti megoszlása a mintában megegyezik a valós értékekkel. A hipotézis a sokaság eloszlására vonatkozik. Az eljárást illeszkedésvizsgálatnak nevezzük és -próbát használunk. A százalékos adatokat átalakítjuk valószínűségekre.
Életkor
Népesség
(%)
Minta
(db)
0-14
0,135
18
15-34
0,250
22
35-64
0,415
27
65-
0,200
13
összesen
1,000
80
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Most az osztályközök száma k=4, a mintából becsült paraméterek száma pedig b=0, mivel nem becsültünk semmit a mintából. A szabadságfok v=k-b-1=4-0-1=3.
A jobb oldali kritikus érték
A minta alapján
Ez nagyobb, mint a kritikus érték, a nullhipotézist tehát elvetjük. A minta 10%-os szignifikanciaszinten nem tekinthető reprezentatívnak.
8.7. Egy légitársaság felmérést készít az utasok testsúlyával kapcsolatban. Korábbi évek adatai alapján az utasok testsúly szerinti eloszlása közelítőleg normális, 81 kg-os átlaggal és 16 kg szórással.
Ellenőrizzük az eloszlásra és a paraméterekre vonatkozó hipotéziseket az alábbi 141 elemű minta segítségével 5%-os szignifikanciaszinten.
Testtömeg
(kg)
Utasok száma
0-50
13
51-70
23
71-90
56
91-110
38
111-
11
összesen
141
Elsőként az eloszlásra vonatkozó hipotézist ellenőrizzük, ha ugyanis ezt elfogadjuk, és a sokaság eloszlását normálisnak tekintjük, jóval kellemesebb lesz a többi hipotézis vizsgálata. Elvetése esetén marha nagy gondban leszünk például a szórásra vonatkozó állítással, azt ugyanis csak jó közelítéssel normális eloszlású sokaságokra alkalmazhatjuk. Node reméljük a legjobbakat!
A normális eloszlásra vonatkozó hipotézisünket illeszkedésvizsgálattal teszteljük és
-próbát használunk.
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Testtömeg
(kg)
Utasok száma
0-50
13
51-70
23
71-90
56
91-110
38
111-
11
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Most válasszuk a felső határokat.
Testtömeg
(kg)
Utasok száma
0-50
13
-1,26
0,1056
51-70
23
-0,42
0,3446
71-90
56
0,41
0,6554
91-110
38
1,24
0,8944
111-
11
1,0000
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályközig az összeshez tartoznak. Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
A 51-70 osztályköznél tehát
A 71-90 osztályköznél tehát
Testtömeg
(kg)
Utasok száma
Normális eloszlást
feltételezve
0-50
13
-1,26
0,1056
0,1056
51-70
23
-0,42
0,3446
0,2390
71-90
56
0,41
0,6554
0,3108
91-110
38
1,24
0,8944
0,2390
111-
11
1,0000
0,1056
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez bizony nagyobb, mint a kritikus érték, a hipotézist tehát 5%-os szignifikanciaszinten elvetjük, a minta alapján az utasok testsúly szerinti eloszlása nem tekinthető normális eloszlásúnak.
Térjünk rá a paraméterek vizsgálatára. A szórással kapcsolatos hipotézisünket csak normális eloszlás esetén tudtuk volna vizsgálni, így sajnálatos módon ez most kimarad. Az átlaggal kapcsolatos hipotézist aszimptotikus Z-próbával vizsgáljuk a minta nagy elemszámának köszönhetően.
Aszimptotikus Z-próba: A sokaság tetszőleges eloszlású, szórása nem ismert, a sokaság átlagára vonatkozik, a minta n elemű, elemszáma nagy.
A nullhipotézis az, hogy az utasok átlagosan 81 kg-osak.
: , az ellenhipotézis pedig : .
Kétoldali kritikus tartomány és két kritikus érték lesz.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
ami bőven az elfogadási tartományba esik.
A hipotézist 5%-os szignifikanciaszinten elfogadjuk.
8.8. Egy felmérés során 400 férfit és 400 nőt vizsgáltak meg, hogy megállnak-e kocsijukkal a zebránál, ha a gyalogos a járdán várakozik. A férfiak közül 310-en, a nők közül 215-en álltak meg.
Független-e a nemtől a zebránál való megállás 5%-os szignifikanciaszinten?
Ellenőrizzük azt a hipotézist, hogy a nők a zebránál kevésbé engedik át a gyalogosokat 5%-os szignifikanciaszinten.
FÜGGETLENSÉGVIZSGÁLAT, -próba: A sokaságon belül két ismérv függetlenségére irányuló vizsgálat. : a két ismérv független, az ellenhipotézis pedig, : a két ismérv közti kapcsolat sztochasztikus vagy függvényszerű.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n, a minta alapján készített kontingencia tábla sorainak száma r, oszlopainak száma c.
Ahol a szabadságfok .
megáll
nem áll meg
össz
nő
215
185
400
férfi
310
90
400
össz
525
275
800
A kontingencia tábla sorainak száma r=2 ( az összesen sor nyilvánvalóan nem számít ) oszlopainak száma pedig c=2, így a szabadságfok
A jobb oldali kritikus érték
Az ügymenet megkönnyítése érdekében készítünk egy -os táblázatot.
Ez pontosan úgy készül, mint ahogyan az asszociációs kapcsolat vizsgálatakor, vagyis
megáll
nem áll meg
össz
nő
262,5
137,5
400
férfi
262,5
137,5
400
össz
525
275
800
A kapott érték határozottan nagyobb a kritikus értéknél, így függetlenségről szóló nullhipotézist minden szignifikanciaszinten elvetjük.
Térjünk rá annak a hipotézisnek a vizsgálatára, hogy a nők kisebb arányban állnak meg a zebránál.
megáll
nem áll meg
össz
nő
215
185
400
férfi
310
90
400
össz
525
275
800
Kétmintás Z-próba: Két sokaság sokasági arányának összehasonlítására irányuló próba.
speciális esetben
ahol és a minták elemszáma.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
: ekkor az ellenhipotézis : és itt az ellenhipotézist szeretnénk igazolni.
Egyoldali kritikus tartomány és egy kritikus érték lesz:
JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény
A kapott eredmény minden szignifikanciaszinten az ellenhipotézist igazolja, vagyis a férfiak nagyobb arányban állnak meg a zebránál.
8.9. Egy várostól északra és nyugatra lavinafogó véderdők találhatók. A faállomány állapotának felméréséhez mindkét véderdőben véletlenszerűen kiválasztottak 150 fenyőt, a minták eredményét tartalmazza az alábbi táblázat.
Eltér-e szignifikánsan a két véderdőben a fák átlagos életkora? Szignifikánsan egyformának tekinthetők-e a két véderdő faállománya? A szignifikanciaszint legyen 5%.
Fák életkora
(év)
Északi
véderdő
Nyugati
véderdő
0-10
13
8
11-20
28
32
21-50
67
58
51-100
31
42
101-
11
10
összesen
150
150
Kétmintás aszimptotikus Z-próba: A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és .
Válasszuk nullhipotézisnek azt, hogy a két véderdő átlagos életkora megegyezik,
: az ellenhipotézis pedig :
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományba esik, a véderdők átlagéletkora szignifikánsan megegyezik.
A faállományok összehasonlítására homogenitásvizsgálatot alkalmazunk.
HOMOGENITÁSVIZSGÁLAT, -próba: Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. : a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, : a két eloszlás nem egyező.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. Mintát ezúttal mindkét sokaságból veszünk, az X sokaságból vett minta elemszáma az Y sokaságból vett mintáé mindkét mintában az osztályközök száma k.
Ahol a szabadságfok .
Mindkét véderdő esetében öt osztályköz van, így k=5 a szabadságfok pedig v=k-1=4.
A jobb oldali kritikus érték
Fák életkora
(év)
Északi
véderdő
Nyugati
véderdő
0-10
13
8
11-20
28
32
21-50
67
58
51-100
31
42
101-
11
10
összesen
150
150
A próbafüggvény
3,81
Ez a kritikus értéknél kisebb, így 5%-os szignifikanciaszinten a két véderdő faállományának életkor szerinti megoszlása megegyezik.
8.10. A nem munkával töltött aktív tevékenység (kertészkedés, sportolás, stb.) megoszlása Magyarországon és Németországban egy-egy 100 elemű minta alapján:
Nem munkával töltött
aktív tevékenység
időtartama naponta
(perc)
HU
DE
0-50
43
10
51-100
30
35
101-150
16
27
151-200
8
20
201-250
3
8
10%-os szignifikanciaszinten a minta alapján azonosak-e a szokások a két országban?
HOMOGENITÁSVIZSGÁLAT, -próba: Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. : a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, : a két eloszlás nem egyező.
A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. Mintát ezúttal mindkét sokaságból veszünk, az X sokaságból vett minta elemszáma az Y sokaságból vett mintáé mindkét mintában az osztályközök száma k.
Ahol a szabadságfok .
Az osztályközök száma öt, a szabadságfok tehát v=k-1=5-1=4.
A jobb oldali kritikus érték
Nem munkával töltött
aktív tevékenység
időtartama naponta
(perc)
HU
DE
0-50
43
10
51-100
30
35
101-150
16
27
151-200
8
20
201-250
3
8
A próbafüggvény
31,16
Ez a kritikus értéknél jóval nagyobb, a két eloszlás szignifikánsan eltér.
8.11. Egy tehenészetben a tehenek tejének zsírtartalmát vizsgálták. A későbbi hasznosítás során nem kedvező, ha a zsírtartalom szórása 10%-nál nagyobb. Literenkénti 5 grammos átlagos zsírtartalommal számolva és feltételezve annak normális eloszlását, szignifikánsan eltér-e a tehenek tejének zsírtartalma a megengedett 10%-tól az alábbi 10 elemű minta alapján?
A tehén
sorszáma
Zsírtartalom
(gramm/liter)
17.
4,7
19.
4,9
34.
5,6
36.
4,3
37.
5,1
38.
5,4
57.
6,1
58.
5,8
63.
4,2
64.
4,2
A szignifikanciaszint legyen 5%.
A minta átlaga
gramm
A minta szórása
A megengedett szórás 10%-os, vagyis 0,5 gramm.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=10 így a szabadságfok v=10-1=9.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
A kapott érték az elfogadási tartományba esik, a tehenek tejének zsírtartalma így a minta alapján megfelel a további hasznosításra.
8.12. Egy első osztályú almaszállítmányban az almák tömegének átlaga 110 gramm, megengedett szórása 20 gramm lehet. Ellenőrizzük 85 elemű minta alapján, hogy egy adott szállítmány megfelel-e az előírásoknak. Az almák méretének eloszlását nem ismerjük, a szignifikanciaszint legyen 10%.
alma tömege
(gramm)
50-69
12
70-89
16
90-109
25
110-129
24
130-159
8
Elsőként megvizsgáljuk, hogy az almák méretének eloszlása tekinthető-e normális eloszlásnak. Ha ugyanis nem, akkor marha nagy gondban leszünk a szórásra vonatkozó állítás vizsgálatával, azt ugyanis csak jó közelítéssel normális eloszlású sokaságokra alkalmazhatjuk. Node reméljük a legjobbakat!
ILLESZKEDÉSVIZSGÁLAT, -próba: A sokaság eloszlására irányuló vizsgálat, : mindegyik osztályköz valószínűsége egy adott eloszlásnak megfelelő érték, vagyis minden i-re az i-edik osztályköz valószínűsége a érték.
Az ellenhipotézis pedig, : van olyan osztályköz, ami nem az adott eloszlásnak megfelelő érték. A próbát jobb oldali kritikus értékkel végezzük el, a nullhipotézist az ennél kisebb, az ellenhipotézist az ennél nagyobb értékek igazolják. A minta elemszáma n.
ahol a szabadságfok .
Itt az osztályközök száma és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg
Ha normális eloszlást tételezünk föl, akkor meg kell adnunk annak két paraméterét, a várható értéket és a szórást. Ezeket a mintából becsléssel állapítjuk meg.
A várható érték a minta átlaga alapján:
A szórás pedig a minta szórása alapján:
Most elkészítjük a normális eloszlásnak megfelelő valószínűségeket.
Ezt úgy kell elképzelnünk, hogy a normális eloszlás harang alakú görbéjét felszeleteljük az osztályközöknek megfelelően öt részre.
Ezeknek a részeknek a területei lesznek a megfelelő valószínűségek.
Kiszámolni úgy tudjuk őket, hogy standardizáljuk az osztályközök határait.
Elegendő csak az alsó vagy csak a felső határokat standardizálni, hiszen ami az egyik szelet felső határa, az a következő szelet alsó határa.
Célszerűbb azonban a felső határokat választani.
alma tömege
(gramm)
50-69
12
-1,292
0,0968
70-89
16
-0,458
0,3264
90-109
25
0,375
0,6461
110-129
24
1,208
0,8849
130-159
8
A valószínűségeket a standard-normális eloszlás táblázatból kapjuk.
Ha Z negatív, akkor a hozzá tartozó valószínűség 1 – (ami a táblázatban van)
Aki nem hiszi, olvassa el a mesét a normális eloszlásról.
Ezek a valószínűségek azonban kumuláltak, vagyis nem az adott osztályközhöz, hanem az adott osztályköz alsó határáig tartozó valószínűségek. Azért az alsó határig, mert az alsó határokat standardizáltuk.
Úgy lesz belőle , ha mindegyikből kivonjuk az előzőt.
Az 50-69 osztályköznél tehát mert itt nincs előző
A 70-89 osztályköznél
A 90-109 osztályköznél
alma tömege
(gramm)
Normális eloszlást
feltételezve
50-69
12
-1,292
0,0968
0,0968
70-89
16
-0,458
0,3264
0,2296
90-109
25
0,375
0,6461
0,3197
110-129
24
1,208
0,8849
0,2388
130-159
8
0,1151
Az utolsó osztályközbe a maradék valószínűség kerül, vagyis
1 – (az eddigiek összege)
A próba elvégzésekor csak jobb oldali kritikus érték van, ha a mintából kapott érték ennél nagyobb, akkor a nullhipotézist elvetjük.
A szabadságfok .
Itt az osztályközök száma, ami most öt és az adott eloszlás azon paramétereinek száma, amit a mintából becsléssel határozunk meg. Most két paramétert határoztunk meg a mintából, mégpedig -t és -t, így . Ekkor
A jobb oldali kritikus érték
A minta alapján
Ez kisebb, mint a kritikus érték, a hipotézist tehát 10%-os szignifikanciaszinten elfogadjuk.
Térjünk rá a paraméterek vizsgálatára. Mivel az eloszlás normális, a szórásra vonatkozó hipotézisre alkalmazhatjuk a -próbát.
-próba: A sokaság normális eloszlású, a sokasági szórásra vonatkozik, a minta n elemű.
A nullhipotézis az ellenhipotézis pedig : és ilyenkor kétoldali kritikus tartományunk lesz.
A minta elemszáma n=85 így a szabadságfok v=85-1=84.
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A minta alapján
A kapott érték az elfogadási tartományon kívül esik, a szórás a minta alapján a megengedettnél nagyobb.
Térjünk rá az átlag ellenőrzésére. Mivel a szórás a jelek szerint egyáltalán nem az előírt 20 gramm, ezért az átlagra vonatkozó hipotézis vizsgálatánál a tényleges szórást ismeretlennek tekintve, a minta szórására hagyatkozunk.
t-próba: A sokaság normális eloszlású, szórása nem ismert, a sokaság
átlagára vonatkozik, a minta elemszáma n.
A nullhipotézis : gramm, az ellenhipotézis pedig : gramm
A szabadságfok v=n-1=85-1=84
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
Ez bőven az elfogadási tartományon kívül esik, tehát az átlagos tömeg sem felel meg a szabványnak.
8.13. Kétféle juhfajta, a német húsmerinó és az Új-Zélandi Romney gyapjújának finomságát vizsgáltuk meg. A német húsmerinó gyapjújának finomsága egy ötelemű minta alapján 26 mikron, 27 mikron, 22 mikron, 28 mikron, 30 mikron.
Az Új-Zélandi Romney gyapjúját egy hatelemű mintával vizsgáltuk, ennek eredménye
30 mikron, 28 mikron, 32 mikron, 33 mikron, 29 mikron, 30 mikron.
Ellenőrizzük 10%-os szignifikanciaszinten, az alábbi állításokat:
a) A Romney gyapjának szálvastagsága nagyobb
b) A Romney gyapjának szálvastagsága 4 mikronnal nagyobb
c) A kétféle juh gyapjú-szálvastagságának szórása megegyezik
Elsőként a szórásokra vonatkozó állítást vizsgáljuk.
F-próba: Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis :
az F-eloszlás két szabadságfoka és , ahol és a két minta elemszáma. Célszerű 1-es sokaságnak mindig a nagyobb szórással rendelkezőt nevezni.
A kritikus értékek az összefüggés alapján:
BAL OLDALI KRITIKUS TARTOMÁNY ESETÉN:
KÉTOLDALI KRITIKUS TARTOMÁNY ESETÉN: ÉS
JOBB OLDALI KRITIKUS TARTOMÁNY ESETÉN:
Az 1-es sokaság legyen a nagyobb szórással rendelkező német merinó. Ekkor
így
így
A nullhipotézis : vagyis kétoldali kritikus tartományunk és így két kritikus értékünk lesz, amiket az F-eloszlás táblázatából keresünk ki.
A szignifikanciaszint , ekkor
és
A minta alapján
Ez az elfogadási tartományba esik, a kétféle juh gyapjú-szálvastagságának tehát a minta alapján szignifikánsan ugyanakkora a szórása.
Most térjünk rá az átlagokkal kapcsolatos állításokra. Mivel a szórások megegyeznek, használhatunk t-próbát.
A német húsmerinó gyapjának átlagos szálvastagsága legyen a a másiké pedig a . Azt az állítást, hogy a Romney gyapjának szálvastagsága nagyobb, úgy írhatjuk fel, hogy:
Átrendezve
Mivel ebben az állításban nincs megengedve az egyenlőség, ez nullhipotézis nem lehet, csak ellenhipotézis, mert a nullhipotézisben mindig szerepelnie kell egyenlőségnek is. Így hát akkor ez az ellenhipotézis:
A hozzá tartozó nullhipotézis pedig
Az átlagok tesztelésére, mivel a juhok gyapjú-vastagságának szórása nem ismert, ezt csak a mintából fogjuk tudni kiszámolni, ezért t-próbát használunk.
Kétmintás t-próba:
itt
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és , a szabadságfok
A minták alapján
Német merinó:
Új-Zélandi Romney:
most
A próbafüggvény értéke:
A nullhipotézis az, hogy tehát bal oldali elfogadási tartomány lesz, amihez jobb oldali kritikus érték tartozik.
A szabadságfok =5+6-2=9
JOBB OLDALI KRITIKUS ÉRTÉK:
A próbafüggvény értéke nem esik bele az elfogadási tartományba, így a nullhipotézist elvetjük, és ezzel egyidejűleg a ellenhipotézist elfogadjuk. Vagyis 10%-os szignifikanciaszinten kijelenthető, hogy tehát a Romney juh gyapjának átlagos szálvastagsága nagyobb.
Vizsgáljuk meg 10%-os szignifikanciaszinten azt az állítást, hogy a Romney gyapjának szálvastagsága 4 mikronnal nagyobb.
Ekkor a
próbafüggvényben annyi változás történik mindössze, hogy .
A nullhipotézis most az, hogy az átlagok eltérése éppen 4, tehát
Most kétoldali kritikus tartomány lesz, a szabadságfok továbbra is
=12+12-2=22
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
Ebbe a próbafüggvény értéke beleesik, tehát elfogadjuk azt az állítást, hogy a Romney átlagos szálvastagsága 4 mikronnal nagyobb.
8.14. 200 fő részvételével tesztelték egy vitaminkészítmény hatékonyságát. 100-an rendszeresen szedték a készítményt, míg a másik 100 résztvevő egyáltalán nem szedett semmit, vagy másfajta vitaminokat szedett. Az évente betegség miatt kieső munkanapok számát hasonlították össze a két csoportban, ezek eloszlását normális eloszlásúnak tekinthetjük. 5%-os szignifikanciaszinten mi mondható az alábbi állításokról?
csoportok
Betegség miatt kieső munkanapok
átlaga
szórása
Szedték a
készítményt
7,2
3,7
Nem szedték a
készítményt
7,8
3,4
Megegyezik-e a két csoportban a kieső munkanapok átlaga és szórása?
Szignifikánsan eltér-e a betegség miatt kieső munkanapok száma a két csoportban?
Az átlag vizsgálatával kezdünk. Sajnos azonban csak a minta szórásai állnak rendelkezésre, így nem használhatunk Z-próbát. Ugyanakkor a minta elemszáma elég nagy, tehát aszimptotikus Z-próbát fogunk használni.
Kétmintás aszimptotikus Z-próba: A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
A nullhipotézis : , ahol tetszőleges, de előre megadott érték.
A minták elemszáma és , szórása és .
A nullhipotézis az, hogy a készítmény nincs hatással a betegség miatt kimaradó munkanapok számára, így az mindkét csoportban megegyezik.
:
BAL OLDALI KRITIKUS ÉRTÉK: JOBB OLDALI KRITIKUS ÉRTÉK:
ELFOGADÁSI TARTOMÁNY:
A próbafüggvény értéke:
Ez az elfogadási tartományba esik, így a nullhipotézist elfogadjuk, a két csoport átlaga megegyezik, a készítmény hatása 5%-os szignifikanciaszinten nem kimutatható.
Vizsgáljuk meg a szórásokat is.
F-próba: Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis :
az F-eloszlás két szabadságfoka és , ahol és a két minta elemszáma. Célszerű 1-es sokaságnak mindig a nagyobb szórással rendelkezőt nevezni.
A kritikus értékek az összefüggés alapján:
KÉTOLDALI KRITIKUS TARTOMÁNY ESETÉN: ÉS
Mindkét csoport elemszáma 100:
így
így
A nullhipotézis : vagyis kétoldali kritikus tartományunk és így két kritikus értékünk lesz, amiket az F-eloszlás táblázatából keresünk ki.
A szignifikanciaszint , ekkor
és
A minta alapján
Ez az elfogadási tartományba esik, így a két csoport szórása a minta alapján ugyancsak megegyezik.
Annak vizsgálatára, hogy szignifikánsan eltér-e a betegség miatt kieső munkanapok száma a két csoportban, varianciaanalízist használunk.
VARIANCIAANALÍZIS: Több sokaság várható értékének összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású és azonos szórású.
A nullhipotézis: , vagyis az, hogy a várható értékek az összes sokaságra (M db) megegyeznek, míg az ellenhipotézis az, hogy van olyan amire .
A részsokaságokból vett minták, a részsokaságok száma M.
minta
elemszám
átlag
szórás
1-es részsokaság
2-es részsokaság
j-edik részsokaság
összesen
A próbafüggvény
A két szabadságfok és , a próba jobb oldali kritikus értékkel hajtandó végre:
JOBB OLDALI KRITIKUS ÉRTÉK:
VARIANCIAANALÍZIS-TÁBLÁZAT
SZÓRÓDÁS
OKA
ELTÉRÉS-
NÉGYZETÖSSZEG
SZABADSÁG-
FOK
ÁTLAGOS
NÉGYZETÖSSZEG
F
p-ÉRTÉK
Részsokaságra
bontás miatt
Részsokaságon
belüli hiba
össz.
A próba elvégzésének feltétele, hogy minden sokaság normális eloszlású és azonos szórású legyen. Most tételezzük föl, hogy ezek a feltételek teljesülnek. Kiszámoljuk a minta részátlagait és rész-szórásait, majd az SSK és SSB eltérés-négyzetösszegeket.
minta
elemszám
átlag
szórás
Szedték a
készítményt
100
Nem szedték a
készítményt
100
összesen
200
A szabadságfok és a próbafüggvény
A 5%-os szignifikanciaszinthez tartozó jobb oldali kritikus érték:
A próbafüggvény érték az elfogadási tartományba esik, így a minta alapján azt kell állítanunk, hogy nincs eltérés a kétféle csoportban a megbetegedés miatt kieső munkanapok száma között.