Statisztika 2 epizód tartalma:

A hipotézisvizsgálat menete, nullhipotézis, ellenhipotézis, szignifikanciaszint, elsőfajú és másodfajú hiba, próbafüggvény, próbák, kritikus tartomány, kritikus érték, paraméteres próbák, nemparaméteres próbák, Z-próba, t-próba, khí-négyzet-próba, homogenitás- vizsgálat, illeszkedésvizsgálat, függetlenségvizsgálat, F-próba, varianciaanalízis, Bartlett-próba.

A képsor tartalma

HIPOTÉZISVIZSGÁLAT

Egy csokigyárban 100 grammos csokoládékat készítenek, 3 gramm szórással.

Álláspontjuk szerint a csokik valóban 100 grammosak, ám fölmerült a gyanú, hogy az valójában kicsit kevesebb és így a vásárlók panaszt tettek. Az ügy tisztázásának érdekében bírósághoz fordul az egyik vásárló, aki azzal vádolja a csokigyárat, hogy hamis adatokat tüntetnek föl a csomagoláson. A bíróság szakértőt rendel ki, aki 150 elemű mintát vesz a csokiból. A kérdés az, hogy egy ilyen minta hogyan hasznosítható a vitás helyzet tisztázására.

A becsléseknél már foglalkoztunk azzal a ténnyel, hogy az n elemű minták átlagai a tényleges sokasági átlag körül közel normális eloszlással helyezkednek el, még akkor is, ha az alapsokaság ugyan nem normális eloszlású, de a minta elemszáma viszonylag nagy.

A gondolatmenet a következő.

Tegyük föl, hogy a csokigyárnak igaza van és tényleg 100 gramm egy tábla csoki.

Ekkor az előbbiek miatt a 150 elemű minták átlagai a 100 gramm körül lényegében normális eloszlással helyezkednek el 100 gramm átlaggal és hát ugye a szórás

Ha a csoki valóban 100 gramm, akkor a minták 90%-a 100 gramm körüli kékkel jelölt részbe esik, és csak 10%-uk a sárgával jelölt részbe.

Mielőtt a vizsgálat eredménye megérkezne, a következő ajánlattal áll elő a csokigyárat perlő vásárló.

Ha a mintaátlag a kék részbe esik, nem kételkedik tovább és elfogadja, hogy a csokigyárnak igaza van. De ha a sárgával jelölt részbe esik, aminek az esélye, ha a csoki tényleg 100 grammos, csak 10%, nos akkor a csokigyárnak el kell ismernie, hogy meg-hamisította a csomagolást.

A csokigyár nem fogadja el az ajánlatot, mert abban az esetben, ha igaza van, akkor is 10%-os eséllyel mégis elítélik. Éppen ezért a következő módosítással áll elő.

Legyen a sárga rész csak 5%, a kék rész pedig 95%, így ha igazuk van és a csoki tényleg 100 gramm, csak 5% eséllyel büntetik őket igazságtalanul, ami már nem nagy rizikó.

Az alku végül nem jött össze, így a döntést a bíróságnak kell meghoznia.

Világos, hogy a döntés kétféle lehet, vagy elítélik a csokigyárat vagy nem. Az is világos, hogy a csokigyár vagy bűnös vagy nem. Végül pedig az ítélet vagy hibás vagy nem. A bíróság is úgy látja helyesnek, hogy ha a minta átlaga a sárga részbe esik, akkor elítéli, ha a kék részbe esik, akkor felmenti a csokigyárat. A kérdés a sárga rész arányának megválasztása. Az egyszerűség kedvéért hívjuk a kék részt elfogadási tartománynak a sárga részt pedig kritikus tartománynak.

Ha a sárga rész kicsi, mondjuk csak 1%, akkor minimális az esélye, hogy tévesen ítélik el, ugyanakkor magának az elítélésnek az esélye is minimális. Vagyis nagyonis megeshet, hogy tévesen mentik fel.

Ha a sárga rész nagy, mondjuk 15%, akkor nagy az esélye, éppen 15%, hogy elítélik annak ellenére, hogy ártatlan, ugyanakkor csökken – de nem tudni mekkora – annak az esélye, hogy tévesen felmentik.

Ha a csokigyárat elítélik, annak ellenére, hogy ártatlan, azt elsőfajú hibának nevezzük. Ennek valószínűsége a sárgával jelölt rész, vagyis a harang görbe kritikus tartományba eső részének nagysága. Ezt a valószínűséget hívjuk szignifikanciaszintnek és -val jelöljük.

Ha a csokigyárat felmentik, pedig bűnös, azt másodfajú hibának nevezzük. A másodfajú hiba nagysága azonban nem a kék rész. Ha a csoki tényleges tömege mondjuk csak 50 gramm, akkor a mintaátlagok valójában az 50 gramm körül helyezkednek el normális eloszlással. Felmentő ítélet akkor születik, ha a mintaátlag az eredetileg megállapított elfogadási tartományba esik, de ennek valószínűségét már az új eloszlás alapján állapítjuk meg, hiszen az mutatja a valós helyzetet. Ez a valószínűség a pirossal jelölt rész. A másodfajú hiba valószínűsége .

Sajnos azonban általában nem meghatározható, hiszen, ha a csoki tényleges tömege nem 50 gramm, hanem 70 gramm, akkor a piros rész aránya ugyanezen a szignifikanciaszinten más lesz. Ha a tényleges tömeg 90 gramm, akkor megint más.

Az elsőfajú hiba elkövetésének valószínűsége tehát megmondható, ezt hívjuk szignifikanciaszintnek, a másodfajú hiba valószínűségét viszont többnyire homály fedi. Érdemes látni, hogy és egymással ellentétes kapcsolatban van.

Ha a szignifikancia szint 1%, vagyis az elsőfajú hiba esélye nagyon kicsi, akkor a piros rész, vagyis a másodfajú hiba valószínűsége jó nagy.

Ha a szignifikanciaszint magasabb, mondjuk 5%, akkor az elsőfajú hiba esélye nagyobb, éppen 5%, de a másodfajú hiba elkövetésének valószínűsége kisebb lesz.

Ha a szignifikanciaszint magas, mondjuk 10%-os, akkor az elsőfajú hiba esélye még nagyobb, de a másodfajú hiba esélye még kisebb.

Éppen ezért a szignifikanciaszintet mindig úgy érdemes megválasztani, hogy mérlegeljük, az elsőfajú, vagy a másodfajú hiba elkövetése okoz-e nagyobb problémát. Ha az elsőfajú hibát szeretnénk jobban elkerülni, akkor a szignifikanciaszintet alacsonynak, míg ha a másodfajú hibát, akkor magasnak célszerű megválasztani.

Ezzel a hipotézisvizsgálat működésének elvét áttekintettük, már csak annyi dolgunk van, hogy mindezt kicsit formalizáljuk.

A hipotézisvizsgálat lépései

A sokaságokra vonatkozó különféle feltevéseket hipotéziseknek, ezen hipotézisek helyességének mintavételi eljárásokon alapuló vizsgálatát hipotézisvizsgálatoknak nevezzük. Ahogyan azt előző példánkban már láthattuk, egy hipotézisvizsgálat eredménye sohasem az, hogy az adott hipotézis igaz vagy nem igaz, mindössze annyi, hogy a hipotézis mennyire hihető egy adott mintavételi eljárás tükrében. A hihetőség megítélésére szolgáló eljárásokat statisztikai próbáknak nevezzük.

Minden hipotézisvizsgálat menete ugyanaz, a különböző próbák csupán technikai elemeikben térnek el egymástól. A csokigyár példájánál maradva nézzük végig a hipotézisvizsgálatok lépéseit.

Egy csokigyárban 100 grammos csokoládékat készítenek, a csokik tömege normális eloszlású valószínűségi változó 3 gramm szórással. A csokigyár azt állítja, hogy az csoki valóban 100 grammos, ám fölmerültek bizonyos kételyek a szavahihetőségükkel kapcsolatban. Előfordulhat ugyanis, hogy a csoki valójában kevesebb, mint 100 gramm, így egy 150 elemű minta alapján szeretnénk eldönteni a csokigyár állításának helyességét hipotézisvizsgálat segítségével.

ELSŐ LÉPÉS: A HIPOTÉZIS MEGFOGALMAZÁSA

Minden hipotézisvizsgálat két egymásnak ellentmondó felvetés felírásával kezdődik. Az egyiket nullhipotézisnek nevezzük és -al jelöljük, a másikat pedig ellenhipotézisnek és jele . A két hipotézis egyidejű felírására azért van szükség, mert az a hipotézisvizsgálat módja, hogy ezeket az állításokat versenyeztetjük egymással, és a kettő közül azt fogjuk igaznak tekinteni, amelyik a mintavétel eredménye alapján hihetőbbnek tűnik a másiknál.

Példánkban a csokigyár által felállított nullhipotézis az, hogy a csoki tömege 100 gramm:

:

Az ellenhipotézis pedig az, hogy a csoki nem 100 gramm:

:

Egy hipotézist egyszerű hipotézisnek nevezünk, ha megvalósulása a sokaság eloszlását egyértelművé teszi. Példánkban az egyféleképpen megvalósuló egyszerű hipotézis, a végtelensokféleképpen megvalósuló pedig összetett hipotézis. Az összetett hipotézisek mindig egyszerű hipotézisek halmazaiként állnak elő.

A nullhipotézist és az ellenhipotézist úgy kell megfogalmaznunk, hogy egymásnak ellentmondjanak és együttesen az összes leh etőséget kimerítsék. Ez azt jelenti, hogy ha a nullhipotézis

:

akkor az ellenhipotézis

:

Ha azt a gyanúnkat akarjuk megfogalmazni, hogy a csoki 100 grammnál kevesebb, akkor ezt az ellenhipotézisben kell megtennünk, a nullhipotézisben ugyanis mindig szerepelnie kell egyenlőségnek is.

Az ellenhipotézisben fogalmazzuk meg tehát azon aggodalmunkat, hogy a csoki 100 grammnál kevesebb, vagyis : az ennek megfelelő nullhipotézis pedig az, hogy a csoki 100 gramm vagy annál több.

A megfelelő hipotézispár tehát ilyenkor

:

:

Ebben az esetben a nullhipotézis és az ellenhipotézis is összetett hipotézis.

Mivel a klasszikus hipotézisvizsgálat egyszerű nullhipotézisek használatát igényli, azokban az esetekben, amikor és is összetett, szükségünk van egy úgynevezett technikai nullhipotézisre, amit -vel jelölünk. Ha bal oldali vagy jobb oldali ellenhipotézis, akkor a -nek legkevésbé ellentmondó egyszerű hipotézist technikai nullhipotézisnek nevezzük. Ilyen esetekben ezt a technikai nullhipotézist használjuk a próba elvégzése során.

Nézzük meg ezeket a csokigyáras példánk segítségével.

Ha a nullhipotézis egyszerű hipotézis, akkor nincs szükség technikai nullhipotézisre.

:

:

Ha a nullhipotézis összetett hipotézis, akkor két esettel foglalkozunk:

Amikor bal oldali ellenhipotézis, a megfelelő hipotézispár

:

:

és a -nek legkevésbé ellentmondó

-beli hipotézis :

Amikor jobb oldali ellenhipotézis, a megfelelő hipotézispár

:

:

és a -nek legkevésbé ellentmondó

-beli hipotézis :

MÁSODIK LÉPÉS: A PRÓBAFÜGGVÉNY KIVÁLASZTÁSA

A próbafüggvény a mintaelemeknek egy olyan függvénye, amelynek eloszlása igazságát feltételezve pontosan ismert, így egy konkrét minta alapján lehetővé teszi a hipotézis helyességének ellenőrzését. Kiválasztása magától a hipotézistől, illetve a mintavétel módjától függ. Léteznek a sokasági átlaggal, a sokasági szórással, a sokaság eloszlásával és még rengeteg más tulajdonságával kapcsolatos hipotézisekhez tartozó próbafüggvények. Ezekkel részletesen majd később foglalkozunk.

Most térjünk rá konkrét példánk vizsgálatára. A csokik tömege normális eloszlású, =3 gramm szórással, a minta elemszáma pedig n=150. Nos ilyenkor a mintaátlagok szintén normális eloszlásúak, átlaguk megegyezik a sokasági átlaggal, szórásuk pedig

Ezt a centrális határeloszlás tételek alapján tudjuk, de ha az elnevezés nagyon rémisztő, akkor egyszerűen csak tudjuk és kész.

Ha a nullhipotézis igazságát feltételezzük, vagyis úgy gondoljuk, hogy a csoki tömege , akkor az n=150 elemű minták átlagai olyan normális eloszlás szerint helyezkednek el, amelynek átlaga 100 és szórása 0,245. Ez lesz a próbafüggvény.

:

:

Amikor bal oldali ellenhipotézis,

a megfelelő hipotézispár

:

:

a próbafüggvényt ilyenkor a

technikai nullhipotézis

:

alapján írjuk föl, vagyis

ugyanaz marad.

Amikor jobb oldali ellenhipotézis,

a megfelelő hipotézispár

:

:

a próbafüggvényt ilyenkor a

technikai nullhipotézis

:

alapján írjuk föl, vagyis

ugyanaz marad.

HARMADIK LÉPÉS: SZIGNIFIKANCIASZINT ÉS KRITIKUS TARTOMÁNY

Most, hogy felállítottuk a nullhipotézist és megvan a hozzá tartozó próbafüggvény, magának a hipotézisvizsgálatnak az elvégzése nagyon egyszerű.

A próbafüggvény értéktartományát alkalmas osztópontokkal két diszjunkt tartományra, az elfogadási és a kritikus tartományra osztjuk. Ha eredményünk majd az elfogadási tartományba fog esni, akkor ezt a tényt a nullhipotézist igazoló jelnek fogjuk tekinteni, ha pedig a kritikus tartományba, akkor a nullhipotézist elvetjük. Az elfogadási tartomány határait úgy választjuk meg, hogy a nullhipotézis fennállása esetén a próbafüggvény előre megadott nagy valószínűséggel ebbe a tartományba essen. Ezt az előre megadott nagy valószínűséget -val jelöljük.

Az elfogadási tartományba esés valószínűsége tehát igen magas , míg a kritikus tartományba esés valószínűsége . Ezt az alacsony valószínűséget szignifikancia szintnek nevezzük. Jellemzően legtöbbször használt értékei 0,01 vagy 0,05 vagy 0,1 amit százalékban szokás megadni, tehát 1% vagy 5% vagy 10%.

Az elfogadási és a kritikus tartomány határán helyezkednek el az úgynevezett kritikus értékek. A kritikus értékeket megegyezés szerint mindig a kritikus tartományba soroljuk.

Ábráinkon a próbafüggvényt a normális eloszlás jellegzetes függvényével szimbolizáljuk, de másfajta próbafüggvények is léteznek.

Ha a nullhipotézistől mindkét

irányban történő eltérés a

hipotézis helytelenségét jelenti,

akkor a kritikus tartomány

kétoldali. Ilyenkor a túl kicsi vagy

a túl nagy értékek egyaránt

a nullhipotézis helytelenségét

jelentik. Kétoldali kritikus

tartomány esetén két kritikus

érték is van, egy alsó és egy

felső kritikus érték.

Ezeket és jelöli

Bal vagy jobb oldali, tehát egyoldali kritikus tartományra olyan esetekben van szükség, amikor a nullhipotézis helytelenségét vagy a kiugróan magas vagy a kiugróan alacsony értékek jelzik.

Bal oldali kritikus tartomány

Esetén a kritikus érték és

jobb oldali az elfogadási

tartomány.

Jobb oldali kritikus tartomány

esetén pedig a kritikus érték

és ilyenkor bal oldali az

elfogadási tartomány.

Nézzük meg az elfogadási és a kritikus tartományokat a csokigyárról szóló példánkban. Legyen a szignifikancia szint mondjuk 5%.

Ekkor tehát .

Ha nullhipotézisünk az, hogy csoki valóban 100 gramm és ezt azzal a hipotézissel versenyeztetjük, hogy a csoki nem 100 gramm, akkor hipotézisünk helytelenségét jelentik a kiugróan alacsony, de a kiugróan magas értékek is. Ilyenkor kétoldali kritikus tartomány lesz két kritikus értékkel.

:

:

A kritikus értékeket általában

majd táblázatokból kell kikeresnünk,

most ezek és .

Ha azt a gyanúnkat akarjuk megfogalmazni, hogy a csoki 100 grammosnál kisebb, akkor ezt az ellenhipotézisben kell megtennünk, a nullhipotézisben ugyanis mindig szerepelnie kell egyenlőségnek is. Az, hogy a csoki 100 grammnál kisebb tehát egy bal oldali ellenhipotézis, a hozzá tartozó nullhipotézis pedig az, hogy a csoki legalább 100 gramm. Ilyenkor egyoldali, mégpedig bal oldali kritikus tartományunk lesz.

:

:

a próbafüggvényt ilyenkor a

technikai nullhipotézis

:

alapján írjuk föl, vagyis ugyanaz marad.

Most csak bal oldali kritikus

érték lesz .

Ha azt akarjuk megfogalmazni, hogy a csoki több mint 100 gramm, ezt is csak az ellenhipotézisbe csomagolva tehetjük meg. A nullhipotézis ekkor az, hogy a csoki nem több, mint 100 gramm, az ellenhipotézis pedig az, hogy több, mint 100 gramm, és egyoldali, mégpedig jobb o ldali kritikus tartományunk lesz.

:

:

a próbafüggvényt ilyenkor a

technikai nullhipotézis

:

alapján írjuk föl, vagyis ugyanaz marad.

Most csak jobb oldali kritikus

érték lesz .

NEGYEDIK LÉPÉS: MINTAVÉTEL ÉS DÖNTÉS

Világos, hogy maga a mintavétel csak az elfogadási és kritikus tartomány meghatározása után történhet. Ha ugyanis ezek határait akkor jelölnénk ki, amikor már megvan a minta eredménye, könnyen kísértésbe eshetünk, hogy a határokat úgy húzzuk meg, hogy a nekünk tetsző hipotézis kerüljön ki győztesként.

A mintavétel eredményének ismeretében a hipotézisről való döntés gondolatmenete mindig ugyanaz.

Ha a mintavétellel kapott eredményünk szerint a próbafüggvény az elfogadási tartományba esik, akkor a nullhipotézist tekintjük igaznak, a ellenhipotézist pedig elvetjük.

Ha viszont a próbafüggvény a minta alapján a kritikus tartományba esik, akkor a nullhipotézist vetjük el és a ellenhipotézist tekintjük igaznak.

A gondolatmenet lényege a következő. Ha feltesszük, hogy a nullhipotézis igaz, akkor a próbafüggvény csak nagyon kis valószínűséggel kerül a kritikus tartományba, vagyis csak nagyon kis valószínűséggel eshet meg az, hogy a hipotézis igaz, de azt mégis elvetjük. Ezt a kis valószínűséget hívjuk egyébként szignifikancia szintnek.

Ha tehát a próba elvégzése során a próbafüggvény mégis a kritikus tartományba esik, akkor kételkedni kezdünk a nullhipotézisben, és az ellenhipotézist tekintjük helyesnek.

Természetesen ezek csak feltevések, tehát bárhogy döntünk is, előfordulhat, hogy hibát követünk el. Hibát követünk el akkor is, ha a nullhipotézis helyes, ám a próbafüggvény mégis a kritikus tartományba esik, így elvetjük. És hibát követünk el akkor is, ha a nullhipotézis nem helyes, de a próbafüggvény mégis az elfogadási tartományba esik, ezért elfogadjuk. A kétféle hiba természetének megértéséhez térjünk vissza a csokigyár példájához.

Legyen a nullhipotézis az, hogy a csoki tömege 100 gramm, az ezzel versenyző ellenhipotézis pedig az, hogy a csoki nem 100 gramm, tehát vagy több vagy kevesebb.

:

:

A szignifikancia szint

Ha a nullhipotézis igaz, vagyis a csoki tömege tényleg 100 gramm, akkor a minták átlagai olyan normális eloszlás szerint helyezkednek el, aminek átlaga 100 és szórása

ahol ez a sokasági szórás, n=150 ez a minta elemszáma.

Ha a nullhipotézis igaz, akkor a mintaátlagok tényleg ezen eloszlás szerint helyezkednek el, vagyis tényleg eséllyel esnek a kék részbe és eséllyel a sárgába.

Ha a mintaátlag a kék részbe vagyis az elfogadási tartományba esik, akkor a nullhipotézist elfogadjuk, és mivel az igaz, döntésünk helyes.

Ha a mintaátlag a sárga részbe, vagyis a kritikus tartományba esik akkor a nullhipotézist nem fogadjuk el, de mivel az igaz, ezzel hibát követünk el. Ezt a hibát nevezzük elsőfajú hibának.

Az elsőfajú hibát tehát akkor követjük el, ha a nullhipotézis igaz, de tragikus véletlen folytán a próbafüggvény mégis a kritikus tartományba esik és ezért elvetjük. Ennek valószínűsége jól láthatóan a sárgával jelzett rész vagyis éppen , tehát a szignifikancia szin t.

Most térjünk rá arra, hogy mi van abban az esetben, amikor a nullhipotézis nem igaz.

Az csoki tömege tehát nem 100 gramm, hanem 80 gramm vagy 110 gramm vagy bármennyi. Legyen mondjuk a tényleges tömeg 50 gramm. Ebben az esetben a mintaátlagok eloszlása ugyanúgy normális eloszlású csak éppen nem a 100 körül, hanem az 50 körül.

A mintaátlagok tényleges eloszlását tehát ez az utóbbi görbe adja meg. Annak valószínűségét, hogy olyan mintánk lesz, ami a kék részbe, vagyis az elfogadási tartományba esik, szintén ez az új függvény adja meg. Ezt ábránkon pirossal jelöljük. A pirossal jelölt rész tehát az, amikor nem vetjük el a nullhipotézist, mert az elfogadási tartományba esik, de valójában az hamis. Ezzel szintén hibát követünk el. Ezt a hibát nevezzük másodfajú hibának. A másodfajú hiba elkövetésének valószínűsége .

Míg az elsőfajú hiba elkövetésének valószínűsége ismert, hiszen ez éppen a szignifikanciaszint, addig a másodfajú hiba valószínűségét általában homály fedi. Ez ugyanis a tényleges helyzettől függ, amit sajnálatosan nem ismerünk. Ha a tényleges tömeg ugyanis nem 50 gramm, hanem mondjuk 60 gramm, akkor a tényleges eloszlás jobbra tolódik, megnövelve ezáltal a piros rész, így a másodfajú hiba elkövetésének valószínűségét.

Az elsőfajú hiba elkövetésének valószínűsége és a másodfajú hiba valószínűsége egymással ellentétes.

Ha a szignifikanciaszintet, vagyis -t csökkentjük, ezáltal a vagyis a másodfajú hiba valószínűsége megnő. Alacsony szignifikanciaszint mellett tehát olyan hipotéziseket érdemes vizsgálni, ahol a kétféle hibázási lehetőség közül az elsőfajú hiba elkövetésének esélyét szeretnénk kisebbnek tudni. Ez olyan esetekben kívánatos, amikor a hipotézis téves elvetése nagyobb károkat okoz, mint esetleges hibás megtartása.

Ha a szignifikancia szintet növeljük, ezáltal nő az elsőfajú hiba valószínűsége, viszont ezzel együtt csökken a másodfajú hiba valószínűsége. Magas szignifikancia szintet tehát akkor érdemes használni, hogyha a másodfajú hiba esélyét szeretnénk csökkenteni, még azon az áron is, hogy esetlegesen elvetjük a nullhipotézist, pedig az helyes.

Magának a hipotézisvizsgálatnak a menete minden esetben ugyanezekből a lépésekből fog állni, a különböző próbák csupán technikai elemeikben térnek majd el egymástól. Ezek közül a próbák közül nézzük meg most a legfontosabbakat.

 

MESE A HIPOTÉZIS-VIZSGÁLATRÓL

01
Itt jön egy fantasztikus
Statisztika 2 epizód.

Hozzászólások

Akkor nem kellene elitélni a csoki gyárat, ha a felső 5%-ba esik a teszt végeredménye. Szólni kéne a gyárnak, hogy a bal szélre koncentráljanak a vád természeténél fogva.