Valószínűségszámítás epizód tartalma:
Regresszió alapötlete, magyarázó változók, eredményváltozó, proxy változó, dummy változó, lineáris kétváltozós regresszió, reziduumok, reziduális szórás, korreláció, kovariancia, elaszticitás, többváltozós lineáris regressziós modell, paraméterek becslése, elaszticitás, korrelációs mátrix, kovariancia mátrix, standard lineáris modell, paraméterek intervallumbecslése, paraméterek szeparált tesztelése, t-próba, modell tesztelése, autokorreláció, nem lineáris regressziók.
A képsor tartalma
Hatványkitevős és exponenciális regresszió
Vannak olyan esetek, amikor a magyarázó változó és az eredményváltozó között nem lineáris a kapcsolat. Ilyenkor legtöbbször hatványkitevős vagy exponenciális regressziót használunk. Nézzünk meg egy konkrét példát, ahol összehasonlítjuk a szóba jöhető regressziós modelleket.
Egy statisztika vizsgára tanulók saját tapasztalatain alapuló felmérése szerint a tanulással töltött órák száma és az elért pontszám között az alábbi összefüggéseket sikerült kimutatni.
Tanulással
töltött órák
Pontszám
(max 100)
3 5
4 6
5 8
6 9
9 16
10 20
12 24
16 56
20 81
24 96
Az összehasonlítás kedvéért nézzük meg mindhárom regressziós modellt, a lineáris a hatványkitevős és az exponenciális modellt.
A lineáris regressziót már ismerjük, erre a lineáris modellre fogjuk a másik kettőt visszavezetni egy trükk segítségével. Megeshet, hogy néhányan rosszakat fognak tőle álmodni, da sajna a trükk az lesz, hogy vesszük a regressziós egyenletek logaritmusát. Mindegy milyen alapú logaritmust veszünk, legyen mondjuk 10-es alapú, vagyis lg.
Az így kapott egyenletek hajszálra megegyeznek az eredeti lineáris modell egyenletével, csak bizonyos betűk elé odakerült, hogy lg. A paraméterek kiszámításának képletei tehát szintén ugyanazok maradnak, csak ott is oda kell írni, hogy lg.
Az eredeti táblázatunkat kiegészítjük és oszlopokkal.
Tanulással
töltött órák
Pontszám
(max 100)
3 5 0,4771 0,6989
4 6 0,6020 0,7781
5 8 0,6989 0,9031
6 9 0,7781 0,9542
9 16 0,9542 1,2041
10 20 1,000 1,3010
12 24 1,0791 1,3802
16 56 1,2041 1,7482
20 81 1,3010 1,9085
24 96 1,3802 1,9823
A lineáris regressziónál minden ugyanúgy megy, mint eddig:
A regresszió egyenlete:
A csak technikai paraméter, pedig azt jelenti, hogy minden egyes órányi tanulás 4,586 ponttal növeli a vizsga pontszámát.
Nézzük mi a helyzet a hatványkitevős regressziónál.
A regresszió egyenlete
amibe a kapott paramétereket írva
Itt csak a paraméternek van érdemi jelentése, ráadásul kicsit szokatlan. Hatványkitevős regressziónál ugyanis az elaszticitás. Esetünkben tehát az elaszticitás 1,514, ami annyit jelent, hogy x 1%-os növekedése 1,514%-al növeli y-t. Másként 1%-al több tanulás 1,514%-al növeli a vizsgán elért pontszámot.
Végül az exponenciális regresszió:
A regresszió egyenlete
amibe a kapott paramétereket írva
A paraméterek jelentése a következő. csak technikai paraméter, pedig azt jelenti, hogy minden egyes órányi tanulás 1,16-szorosára növeli a vizsga pontszámát.
Nézzük meg, a három regresszió közül melyik illeszkedik a legjobban. Elsőként a reziduumokat számoljuk ki.
Tanulással
töltött órák
Pontszám
(max 100)
lineáris
hatvány
exp.
3 5 -4,129 3,456 5,822
4 6 0,457 5,343 6,754
5 8 5,043 7,490 7,834
6 9 9,629 9,871 9,087
9 16 23,387 18,237 14,185
10 20 27,973 21,391 16,455
12 24 37,145 28,192 22,141
16 56 55,489 43,579 40,090
20 81 73,833 61,094 72,588
24 96 92,177 80,516 131,432
A jelek szerint a lineáris modell SSE-je a legkisebb, tehát ebben az esetben ez a modell illeszkedik legjobban.
Itt jön egy izgalmas
Valószínűségszámítás epizód.
Valószínűségszámítás epizód.