Statisztika és valszám alapok epizód tartalma:
Medián, módusz, kvartilisek, szórás, relatív szórás, gyakoriság, relatív gyakoriság, gyakorisági sor, értékösszeg sor, koncentráció, Lorenz-görbe, doboz-ábra, alakmutatók, Pearson-mutató, F-mutató.
Azokat az adatsorokat nevezzük idősornak, amely egy – vagy több – ismérv időben történő megoszlását írja le. Legjobb lesz, ha nézünk néhány példát.
Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.
év
megbukott
vizsgázók száma
2007
350
2008
380
2009
420
2010
450
Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa szerencsés esetben mindig ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem volna ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik rubrikában két év megbukott hallgatóinak száma szerepel, akkor például a bukottak száma 350, 380, 870. A látszólagos ugrás azonban csak a csalás miatt van.
Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.
Nézzünk egy másik példát is idősorra. Vegyük, mondjuk egy országban a gépkocsi tulajdonosok és a közúti balesetek számának évenkénti megoszlását.
év
gépkocsi
tulajdonosok száma
közúti
balesetek száma
2007
2 315 421
81 256
2008
2 531 254
80 578
2009
2 624 322
79 875
2010
2 598 378
79 756
A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.
Ha az adatok összeadásával kapott eredmény értelmes,
az idősort tartamidősornak nevezzük. Ilyen például táblázatunkban a közúti balesetek száma. Ezeket összeadva kiderül, hány baleset volt a négy év során.
Ha az adatok összeadásával kapott eredmény nem értelmes,
az idősort állapotidősornak nevezzük. Ilyen a táblázatban a gépkocsi tulajdonosok száma. Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.
A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák – innen ered a nevük is – tehát egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb.
Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában.
Az idősorban bekövetkező változásokat általában százalékosan szokás megadni, az úgynevezett viszonyszámokkal. Vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.
Nézzünk egy feladatot!
Az alábbi táblázat egy mozi forgalmának és jegyárainak évenkénti megoszlását tartalmazza.
év
TARTAMIDŐSOR
forgalom
(millió fő)
ÁLLAPOTIDŐSOR
Jegyár
(jan.1-én)
2007
5
950
2008
5,4
1150
2009
5,1
1300
2010
4,9
1450
2011
5
1500
Lássuk a viszonyszámokat! A forgalom oszlopban tekintsük bázisévnek 2007-et. Ekkor a bázisviszonyszámok
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
950
2008
1150
2009
1300
2010
1450
2011
1500
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
950
2008
1150
2009
1300
2010
1450
2011
1500
A láncviszonyszámok mindig az előző évhez viszonyítanak.
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
lánc-
viszonyszám
(előző év=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
nincs
950
2008
1150
2009
1300
2010
1450
2011
1500
A bázisviszonyszám és a láncviszonyszám jelentése mindig százalékos változás.
Ha például a 2009-et nézzük, 1,020 azt jelenti, hogy 2%-al volt nagyobb a forgalom, mint a bázisévben, 0,944 pedig azt jelenti, hogy 0,056-al tehát 5,6%-al volt kisebb a forgalom, mint az előző évben.
A láncviszonyszámokat nézzük meg a jegyárakra is,
a bázisviszonyszámot meg egy időre felejtsük el.
év
forgalom
(millió fő)
lánc-
viszonyszám
(előző év=100%)
Jegyár
lánc-
viszonyszám
(előző év=100%)
2007
nincs
2008
2009
2010
2011
Az évek során bekövetkezett változást kétféleképpen is szemléltethetjük. Az egyik lehetőség az átlagos különbség, ami a jegyáraknál például azt jelenti, hogy hány forinttal drágultak a jegyek átlagosan egy év alatt. Ezt a változás mértékének szokás nevezni.
Az átlagos változás mértéke
Tehát összeadogatjuk a drágulásokat, aztán elosztjuk – mivel is? Az évek száma n, de nem n-el osztunk. Azért nem n-el, mert a drágulások számával kell osztanunk és az nem n, hanem n-1, az egyik évről a másikra történő ugrások száma. Most a vizsgált időszak 2007-től 2011-ig tart, ami öt év ugyan, de ugrásból csak négy van, ezért kell néggyel osztani:
tehát átlagosan évente 137,5 forinttal drágult a mozizás. Ha valaki jártas az általános iskola matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:
Nem csak azt kérdezhetjük meg, hogy hány forinttal drágult a mozi, hanem azt is, hogy hány százalékos volt az éves áremelés. Ezt a változás ütemének hívjuk.
A változás üteme
Itt is azért van a gyökkitevőben n-1, mert nem az évek száma kell nekünk, hanem a változások száma, egyik évről másikra. Ez pedig n-1. A mozijegyek árának évenkénti változása tehát:
A változás mértéke:
A változás üteme:
A jegyek átlagosan 137,5 forinttal, 12%-al drágultak.
Ugyanezt megnézhetjük a mozilátogatók számának esetében is.
A változás mértéke:
A változás üteme:
Most térjünk rá az átlagok kiszámolására. Az átlagos nézőszám esetében tartamidősorunk van, vagyis van értelme összeadni az idősor adatait. Itt az átlagot a szokásos módon számoljuk:
Más a helyzet az átlagos jegyár esetében, ami állapotidősor, így az adatok összege értelmetlen. Ilyenkor úgynevezett kronologikus átlagot számolunk, ami
Nézzünk egy másik példát, ahol összefoglaljuk az eddigieket.
A következő táblázat egy autókereskedés raktárkészletének és eladásainak időbeli eloszlását tartalmazza. Számoljuk ki az összes eddigi állatfajtát.
hónap
raktárkészlet
(a hónap elején)
eladott
mennyiség
jan.
210
150
feb.
350
120
mar.
310
100
apr.
300
120
maj.
290
A változások mértéke és üteme:
hónap
ÁLLAPOTIDŐSOR
raktárkészlet
(a hónap elején)
TARTAMIDŐSOR
eladott
mennyiség
jan.
feb.
mar.
apr.
maj.
hónap
ÁLLAPOTIDŐSOR
raktárkészlet
TARTAMIDŐSOR
eladott mennyiség
jan.
feb.
mar.
apr.
maj.
Változás
mértéke
Változás
üteme
átlag
2.4. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.
Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.
Előállított mennyiség
Raktározva
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
-
125
-
febr.
120
110
1100
marc.
3500
apr.
150
3750
87,5
Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor
Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak
107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.
Előállított mennyiség
Raktárkészlet
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
1
-
2500
1,25
-
1000
febr.
1,2
1,2
3000
1,375
1,1
1100
marc.
1,4
1,167
3500
1
0,7272
800
apr.
1,5
1,071
3750
0,875
0,875
700
Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?
Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor
Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.
A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:
2.5. Egy áruház raktárkészlete valamely termékből az alábbiak szerint alakult:
hónap
Készlet
Jan=100%
Előző
hónap=100%
Változás %-ban
február=100%
Változás
februárhoz képest (db)
Aktuális készlet a hónap végén (db)
Jan.
100
-
-20
-10
Febr.
Márc.
110
Ápr.
+16
Máj.
600
Jún.
80
Júl.
130
a) Töltsük ki a hiányzó részeket!
b) Mekkora volt az átlagos raktárkészlet ebből a termékből a második negyedévben?
Statisztika és valszám alapok epizód.