Egy ismérv szerinti elemzés
Csúcsosság
A csúcsosság azt jelenti, hogy az eloszlás görbéje mennyire csúcsosodik ki.
A csúcsosság mérésére a következő mutató van forgalomban:
\( \alpha_4 = \frac{ M_4 ( \overline{X} )}{\sigma^4} -3 \)
Itt $M_4(\overline{X})$ az úgynevezett negyedik momentum, és így számolható ki:
\( M_4(\overline{X})=\frac{ \sum \left( \overline{X} - X_i \right)^4}{N} \)
F-mutató
Az alakmutatók arról szólnak, hogy az eloszlás mennyire asszimetrikus.
Az egyik legegyszerűbb és leggyakrabban használt alakmutatók, az úgynevezett Pearson-féle mérőszámok mellett az F-mutatók:
\( F_{0,25} = \frac{ \left( Q_3 - Me \right) - \left( Me - Q_1 \right) }{ \left( Q_3 - Me \right) + \left( Me - Q_1 \right) } \)
\( F_{0,1} = \frac{ \left( D_9 - Me \right) - \left( Me - D_1 \right) }{ \left( D_9 - Me \right) + \left( Me - D_1 \right) } \)
ahol $D_1$ az első, $D_9$ pedig a kilencedik decilist jelenti.
A negatív értékek jobb oldali asszimetriát jelentenek. A pozitív értékek esetén pedig bal oldali asszimetria van.
Az F mutató csak -1 és 1 között lehet.
Pearson-mutató
Az alakmutatók arról szólnak, hogy az eloszlás mennyire asszimetrikus.
Az egyik legegyszerűbb és leggyakrabban használt alakmutatók, az úgynevezett Pearson-féle mérőszámok:
\( P = 3 \frac{ \overline{X}-Me}{\sigma} \qquad A= \frac{\overline{X}-Mo}{\sigma} \)
A negatív értékek jobb oldali asszimetriát jelentenek. A pozitív értékek esetén pedig bal oldali asszimetria van.
A Pearson-féle P és A mutatók általában -1 és 1 között tartózkodnak és csak extrém esetekben vesznek föl 1-nél nagyobb vagy -1-nél kisebb értéket.
Herfindahl-index
A Herfindahl-index egy eszköz a koncentráció vizsgálatára.
\( HI = \sum Z^2_i \)
A Herfindahl-index 1/N és 1 között vesz fel értékeket és minél közelebb van az 1-hez, annál nagyobb a koncentráció.
Lorenz-görbe
A Lorenz-görbe egy eszköz a koncentráció vizsgálatára.
A Lorenz-görbe az úgynevezett koncentrációs területtel szemlélteti a koncentráció mértékét.
Minél nagyobb ez a terület, a koncentráció annál erősebb.
Olyankor pedig, amikor a Lorenz görbe egybeesik a négyzet átlójával, a koncentráció nulla.
Állapotidősor
Az állapotidősorok egy vizsgált időtartam egy adott pillanatára vonatkozó megfigyeléseket tartalmazzák, például az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában, stb. és ilyenkor az adatok összeadásával nem kapunk értelmezhető eredményt.
Kronologikus átlag
Egy speciális átlag, például ha négy hónap adataiból számoljuk ki az átlagot, viszont csak három hónapos időtartamra.
Az állapotidősornál mindig kronologikus átlagot számolunk:
\( \overline{y}_k = \frac{\frac{y_1}{2}+y_2+y_3+\dots+\frac{y_n}{2}}{n-1} \)
Tartamidősor
A tartamidősorok egy vizsgált időtartamra vonatkozó megfigyeléseket tartalmaznak.
Például egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb. Ilyenkor az adatok összeadása értelmes eredményt ad.
Egy áruház raktárkészlete valamely termékből az alábbiak szerint alakult:
Hónap | Készlet | ||||
Jan = 100% | Előző hónap = 100% | Változás %-ban február = 100% |
Változás februárhoz képest (db) |
Aktuális készlet a hónap végén (db) |
|
Jan. | 100 | - | -20 | -10 | |
Febr. | |||||
Márc. | 110 | ||||
Ápr. | +16 | ||||
Máj. | 600 | ||||
Jún. | 80 | ||||
Júl. | 130 |
a) Töltsük ki a hiányzó részeket!
b) Mekkora volt az átlagos raktárkészlet ebből a termékből a második negyedévben?
Egy cég dolgozóinak fizetés szerinti megoszlása:
Lakásméret (négyzetméter) |
Lakások száma (ezer darab) \( f_i \) |
0-19 | 18 |
20-39 | 30 |
40-99 | 66 |
100-199 | 36 |
200- | 10 |
Összesen: | 160 |
Melyik osztályközben lesz a módusz, medián?
Számoljuk ki az átlagot és szórást.
Nézzük meg alakmutatók segítségével, hogy milyen jellegű asszimetriát mutat a terroristák életkor szerinti megoszlása.
Életkor | Terroristák száma (%) |
0-19 | 7% |
20-29 | 46% |
30-39 | 32% |
40-59 | 10% |
60-79 | 5% |
Számítsuk ki a Pearson-féle mutatókat és a csúcsosságot.
Egy cég dolgozóinak fizetés szerinti megoszlása:
Fizetés (EUR) |
Dolgozók száma |
0-1499 | 66 |
1500-2999 | 64 |
3000-4499 | 56 |
4500-5999 | 12 |
6000-7499 | 2 |
Összesen: | 200 |
Készítsük el a kumulált relatív értékösszeget, majd vizsgáljuk a koncentrációt Herfindahl-indexel és Lorenz-görbével.
Az alábbi táblázat egy üzlet havi fogkrémeladásait és raktárkészletét tartalmazza.
Hónap | Eladás (db) |
Raktárkészlet (db, hónap 1-én) |
Jan. | 640 | 120 |
Febr. | 720 | 150 |
Márc. | 740 | 160 |
Ápr. | 760 | 110 |
Máj. | 730 | 100 |
Jún. | 760 | 120 |
Számoljuk ki az első negyedév átlagos forgalmát és raktárkészletét.
Hisztogram, oszlopdiagram, leveles-ág és doboz ábra
Ez a rész arról fog szólni, hogy a korábban megismert sokféle statisztikai mutató még jó is valamire. Arra fogjuk használni őket, hogy kimutassuk velük az adatsorok speciális tulajdonságait, megállapítsuk főbb jellemzőit. Vagyis a sok-sok számot becseréljük néhány szemléletes ábrára és egykét jól eltalált mutatószámra.
Az ábrák közül a leginkább leegyszerűsített a doboz-ábra, ez majd a kiugró értékek szemléltetésére lesz forgalomban. Az értékek megoszlásáról a diagramok adnak grafikus információkat. Ilyenek a gyakorisági-poligonok, az oszlopdiagramok, kördiagramok, vagy a hisztogramok.
Íme egy hisztogram
És egy oszlopdiagram
A két ábra között nem csupán esztétikai különbség van.
Ahhoz, hogy ez világos legyen, nézzünk rá példát. Hogy valami kellemes legyen, vegyünk mondjuk egy statisztika vizsgát.
Az első diagram, a hisztogram a vizsgán elért összpontszámot mutatja 25 pontonként. Itt az oszlopoknak össze kell érniük, az első oszlop egészen 24,9 pontig fogadja be a vizsgázókat, a második pedig már 25 ponttól.
[Szövegdoboz: db 25 50 75 100]
Ha viszont nem a pontszámokat, hanem a vizsgajegyeket ábrázoljuk, akkor más a helyzet. Nincs ugyanis 3,9-es vagy 4,3-as jegy. Pontosan öt kategória van és ezek élesen határolódnak el egymástól.
[Szövegdoboz: db 1 2 3 4 5]
Mielőtt tehát túlzottan elmélyednénk a diagramokban, nem árt tisztázni, milyen különbségek lehetnek maguk közt az adatok közt. Íme a menü:
[Szövegdoboz: MINŐSÉGI Nominális (névleges) A sokaság elemeit valamilyen tulajdonságok szerinti csoportokba soroljuk, de a csoportok közt nincs semmiféle rangsor példák: az áldozatok halálának oka a terroristák nemzetisége Ordinális (sorrendi) A csoportok között már felállítható sorrendiség példák: a hotelek besorolása (** *** **** *****) a vizsgázók jegyei (1, 2, 3, 4, 5 ) MENNYISÉGI Intervallum A sokaság elemeit itt már valamilyen mértékegység szerint osztályozzuk, de csak a „mennyivel több?” kérdésre tudunk válaszolni, a „hányszoros?”-ra nem példák: hőmérséklet (tegnap -5 fok volt, ma 0 fok, hányszor melegebb van?) Arány Itt is mértékegység szerinti az osztályozás, de a „hányszoros?” kérdésre is tudunk válaszolni (mindig 0-tól kezdünk mérni) példák: életkor testmagasság]
Az ismérvek grafikus ábrázolásánál mindig az ismérv típusának megfelelő diagramra van szükség. A hisztogramot mennyiségi ismérvek esetében használjuk, ilyen például korábbi példánkban a vizsgán elért pontszám (megengedve akár a töredékpontokat is).
Az oszlopdiagram minőségi ismérvek esetén használatos, ilyen például a vizsgán elért jegy.
A kördiagramot is általában minőségi ismérvek esetén alkalmazzuk, de néha alkalmas lehet mennyiségi ismérvek megoszlásának kimutatására is. A kördiagram lényege, hogy a csoportok közti arányokat szemlélteti. A továbbiakban nézzünk néhány példát az egyes diagramtípusokra.
Az alábbi táblázat egy városban a lakások megoszlását tartalmazza. Ábrázoljuk a táblázat adatait oszlopdiagrammal és hisztogrammal.
Lakásméret
(négyzetméter)
Lakások száma
(1000 darab)
A
B
C
0-49
21
12
3
4
50-99
33
10
15
8
100-159
60
17
23
20
150-250
46
21
18
7
összesen
160
60
61
39
A=Belvárosi társasház
B=Zöldövezeti társasház
C=Lakótelepi lakás
A lakások méret szerinti megoszlása mennyiségi ismérv, tehát nekünk egy hisztogramra van szükségünk.
[Szövegdoboz: Lakások száma (1000 db) 21 33 60 23 23 0 50 100 150 200 250]
A lakások típus szerinti megoszlása viszont minőségi ismérv. Ekkor oszlopdiagramot használunk.
[Szövegdoboz: Lakások száma (1000 db) 60 61 39 A B C]
Alakmutatók
Az alakmutatók az eloszlások szabálytalanságait próbálják jellemezni, legtöbbjük azt méri, hogy az adott eloszlás mennyiben tér el az etalonnak tekintett normális-eloszlás jellegzetes harang alakú görbéjétől. Az eltérés megmutatkozhat lapultságban vagy csúcsosságban, illetve aszimmetriában, ami jelenthet jobbra vagy balra elnyúlást.
Az egyik legegyszerűbb és leggyakrabban használt alakmutatók, az úgynevezett
Pearson-féle mérőszámok
illetve az F-mutatók
és
ahol az első, pedig a kilencedik decilist jelenti.
Negatív értékek esetén az eloszlás balra tolódó, pozitív értékekre jobbra tolódó.
A P és A mutató általában -1 és 1 között tartózkodik és csak extrém esetekben vesz föl 1-nél nagyobb vagy -1-nél kisebb értéket. Az F mutató csak -1 és 1 között lehet.
A csúcsosság mérésére a következő mutató van forgalomban:
Itt az úgynevezett negyedik momentum, ami
Lássunk egy példát az alakmutatók használatára! Nézzük meg például, hogy milyen jellegű aszimmetriát mutat a terroristák életkor szerinti megoszlása. A terrorizmus jellemzően fiatalabb emberek elfoglaltsága, ráadásul várható élettartamuk is rövidebb, így bal oldali aszimmetria lesz majd felfedezhető. Node lássuk a számokat!
életkor
terroristák
száma (%)
0-19
7%
20-29
46%
30-39
32%
40-59
10%
60-79
5%
Először F-mutatókat számolunk:
Amihez kellenek a kvartilisek és a medián.
A kvartilisek:
A medián:
A másik F-mutatóhoz a decilisek kellenek:
Mindkét F-mutató közepes bal oldali aszimmetriát mutat.
Most jöhetnek a Pearson-féle mutatók. Ezekhez kell átlag és szórás is sajna:
Az átlag:
A szórás:
Végül egy móduszt is számolunk. Mivel nem egyenletesek az osztályközök, a módusz miatt újra kell osztani az életkorokat, méghozzá 10-esével.
A leggyakoribb osztályköz hossza viszont már eleve 10, így az újraosztás rajta már nem változtat.
életkor
terroristák
száma (%)
0-9
3,5%
10-19
3,5%
20-29
46%
30-39
32%
40-59
10%
60-79
5%
Lássuk a P és A mutatókat:
Mindkettő közepes bal oldali aszimmetriát mutat.
Végül nézzük meg a csúcsosságot is:
Itt
És
Egy bank ügyfeleinek a sorra kerülésig várakozással eltöltött ideje percben megadva egy vizsgált időtartamban:
3, 5, 2, 7, 4, 3, 8, 2, 5, 5, 3, 2, 4, 2, 6, 2
Ábrázoljuk az értékeket leveles-ág és doboz-ábrán.
A leveles-ág ábra az adatok nagyság szerinti sorba rendezése az alábbi módon:
1
2, 2, 2, 2,
3, 3, 3
4, 4
5, 5, 5
7,7
8
A doboz-ábra lényege, hogy az adatokat egy számegyenesen ábrázoljuk, az alsó és felső kvartilisek között elnyúló doboz társaságában.
Számoljuk ki a kvartiliseket. Összesen 16db adat van, így az alsó negyedelő 4 és 5 között a felső negyedelő 12 és 13 között van.
[Szövegdoboz: 1 2 2 2 2 3 3 3 4 4 5 5 5 7 7 8] [Szövegdoboz: Felső kvartilis] [Szövegdoboz: Medián: A sorbarendezett adatsor középső értéke. Most két középső is van, a tizedik és a tizenegyedik, ilyenkor az átlaguk:] [Szövegdoboz: Alsó kvartilis:]
[Szövegdoboz: A doboz-ábra X X X 0 1 2 3 4 5 6 7 8 9]
Az alsó és felső kvartilis közötti intervallumot nevezzük interkvartilis terjedelemnek. Most az interkvartilis 2-töl 5-ig tart, hossza 3. Az interkvartilis terjedelembe vagyis a dobozba esik az értékek legalább 50%-a. A doboz-ábra az adatsor öt jellegzetes mutatóját tartalmazza, a minimális és maximális értéket, a két kvartilist és a mediánt.
2.3. Húsz napon át figyelték egy alpesi kisváros sípályáinak összesített napi forgalmát. A kapott értékek a következők voltak:
1000
2000
7000
9000
12500
3500
1000
5000
3000
13000
5000
1500
3000
8000
9000
2500
3000
1500
8500
3000
Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját, a móduszt, mediánt, átlagot. Készítsünk leveles-ág ábrát illetve doboz-ábrát. Helyezzük el az adatokat egy gyakorisági sorban 2500-as osztályközökkel. Szemléltessük hisztogrammal a forgalom mértékét.
[Szövegdoboz: 1000 1000 1500 1500 2000 2500 3000 3000 3000 3000 3500 5000 5000 7000 8000 8500 9000 9000 11500 12000] [Szövegdoboz: Átlag:] [Szövegdoboz:] [Szövegdoboz: Felső kvartilis] [Szövegdoboz: Medián: A sorbarendezett adatsor középső értéke. Most két középső is van, a tizedik és a tizenegyedik, ilyenkor az átlaguk:] [Szövegdoboz: Alsó kvartilis:] [Szövegdoboz: Módusz =A leggyakoribb érték, most 5000]
A leveles-ág ábra
1 000, 000, 500, 500
2 000, 500
3 000, 000, 000, 000, 500
5 000, 000
7 000
8 000, 500
9 000, 000
11 500
12 000
[Szövegdoboz: A doboz-ábra X X X 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 11000 12000]
Az alsó és felső kvartilis közötti intervallumot nevezzük interkvartilis terjedelemnek. Most az interkvartilis 2250-töl 8250-ig tart, hossza 6000. Az interkvartilis terjedelembe vagyis a dobozba esik az értékek legalább 50%-a. A medián a doboz első harmadában található, a szélső értékek a dobozhoz képest jobbra tolódnak.
Napi forgalom
0 – 2499
2500 – 4999
5000 – 7499
7500 – 9999
10 000 – 12 499
5
6
3
4
2
5
11
14
18
20
5/20
6/20
3/20
4/20
2/20
5/20
11/20
14/20
18/20
20/20
Néhány további mutatót is kiszámoltunk, ezek a relatív gyakoriság, kumulált relatív gyakoriság, az értékösszeg és a relatív értékösszeg.
A relatív értékösszegre hamarosan nagy szükségünk lesz majd a koncentráció vizsgálatakor.
Napi forgalom
Osztály-
közép
0 – 2499
2500 – 4999
5000 – 7499
7500 – 9999
10 000 –12 499
1250
3750
6250
8750
12500
5
6
3
4
2
5
11
14
18
20
5/20
6/20
3/20
4/20
2/20
5/20
11/20
14/20
18/20
20/20
6250/105 000=0,07
22500/105 000=0,21
18750/105 000=0,18
35000/105 000=0,33
22500/105 000=0,21
Koncentráció, Lorenz-görbe
Hasonlítsuk össze a Föld néhány országának egy főre jutó GDP-jét és az országok népességét. Az európai országok egy főre jutó GDP-je úgy 40 ezer USA-dollár körül mozog, igaz kelet felé haladva ez jelentős csökkenésnek indul és Oroszországnál eléri a 10 ezret. USA és Kanada is ezt a 40 ezres szintet hozza, Mexikó pedig 8 ezret. Aztán lejjebb haladva Dél-Amerikában már a 10 ezer számít kiemelkedően magasnak. Ázsiában él a Föld lakosságának több, mint fele. Az egy főre jutó GDP azonban 2000 USA-dollár körül mozog. Ezek a megdöbbentő adatok sokakat vallások megalapítására sarkallnak, mások terrorista hálózatokat építenek ki, mi viszont belevágunk a Lorenz-görbe fölrajzolásába. A Lorenz-görbe az egyik legkiválóbb szemléltető eszköze a koncentrációnak, most éppen az egy főre jutó GDP nagyon erős koncentrálódásának. A koncentráció a sokasághoz tartozó teljes értékösszeg jelentős részének vagy egészének kevés egységre történő összpontosulása.
Ország
GDP/fő
(ezer USA-dollár, 2008)
Népesség
(millió)
Ausztria
46 600
8,4
Belgium
44 730
10,4
Csehország
17 280
10,2
Dánia
60 800
5,5
Franciaország
43 640
61,4
Németország
41 400
82,7
Magyarország
13 860
10,0
Norvégia
90 180
4,7
Nagy-Britannia
46 740
60,7
Olaszország
38 190
58,1
Oroszország
10 100
141,8
Svájc
55 780
7,6
Szlovákia
14 600
5,5
Ukrajna
3 307
46,0
Kanada
40 100
33,2
Mexikó
8 200
110,0
USA
47 330
304,8
Argentína
6 790
40,0
Brazília
6 600
192,0
Chile
10 590
16,8
Ausztrália
42 420
20,6
India
1 180
1 130,0
Indonézia
1 950
237,5
Irán
3 900
71,3
Kína
3 000
1 330,0
Japán
38 930
127,5
Pakisztán
940
167,2
Egyiptom
1 870
77,5
Etiópia
229
85
Kenya
640
38,5
Nigéria
1 020
150
Tanzánia
353
40,4
Készítsünk egy táblázatot, a Föld népességének egy főre jutó GDP szerinti megoszlásáról.
Az osztályközök a pontosság érdekében nem egyenletesek.
Első oszlopunk a gyakoriság, ami azt jelenti, hogy hány millió ember tartozik az adott GDP-szintet jelentő osztályközbe.
A következő oszlop a relatív gyakoriság. Jól látszik, hogy a népesség 30%-a tartozik a második osztályközbe és majdnem 30%-a a harmadikba, vagyis a Föld lakosságának jóval több, mint fele az 5000-es szint alatt van.
A kumulált relatív gyakoriság oszlopból látszik, hogy 70% van 5000 alatt, és 80% 10 ezer alatt. Magyarország a 14 ezer körüli szintjével a felső 20%-ba tartozik.
A következő oszlop az értékösszeg azt mutatja meg, hogy az egyes osztályokba tartozókra összesen mennyi GDP esik. A nyugati világ gazdaságilag fejlett országai a Föld lakosságának egytizedét teszik ki, de több GDP jut rá, mint az összes addigira együttvéve. Ezt jól szemlélteti a relatív értékösszeg és a kumulált relatív értékösszeg oszlop.
GDP/fő
(millió)
(ezer USA-dollár)
0-1 000
720
0,116
0,116
360 000
0,006
0,006
1 001-2 000
1 940
0,313
0,429
2 910 000
0,053
0,059
2 001-5 000
1 790
0,290
0,719
4 475 000
0,080
0,139
5 001-10 000
490
0,079
0,798
3 675 000
0,066
0,205
10 001-20 000
288
0,046
0,844
4 320 000
0,078
0,283
20 001-30 000
76
0,012
0,856
1 900 000
0,034
0,317
30 001-40 000
254
0,041
0,897
8 890 000
0,160
0,477
40 001-50 000
604
0,098
0,995
27 180 000
0,488
0,965
50 001-60 000
18
0,003
0,998
990 000
0,018
0,983
60 001-
15
0,002
1,000
975 000
0,017
1,000
Total
6 195
1,000
55 675 000
1,000
A Lorenz-görbe azt fejezi ki, hogy a gyakoriság egy adott százalékához az összérték hány százaléka tartozik. Az x tengelyen tehát a kumulált relatív gyakoriságot, míg az y tengelyen a kumulált relatív értékösszeget mérjük.
A Föld népességének 11,6%-ára az összes GDP 0,6%-a jut.
42,9%-ra még mindig csak 5,9% jut. 71,9%-ra mindössze 13,9% jut.
Könnyű belegondolni, hogy az y=x egyenes mentén a koncentráció nulla. Az y=x egyenes és a kapott görbe közötti területet hívjuk koncentrációs területnek, ez jellemzi a koncentráció mértékét, ami esetünkben igen magas.
[Szövegdoboz:]
A koncentráció kimutatásának egy másik egyszerű eszköze a kvantilis-eloszlás, vagyis ha olyan gyakorisági sort szerkesztünk, ahol minden gyakoriság egyenlő. Ha minden relatív értékösszeg (Zi) is egyenlő, az a koncentráció hiányát jelenti. Minél egyenlőtlenebbül alakulnak a relatív értékösszegek, a koncentráció annál nagyobb.
A kvartilis-elsozlás például úgy készül, hogy a Föld lakosságát az egy főre jutó GDP szerint sorba állítjuk, és négy egyenlő létszámú csoportra osztjuk. Az osztályközök határai ekkor kvartilisek lesznek.
GDP/fő
(millió)
0-1 100
1 548,75
0,010
1 101-2 100
1 548,75
0,027
2 101-11 000
1 548,75
0,110
11 001-90 000
1 548,75
0,853
Total
6 195
1,000
A kvintilis-eloszlás pedig ötödökre osztja.
GDP/fő
(millió)
0-1 000
1 239
0,007
1 001-2 000
1 239
0,020
2 001-4 000
1 239
0,042
4 001-20 000
1 239
0,167
20 001-90 000
1 239
0,764
Total
6 195
1,000
A koncentráció mértékének egy számmal való jellemzésére a koncentrációs terület kiszámolása viszonylag körülményes. Ezen kívül az egyik legalkalmasabb mutató az úgynevezett Herfindahl-index. Kiszámolása a Z értékekből történik:
Az eredeti táblázatunkban ezt kiszámolva
A Herfindahl-index, a kiszámolásának módja miatt mindig 1/N és 1 közötti értékkel méri a koncentráció fokát. Ha HI=1/N akkor minden egység egyformán részesedik a teljes értékösszegből, ha pedig HI=1, akkor a lehető legerősebb a koncentráció.
Azokat az adatsorokat nevezzük idősornak, amely egy – vagy több – ismérv időben történő megoszlását írja le. Legjobb lesz, ha nézünk néhány példát.
Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.
év
megbukott
vizsgázók száma
2007
350
2008
380
2009
420
2010
450
Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa szerencsés esetben mindig ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem volna ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik rubrikában két év megbukott hallgatóinak száma szerepel, akkor például a bukottak száma 350, 380, 870. A látszólagos ugrás azonban csak a csalás miatt van.
Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.
Nézzünk egy másik példát is idősorra. Vegyük, mondjuk egy országban a gépkocsi tulajdonosok és a közúti balesetek számának évenkénti megoszlását.
év
gépkocsi
tulajdonosok száma
közúti
balesetek száma
2007
2 315 421
81 256
2008
2 531 254
80 578
2009
2 624 322
79 875
2010
2 598 378
79 756
A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.
Ha az adatok összeadásával kapott eredmény értelmes,
az idősort tartamidősornak nevezzük. Ilyen például táblázatunkban a közúti balesetek száma. Ezeket összeadva kiderül, hány baleset volt a négy év során.
Ha az adatok összeadásával kapott eredmény nem értelmes,
az idősort állapotidősornak nevezzük. Ilyen a táblázatban a gépkocsi tulajdonosok száma. Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.
A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák – innen ered a nevük is – tehát egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb.
Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában.
Az idősorban bekövetkező változásokat általában százalékosan szokás megadni, az úgynevezett viszonyszámokkal. Vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.
Nézzünk egy feladatot!
Az alábbi táblázat egy mozi forgalmának és jegyárainak évenkénti megoszlását tartalmazza.
év
TARTAMIDŐSOR
forgalom
(millió fő)
ÁLLAPOTIDŐSOR
Jegyár
(jan.1-én)
2007
5
950
2008
5,4
1150
2009
5,1
1300
2010
4,9
1450
2011
5
1500
Lássuk a viszonyszámokat! A forgalom oszlopban tekintsük bázisévnek 2007-et. Ekkor a bázisviszonyszámok
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
950
2008
1150
2009
1300
2010
1450
2011
1500
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
950
2008
1150
2009
1300
2010
1450
2011
1500
A láncviszonyszámok mindig az előző évhez viszonyítanak.
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
lánc-
viszonyszám
(előző év=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
nincs
950
2008
1150
2009
1300
2010
1450
2011
1500
A bázisviszonyszám és a láncviszonyszám jelentése mindig százalékos változás.
Ha például a 2009-et nézzük, 1,020 azt jelenti, hogy 2%-al volt nagyobb a forgalom, mint a bázisévben, 0,944 pedig azt jelenti, hogy 0,056-al tehát 5,6%-al volt kisebb a forgalom, mint az előző évben.
A láncviszonyszámokat nézzük meg a jegyárakra is,
a bázisviszonyszámot meg egy időre felejtsük el.
év
forgalom
(millió fő)
lánc-
viszonyszám
(előző év=100%)
Jegyár
lánc-
viszonyszám
(előző év=100%)
2007
nincs
2008
2009
2010
2011
Az évek során bekövetkezett változást kétféleképpen is szemléltethetjük. Az egyik lehetőség az átlagos különbség, ami a jegyáraknál például azt jelenti, hogy hány forinttal drágultak a jegyek átlagosan egy év alatt. Ezt a változás mértékének szokás nevezni.
Az átlagos változás mértéke
Tehát összeadogatjuk a drágulásokat, aztán elosztjuk – mivel is? Az évek száma n, de nem n-el osztunk. Azért nem n-el, mert a drágulások számával kell osztanunk és az nem n, hanem n-1, az egyik évről a másikra történő ugrások száma. Most a vizsgált időszak 2007-től 2011-ig tart, ami öt év ugyan, de ugrásból csak négy van, ezért kell néggyel osztani:
tehát átlagosan évente 137,5 forinttal drágult a mozizás. Ha valaki jártas az általános iskola matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:
Nem csak azt kérdezhetjük meg, hogy hány forinttal drágult a mozi, hanem azt is, hogy hány százalékos volt az éves áremelés. Ezt a változás ütemének hívjuk.
A változás üteme
Itt is azért van a gyökkitevőben n-1, mert nem az évek száma kell nekünk, hanem a változások száma, egyik évről másikra. Ez pedig n-1. A mozijegyek árának évenkénti változása tehát:
A változás mértéke:
A változás üteme:
A jegyek átlagosan 137,5 forinttal, 12%-al drágultak.
Ugyanezt megnézhetjük a mozilátogatók számának esetében is.
A változás mértéke:
A változás üteme:
Most térjünk rá az átlagok kiszámolására. Az átlagos nézőszám esetében tartamidősorunk van, vagyis van értelme összeadni az idősor adatait. Itt az átlagot a szokásos módon számoljuk:
Más a helyzet az átlagos jegyár esetében, ami állapotidősor, így az adatok összege értelmetlen. Ilyenkor úgynevezett kronologikus átlagot számolunk, ami
Nézzünk egy másik példát, ahol összefoglaljuk az eddigieket.
A következő táblázat egy autókereskedés raktárkészletének és eladásainak időbeli eloszlását tartalmazza. Számoljuk ki az összes eddigi állatfajtát.
hónap
raktárkészlet
(a hónap elején)
eladott
mennyiség
jan.
210
150
feb.
350
120
mar.
310
100
apr.
300
120
maj.
290
A változások mértéke és üteme:
hónap
ÁLLAPOTIDŐSOR
raktárkészlet
(a hónap elején)
TARTAMIDŐSOR
eladott
mennyiség
jan.
feb.
mar.
apr.
maj.
hónap
ÁLLAPOTIDŐSOR
raktárkészlet
TARTAMIDŐSOR
eladott mennyiség
jan.
feb.
mar.
apr.
maj.
Változás
mértéke
Változás
üteme
átlag
2.4. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.
Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.
Előállított mennyiség
Raktározva
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
-
125
-
febr.
120
110
1100
marc.
3500
apr.
150
3750
87,5
Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor
Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak
107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.
Előállított mennyiség
Raktárkészlet
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
1
-
2500
1,25
-
1000
febr.
1,2
1,2
3000
1,375
1,1
1100
marc.
1,4
1,167
3500
1
0,7272
800
apr.
1,5
1,071
3750
0,875
0,875
700
Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?
Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor
Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.
A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:
2.5. Egy áruház raktárkészlete valamely termékből az alábbiak szerint alakult:
hónap
Készlet
Jan=100%
Előző
hónap=100%
Változás %-ban
február=100%
Változás
februárhoz képest (db)
Aktuális készlet a hónap végén (db)
Jan.
100
-
-20
-10
Febr.
Márc.
110
Ápr.
+16
Máj.
600
Jún.
80
Júl.
130
a) Töltsük ki a hiányzó részeket!
b) Mekkora volt az átlagos raktárkészlet ebből a termékből a második negyedévben?