Egy ismérv szerinti elemzés

1. Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1000 2000 7000 9000 11 500
3500 1000 5000 3000 12 000
5000 1500 3000 8000 9000
2500 3000 1500 8500 3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját. Ezek a módusz, a medián, a kvartilisek, és a számtani átlag.

Megnézem, hogyan kell megoldani


2.

Vásárlás értéke Osztály-közép \( f_i \) \( g_i \)
0 - 2499 1250 5 5/20
2500 - 4999 3750 6 6/20
5000 - 7499 6250 3 3/20
7500 - 9999 8750 4 4/20
10 000 - 12 499 11250 2 2/20

Állapítsuk meg az adatsor átlagát, móduszát, és mediánját.

Megnézem, hogyan kell megoldani


3. Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1000 2000 7000 9000 11 500
3500 1000 5000 3000 12 000
5000 1500 3000 8000 9000
2500 3000 1500 8500 3000

Számoljuk ki a vásárlások értékének szórását.

Megnézem, hogyan kell megoldani


4. Nézzünk meg egy másik példát is, ahol nem egyenletes osztóintervallumok vannak. Az alábbi táblázat egy város lakásainak méret szerinti megoszlását tartalmazza.

Lakásméret (négyzetméterben megadva) Lakások száma (1000 darabban)  
\( f_i \) \( f'_i \)
0-19 18 18
20-39 30 48
40-99 66 114
100-199 36 150
200- 10 160

Számítsuk ki a móduszt, mediánt, átlagot és szórást.

Megnézem, hogyan kell megoldani


5. A statisztika vizsga 5 feladatából a vizsgázók által teljesen megoldott feladatok eloszlását tartalmazza a következő táblázat. A vizsgázók teljes létszáma 250 fő.

Megoldott feladatok száma Vizsgázók száma  
\( f_i \) \( f'_i \)
0 60 60
1 70 130
2 80 210
3 vagy több 40 250

Számítsuk ki a móduszt, mediánt, átlagot és szórást.

Megnézem, hogyan kell megoldani


6. Egy újságárús havi lapeladásait tartalmazza a következő táblázat.

Napok száma Eladott mennyiség
2 215
4 217
2 218
5 220
8 222
7 225
3 230

a) Mekkora az átlagos havi lapeladás?

b) Határozzuk meg a mediánt.

c) Mekkora a relatív szórás?

Megnézem, hogyan kell megoldani


7. Az alábbi táblázat egy városban a lakások megoszlását tartalmazza. Ábrázoljuk a táblázat adatait oszlopdiagrammal, hisztogrammal, kördiagrammal.

Lakásméret

(négyzetméter)

Lakások száma (1000 darab)

\( f_i \)

A B C
0-49 21 12 3 4
50-99 33 10 15 8
100-149 60 17 23 20
150-250 46 21 18 7
Összesen 160 60 61 39

A = Belvárosi társasház

B = Zöldövezeti társasház

C = Lakótelepi lakás

Megnézem, hogyan kell megoldani


8. Nézzük meg, hogy milyen jellegű asszimetriát mutat a terroristák életkor szerinti megoszlása.

életkor terroristák száma (%)
0-19 7%
20-29 46%
30-39 32%
40-59 10%
60-79 5%

Megnézem, hogyan kell megoldani


9. Egy bank ügyfeleinek a sorra kerülésig várakozással eltöltött ideje percben megadva egy vizsgált időtartamban:

2, 8, 5, 1, 2, 5, 4, 4, 2, 7, 3, 7, 2, 3, 3, 5

Ábrázoljuk az értékeket leveles-ág és doboz-ábrán.

Megnézem, hogyan kell megoldani


10. Húsz napon át figyelték egy alpesi kisváros sípályáinak összesített napi forgalmát. A kapott értékek a következők voltak:

1000 2000 7000 9000 11 500
3500 1000 5000 3000 12 000
5000 1500 3000 8000 9000
2500 3000 1500 8500 3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját, a móduszt, mediánt, átlagot. Készítsünk leveles-ág ábrát, illetve doboz-ábrát. Helyezzük el az adatokat egy gyakorisági sorban 2500-as osztályközökkel. Szemléltessük hisztogrammal a forgalom mértékét.

Megnézem, hogyan kell megoldani


11. Készítsünk egy táblázatot a Föld népességének egy főre jutó GDP szerinti megoszlásáról. Az osztályközök a pontosság érdekében nem egyenletesek. Első oszlopunk a gyakoriság, ami azt jelenti, hogy hány millió ember tartozik az adott GDP-szintet jelentő osztályközbe.

GDP / fő \( f_i \) (milió)
0 - 1 000  
1 001 - 2 000  
2 001 - 5 000  
5 001 - 10 000  
10 001 - 20 000  
20 001 - 30 000  
30 001 - 40 000  
40 001 - 50 000  
50 001 - 60 000  
60 001 -   
Total  

Megnézem, hogyan kell megoldani


12. Az alábbi táblázat egy üzlet havi fogkrémeladásait és raktárkészletét tartalmazza

hónap

TARTAMIDŐSOR

eladás (db.)

ÁLLAPOTIDŐSOR

raktárkészlet (db., hónap 1-én)

Jan. 640 120
Febr. 720 150
Márc. 740 160
Ápr. 760 110
Máj. 730 100
Jún. 760 120

Számoljuk ki az első negyedév átlagos forgalmát és raktárkészletét.

Megnézem, hogyan kell megoldani


13. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban. Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.

  Előállítot mennyiség Raktározva (a hónap elején)
  jan. = 100% előző hónap = 100% db marc. = 100% előző hónap = 100% db
jan.   -   125 -  
febr.   120     110 1100
marc.     3500      
apr. 150   3750 87,5    

Megnézem, hogyan kell megoldani


14. Egy áruház raktárkészlete valamely termékből az alábbi.

hónap Készlet
Jan = 100% Előző hónap = 100%

Változás %-ban

február = 100%

Változás februárhoz képest (db) Aktuális készlet a hónap végén (db)
Jan. 100 - -20 -10  
Febr.          
Márc. 110        
Ápr.       +16  
Máj.         600
Jún.   80      
Júl.     130    

a) Töltsük ki a hiányzó részeket!

b) Mekkora volt az átlagos raktárkészlet ebből a termékből a második negyedévben?

Megnézem, hogyan kell megoldani


15. Az alábbi táblázat a lakosság életkor szerinti megoszlását tartalmazza Németországban és Törökországban. Hasonlítsuk össze a két megoszlást a középértékekkel, a dobozábrával illetve hisztogrammal.

  Németország Törökország
ÉLETKOR NÉPESSÉG (%) NÉPESSÉG (%)
0-14 13,5 26,9
15-34 25 45
35-64 41,5 21,9
65-75 15 5,2
75- 5 1

Megnézem, hogyan kell megoldani


16. Egy cég dolgozóinak fizetésük szerinti megoszlása a következő:

Fizetés (USD) Létszám
0-1000 110
1001-2000 215
2001-3000 60
3001- 15

Jellemezzük a fizetések megoszlását helyzetmutatókkal, szóródási mutatókkal, dobozábrával.

Megnézem, hogyan kell megoldani


17. Egy taxitársaságnál a telefonos rendeléstől a helyszínre érkezésig eltelt idő egy hét leforgása alatt az alábbi volt:

Helyszínre érkezésig eltelt idő (perc) Esetek száma
0-4 1654
5-9 2470
10-19 680
20- 46

Jellemezzük a várakozási időt helyzetmutatókkal, szóródási mutatókkal, alakmutatókkal.

Megnézem, hogyan kell megoldani

A témakör tartalma


MÓDUSZ, MEDIÁN, ÁTLAG, KVARTILISEK

EGY ISMÉRV SZERINTI ELEMZÉS

Módusz, medián, átlag

Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját. Ezek a módusz, a medián, a kvartilisek, és a számtani átlag.

Ezek után az adatokat elhelyezzük egy gyakorisági sorban 2500 forintonkénti osztályközökkel. Az így kapott gyakorisági sorban szintén kiszámoljuk a becsült móduszt, mediánt és átlagot.

[Szövegdoboz:] [Szövegdoboz: Átlag:] [Szövegdoboz: 1000 1000 1500 1500 2000 2500 3000 3000 3000 3000 3500 5000 5000 7000 8000 8500 9000 9000 11500 12000] [Szövegdoboz: Felső kvartilis] [Szövegdoboz: Medián: A sorbarendezett adatsor középső értéke. Most két középső is van, a tizedik és a tizenegyedik, ilyenkor az átlaguk:] [Szövegdoboz: Alsó kvartilis:] [Szövegdoboz: Módusz =A leggyakoribb érték, most 5000]

A kapott adatokat helyezzük el a gyakorisági sorban. Ez nem más, mint egy táblázat, amely a vásárlások értékét tartalmazza, mondjuk 2500 forintonkénti bontásban.

 itt a gyakoriságokat jelenti, vagyis azt, hogy hány darab vásárló tartozik az egyes kategóriákba.

Vásárlás értéke

= gyakoriság (hány darab)

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

5

6

3

4

2

N=összesen

20

És már itt is van az első buktató! Az osztályközök határai ugyanis kicsit megtévesztők.

A 0-2499 valójában azt jelenti, hogy 0-2500. Ez lehet, hogy elsőre kicsit furcsának tűnik, de a helyzet a következő. Ha 2500-forintonkénti bontást csinálunk, az osztályközök valójában így néznének ki, hogy

Vásárlás értéke

0 –   2500

2500 –   5000

5000 –   7500

7500 – 10 000

10 000 – 12 500

5

6

3

4

2

N=összesen

20

[Szövegdoboz: Mindig a bal végpontokat vesszük bele az osztályközbe Ilyenkor a táblázat Vásárlás értéke 0 – 2499 2500 – 4999 5000 – 7500 7500 – 10 000 10 000 – 12 500 5 6 3 4 2 N=összesen 20] Csakhogy, ha valaki mondjuk éppen 2500-ért vásárol, akkor marha nagy gondba lennénk, hogy ezt a 0-2500 osztályközbe, vagy a 2500-5000 osztályközbe rakjuk-e. Éppen ezért megállapodást kell kötnünk, hogy a végpontokat hova tegyük. Erre két lehetőség van.

[Szövegdoboz: Mindig a jobb végpontokat vesszük bele az osztályközbe Ilyenkor a táblázat Vásárlás értéke 0 – 2500 2501 – 5000 5001 – 7500 7501 – 10 000 10 001 – 12 500 5 6 3 4 2 N=összesen 20]

De bármelyiket válasszuk is, ne felejtsük el, hogy nincsenek hézagok a táblázatban, tehát az osztályközök hossza mindig 2500! Ez azért fontos, mert ha kellenek az osztályközök felezőpontjai, az osztályközepek, akkor azok bizony így néznek ki:

      és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

A kapott táblázatunkat kibővíthetjük egy újabb oszloppal, amely azt tartalmazza, hogy az adott kategóriáig hányan vásároltak. Ezt az oszlopot kumulált gyakoriságnak nevezzük.

Vásárlás értéke

= kumulált gyakoriság

(az adott osztályközig hány darab)

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

Megint újabb oszlopot vezetünk be, amely az egyes kategóriák teljes mennyiséghez viszonyított arányát jelentik. Ezt az oszlopot hívjuk relatív gyakoriságnak.

Vásárlás értéke

= relatív gyakoriság  

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

Még egy oszlopot iktatunk be, a kumulált relatív gyakoriságot.

Vásárlás érétke

= kumulált relatív gyakoriság

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Még egy oszlopot iktatunk be, az úgynevezett értékösszeget. Ez úgy kell érteni, hogy minden kategóriában összeadogatjuk a vásárlások értékét. Az értékösszeg jele S.

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az értékösszeg

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az így kapott táblázatban az eredeti adatok már elvesztek, csupán azt tudjuk, hogy az egyes osztályközökben hány darab adat található. De, hogy pontosan mik is ezek az adatok, azt nem. Az első osztályközbe például 5 elem tartozik, ennél többet azonban nem tudunk róluk. Ezeket az elemeket jól jellemezhetjük az osztályköz középső elemével, úgy vesszük, mintha mind az öt elem ugyanez a középső elem volna.

Ha most ki szeretnénk számolni a gyakorisági sor átlagát, akkor a szokásos módon számolunk, vagyis összeadogatjuk az elemeket és elosztjuk a darabszámmal. Csakhogy az elemek most az osztályközepek.

Ami egyszerűbben:

Vagyis a gyakorisági sor számtanit átlaga:

[Szövegdoboz: Számoljuk most ki a móduszt, vagyis a leggyakoribb értéket. A legtöbb elem (egészen pontosan 10 db.) a második osztályközbe tartozik, a módusznak tehát valahol ott kell lennie. jelöli ennek az osztályköznek az alsó határát. A móduszra egy becslést adunk, melynek a képlete: Itt , vagyis a móduszt tartalmazó osztályköz gyakorisága, mínusz az előtte lévő osztályköz gyakorisága. Ezt úgy fogjuk leírni, hogy]

[Szövegdoboz: Vásárlás érétke 0 – 2499 2500 – 4999 5000 – 7499 7500 – 9999 10 000 – 12 499 1250 3750 6250 8750 11250 5 6 3 4 2 5 11 14 18 20 5/20 6/20 3/20 4/20 2/20 mo=2500]

tehát , végül pedig  a móduszt tartalmazó osztályköz hossza, így . A módusz tehát:

[Szövegdoboz: Vásárlás érétke 0 – 2499 2500 – 4999 5000 – 7499 7500 – 9999 10 000 – 12 499 1250 3750 6250 8750 11250 5 6 3 4 2 5 11 14 18 20 5/20 6/20 3/20 4/20 2/20]

A medián kiszámolása szintén becsléssel történik. Most a medián a 10. és a 11. elem közt van, vagyis a második osztályközben.

[Szövegdoboz: A képlet:]

Itt = a mediánt tartalmazó osztályköz alsó határa, vagyis , , , ,  

tehát

Szórás, relatív szórás

A szórás az átlagtól való eltérést méri. Az átlag ugyanis, csak úgy önmagában

meglehetősen kevés dolgot árul el. 

Ha például egy utazási iroda felméri, hogy átlagosan milyen utakat választanak az ügyfeleik és kiderül, hogy az ügyfelek egyik fele 400 eurós ár körül választ utat, a másik felük meg 2000 eurós áron, akkor kiszámolva az átlagot, azt kapjuk, hogy az ügyfeleik átlagosan 1200 euró értékben utaznak. Ha ezek után az utazási iroda innentől 1200 eurós utakat hirdet, mondván, hogy ez az átlagos, csődbe megy. Fontos tehát az átlag, de éppoly fontos látni az átlagtól való eltérések nagyságát is. 

Ezt az átlagtól való ingadozást méri a szórás. Jele  (szigma). Kiszámolásához venni kell az egyes értékeknek az átlagtól való eltérését.

Előző példánkhoz visszatérve számoljuk ki a vásárlások értékének szórását.

értékek

átlagtól való eltérés

  1000

  1000

  1500

  1500

  2000

  2500

  3000

  3000

  3000

  3000

  3500

  5000

  5000

  7000

  8000

  8500

  9000

  9000

11 500

12 000

1000-5000

1000-5000

1500-5000

1500-5000

2000-5000

2500-5000

3000-5000

3000-5000

3000-5000

3000-5000

3500-5000

5000-5000

5000-5000

7000-5000

8000-5000

8500-5000

9000-5000

9000-5000

    11 500-5000

    12 000-5000

Ha ezeket az eltéréseket összeadnánk, éppen nulla jönne ki, az átlag ugyanis pont félúton helyezkedik el az adatok között.

Minket azonban most nem érdekel az eltérés iránya, tehát, az hogy az átlagnál több vagy az átlagnál kevesebb, csak maga az eltérés érdekel. Ennek érdekében megszabadulunk az előjelektől úgy, hogy az eltéréseket négyzetre emeljük.

    vagyis    

Lássuk csak mennyi most a szórás:

A szórás átlaghoz viszonyított értékét relatív szórásnak nevezzük.

Most a relatív szórás

ami 69% tehát elég magas.

Az adatsor legkisebb és legnagyobb értéke közti eltérést szóródásnak nevezzük. Most a szóródás, lássuk csak

12 500 – 1000=11 500

Ha nem az összes elem szórását számoljuk, hanem csak például egy mintáét, akkor a minta szórás képlete:

Például ha az első öt vásárlás esetén akarjuk a minta szórását kiszámolni:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Itt

Tehát

A szórást nem csak a konkrét értékekből számolhatjuk, hanem a gyakoriságokat tartalmazó táblázatból is. Ezt becsült szórásnak hívjuk. Esetünkben a gyakorisági sor

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

A becsült szórás képlete gyakorisági sor esetén

Emlékezzünk vissza az átlagra:

Ekkor a szórás

Tehát  

Néhány tanulságos gyakorisági sor

Nézzünk meg egy másik példát is, ahol nem egyenletes osztóintervallumok vannak.

Az alábbi táblázat egy város lakásainak méret szerinti megoszlását tartalmazza.

Lakásméret

(négyzetméterben megadva)

Lakások száma

(1000 darabban)

0-19

18

18

20-39

30

48

40-99

66

114

100-199

36

150

200-

10

160

 Számítsuk ki itt is a móduszt, mediánt, átlagot és szórást.

Az első észrevétel, hogy az utolsó osztályköz nyitott. Ezt úgy zárjuk le, hogy ugyanolyan hosszúnak vesszük, mint az előtte lévőt.

Lakásméret

(négyzetméterben megadva)

                      hossz

Lakások száma

(1000 darabban)

0-19

20

18

18

20-39

20

30

48

40-99

60

66

114

100-199

100

36

150

200-299

100

10

160

A második észrevétel, hogy az osztályközök nem egyforma hosszúak.

A módusz, vagyis a leggyakoribb érték most 66 darab és a 40-99 osztályközbe esik.

De csak azért, mert ez az osztályköz jóval hosszabb, háromszor olyan hosszú, mint az előtte lévő. Ha elharmadoljuk, akkor máris nem ide esik a módusz.

Vagyis a módusz kiszámolásához a csalások elkerülése érdekében újra kell osztani az osztályközöket, az újraosztás pedig egy olyan hosszal történik, aminek egész számú többszöröse mindegyik eredeti osztályköz hossza.

Most úgy tűnik az újraosztásnál 20 hosszúságú osztályközök lesznek, vagyis a 40-99 osztályközt elharmadolva három darab 20 hosszú osztályközre bontjuk a 100-199 osztályközt és az utána következőt is öt részre vágva azokból is 20 hosszú osztályközöket csinálunk.

Jól látszik, hogy a modális osztályköz a 20-39 osztályköz lesz, vagyis csak a körülötte lévő osztályközökkel fogjuk az újraosztást ténylegesen elvégezni.

Lakásméret

(négyzetméterben megadva)

                      hossz

Lakások száma

(1000 darabban)

0-19

20

18

18

20-39

20

30

48

40-59

20

22

74

60-79

20

22

94

80-99

20

22

114

100-199

100

36

150

200-299

100

10

160

Itt       

Lakásméret

(négyzetméterben megadva)

                      hossz

Lakások száma

(1000 darabban)

0-19

20

18

18

20-39

20

30

48

40-99

60

66

114

100-199

100

36

150

200-299

100

10

160

A medián kiszámolásánál nem lesz gond az eltérő hosszúságokkal.

A képlet:

Mivel , aminek a fele 80, a medián is az 50-99 terjedő osztályközben van. Ekkor, , és  tehát

Adjuk meg az átlagot és a szórást!

Ezek kiszámolásában tökmindegy, hogy egyenletesek-e az osztályközök vagy sem. Kiszámoljuk az osztályközepeket:

Lakásméret

(négyzetméterben megadva)

                            osztályközép

Lakások száma

(1000 darabban)

0-19

10

18

18

20-39

30

30

48

40-99

70

66

114

100-199

150

36

150

200-299

250

10

160

Az átlag:

A szórás pedig:

A relatív szórás

    ami 74% tehát elég sok.

A szóródás pedig a legnagyobb és a legkisebb érték különbsége, vagyis 250-10=240

2.1. Nézzünk meg még egy gyakorisági sort is!

A statisztika vizsga 5 feladatából a vizsgázók által teljesen megoldott feladatok eloszlása:

Megoldott

feladatok száma

Vizsgázók

száma

0

60

60

1

70

130

2

80

210

3 vagy több

40

250

Itt is számítsuk ki itt is a móduszt, mediánt, átlagot és szórást.

Valójában az osztályközök itt is felfoghatók intervallumoknak, az első 0-0,9 feladatig tart a második 1-1,9 feladatig és így tovább. Az utolsó osztályköz nyitott, ezt gondolatban olyan hosszúnak vesszük, mint az előtte lévőt – bár bizonyára sok vizsgázó meg tudott oldani öt feladatot is.

A módusz, vagyis a leggyakoribb érték most 2 darab.

Itt       

A medián kiszámolásánál a képlet:

Mivel , aminek a fele 125, a medián az 1db feladat osztályközében lesz.

Ekkor, , és  tehát

Adjuk meg az átlagot és a szórást!

Az átlag:

A szórás pedig:

2.2. Egy újságárus havi lapeladásait tartalmazza a következő táblázat.

Napok

száma

Eladott

mennyiség

2

215

4

217

2

218

5

220

8

222

7

225

3

230

a)Mekkora az átlagos havi lapeladás?

b)Határozzuk meg a mediánt.

c)Mekkora a relatív szórás?

Elsőként azonosítsuk be az osztályközöket, vagyis, hogy minek az átlagát mediánját, stb. fogjuk számolni. Első ránézésre az első oszlop tűnik nyerőnek, de hamar lebuktatja, hogy a számok nem sorban vannak.

Az osztályközök ugyanis mindig növekvő sorrendben kell, hogy legyenek. A feladatban tehát cselesen meg van cserélve a két oszlop.

Erre úgy is rájöhetünk, ha elolvassuk, minek az átlagát kell kiszámolnunk. Na azok lesznek ugyanis az osztályközök. Most a havi eladás átlaga kell, tehát semmi kétség, az osztályközök az eladott mennyiség.

Eladott

Mennyiség

Napok

Száma

215

2

2

217

4

6

218

2

8

220

5

13

222

8

21

225

7

28

230

3

31

Össz.

31

Az átlag a szokásos módon

Az átlagosan eladott lapok száma tehát 221,77

Nézzük a mediánt!

Végül számoljuk ki a szórást.

A relatív szórás  tehát 1%.

Módusz, medián, átlag

Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját. Ezek a módusz, a medián, a kvartilisek, és a számtani átlag.

Ezek után az adatokat elhelyezzük egy gyakorisági sorban 2500 forintonkénti osztályközökkel. Az így kapott gyakorisági sorban szintén kiszámoljuk a becsült móduszt, mediánt és átlagot.

[Szövegdoboz:] [Szövegdoboz: Átlag:] [Szövegdoboz: 1000 1000 1500 1500 2000 2500 3000 3000 3000 3000 3500 5000 5000 7000 8000 8500 9000 9000 11500 12000] [Szövegdoboz: Felső kvartilis] [Szövegdoboz: Medián: A sorbarendezett adatsor középső értéke. Most két középső is van, a tizedik és a tizenegyedik, ilyenkor az átlaguk:] [Szövegdoboz: Alsó kvartilis:] [Szövegdoboz: Módusz =A leggyakoribb érték, most 5000]

A kapott adatokat helyezzük el a gyakorisági sorban. Ez nem más, mint egy táblázat, amely a vásárlások értékét tartalmazza, mondjuk 2500 forintonkénti bontásban.

 itt a gyakoriságokat jelenti, vagyis azt, hogy hány darab vásárló tartozik az egyes kategóriákba.

Vásárlás értéke

= gyakoriság (hány darab)

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

5

6

3

4

2

N=összesen

20

És már itt is van az első buktató! Az osztályközök határai ugyanis kicsit megtévesztők.

A 0-2499 valójában azt jelenti, hogy 0-2500. Ez lehet, hogy elsőre kicsit furcsának tűnik, de a helyzet a következő. Ha 2500-forintonkénti bontást csinálunk, az osztályközök valójában így néznének ki, hogy

Vásárlás értéke

0 –   2500

2500 –   5000

5000 –   7500

7500 – 10 000

10 000 – 12 500

5

6

3

4

2

N=összesen

20

[Szövegdoboz: Mindig a bal végpontokat vesszük bele az osztályközbe Ilyenkor a táblázat Vásárlás értéke 0 – 2499 2500 – 4999 5000 – 7500 7500 – 10 000 10 000 – 12 500 5 6 3 4 2 N=összesen 20] Csakhogy, ha valaki mondjuk éppen 2500-ért vásárol, akkor marha nagy gondba lennénk, hogy ezt a 0-2500 osztályközbe, vagy a 2500-5000 osztályközbe rakjuk-e. Éppen ezért megállapodást kell kötnünk, hogy a végpontokat hova tegyük. Erre két lehetőség van.

[Szövegdoboz: Mindig a jobb végpontokat vesszük bele az osztályközbe Ilyenkor a táblázat Vásárlás értéke 0 – 2500 2501 – 5000 5001 – 7500 7501 – 10 000 10 001 – 12 500 5 6 3 4 2 N=összesen 20]

De bármelyiket válasszuk is, ne felejtsük el, hogy nincsenek hézagok a táblázatban, tehát az osztályközök hossza mindig 2500! Ez azért fontos, mert ha kellenek az osztályközök felezőpontjai, az osztályközepek, akkor azok bizony így néznek ki:

      és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

A kapott táblázatunkat kibővíthetjük egy újabb oszloppal, amely azt tartalmazza, hogy az adott kategóriáig hányan vásároltak. Ezt az oszlopot kumulált gyakoriságnak nevezzük.

Vásárlás értéke

= kumulált gyakoriság

(az adott osztályközig hány darab)

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

Megint újabb oszlopot vezetünk be, amely az egyes kategóriák teljes mennyiséghez viszonyított arányát jelentik. Ezt az oszlopot hívjuk relatív gyakoriságnak.

Vásárlás értéke

= relatív gyakoriság  

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

Még egy oszlopot iktatunk be, a kumulált relatív gyakoriságot.

Vásárlás érétke

= kumulált relatív gyakoriság

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Még egy oszlopot iktatunk be, az úgynevezett értékösszeget. Ez úgy kell érteni, hogy minden kategóriában összeadogatjuk a vásárlások értékét. Az értékösszeg jele S.

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az értékösszeg

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az így kapott táblázatban az eredeti adatok már elvesztek, csupán azt tudjuk, hogy az egyes osztályközökben hány darab adat található. De, hogy pontosan mik is ezek az adatok, azt nem. Az első osztályközbe például 5 elem tartozik, ennél többet azonban nem tudunk róluk. Ezeket az elemeket jól jellemezhetjük az osztályköz középső elemével, úgy vesszük, mintha mind az öt elem ugyanez a középső elem volna.

Ha most ki szeretnénk számolni a gyakorisági sor átlagát, akkor a szokásos módon számolunk, vagyis összeadogatjuk az elemeket és elosztjuk a darabszámmal. Csakhogy az elemek most az osztályközepek.

Ami egyszerűbben:

Vagyis a gyakorisági sor számtanit átlaga:

[Szövegdoboz: Számoljuk most ki a móduszt, vagyis a leggyakoribb értéket. A legtöbb elem (egészen pontosan 10 db.) a második osztályközbe tartozik, a módusznak tehát valahol ott kell lennie. jelöli ennek az osztályköznek az alsó határát. A móduszra egy becslést adunk, melynek a képlete: Itt , vagyis a móduszt tartalmazó osztályköz gyakorisága, mínusz az előtte lévő osztályköz gyakorisága. Ezt úgy fogjuk leírni, hogy]

[Szövegdoboz: Vásárlás érétke 0 – 2499 2500 – 4999 5000 – 7499 7500 – 9999 10 000 – 12 499 1250 3750 6250 8750 11250 5 6 3 4 2 5 11 14 18 20 5/20 6/20 3/20 4/20 2/20 mo=2500]

tehát , végül pedig  a móduszt tartalmazó osztályköz hossza, így . A módusz tehát:

[Szövegdoboz: Vásárlás érétke 0 – 2499 2500 – 4999 5000 – 7499 7500 – 9999 10 000 – 12 499 1250 3750 6250 8750 11250 5 6 3 4 2 5 11 14 18 20 5/20 6/20 3/20 4/20 2/20]

A medián kiszámolása szintén becsléssel történik. Most a medián a 10. és a 11. elem közt van, vagyis a második osztályközben.

[Szövegdoboz: A képlet:]

Itt = a mediánt tartalmazó osztályköz alsó határa, vagyis , , , ,  

tehát

Szórás, relatív szórás

A szórás az átlagtól való eltérést méri. Az átlag ugyanis, csak úgy önmagában

meglehetősen kevés dolgot árul el. 

Ha például egy utazási iroda felméri, hogy átlagosan milyen utakat választanak az ügyfeleik és kiderül, hogy az ügyfelek egyik fele 400 eurós ár körül választ utat, a másik felük meg 2000 eurós áron, akkor kiszámolva az átlagot, azt kapjuk, hogy az ügyfeleik átlagosan 1200 euró értékben utaznak. Ha ezek után az utazási iroda innentől 1200 eurós utakat hirdet, mondván, hogy ez az átlagos, csődbe megy. Fontos tehát az átlag, de éppoly fontos látni az átlagtól való eltérések nagyságát is. 

Ezt az átlagtól való ingadozást méri a szórás. Jele  (szigma). Kiszámolásához venni kell az egyes értékeknek az átlagtól való eltérését.

Előző példánkhoz visszatérve számoljuk ki a vásárlások értékének szórását.

értékek

átlagtól való eltérés

  1000

  1000

  1500

  1500

  2000

  2500

  3000

  3000

  3000

  3000

  3500

  5000

  5000

  7000

  8000

  8500

  9000

  9000

11 500

12 000

1000-5000

1000-5000

1500-5000

1500-5000

2000-5000

2500-5000

3000-5000

3000-5000

3000-5000

3000-5000

3500-5000

5000-5000

5000-5000

7000-5000

8000-5000

8500-5000

9000-5000

9000-5000

    11 500-5000

    12 000-5000

Ha ezeket az eltéréseket összeadnánk, éppen nulla jönne ki, az átlag ugyanis pont félúton helyezkedik el az adatok között.

Minket azonban most nem érdekel az eltérés iránya, tehát, az hogy az átlagnál több vagy az átlagnál kevesebb, csak maga az eltérés érdekel. Ennek érdekében megszabadulunk az előjelektől úgy, hogy az eltéréseket négyzetre emeljük.

    vagyis    

Lássuk csak mennyi most a szórás:

A szórás átlaghoz viszonyított értékét relatív szórásnak nevezzük.

Most a relatív szórás

ami 69% tehát elég magas.

Az adatsor legkisebb és legnagyobb értéke közti eltérést szóródásnak nevezzük. Most a szóródás, lássuk csak

12 500 – 1000=11 500

Ha nem az összes elem szórását számoljuk, hanem csak például egy mintáét, akkor a minta szórás képlete:

Például ha az első öt vásárlás esetén akarjuk a minta szórását kiszámolni:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Itt

Tehát

A szórást nem csak a konkrét értékekből számolhatjuk, hanem a gyakoriságokat tartalmazó táblázatból is. Ezt becsült szórásnak hívjuk. Esetünkben a gyakorisági sor

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

A becsült szórás képlete gyakorisági sor esetén

Emlékezzünk vissza az átlagra:

Ekkor a szórás

Tehát 

1.1. Egy iskolai büfé napi vevőszámának alakulása az elmúlt 20 napban az alábbi volt. Határozzuk meg a móduszt és a kvartiliseket.

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

1.2. Az alábbi táblázat egy város havi gázfogyasztóinak eloszlását tartalmazza, a fogyasztók számát ezer főben megadva.

Havi fogyasztás

 (köbméterben megadva)

f

f’

g

g’

0-49

3

50-99

4

100-149

15

150-199

0

200-249

0,25

töltsük ki a hiányzó részeket.
Adjuk meg a móduszt és a mediánt!
Adjuk meg az átlagot és a szórást!
Vegyük a legalább száz köbmétert fogyasztó felhasználókat. Mekkora esetükben az átlag? Mekkora a szórás?

Íme a hiányzó részek.

Havi fogyasztás

 (köbméterben megadva)

f

f’

g

g’

0-49

3

3

0,15

0,15

50-99

4

7

0,2

0,35

100-149

8

15

0,4

0,75

150-199

0

15

0

0,75

200-249

5

20

0,25

1

Adjuk meg a móduszt és a mediánt!

A módusz a leggyakoribb érték. Most a legtöbb fogyasztó a

100-149 kategóriába esik, egészen pontosan 8, vagyis 8 ezer fő. A móduszra használt képlet alapján

Havi fogyasztás

(köbméterben)

f

f’

g

g’

0-49

3

3

0,15

0,15

50-99

4

7

0,2

0,35

100-149

8

15

0,4

0,75

150-199

0

15

0

0,75

200-249

5

20

0,25

1

A medián a felező érték, vagyis, ha sorba állítanánk a lakosokat gázfogyasztásuk szerint, akkor a 20 ezer lakosból középen álló lakos gázfogyasztása a medián. A középső lakos most szintén a 100-149 kategóriába esik. A medián képlete alapján:

Havi fogyasztás

(köbméterben)

f

f’

g

g’

0-49

3

3

0,15

0,15

50-99

4

7

0,2

0,35

100-149

8

15

0,4

0,75

150-199

0

15

0

0,75

200-249

5

20

0,25

1

Adjuk meg az átlagot és a szórást

Az átlag kiszámolása azt jelenti, hogy átlagosan hány köbméter gázt fogyasztanak havonta. A 0-49 terjedő fogyasztást szimbolizáljuk az osztályközéppel, vaygis 25 köbméterrel. Ekkor ilyen fogyasztásból van 3 ezer. Az 50-99 terjedő fogyasztást szintén az osztályközéppel reprezentáljuk, ami 75, ilyenből van 4 ezer. És így tovább.

Havi fogyasztás

 (köbméterben megadva)

f

f’

g

g’

0-49                  M1=25

3

3

0,15

0,15

50-99                M2=75

4

7

0,2

0,35

100-149            M3=125

8

15

0,4

0,75

150-199            M4=175

0

15

0

0,75

200-249            M5=225

5

20

0,25

1

Az átlag

A szórás pedig

Végül vegyük a legalább száz köbmétert fogyasztó felhasználókat. Mekkora esetükben az átlag? Mekkora a szórás?

Ekkor egy mintának kell kiszámolnunk az átlagát és a szórását.

Havi fogyasztás

 (köbméterben megadva)

f

f’

g

g’

0-49                  M1=25

3

3

0,15

0,15

50-99                M2=75

4

7

0,2

0,35

100-149            M3=125

8

15

0,4

0,75

150-199            M4=175

0

15

0

0,75

200-249            M5=225

5

20

0,25

1

Az átlag

A szórás pedig

1.3. Az alábbi táblázat egy bevásárlóközpont üzlethelyiségeinek alapterület szerinti megoszlását tartalmazza.

alapterület

0-99

4

100-199

9

200-299

12

300-399

34

400-

50

Töltsük ki a hiányzó adatokat!
Mekkora a tipikus üzlethelyiség alapterülete?
Mekkora az átlagos üzlethelyiség alapterülete? Mekkora a szórás?

1.4. Egy évfolyam négy különböző szakán az alábbiak ismertek:

Szak

Nők

100 férfira jutó

nők száma szakonként

A

30%

120

B

20%

130

C

18%

110

D

32%

140

Össz.

100%

-

Mennyi az egész évfolyamon a 100 férfire jutó nők átlagos száma? Mennyi a 100 nőre jutó férfiak száma?

Világos, hogy ha 100 férfira 120 nő jut, akkor 1 férfira 1,2. Ez egy viszonyszám, méghozzá

   A=nő B=férfi

Súlyozott átlagot kell számolnunk és súlyoknak a nőket tudjuk csak használni, mert más adatunk nincs. Mivel nő=A ezért az átlagolásnál az A-k a súlyok, vagyis harmonikus átlagra van szükségünk. Akinek ez nem teljesen világos, legjobb lesz, ha megnézi, hogy mit kéne tudnia a VISZONYSZÁMOKról. Lássuk az átlagot.

Átlagosan egy férfira 1,256 nő jut, vagyis 100 férfira átlag 125,6 nő. A 100 nőre jutó férfiak száma ennek reciproka.

 ami azt jelenti, hogy egy nőre 0,796 férfi jut, így 100 nőre 79,6 db.

1.5. Egy város lakosainak száma 2009-ben 760 ezer, míg 2011-ben 758 ezer. Az alábbiakat tudjuk:

év

Orvosok száma

2009=100%

Háziorvosok

száma (%)

Egy háziorvosra jutó

lakosok száma (%)

Háziorvosok

részaránya

(%)

2010=100%

2009

100

105

7

2010

100

100

6,8

2011

120

83

6

Töltsük ki a hiányzó részeket!

Legyen A=háziorvos és B=lakos. Ekkor  és . Az egy háziorvosra jutó lakosok száma

Tudjuk, hogy mennyi ? Sajna nem, csak annyit tudunk, hogy ez a 2010-es érték 83%-a. Vagyis:

  és   valamint  és .

Most rettenetes dolgok jönnek. Beírjuk a B-k helyére, amit tudunk,

Aztán vesszük a két egyenlet hányadosát.

Jobb oldalon A-k és B-k kiesnek, bal oldalon meg egy hipnózis segítségével elevenítsük föl az általános iskolás időket, amikor törtet törttel osztottunk.

  vagyis ami azt jelenti, hogy a 2009-es adat a 2011-es adatnak 79,2%-a. Mivel pedig a 2011-es adat a 2010-es adatnak 120%-a, ezért

 és és itt most az egyenleteket szorozni kell, hogy kiessen  és maradjanak a nekünk hasznos szereplők.

vagyis  

Megtudtuk tehát, hogy 2009-ben a 2010-es háziorvos-állomány 95%-a volt.

Innentől már csak pihentetőleg számoljuk ki a többi hiányzó adatot. A háziorvosok részaránya 2009-ben 7% az egyszerűség kedvéért mondjuk azt, hogy összesen 100 orvos van és 7db házi. 2010-re a 7db háziorvosból lesz

vagyis lesz 7,368db háziorvos, ami az összes orvosnak 6,8%-a így összes orvos van

Ami a 2009-es 100db orvosnak éppen a 108,36%-a.

Ugyanezt megcsináljuk 2011-re is. Ott a 2010-es háziorvos létszám 120%-a van, vagyis

Ez az összes orvos 6,9%-a, így összes orvos van, lássuk csak

év

Orvosok száma

2009=100%

Háziorvosok

száma (%)

Egy háziorvosra jutó

lakosok száma (%)

Háziorvosok

részaránya

2010=100%

2009

100

0,95

105

7

2010

108,36

100

100

6,8

2011

128,10

120

83

6,9

1.6. Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1100

2000

7300

9200

11500

3500

5000

1000

3000

12000

5000

1600

3000

8000

9000

2500

3000

1500

8500

3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját. Ezek a módusz, a medián, a kvartilisek, majd helyezzük el az adatokat egy gyakorisági sorban 2500 forintonkénti osztályközökkel. Készítsük el a statisztikai sorok típusait.

[Szövegdoboz:] [Szövegdoboz: Átlag:] [Szövegdoboz: 1000 1100 1500 1600 2000 2500 3000 3000 3000 3000 3500 5000 5000 7300 8000 8500 9000 9200 11500 12000] [Szövegdoboz: Felső kvartilis] [Szövegdoboz: Medián: A sorbarendezett adatsor középső értéke. Most két középső is van, a tizedik és a tizenegyedik, ilyenkor az átlaguk:] [Szövegdoboz: Alsó kvartilis:] [Szövegdoboz: Módusz =A leggyakoribb érték, most 5000]

A kapott adatokat helyezzük el a gyakorisági sorban. Ez nem más, mint egy táblázat, amely a vásárlások értékét tartalmazza most éppen 2500 forintonkénti bontásban.  itt a gyakoriságokat jelenti, vagyis azt, hogy az egyes kategóriákba hány darab vásárló tartozik.

Vásárlás értéke

= gyakoriság (hány darab)

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

5

6

3

4

2

N=összesen

20

Itt az első buktató! Az osztályközök határai ugyanis kicsit megtévesztők.

A 0-2499 valójában ugyanis azt jelenti, hogy 0-2500. Ez lehet, hogy elsőre kicsit furcsának tűnik, de a helyzet a következő. Ha 2500-forintonkénti bontást csinálunk, az osztályközök valójában így néznének ki, hogy

Vásárlás értéke

0 –   2500

2500 –   5000

5000 –   7500

7500 – 10 000

10 000 – 12 500

5

6

3

4

2

N=összesen

20

Csakhogy, ha valaki mondjuk éppen 2500-ért vásárol, akkor marha nagy gondba leszünk, hogy ezt a 0-2500 osztályközbe, vagy a 2500-5000 osztályközbe rakjuk-e. Éppen ezért megállapodást kell kötnünk, hogy a végpontokat hova tegyük. Erre két lehetőség van.

[Szövegdoboz: Mindig a jobb végpontokat vesszük bele az osztályközbe Ilyenkor a táblázat Vásárlás értéke 0 – 2499 2500 – 4999 5000 – 7500 7500 – 10 000 10 000 – 12 500 5 6 3 4 2 N=összesen 20] [Szövegdoboz: Mindig a bal végpontokat vesszük bele az osztályközbe Ilyenkor a táblázat Vásárlás értéke 0 – 2500 2501 – 5000 5001 – 7500 7501 – 10 000 10 001 – 12 500 5 6 3 4 2 N=összesen 20]

De bármelyiket válasszuk is, ne felejtsük el, hogy az osztályközök mindkét esetben 0-2500 aztán 2500-5000 és így tovább és az osztályközök hossza mindig 2500! Ez azért fontos, mert ha kellenek az osztályközök felezőpontjai, az osztályközepek, akkor azok bizony

      és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

      és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

A kapott táblázatunkat kibővíthetjük egy újabb oszloppal, amely azt tartalmazza, hogy az adott kategóriáig hányan vásároltak. Ezt az oszlopot kumulált gyakoriságnak nevezzük.

Vásárlás értéke

= kumulált gyakoriság

(az adott osztályközig hány darab)

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

Megint újabb oszlopot vezetünk be, amely az egyes kategóriák teljes mennyiséghez viszonyított arányát jelentik. Ezt az oszlopot hívjuk relatív gyakoriságnak.

Vásárlás értéke

= relatív gyakoriság  

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

Még egy oszlopot iktatunk be, a kumulált relatív gyakoriságot.

Vásárlás érétke

= kumulált relatív gyakoriság

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Még egy oszlopot iktatunk be, az úgynevezett értékösszeget. Ez úgy kell érteni, hogy minden kategóriában összeadogatjuk a vásárlások értékét. Az értékösszeg jele S.

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az értékösszeg

Vásárlás érétke

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az így kapott táblázatban az eredeti adatok már elvesztek, csupán azt tudjuk, hogy az egyes osztályközökben hány darab adat található. De, hogy pontosan mik is ezek az adatok, azt nem. Az első osztályközbe például 5 elem tartozik, ennél többet azonban nem tudunk róluk. Ezeket az elemeket jól jellemezhetjük az osztályköz középső elemével, úgy vesszük, mintha mind az öt elem ugyanez a középső elem volna.

Ha most ki szeretnénk számolni a gyakorisági sor átlagát, akkor a szokásos módon számolunk, vagyis összeadogatjuk az elemeket és elosztjuk a darabszámmal. Csakhogy az elemek most az osztályközepek.

1.7. Az elmúlt 20 évben a villamos által elgázolt járókelők száma évente a következőképpen alakult: 10, 11, 8, 7, 12, 9, 8, 6, 12, 8, 5, 3, 4, 2, 4, 1, 0, 5, 1, 1

Adjuk meg a kvartilis-eloszlást, a kvintilis-eloszlást és a decilis-eloszlást

A kvartilis-eloszlás négy egyenlő csoportra osztja a növekvő sorrendbe rendezett adatokat.

0, 1, 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 8, 8, 8, 9, 10, 11, 12, 12

Vásárlás érétke

0-2

5

5

0,25

0,25

3-5

5

10

0,25

0,5

6-8

5

15

0,25

0,75

9-12

5

20

0,25

1

 A kvintilis eloszlás ötödökre oszt.

0, 1, 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 8, 8, 8, 9, 10, 11, 12, 12

Vásárlás érétke

0-1

4

4

0,2

0,2

2-4

4

8

0,2

0,4

5-7

4

12

0,2

0,6

8-9

4

16

0,2

0,8

10-12

4

20

0,2

1

A decilis eloszlás tizedekre osztja az elemeket, de ez most nem lesz jó

0, 1, 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 8, 8, 8, 9, 10, 11, 12, 12

Ekkor ugyanis az 1-esek két különböző osztályközbe kerülnének, ami lehetetlen. Vagyis decilis eloszlás nem létezik.

Jegyezzük meg, hogy ha létezik decilis eloszlás, akkor létezik kvintilis eloszlás is, hiszen a decilis eloszlás osztályait kell összeolvasztani. Ha viszont létezik kvintilis eloszlás, abból még nem következik, hogy létezik decilis eloszlás is, mert az iménti problémák adódhatnak.


BECSÜLT ÁTLAG, MÓDUSZ, MEDIÁN

SZÓRÁS, RELATÍV SZÓRÁS, SZÓRÓDÁS

MI VAN, HA NEM EGYENLETESEK AZ OSZTÁLY-KÖZÖK?

FELADAT 2. 1.

FELADAT 2. 2.

HISZTOGRAM, OSZLOP-DIAGRAM

Hisztogram, oszlopdiagram, leveles-ág és doboz ábra

Ez a rész arról fog szólni, hogy a korábban megismert sokféle statisztikai mutató még jó is valamire. Arra fogjuk használni őket, hogy kimutassuk velük az adatsorok speciális tulajdonságait, megállapítsuk főbb jellemzőit. Vagyis a sok-sok számot becseréljük néhány szemléletes ábrára és egykét jól eltalált mutatószámra.

Az ábrák közül a leginkább leegyszerűsített a doboz-ábra, ez majd a kiugró értékek szemléltetésére lesz forgalomban. Az értékek megoszlásáról a diagramok adnak grafikus információkat. Ilyenek a gyakorisági-poligonok, az oszlopdiagramok, kördiagramok, vagy a hisztogramok.

Íme egy hisztogram

És egy oszlopdiagram

A két ábra között nem csupán esztétikai különbség van.

Ahhoz, hogy ez világos legyen, nézzünk rá példát. Hogy valami kellemes legyen, vegyünk mondjuk egy statisztika vizsgát.

Az első diagram, a hisztogram a vizsgán elért összpontszámot mutatja 25 pontonként. Itt az oszlopoknak össze kell érniük, az első oszlop egészen 24,9 pontig fogadja be a vizsgázókat, a második pedig már 25 ponttól.

[Szövegdoboz: db 25 50 75 100]

Ha viszont nem a pontszámokat, hanem a vizsgajegyeket ábrázoljuk, akkor más a helyzet. Nincs ugyanis 3,9-es vagy 4,3-as jegy. Pontosan öt kategória van és ezek élesen határolódnak el egymástól.

[Szövegdoboz: db 1 2 3 4 5]

Mielőtt tehát túlzottan elmélyednénk a diagramokban, nem árt tisztázni, milyen különbségek lehetnek maguk közt az adatok közt. Íme a menü:

[Szövegdoboz: MINŐSÉGI Nominális (névleges) A sokaság elemeit valamilyen tulajdonságok szerinti csoportokba soroljuk, de a csoportok közt nincs semmiféle rangsor példák: az áldozatok halálának oka a terroristák nemzetisége Ordinális (sorrendi) A csoportok között már felállítható sorrendiség példák: a hotelek besorolása (** *** **** *****) a vizsgázók jegyei (1, 2, 3, 4, 5 ) MENNYISÉGI Intervallum A sokaság elemeit itt már valamilyen mértékegység szerint osztályozzuk, de csak a „mennyivel több?” kérdésre tudunk válaszolni, a „hányszoros?”-ra nem példák: hőmérséklet (tegnap -5 fok volt, ma 0 fok, hányszor melegebb van?) Arány Itt is mértékegység szerinti az osztályozás, de a „hányszoros?” kérdésre is tudunk válaszolni (mindig 0-tól kezdünk mérni) példák: életkor testmagasság]

Az ismérvek grafikus ábrázolásánál mindig az ismérv típusának megfelelő diagramra van szükség. A hisztogramot mennyiségi ismérvek esetében használjuk, ilyen például korábbi példánkban a vizsgán elért pontszám (megengedve akár a töredékpontokat is).

Az oszlopdiagram minőségi ismérvek esetén használatos, ilyen például a vizsgán elért jegy.

A kördiagramot is általában minőségi ismérvek esetén alkalmazzuk, de néha alkalmas lehet mennyiségi ismérvek megoszlásának kimutatására is. A kördiagram lényege, hogy a csoportok közti arányokat szemlélteti. A továbbiakban nézzünk néhány példát az egyes diagramtípusokra.

Az alábbi táblázat egy városban a lakások megoszlását tartalmazza. Ábrázoljuk a táblázat adatait oszlopdiagrammal és hisztogrammal.

Lakásméret

(négyzetméter)

Lakások száma

(1000 darab)

A

B

C

    0-49

21

12

3

4

  50-99

33

10

15

8

100-159

60

17

23

20

150-250

46

21

18

7

összesen

160

60

61

39

A=Belvárosi társasház

B=Zöldövezeti társasház

C=Lakótelepi lakás

A lakások méret szerinti megoszlása mennyiségi ismérv, tehát nekünk egy hisztogramra van szükségünk.

[Szövegdoboz: Lakások száma (1000 db) 21 33 60 23 23 0 50 100 150 200 250]

A lakások típus szerinti megoszlása viszont minőségi ismérv. Ekkor oszlopdiagramot használunk.

[Szövegdoboz: Lakások száma (1000 db) 60 61 39 A B C]


ALAKMUTATÓK

Alakmutatók

Az alakmutatók az eloszlások szabálytalanságait próbálják jellemezni, legtöbbjük azt méri, hogy az adott eloszlás mennyiben tér el az etalonnak tekintett normális-eloszlás jellegzetes harang alakú görbéjétől. Az eltérés megmutatkozhat lapultságban vagy csúcsosságban, illetve aszimmetriában, ami jelenthet jobbra vagy balra elnyúlást.

Az egyik legegyszerűbb és leggyakrabban használt alakmutatók, az úgynevezett

Pearson-féle mérőszámok

illetve az F-mutatók

   és 

ahol  az első,  pedig a kilencedik decilist jelenti.

Negatív értékek esetén az eloszlás balra tolódó, pozitív értékekre jobbra tolódó.

A P és A mutató általában -1 és 1 között tartózkodik és csak extrém esetekben vesz föl 1-nél nagyobb vagy -1-nél kisebb értéket. Az F mutató csak -1 és 1 között lehet.

A csúcsosság mérésére a következő mutató van forgalomban:

Itt  az úgynevezett negyedik momentum, ami

Lássunk egy példát az alakmutatók használatára! Nézzük meg például, hogy milyen jellegű aszimmetriát mutat a terroristák életkor szerinti megoszlása. A terrorizmus jellemzően fiatalabb emberek elfoglaltsága, ráadásul várható élettartamuk is rövidebb, így bal oldali aszimmetria lesz majd felfedezhető. Node lássuk a számokat!

életkor

terroristák

száma (%)

0-19

7%

20-29

46%

30-39

32%

40-59

10%

60-79

5%

Először F-mutatókat számolunk:

Amihez kellenek a kvartilisek és a medián.

A  kvartilisek:

A medián: 

A másik F-mutatóhoz a decilisek kellenek:

Mindkét F-mutató közepes bal oldali aszimmetriát mutat.

Most jöhetnek a Pearson-féle mutatók. Ezekhez kell átlag és szórás is sajna:

Az átlag:

A szórás:

Végül egy móduszt is számolunk. Mivel nem egyenletesek az osztályközök, a módusz miatt újra kell osztani az életkorokat, méghozzá 10-esével.

A leggyakoribb osztályköz hossza viszont már eleve 10, így az újraosztás rajta már nem változtat.

életkor

terroristák

száma (%)

0-9

3,5%

10-19

3,5%

20-29

46%

30-39

32%

40-59

10%

60-79

5%

Lássuk a P és A mutatókat:

Mindkettő közepes bal oldali aszimmetriát mutat.

Végül nézzük meg a csúcsosságot is:

Itt

És

Egy bank ügyfeleinek a sorra kerülésig várakozással eltöltött ideje percben megadva egy vizsgált időtartamban:

3, 5, 2, 7, 4, 3, 8, 2, 5, 5, 3, 2, 4, 2, 6, 2

Ábrázoljuk az értékeket leveles-ág és doboz-ábrán.

A leveles-ág ábra az adatok nagyság szerinti sorba rendezése az alábbi módon:

1

2, 2, 2, 2,

3, 3, 3

4, 4

5, 5, 5

7,7

8

A doboz-ábra lényege, hogy az adatokat egy számegyenesen ábrázoljuk, az alsó és felső kvartilisek között elnyúló doboz társaságában.

Számoljuk ki a kvartiliseket. Összesen 16db adat van, így az alsó negyedelő 4 és 5 között a felső negyedelő 12 és 13 között van.

[Szövegdoboz: 1 2 2 2 2 3 3 3 4 4 5 5 5 7 7 8] [Szövegdoboz: Felső kvartilis] [Szövegdoboz: Medián: A sorbarendezett adatsor középső értéke. Most két középső is van, a tizedik és a tizenegyedik, ilyenkor az átlaguk:] [Szövegdoboz: Alsó kvartilis:]

[Szövegdoboz: A doboz-ábra X X X 0 1 2 3 4 5 6 7 8 9]

Az alsó és felső kvartilis közötti intervallumot nevezzük interkvartilis terjedelemnek. Most az interkvartilis 2-töl 5-ig tart, hossza 3. Az interkvartilis terjedelembe vagyis a dobozba esik az értékek legalább 50%-a. A doboz-ábra az adatsor öt jellegzetes mutatóját tartalmazza, a minimális és maximális értéket, a két kvartilist és a mediánt.

2.3. Húsz napon át figyelték egy alpesi kisváros sípályáinak összesített napi forgalmát. A kapott értékek a következők voltak:

1000

2000

7000

9000

12500

3500

1000

5000

3000

13000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját, a móduszt, mediánt, átlagot. Készítsünk leveles-ág ábrát illetve doboz-ábrát. Helyezzük el az adatokat egy gyakorisági sorban 2500-as osztályközökkel. Szemléltessük hisztogrammal a forgalom mértékét.

[Szövegdoboz: 1000 1000 1500 1500 2000 2500 3000 3000 3000 3000 3500 5000 5000 7000 8000 8500 9000 9000 11500 12000] [Szövegdoboz: Átlag:] [Szövegdoboz:] [Szövegdoboz: Felső kvartilis] [Szövegdoboz: Medián: A sorbarendezett adatsor középső értéke. Most két középső is van, a tizedik és a tizenegyedik, ilyenkor az átlaguk:] [Szövegdoboz: Alsó kvartilis:] [Szövegdoboz: Módusz =A leggyakoribb érték, most 5000]

A leveles-ág ábra

   1   000, 000, 500, 500

   2   000, 500

   3   000, 000, 000, 000, 500

   5   000, 000

   7   000

   8   000, 500

   9   000, 000

 11   500

 12   000

[Szövegdoboz: A doboz-ábra X X X 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 11000 12000]

Az alsó és felső kvartilis közötti intervallumot nevezzük interkvartilis terjedelemnek. Most az interkvartilis 2250-töl 8250-ig tart, hossza 6000. Az interkvartilis terjedelembe vagyis a dobozba esik az értékek legalább 50%-a. A medián a doboz első harmadában található, a szélső értékek a dobozhoz képest jobbra tolódnak.

Napi forgalom

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 – 12 499

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Néhány további mutatót is kiszámoltunk, ezek a relatív gyakoriság, kumulált relatív gyakoriság, az értékösszeg és a relatív értékösszeg.

A relatív értékösszegre hamarosan nagy szükségünk lesz majd a koncentráció vizsgálatakor.

Napi forgalom

Osztály-

közép

0 –   2499

2500 –   4999

5000 –   7499

7500 –   9999

10 000 –12 499

1250

3750

6250

8750

12500

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

6250/105 000=0,07

22500/105 000=0,21

18750/105 000=0,18

35000/105 000=0,33

22500/105 000=0,21


LEVELES ÁG ÉS DOBOZ ÁBRA

FELADAT 2. 3.

KONCENTRÁCIÓ, LORENZ-GÖRBE

Koncentráció, Lorenz-görbe

Hasonlítsuk össze a Föld néhány országának egy főre jutó GDP-jét és az országok népességét. Az európai országok egy főre jutó GDP-je úgy 40 ezer USA-dollár körül mozog, igaz kelet felé haladva ez jelentős csökkenésnek indul és Oroszországnál eléri a 10 ezret. USA és Kanada is ezt a 40 ezres szintet hozza, Mexikó pedig 8 ezret. Aztán lejjebb haladva Dél-Amerikában már a 10 ezer számít kiemelkedően magasnak. Ázsiában él a Föld lakosságának több, mint fele. Az egy főre jutó GDP azonban 2000 USA-dollár körül mozog. Ezek a megdöbbentő adatok sokakat vallások megalapítására sarkallnak, mások terrorista hálózatokat építenek ki, mi viszont belevágunk a Lorenz-görbe fölrajzolásába. A Lorenz-görbe az egyik legkiválóbb szemléltető eszköze a koncentrációnak, most éppen az egy főre jutó GDP nagyon erős koncentrálódásának. A koncentráció a sokasághoz tartozó teljes értékösszeg jelentős részének vagy egészének kevés egységre történő összpontosulása.

Ország

GDP/fő

(ezer USA-dollár, 2008)

Népesség

(millió)

Ausztria

46 600

8,4

Belgium

44 730

10,4

Csehország

17 280

10,2

Dánia

60 800

5,5

Franciaország

43 640

61,4

Németország

41 400

82,7

Magyarország

13 860

10,0

Norvégia

90 180

4,7

Nagy-Britannia

46 740

60,7

Olaszország

38 190

58,1

Oroszország

10 100

141,8

Svájc

55 780

7,6

Szlovákia

14 600

5,5

Ukrajna

3 307

46,0

Kanada

40 100

33,2

Mexikó

8 200

110,0

USA

47 330

304,8

Argentína

6 790

40,0

Brazília

6 600

192,0

Chile

10 590

16,8

Ausztrália

42 420

20,6

India

1 180

1 130,0 

Indonézia

1 950

237,5

Irán

3 900

71,3

Kína

3 000

1 330,0

Japán

38 930

127,5

Pakisztán

940

167,2

Egyiptom

1 870

77,5

Etiópia

229

85

Kenya

640

38,5

Nigéria

1 020

150

Tanzánia

353

40,4

Készítsünk egy táblázatot, a Föld népességének egy főre jutó GDP szerinti megoszlásáról.

Az osztályközök a pontosság érdekében nem egyenletesek.

Első oszlopunk a gyakoriság, ami azt jelenti, hogy hány millió ember tartozik az adott GDP-szintet jelentő osztályközbe.

A következő oszlop a relatív gyakoriság. Jól látszik, hogy a népesség 30%-a tartozik a második osztályközbe és majdnem 30%-a a harmadikba, vagyis a Föld lakosságának jóval több, mint fele az 5000-es szint alatt van.

A kumulált relatív gyakoriság oszlopból látszik, hogy 70% van 5000 alatt, és 80% 10 ezer alatt. Magyarország a 14 ezer körüli szintjével a felső 20%-ba tartozik.

A következő oszlop az értékösszeg azt mutatja meg, hogy az egyes osztályokba tartozókra összesen mennyi GDP esik. A nyugati világ gazdaságilag fejlett országai a Föld lakosságának egytizedét teszik ki, de több GDP jut rá, mint az összes addigira együttvéve. Ezt jól szemlélteti a relatív értékösszeg és a kumulált relatív értékösszeg oszlop.

GDP/fő

(millió)

(ezer USA-dollár)

        0-1 000

720

0,116

0,116

360 000

0,006

0,006

  1 001-2 000

1 940

0,313

0,429

2 910 000

0,053

0,059

  2 001-5 000

1 790

0,290

0,719

4 475 000

0,080

0,139

  5 001-10 000

490

0,079

0,798

3 675 000

0,066

0,205

10 001-20 000

288

0,046

0,844

4 320 000

0,078

0,283

20 001-30 000

76

0,012

0,856

1 900 000

0,034

0,317

30 001-40 000

254

0,041

0,897

8 890 000

0,160

0,477

40 001-50 000

604

0,098

0,995

27 180 000

0,488

0,965

50 001-60 000

18

0,003

0,998

990 000

0,018

0,983

60 001-

15

0,002

1,000

975 000

0,017

1,000

Total

6 195

1,000

55 675 000

1,000

A Lorenz-görbe azt fejezi ki, hogy a gyakoriság egy adott százalékához az összérték hány százaléka tartozik. Az x tengelyen tehát a kumulált relatív gyakoriságot, míg az y tengelyen a kumulált relatív értékösszeget mérjük.

A Föld népességének 11,6%-ára az összes GDP 0,6%-a jut.

42,9%-ra még mindig csak 5,9% jut. 71,9%-ra mindössze 13,9% jut.

Könnyű belegondolni, hogy az y=x egyenes mentén a koncentráció nulla. Az y=x egyenes és a kapott görbe közötti területet hívjuk koncentrációs területnek, ez jellemzi a koncentráció mértékét, ami esetünkben igen magas.

[Szövegdoboz:]

A koncentráció kimutatásának egy másik egyszerű eszköze a kvantilis-eloszlás, vagyis ha olyan gyakorisági sort szerkesztünk, ahol minden gyakoriság egyenlő. Ha minden relatív értékösszeg (Zi) is egyenlő, az a koncentráció hiányát jelenti. Minél egyenlőtlenebbül alakulnak a relatív értékösszegek, a koncentráció annál nagyobb.

A kvartilis-elsozlás például úgy készül, hogy a Föld lakosságát az egy főre jutó GDP szerint sorba állítjuk, és négy egyenlő létszámú csoportra osztjuk. Az osztályközök határai ekkor kvartilisek lesznek.

GDP/fő

(millió)

          0-1 100

1 548,75

0,010

    1 101-2 100

1 548,75

0,027

    2 101-11 000

1 548,75

0,110

  11 001-90 000

1 548,75

0,853

Total

6 195

1,000

A kvintilis-eloszlás pedig ötödökre osztja.

GDP/fő

(millió)

        0-1 000

1 239

0,007

  1 001-2 000

1 239

0,020

  2 001-4 000

1 239

0,042

  4 001-20 000

1 239

0,167

20 001-90 000

1 239

0,764

Total

6 195

1,000

A koncentráció mértékének egy számmal való jellemzésére a koncentrációs terület kiszámolása viszonylag körülményes. Ezen kívül az egyik legalkalmasabb mutató az úgynevezett Herfindahl-index. Kiszámolása a Z értékekből történik:

Az eredeti táblázatunkban ezt kiszámolva

A Herfindahl-index, a kiszámolásának módja miatt mindig 1/N és 1 közötti értékkel méri a koncentráció fokát. Ha HI=1/N akkor minden egység egyformán részesedik a teljes értékösszegből, ha pedig HI=1, akkor a lehető legerősebb a koncentráció.


ÁLLAPOT- ÉS TARTAMIDŐSOR KRON. ÁTL.

Azokat az adatsorokat nevezzük idősornak, amely egy – vagy több – ismérv időben történő megoszlását írja le. Legjobb lesz, ha nézünk néhány példát.

Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.

év

megbukott

vizsgázók száma

2007

350

2008

380

2009

420

2010

450

Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa szerencsés esetben mindig ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem volna ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik rubrikában két év megbukott hallgatóinak száma szerepel, akkor például a bukottak száma 350, 380, 870. A látszólagos ugrás azonban csak a csalás miatt van.

Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.

Nézzünk egy másik példát is idősorra. Vegyük, mondjuk egy országban a gépkocsi tulajdonosok és a közúti balesetek számának évenkénti megoszlását.

év

gépkocsi

tulajdonosok száma

közúti

balesetek száma

2007

2 315 421

81 256

2008

2 531 254

80 578

2009

2 624 322

79 875

2010

2 598 378

79 756

A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.

Ha az adatok összeadásával kapott eredmény értelmes,

az idősort tartamidősornak nevezzük. Ilyen például táblázatunkban a közúti balesetek száma. Ezeket összeadva kiderül, hány baleset volt a négy év során.

Ha az adatok összeadásával kapott eredmény nem értelmes,

az idősort állapotidősornak nevezzük. Ilyen a táblázatban a gépkocsi tulajdonosok száma. Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.

A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák – innen ered a nevük is – tehát egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb.

Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában.

Az idősorban bekövetkező változásokat általában százalékosan szokás megadni, az úgynevezett viszonyszámokkal. Vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.

Nézzünk egy feladatot!

Az alábbi táblázat egy mozi forgalmának és jegyárainak évenkénti megoszlását tartalmazza.

év

TARTAMIDŐSOR

forgalom

(millió fő)

ÁLLAPOTIDŐSOR

Jegyár

(jan.1-én)

2007

5

950

2008

5,4

1150

2009

5,1

1300

2010

4,9

1450

2011

5

1500

Lássuk a viszonyszámokat! A forgalom oszlopban tekintsük bázisévnek 2007-et. Ekkor a bázisviszonyszámok

év

TARTAMIDŐSOR

forgalom

(millió fő)

bázis

viszonyszám

(2007=100%)

ÁLLAPOTIDŐSOR

jegyár

2007

950

2008

1150

2009

1300

2010

1450

2011

1500

év

TARTAMIDŐSOR

forgalom

(millió fő)

bázis

viszonyszám

(2007=100%)

ÁLLAPOTIDŐSOR

jegyár

2007

950

2008

1150

2009

1300

2010

1450

2011

1500

A láncviszonyszámok mindig az előző évhez viszonyítanak.

év

TARTAMIDŐSOR

forgalom

(millió fő)

bázis

viszonyszám

(2007=100%)

lánc-

viszonyszám

(előző év=100%)

ÁLLAPOTIDŐSOR

jegyár

2007

 nincs

950

2008

1150

2009

1300

2010

1450

2011

1500

A bázisviszonyszám és a láncviszonyszám jelentése mindig százalékos változás.

Ha például a 2009-et nézzük, 1,020 azt jelenti, hogy 2%-al volt nagyobb a forgalom, mint a bázisévben, 0,944 pedig azt jelenti, hogy 0,056-al tehát 5,6%-al volt kisebb a forgalom, mint az előző évben.

A láncviszonyszámokat nézzük meg a jegyárakra is,

a bázisviszonyszámot meg egy időre felejtsük el.

év

forgalom

(millió fő)

lánc-

viszonyszám

(előző év=100%)

Jegyár

lánc-

viszonyszám

(előző év=100%)

2007

 nincs

2008

2009

2010

2011

Az évek során bekövetkezett változást kétféleképpen is szemléltethetjük. Az egyik lehetőség az átlagos különbség, ami a jegyáraknál például azt jelenti, hogy hány forinttal drágultak a jegyek átlagosan egy év alatt. Ezt a változás mértékének szokás nevezni.

Az átlagos változás mértéke

Tehát összeadogatjuk a drágulásokat, aztán elosztjuk – mivel is? Az évek száma n, de nem n-el osztunk. Azért nem n-el, mert a drágulások számával kell osztanunk és az nem n, hanem n-1, az egyik évről a másikra történő ugrások száma. Most a vizsgált időszak 2007-től 2011-ig tart, ami öt év ugyan, de ugrásból csak négy van, ezért kell néggyel osztani:

tehát átlagosan évente 137,5 forinttal drágult a mozizás. Ha valaki jártas az általános iskola matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:

Nem csak azt kérdezhetjük meg, hogy hány forinttal drágult a mozi, hanem azt is, hogy hány százalékos volt az éves áremelés. Ezt a változás ütemének hívjuk.

A változás üteme

Itt is azért van a gyökkitevőben n-1, mert nem az évek száma kell nekünk, hanem a változások száma, egyik évről másikra. Ez pedig n-1. A mozijegyek árának évenkénti változása tehát:

A változás mértéke:

A változás üteme:

A jegyek átlagosan 137,5 forinttal, 12%-al drágultak.

Ugyanezt megnézhetjük a mozilátogatók számának esetében is.

A változás mértéke:

A változás üteme:

Most térjünk rá az átlagok kiszámolására. Az átlagos nézőszám esetében tartamidősorunk van, vagyis van értelme összeadni az idősor adatait. Itt az átlagot a szokásos módon számoljuk:

Más a helyzet az átlagos jegyár esetében, ami állapotidősor, így az adatok összege értelmetlen. Ilyenkor úgynevezett kronologikus átlagot számolunk, ami

Nézzünk egy másik példát, ahol összefoglaljuk az eddigieket.

A következő táblázat egy autókereskedés raktárkészletének és eladásainak időbeli eloszlását tartalmazza. Számoljuk ki az összes eddigi állatfajtát.

hónap

raktárkészlet

(a hónap elején)

eladott

mennyiség

jan.

210

150

feb.

350

120

mar.

310

100

apr.

300

120

maj.

290

A változások mértéke és üteme:

hónap

ÁLLAPOTIDŐSOR

raktárkészlet

(a hónap elején)

TARTAMIDŐSOR

eladott

mennyiség

jan.

feb.

mar.

apr.

maj.

hónap

ÁLLAPOTIDŐSOR

raktárkészlet

TARTAMIDŐSOR

eladott mennyiség

jan.

feb.

mar.

apr.

maj.

Változás

mértéke

Változás

üteme

átlag

2.4. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.

Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.

Előállított mennyiség

Raktározva

(a hónap elején)

jan.=100%

előző hónap=100%

db

marc.=100%

előző hónap=100%

db

jan.

-

125

-

febr.

120

110

1100

marc.

3500

apr.

150

3750

87,5

Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor

Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak

107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.

Előállított mennyiség

Raktárkészlet

(a hónap elején)

jan.=100%

előző hónap=100%

db

marc.=100%

előző hónap=100%

db

jan.

1

-

2500

1,25

-

1000

febr.

1,2

1,2

3000

1,375

1,1

1100

marc.

1,4

1,167

3500

1

0,7272

800

apr.

1,5

1,071

3750

0,875

0,875

700

Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?

Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor

Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.

A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:

2.5. Egy áruház raktárkészlete valamely termékből az alábbiak szerint alakult:

hónap

Készlet

Jan=100%

Előző

hónap=100%

Változás %-ban

február=100%

Változás

februárhoz képest (db)

Aktuális készlet a hónap végén (db)

Jan.

100

-

-20

-10

Febr.

Márc.

110

Ápr.

+16

Máj.

600

Jún.

80

Júl.

130

a) Töltsük ki a hiányzó részeket!

b) Mekkora volt az átlagos raktárkészlet ebből a termékből a második negyedévben?


FELADAT 2. 4.

FELADAT 2. 5.

FELADAT 2. 6.

FELADAT 2. 7.

FELADAT 2. 8.