Középiskolai matek képsor tartalma:

Medián, módusz, kvartilisek, szórás, relatív szórás, gyakoriság, relatív gyakoriság, gyakorisági sor, értékösszeg sor, koncentráció, Lorenz-görbe, doboz-ábra, alakmutatók, Pearson-mutató, F-mutató.

A képsor tartalma

EGY ISMÉRV SZERINTI ELEMZÉS

Módusz, medián, átlag

Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját. Ezek a módusz, a medián, a kvartilisek, és a számtani átlag.

Ezek után az adatokat elhelyezzük egy gyakorisági sorban 2500 forintonkénti osztályközökkel. Az így kapott gyakorisági sorban szintén kiszámoljuk a becsült móduszt, mediánt és átlagot.

A kapott adatokat helyezzük el a gyakorisági sorban. Ez nem más, mint egy táblázat, amely a vásárlások értékét tartalmazza, mondjuk 2500 forintonkénti bontásban.

itt a gyakoriságokat jelenti, vagyis azt, hogy hány darab vásárló tartozik az egyes kategóriákba.

Vásárlás értéke

= gyakoriság (hány darab)

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

5

6

3

4

2

N=összesen

20

És már itt is van az első buktató! Az osztályközök határai ugyanis kicsit megtévesztők.

A 0-2499 valójában azt jelenti, hogy 0-2500. Ez lehet, hogy elsőre kicsit furcsának tűnik, de a helyzet a következő. Ha 2500-forintonkénti bontást csinálunk, az osztályközök valójában így néznének ki, hogy

Vásárlás értéke

0 – 2500

2500 – 5000

5000 – 7500

7500 – 10 000

10 000 – 12 500

5

6

3

4

2

N=összesen

20

Csakhogy, ha valaki mondjuk éppen 2500-ért vásárol, akkor marha nagy gondba lennénk, hogy ezt a 0-2500 osztályközbe, vagy a 2500-5000 osztályközbe rakjuk-e. Éppen ezért megállapodást kell kötnünk, hogy a végpontokat hova tegyük. Erre két lehetőség van.

De bármelyiket válasszuk is, ne felejtsük el, hogy nincsenek hézagok a táblázatban, tehát az osztályközök hossza mindig 2500! Ez azért fontos, mert ha kellenek az osztályközök felezőpontjai, az osztályközepek, akkor azok bizony így néznek ki:

és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

A kapott táblázatunkat kibővíthetjük egy újabb oszloppal, amely azt tartalmazza, hogy az adott kategóriáig hányan vásároltak. Ezt az oszlopot kumulált gyakoriságnak nevezzük.

Vásárlás értéke

= kumulált gyakoriság

(az adott osztályközig hány darab)

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

Megint újabb oszlopot vezetünk be, amely az egyes kategóriák teljes mennyiséghez viszonyított arányát jelentik. Ezt az oszlopot hívjuk relatív gyakoriságnak.

Vásárlás értéke

= relatív gyakoriság

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

Még egy oszlopot iktatunk be, a kumulált relatív gyakoriságot.

Vásárlás érétke

= kumulált relatív gyakoriság

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Még egy oszlopot iktatunk be, az úgynevezett értékösszeget. Ez úgy kell érteni, hogy minden kategóriában összeadogatjuk a vásárlások értékét. Az értékösszeg jele S.

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az értékösszeg

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az így kapott táblázatban az eredeti adatok már elvesztek, csupán azt tudjuk, hogy az egyes osztályközökben hány darab adat található. De, hogy pontosan mik is ezek az adatok, azt nem. Az első osztályközbe például 5 elem tartozik, ennél többet azonban nem tudunk róluk. Ezeket az elemeket jól jellemezhetjük az osztályköz középső elemével, úgy vesszük, mintha mind az öt elem ugyanez a középső elem volna.

Ha most ki szeretnénk számolni a gyakorisági sor átlagát, akkor a szokásos módon számolunk, vagyis összeadogatjuk az elemeket és elosztjuk a darabszámmal. Csakhogy az elemek most az osztályközepek.

Ami egyszerűbben:

Vagyis a gyakorisági sor számtanit átlaga:

tehát , végül pedig a móduszt tartalmazó osztályköz hossza, így . A módusz tehát:

A medián kiszámolása szintén becsléssel történik. Most a medián a 10. és a 11. elem közt van, vagyis a második osztályközben.

Itt = a mediánt tartalmazó osztályköz alsó határa, vagyis , , , ,

tehát

Szórás, relatív szórás

A szórás az átlagtól való eltérést méri. Az átlag ugyanis, csak úgy önmagában

meglehetősen kevés dolgot árul el.

Ha például egy utazási iroda felméri, hogy átlagosan milyen utakat választanak az ügyfeleik és kiderül, hogy az ügyfelek egyik fele 400 eurós ár körül választ utat, a másik felük meg 2000 eurós áron, akkor kiszámolva az átlagot, azt kapjuk, hogy az ügyfeleik átlagosan 1200 euró értékben utaznak. Ha ezek után az utazási iroda innentől 1200 eurós utakat hirdet, mondván, hogy ez az átlagos, csődbe megy. Fontos tehát az átlag, de éppoly fontos látni az átlagtól való eltérések nagyságát is.

Ezt az átlagtól való ingadozást méri a szórás. Jele (szigma). Kiszámolásához venni kell az egyes értékeknek az átlagtól való eltérését.

Előző példánkhoz visszatérve számoljuk ki a vásárlások értékének szórását.

értékek

átlagtól való eltérés

1000

1000

1500

1500

2000

2500

3000

3000

3000

3000

3500

5000

5000

7000

8000

8500

9000

9000

11 500

12 000

1000-5000

1000-5000

1500-5000

1500-5000

2000-5000

2500-5000

3000-5000

3000-5000

3000-5000

3000-5000

3500-5000

5000-5000

5000-5000

7000-5000

8000-5000

8500-5000

9000-5000

9000-5000

11 500-5000

12 000-5000

Ha ezeket az eltéréseket összeadnánk, éppen nulla jönne ki, az átlag ugyanis pont félúton helyezkedik el az adatok között.

Minket azonban most nem érdekel az eltérés iránya, tehát, az hogy az átlagnál több vagy az átlagnál kevesebb, csak maga az eltérés érdekel. Ennek érdekében megszabadulunk az előjelektől úgy, hogy az eltéréseket négyzetre emeljük.

vagyis

Lássuk csak mennyi most a szórás:

A szórás átlaghoz viszonyított értékét relatív szórásnak nevezzük.

Most a relatív szórás

ami 69% tehát elég magas.

Az adatsor legkisebb és legnagyobb értéke közti eltérést szóródásnak nevezzük. Most a szóródás, lássuk csak

12 500 – 1000=11 500

Ha nem az összes elem szórását számoljuk, hanem csak például egy mintáét, akkor a minta szórás képlete:

Például ha az első öt vásárlás esetén akarjuk a minta szórását kiszámolni:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Itt

Tehát

A szórást nem csak a konkrét értékekből számolhatjuk, hanem a gyakoriságokat tartalmazó táblázatból is. Ezt becsült szórásnak hívjuk. Esetünkben a gyakorisági sor

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

A becsült szórás képlete gyakorisági sor esetén

Emlékezzünk vissza az átlagra:

Ekkor a szórás

Tehát

Néhány tanulságos gyakorisági sor

Nézzünk meg egy másik példát is, ahol nem egyenletes osztóintervallumok vannak.

Az alábbi táblázat egy város lakásainak méret szerinti megoszlását tartalmazza.

Lakásméret

(négyzetméterben megadva)

Lakások száma

(1000 darabban)

0-19

18

18

20-39

30

48

40-99

66

114

100-199

36

150

200-

10

160

Számítsuk ki itt is a móduszt, mediánt, átlagot és szórást.

Az első észrevétel, hogy az utolsó osztályköz nyitott. Ezt úgy zárjuk le, hogy ugyanolyan hosszúnak vesszük, mint az előtte lévőt.

Lakásméret

(négyzetméterben megadva)

hossz

Lakások száma

(1000 darabban)

0-19

20

18

18

20-39

20

30

48

40-99

60

66

114

100-199

100

36

150

200-299

100

10

160

A második észrevétel, hogy az osztályközök nem egyforma hosszúak.

A módusz, vagyis a leggyakoribb érték most 66 darab és a 40-99 osztályközbe esik.

De csak azért, mert ez az osztályköz jóval hosszabb, háromszor olyan hosszú, mint az előtte lévő. Ha elharmadoljuk, akkor máris nem ide esik a módusz.

Vagyis a módusz kiszámolásához a csalások elkerülése érdekében újra kell osztani az osztályközöket, az újraosztás pedig egy olyan hosszal történik, aminek egész számú többszöröse mindegyik eredeti osztályköz hossza.

Most úgy tűnik az újraosztásnál 20 hosszúságú osztályközök lesznek, vagyis a 40-99 osztályközt elharmadolva három darab 20 hosszú osztályközre bontjuk a 100-199 osztályközt és az utána következőt is öt részre vágva azokból is 20 hosszú osztályközöket csinálunk.

Jól látszik, hogy a modális osztályköz a 20-39 osztályköz lesz, vagyis csak a körülötte lévő osztályközökkel fogjuk az újraosztást ténylegesen elvégezni.

Lakásméret

(négyzetméterben megadva)

hossz

Lakások száma

(1000 darabban)

0-19

20

18

18

20-39

20

30

48

40-59

20

22

74

60-79

20

22

94

80-99

20

22

114

100-199

100

36

150

200-299

100

10

160

Itt

Lakásméret

(négyzetméterben megadva)

hossz

Lakások száma

(1000 darabban)

0-19

20

18

18

20-39

20

30

48

40-99

60

66

114

100-199

100

36

150

200-299

100

10

160

A medián kiszámolásánál nem lesz gond az eltérő hosszúságokkal.

A képlet:

Mivel , aminek a fele 80, a medián is az 50-99 terjedő osztályközben van. Ekkor, , és tehát

Adjuk meg az átlagot és a szórást!

Ezek kiszámolásában tökmindegy, hogy egyenletesek-e az osztályközök vagy sem. Kiszámoljuk az osztályközepeket:

Lakásméret

(négyzetméterben megadva)

osztályközép

Lakások száma

(1000 darabban)

0-19

10

18

18

20-39

30

30

48

40-99

70

66

114

100-199

150

36

150

200-299

250

10

160

Az átlag:

A szórás pedig:

A relatív szórás

ami 74% tehát elég sok.

A szóródás pedig a legnagyobb és a legkisebb érték különbsége, vagyis 250-10=240

2.1. Nézzünk meg még egy gyakorisági sort is!

A statisztika vizsga 5 feladatából a vizsgázók által teljesen megoldott feladatok eloszlása:

Megoldott

feladatok száma

Vizsgázók

száma

0

60

60

1

70

130

2

80

210

3 vagy több

40

250

Itt is számítsuk ki itt is a móduszt, mediánt, átlagot és szórást.

Valójában az osztályközök itt is felfoghatók intervallumoknak, az első 0-0,9 feladatig tart a második 1-1,9 feladatig és így tovább. Az utolsó osztályköz nyitott, ezt gondolatban olyan hosszúnak vesszük, mint az előtte lévőt – bár bizonyára sok vizsgázó meg tudott oldani öt feladatot is.

A módusz, vagyis a leggyakoribb érték most 2 darab.

Itt

A medián kiszámolásánál a képlet:

Mivel , aminek a fele 125, a medián az 1db feladat osztályközében lesz.

Ekkor, , és tehát

Adjuk meg az átlagot és a szórást!

Az átlag:

A szórás pedig:

2.2. Egy újságárus havi lapeladásait tartalmazza a következő táblázat.

Napok

száma

Eladott

mennyiség

2

215

4

217

2

218

5

220

8

222

7

225

3

230

a)Mekkora az átlagos havi lapeladás?

b)Határozzuk meg a mediánt.

c)Mekkora a relatív szórás?

Elsőként azonosítsuk be az osztályközöket, vagyis, hogy minek az átlagát mediánját, stb. fogjuk számolni. Első ránézésre az első oszlop tűnik nyerőnek, de hamar lebuktatja, hogy a számok nem sorban vannak.

Az osztályközök ugyanis mindig növekvő sorrendben kell, hogy legyenek. A feladatban tehát cselesen meg van cserélve a két oszlop.

Erre úgy is rájöhetünk, ha elolvassuk, minek az átlagát kell kiszámolnunk. Na azok lesznek ugyanis az osztályközök. Most a havi eladás átlaga kell, tehát semmi kétség, az osztályközök az eladott mennyiség.

Eladott

Mennyiség

Napok

Száma

215

2

2

217

4

6

218

2

8

220

5

13

222

8

21

225

7

28

230

3

31

Össz.

31

Az átlag a szokásos módon

Az átlagosan eladott lapok száma tehát 221,77

Nézzük a mediánt!

Végül számoljuk ki a szórást.

A relatív szórás tehát 1%.

Módusz, medián, átlag

Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját. Ezek a módusz, a medián, a kvartilisek, és a számtani átlag.

Ezek után az adatokat elhelyezzük egy gyakorisági sorban 2500 forintonkénti osztályközökkel. Az így kapott gyakorisági sorban szintén kiszámoljuk a becsült móduszt, mediánt és átlagot.

A kapott adatokat helyezzük el a gyakorisági sorban. Ez nem más, mint egy táblázat, amely a vásárlások értékét tartalmazza, mondjuk 2500 forintonkénti bontásban.

itt a gyakoriságokat jelenti, vagyis azt, hogy hány darab vásárló tartozik az egyes kategóriákba.

Vásárlás értéke

= gyakoriság (hány darab)

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

5

6

3

4

2

N=összesen

20

És már itt is van az első buktató! Az osztályközök határai ugyanis kicsit megtévesztők.

A 0-2499 valójában azt jelenti, hogy 0-2500. Ez lehet, hogy elsőre kicsit furcsának tűnik, de a helyzet a következő. Ha 2500-forintonkénti bontást csinálunk, az osztályközök valójában így néznének ki, hogy

Vásárlás értéke

0 – 2500

2500 – 5000

5000 – 7500

7500 – 10 000

10 000 – 12 500

5

6

3

4

2

N=összesen

20

Csakhogy, ha valaki mondjuk éppen 2500-ért vásárol, akkor marha nagy gondba lennénk, hogy ezt a 0-2500 osztályközbe, vagy a 2500-5000 osztályközbe rakjuk-e. Éppen ezért megállapodást kell kötnünk, hogy a végpontokat hova tegyük. Erre két lehetőség van.

De bármelyiket válasszuk is, ne felejtsük el, hogy nincsenek hézagok a táblázatban, tehát az osztályközök hossza mindig 2500! Ez azért fontos, mert ha kellenek az osztályközök felezőpontjai, az osztályközepek, akkor azok bizony így néznek ki:

és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

A kapott táblázatunkat kibővíthetjük egy újabb oszloppal, amely azt tartalmazza, hogy az adott kategóriáig hányan vásároltak. Ezt az oszlopot kumulált gyakoriságnak nevezzük.

Vásárlás értéke

= kumulált gyakoriság

(az adott osztályközig hány darab)

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

Megint újabb oszlopot vezetünk be, amely az egyes kategóriák teljes mennyiséghez viszonyított arányát jelentik. Ezt az oszlopot hívjuk relatív gyakoriságnak.

Vásárlás értéke

= relatív gyakoriság

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

Még egy oszlopot iktatunk be, a kumulált relatív gyakoriságot.

Vásárlás érétke

= kumulált relatív gyakoriság

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Még egy oszlopot iktatunk be, az úgynevezett értékösszeget. Ez úgy kell érteni, hogy minden kategóriában összeadogatjuk a vásárlások értékét. Az értékösszeg jele S.

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az értékösszeg

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az így kapott táblázatban az eredeti adatok már elvesztek, csupán azt tudjuk, hogy az egyes osztályközökben hány darab adat található. De, hogy pontosan mik is ezek az adatok, azt nem. Az első osztályközbe például 5 elem tartozik, ennél többet azonban nem tudunk róluk. Ezeket az elemeket jól jellemezhetjük az osztályköz középső elemével, úgy vesszük, mintha mind az öt elem ugyanez a középső elem volna.

Ha most ki szeretnénk számolni a gyakorisági sor átlagát, akkor a szokásos módon számolunk, vagyis összeadogatjuk az elemeket és elosztjuk a darabszámmal. Csakhogy az elemek most az osztályközepek.

Ami egyszerűbben:

Vagyis a gyakorisági sor számtanit átlaga:

tehát , végül pedig a móduszt tartalmazó osztályköz hossza, így . A módusz tehát:

A medián kiszámolása szintén becsléssel történik. Most a medián a 10. és a 11. elem közt van, vagyis a második osztályközben.

Itt = a mediánt tartalmazó osztályköz alsó határa, vagyis , , , ,

tehát

Szórás, relatív szórás

A szórás az átlagtól való eltérést méri. Az átlag ugyanis, csak úgy önmagában

meglehetősen kevés dolgot árul el.

Ha például egy utazási iroda felméri, hogy átlagosan milyen utakat választanak az ügyfeleik és kiderül, hogy az ügyfelek egyik fele 400 eurós ár körül választ utat, a másik felük meg 2000 eurós áron, akkor kiszámolva az átlagot, azt kapjuk, hogy az ügyfeleik átlagosan 1200 euró értékben utaznak. Ha ezek után az utazási iroda innentől 1200 eurós utakat hirdet, mondván, hogy ez az átlagos, csődbe megy. Fontos tehát az átlag, de éppoly fontos látni az átlagtól való eltérések nagyságát is.

Ezt az átlagtól való ingadozást méri a szórás. Jele (szigma). Kiszámolásához venni kell az egyes értékeknek az átlagtól való eltérését.

Előző példánkhoz visszatérve számoljuk ki a vásárlások értékének szórását.

értékek

átlagtól való eltérés

1000

1000

1500

1500

2000

2500

3000

3000

3000

3000

3500

5000

5000

7000

8000

8500

9000

9000

11 500

12 000

1000-5000

1000-5000

1500-5000

1500-5000

2000-5000

2500-5000

3000-5000

3000-5000

3000-5000

3000-5000

3500-5000

5000-5000

5000-5000

7000-5000

8000-5000

8500-5000

9000-5000

9000-5000

11 500-5000

12 000-5000

Ha ezeket az eltéréseket összeadnánk, éppen nulla jönne ki, az átlag ugyanis pont félúton helyezkedik el az adatok között.

Minket azonban most nem érdekel az eltérés iránya, tehát, az hogy az átlagnál több vagy az átlagnál kevesebb, csak maga az eltérés érdekel. Ennek érdekében megszabadulunk az előjelektől úgy, hogy az eltéréseket négyzetre emeljük.

vagyis

Lássuk csak mennyi most a szórás:

A szórás átlaghoz viszonyított értékét relatív szórásnak nevezzük.

Most a relatív szórás

ami 69% tehát elég magas.

Az adatsor legkisebb és legnagyobb értéke közti eltérést szóródásnak nevezzük. Most a szóródás, lássuk csak

12 500 – 1000=11 500

Ha nem az összes elem szórását számoljuk, hanem csak például egy mintáét, akkor a minta szórás képlete:

Például ha az első öt vásárlás esetén akarjuk a minta szórását kiszámolni:

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

Itt

Tehát

A szórást nem csak a konkrét értékekből számolhatjuk, hanem a gyakoriságokat tartalmazó táblázatból is. Ezt becsült szórásnak hívjuk. Esetünkben a gyakorisági sor

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

A becsült szórás képlete gyakorisági sor esetén

Emlékezzünk vissza az átlagra:

Ekkor a szórás

Tehát

1.1. Egy iskolai büfé napi vevőszámának alakulása az elmúlt 20 napban az alábbi volt. Határozzuk meg a móduszt és a kvartiliseket.

1000

2000

7000

9000

11500

3500

1000

5000

3000

12000

5000

1500

3000

8000

9000

2500

3000

1500

8500

3000

1.2. Az alábbi táblázat egy város havi gázfogyasztóinak eloszlását tartalmazza, a fogyasztók számát ezer főben megadva.

Havi fogyasztás

(köbméterben megadva)

f

f’

g

g’

0-49

3

50-99

4

100-149

15

150-199

0

200-249

0,25

töltsük ki a hiányzó részeket.
Adjuk meg a móduszt és a mediánt!
Adjuk meg az átlagot és a szórást!
Vegyük a legalább száz köbmétert fogyasztó felhasználókat. Mekkora esetükben az átlag? Mekkora a szórás?

Íme a hiányzó részek.

Havi fogyasztás

(köbméterben megadva)

f

f’

g

g’

0-49

3

3

0,15

0,15

50-99

4

7

0,2

0,35

100-149

8

15

0,4

0,75

150-199

0

15

0

0,75

200-249

5

20

0,25

1

Adjuk meg a móduszt és a mediánt!

A módusz a leggyakoribb érték. Most a legtöbb fogyasztó a

100-149 kategóriába esik, egészen pontosan 8, vagyis 8 ezer fő. A móduszra használt képlet alapján

Havi fogyasztás

(köbméterben)

f

f’

g

g’

0-49

3

3

0,15

0,15

50-99

4

7

0,2

0,35

100-149

8

15

0,4

0,75

150-199

0

15

0

0,75

200-249

5

20

0,25

1

A medián a felező érték, vagyis, ha sorba állítanánk a lakosokat gázfogyasztásuk szerint, akkor a 20 ezer lakosból középen álló lakos gázfogyasztása a medián. A középső lakos most szintén a 100-149 kategóriába esik. A medián képlete alapján:

Havi fogyasztás

(köbméterben)

f

f’

g

g’

0-49

3

3

0,15

0,15

50-99

4

7

0,2

0,35

100-149

8

15

0,4

0,75

150-199

0

15

0

0,75

200-249

5

20

0,25

1

Adjuk meg az átlagot és a szórást

Az átlag kiszámolása azt jelenti, hogy átlagosan hány köbméter gázt fogyasztanak havonta. A 0-49 terjedő fogyasztást szimbolizáljuk az osztályközéppel, vaygis 25 köbméterrel. Ekkor ilyen fogyasztásból van 3 ezer. Az 50-99 terjedő fogyasztást szintén az osztályközéppel reprezentáljuk, ami 75, ilyenből van 4 ezer. És így tovább.

Havi fogyasztás

(köbméterben megadva)

f

f’

g

g’

0-49 M1=25

3

3

0,15

0,15

50-99 M2=75

4

7

0,2

0,35

100-149 M3=125

8

15

0,4

0,75

150-199 M4=175

0

15

0

0,75

200-249 M5=225

5

20

0,25

1

Az átlag

A szórás pedig

Végül vegyük a legalább száz köbmétert fogyasztó felhasználókat. Mekkora esetükben az átlag? Mekkora a szórás?

Ekkor egy mintának kell kiszámolnunk az átlagát és a szórását.

Havi fogyasztás

(köbméterben megadva)

f

f’

g

g’

0-49 M1=25

3

3

0,15

0,15

50-99 M2=75

4

7

0,2

0,35

100-149 M3=125

8

15

0,4

0,75

150-199 M4=175

0

15

0

0,75

200-249 M5=225

5

20

0,25

1

Az átlag

A szórás pedig

1.3. Az alábbi táblázat egy bevásárlóközpont üzlethelyiségeinek alapterület szerinti megoszlását tartalmazza.

alapterület

0-99

4

100-199

9

200-299

12

300-399

34

400-

50

Töltsük ki a hiányzó adatokat!
Mekkora a tipikus üzlethelyiség alapterülete?
Mekkora az átlagos üzlethelyiség alapterülete? Mekkora a szórás?

1.4. Egy évfolyam négy különböző szakán az alábbiak ismertek:

Szak

Nők

100 férfira jutó

nők száma szakonként

A

30%

120

B

20%

130

C

18%

110

D

32%

140

Össz.

100%

-

Mennyi az egész évfolyamon a 100 férfire jutó nők átlagos száma? Mennyi a 100 nőre jutó férfiak száma?

Világos, hogy ha 100 férfira 120 nő jut, akkor 1 férfira 1,2. Ez egy viszonyszám, méghozzá

A=nő B=férfi

Súlyozott átlagot kell számolnunk és súlyoknak a nőket tudjuk csak használni, mert más adatunk nincs. Mivel nő=A ezért az átlagolásnál az A-k a súlyok, vagyis harmonikus átlagra van szükségünk. Akinek ez nem teljesen világos, legjobb lesz, ha megnézi, hogy mit kéne tudnia a VISZONYSZÁMOKról. Lássuk az átlagot.

Átlagosan egy férfira 1,256 nő jut, vagyis 100 férfira átlag 125,6 nő. A 100 nőre jutó férfiak száma ennek reciproka.

ami azt jelenti, hogy egy nőre 0,796 férfi jut, így 100 nőre 79,6 db.

1.5. Egy város lakosainak száma 2009-ben 760 ezer, míg 2011-ben 758 ezer. Az alábbiakat tudjuk:

év

Orvosok száma

2009=100%

Háziorvosok

száma (%)

Egy háziorvosra jutó

lakosok száma (%)

Háziorvosok

részaránya

(%)

2010=100%

2009

100

105

7

2010

100

100

6,8

2011

120

83

6

Töltsük ki a hiányzó részeket!

Legyen A=háziorvos és B=lakos. Ekkor és . Az egy háziorvosra jutó lakosok száma

Tudjuk, hogy mennyi ? Sajna nem, csak annyit tudunk, hogy ez a 2010-es érték 83%-a. Vagyis:

és valamint és .

Most rettenetes dolgok jönnek. Beírjuk a B-k helyére, amit tudunk,

Aztán vesszük a két egyenlet hányadosát.

Jobb oldalon A-k és B-k kiesnek, bal oldalon meg egy hipnózis segítségével elevenítsük föl az általános iskolás időket, amikor törtet törttel osztottunk.

vagyis ami azt jelenti, hogy a 2009-es adat a 2011-es adatnak 79,2%-a. Mivel pedig a 2011-es adat a 2010-es adatnak 120%-a, ezért

és és itt most az egyenleteket szorozni kell, hogy kiessen és maradjanak a nekünk hasznos szereplők.

vagyis

Megtudtuk tehát, hogy 2009-ben a 2010-es háziorvos-állomány 95%-a volt.

Innentől már csak pihentetőleg számoljuk ki a többi hiányzó adatot. A háziorvosok részaránya 2009-ben 7% az egyszerűség kedvéért mondjuk azt, hogy összesen 100 orvos van és 7db házi. 2010-re a 7db háziorvosból lesz

vagyis lesz 7,368db háziorvos, ami az összes orvosnak 6,8%-a így összes orvos van

Ami a 2009-es 100db orvosnak éppen a 108,36%-a.

Ugyanezt megcsináljuk 2011-re is. Ott a 2010-es háziorvos létszám 120%-a van, vagyis

Ez az összes orvos 6,9%-a, így összes orvos van, lássuk csak

év

Orvosok száma

2009=100%

Háziorvosok

száma (%)

Egy háziorvosra jutó

lakosok száma (%)

Háziorvosok

részaránya

2010=100%

2009

100

0,95

105

7

2010

108,36

100

100

6,8

2011

128,10

120

83

6,9

1.6. Egy szupermarket valamelyik pénztáránál fél óra alatt 20-an fizettek az alábbi összegekért:

1100

2000

7300

9200

11500

3500

5000

1000

3000

12000

5000

1600

3000

8000

9000

2500

3000

1500

8500

3000

Állapítsuk meg az adatsor néhány alapvető statisztikai mutatóját. Ezek a módusz, a medián, a kvartilisek, majd helyezzük el az adatokat egy gyakorisági sorban 2500 forintonkénti osztályközökkel. Készítsük el a statisztikai sorok típusait.

A kapott adatokat helyezzük el a gyakorisági sorban. Ez nem más, mint egy táblázat, amely a vásárlások értékét tartalmazza most éppen 2500 forintonkénti bontásban. itt a gyakoriságokat jelenti, vagyis azt, hogy az egyes kategóriákba hány darab vásárló tartozik.

Vásárlás értéke

= gyakoriság (hány darab)

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

5

6

3

4

2

N=összesen

20

Itt az első buktató! Az osztályközök határai ugyanis kicsit megtévesztők.

A 0-2499 valójában ugyanis azt jelenti, hogy 0-2500. Ez lehet, hogy elsőre kicsit furcsának tűnik, de a helyzet a következő. Ha 2500-forintonkénti bontást csinálunk, az osztályközök valójában így néznének ki, hogy

Vásárlás értéke

0 – 2500

2500 – 5000

5000 – 7500

7500 – 10 000

10 000 – 12 500

5

6

3

4

2

N=összesen

20

Csakhogy, ha valaki mondjuk éppen 2500-ért vásárol, akkor marha nagy gondba leszünk, hogy ezt a 0-2500 osztályközbe, vagy a 2500-5000 osztályközbe rakjuk-e. Éppen ezért megállapodást kell kötnünk, hogy a végpontokat hova tegyük. Erre két lehetőség van.

De bármelyiket válasszuk is, ne felejtsük el, hogy az osztályközök mindkét esetben 0-2500 aztán 2500-5000 és így tovább és az osztályközök hossza mindig 2500! Ez azért fontos, mert ha kellenek az osztályközök felezőpontjai, az osztályközepek, akkor azok bizony

és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

és így tovább, nem pedig valami 1250,1 vagy 1249,5 meg hasonló kellemetlen baromságok.

A kapott táblázatunkat kibővíthetjük egy újabb oszloppal, amely azt tartalmazza, hogy az adott kategóriáig hányan vásároltak. Ezt az oszlopot kumulált gyakoriságnak nevezzük.

Vásárlás értéke

= kumulált gyakoriság

(az adott osztályközig hány darab)

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

Megint újabb oszlopot vezetünk be, amely az egyes kategóriák teljes mennyiséghez viszonyított arányát jelentik. Ezt az oszlopot hívjuk relatív gyakoriságnak.

Vásárlás értéke

= relatív gyakoriság

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

Még egy oszlopot iktatunk be, a kumulált relatív gyakoriságot.

Vásárlás érétke

= kumulált relatív gyakoriság

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Még egy oszlopot iktatunk be, az úgynevezett értékösszeget. Ez úgy kell érteni, hogy minden kategóriában összeadogatjuk a vásárlások értékét. Az értékösszeg jele S.

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az értékösszeg

Vásárlás érétke

0 – 2499

2500 – 4999

5000 – 7499

7500 – 9999

10 000 – 12 499

1250

3750

6250

8750

11250

5

6

3

4

2

5

11

14

18

20

5/20

6/20

3/20

4/20

2/20

5/20

11/20

14/20

18/20

20/20

Az így kapott táblázatban az eredeti adatok már elvesztek, csupán azt tudjuk, hogy az egyes osztályközökben hány darab adat található. De, hogy pontosan mik is ezek az adatok, azt nem. Az első osztályközbe például 5 elem tartozik, ennél többet azonban nem tudunk róluk. Ezeket az elemeket jól jellemezhetjük az osztályköz középső elemével, úgy vesszük, mintha mind az öt elem ugyanez a középső elem volna.

Ha most ki szeretnénk számolni a gyakorisági sor átlagát, akkor a szokásos módon számolunk, vagyis összeadogatjuk az elemeket és elosztjuk a darabszámmal. Csakhogy az elemek most az osztályközepek.

1.7. Az elmúlt 20 évben a villamos által elgázolt járókelők száma évente a következőképpen alakult: 10, 11, 8, 7, 12, 9, 8, 6, 12, 8, 5, 3, 4, 2, 4, 1, 0, 5, 1, 1

Adjuk meg a kvartilis-eloszlást, a kvintilis-eloszlást és a decilis-eloszlást

A kvartilis-eloszlás négy egyenlő csoportra osztja a növekvő sorrendbe rendezett adatokat.

0, 1, 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 8, 8, 8, 9, 10, 11, 12, 12

Vásárlás érétke

0-2

5

5

0,25

0,25

3-5

5

10

0,25

0,5

6-8

5

15

0,25

0,75

9-12

5

20

0,25

1

A kvintilis eloszlás ötödökre oszt.

0, 1, 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 8, 8, 8, 9, 10, 11, 12, 12

Vásárlás érétke

0-1

4

4

0,2

0,2

2-4

4

8

0,2

0,4

5-7

4

12

0,2

0,6

8-9

4

16

0,2

0,8

10-12

4

20

0,2

1

A decilis eloszlás tizedekre osztja az elemeket, de ez most nem lesz jó

0, 1, 1, 1, 2, 3, 4, 4, 5, 5, 6, 7, 8, 8, 8, 9, 10, 11, 12, 12

Ekkor ugyanis az 1-esek két különböző osztályközbe kerülnének, ami lehetetlen. Vagyis decilis eloszlás nem létezik.

Jegyezzük meg, hogy ha létezik decilis eloszlás, akkor létezik kvintilis eloszlás is, hiszen a decilis eloszlás osztályait kell összeolvasztani. Ha viszont létezik kvintilis eloszlás, abból még nem következik, hogy létezik decilis eloszlás is, mert az iménti problémák adódhatnak.

 

Módusz, medián, átlag, kvartilisek

03
Itt jön egy fantasztikus
Középiskolai matek képsor.

Hozzászólások

Még nincs hozzászólás. Legyél Te az első!