Statisztika és valszám alapok epizód tartalma:
Medián, módusz, kvartilisek, szórás, relatív szórás, gyakoriság, relatív gyakoriság, gyakorisági sor, értékösszeg sor, koncentráció, Lorenz-görbe, doboz-ábra, alakmutatók, Pearson-mutató, F-mutató.
Koncentráció, Lorenz-görbe
Hasonlítsuk össze a Föld néhány országának egy főre jutó GDP-jét és az országok népességét. Az európai országok egy főre jutó GDP-je úgy 40 ezer USA-dollár körül mozog, igaz kelet felé haladva ez jelentős csökkenésnek indul és Oroszországnál eléri a 10 ezret. USA és Kanada is ezt a 40 ezres szintet hozza, Mexikó pedig 8 ezret. Aztán lejjebb haladva Dél-Amerikában már a 10 ezer számít kiemelkedően magasnak. Ázsiában él a Föld lakosságának több, mint fele. Az egy főre jutó GDP azonban 2000 USA-dollár körül mozog. Ezek a megdöbbentő adatok sokakat vallások megalapítására sarkallnak, mások terrorista hálózatokat építenek ki, mi viszont belevágunk a Lorenz-görbe fölrajzolásába. A Lorenz-görbe az egyik legkiválóbb szemléltető eszköze a koncentrációnak, most éppen az egy főre jutó GDP nagyon erős koncentrálódásának. A koncentráció a sokasághoz tartozó teljes értékösszeg jelentős részének vagy egészének kevés egységre történő összpontosulása.
Ország
GDP/fő
(ezer USA-dollár, 2008)
Népesség
(millió)
Ausztria
46 600
8,4
Belgium
44 730
10,4
Csehország
17 280
10,2
Dánia
60 800
5,5
Franciaország
43 640
61,4
Németország
41 400
82,7
Magyarország
13 860
10,0
Norvégia
90 180
4,7
Nagy-Britannia
46 740
60,7
Olaszország
38 190
58,1
Oroszország
10 100
141,8
Svájc
55 780
7,6
Szlovákia
14 600
5,5
Ukrajna
3 307
46,0
Kanada
40 100
33,2
Mexikó
8 200
110,0
USA
47 330
304,8
Argentína
6 790
40,0
Brazília
6 600
192,0
Chile
10 590
16,8
Ausztrália
42 420
20,6
India
1 180
1 130,0
Indonézia
1 950
237,5
Irán
3 900
71,3
Kína
3 000
1 330,0
Japán
38 930
127,5
Pakisztán
940
167,2
Egyiptom
1 870
77,5
Etiópia
229
85
Kenya
640
38,5
Nigéria
1 020
150
Tanzánia
353
40,4
Készítsünk egy táblázatot, a Föld népességének egy főre jutó GDP szerinti megoszlásáról.
Az osztályközök a pontosság érdekében nem egyenletesek.
Első oszlopunk a gyakoriság, ami azt jelenti, hogy hány millió ember tartozik az adott GDP-szintet jelentő osztályközbe.
A következő oszlop a relatív gyakoriság. Jól látszik, hogy a népesség 30%-a tartozik a második osztályközbe és majdnem 30%-a a harmadikba, vagyis a Föld lakosságának jóval több, mint fele az 5000-es szint alatt van.
A kumulált relatív gyakoriság oszlopból látszik, hogy 70% van 5000 alatt, és 80% 10 ezer alatt. Magyarország a 14 ezer körüli szintjével a felső 20%-ba tartozik.
A következő oszlop az értékösszeg azt mutatja meg, hogy az egyes osztályokba tartozókra összesen mennyi GDP esik. A nyugati világ gazdaságilag fejlett országai a Föld lakosságának egytizedét teszik ki, de több GDP jut rá, mint az összes addigira együttvéve. Ezt jól szemlélteti a relatív értékösszeg és a kumulált relatív értékösszeg oszlop.
GDP/fő
(millió)
(ezer USA-dollár)
0-1 000
720
0,116
0,116
360 000
0,006
0,006
1 001-2 000
1 940
0,313
0,429
2 910 000
0,053
0,059
2 001-5 000
1 790
0,290
0,719
4 475 000
0,080
0,139
5 001-10 000
490
0,079
0,798
3 675 000
0,066
0,205
10 001-20 000
288
0,046
0,844
4 320 000
0,078
0,283
20 001-30 000
76
0,012
0,856
1 900 000
0,034
0,317
30 001-40 000
254
0,041
0,897
8 890 000
0,160
0,477
40 001-50 000
604
0,098
0,995
27 180 000
0,488
0,965
50 001-60 000
18
0,003
0,998
990 000
0,018
0,983
60 001-
15
0,002
1,000
975 000
0,017
1,000
Total
6 195
1,000
55 675 000
1,000
A Lorenz-görbe azt fejezi ki, hogy a gyakoriság egy adott százalékához az összérték hány százaléka tartozik. Az x tengelyen tehát a kumulált relatív gyakoriságot, míg az y tengelyen a kumulált relatív értékösszeget mérjük.
A Föld népességének 11,6%-ára az összes GDP 0,6%-a jut.
42,9%-ra még mindig csak 5,9% jut. 71,9%-ra mindössze 13,9% jut.
Könnyű belegondolni, hogy az y=x egyenes mentén a koncentráció nulla. Az y=x egyenes és a kapott görbe közötti területet hívjuk koncentrációs területnek, ez jellemzi a koncentráció mértékét, ami esetünkben igen magas.
A koncentráció kimutatásának egy másik egyszerű eszköze a kvantilis-eloszlás, vagyis ha olyan gyakorisági sort szerkesztünk, ahol minden gyakoriság egyenlő. Ha minden relatív értékösszeg (Zi) is egyenlő, az a koncentráció hiányát jelenti. Minél egyenlőtlenebbül alakulnak a relatív értékösszegek, a koncentráció annál nagyobb.
A kvartilis-elsozlás például úgy készül, hogy a Föld lakosságát az egy főre jutó GDP szerint sorba állítjuk, és négy egyenlő létszámú csoportra osztjuk. Az osztályközök határai ekkor kvartilisek lesznek.
GDP/fő
(millió)
0-1 100
1 548,75
0,010
1 101-2 100
1 548,75
0,027
2 101-11 000
1 548,75
0,110
11 001-90 000
1 548,75
0,853
Total
6 195
1,000
A kvintilis-eloszlás pedig ötödökre osztja.
GDP/fő
(millió)
0-1 000
1 239
0,007
1 001-2 000
1 239
0,020
2 001-4 000
1 239
0,042
4 001-20 000
1 239
0,167
20 001-90 000
1 239
0,764
Total
6 195
1,000
A koncentráció mértékének egy számmal való jellemzésére a koncentrációs terület kiszámolása viszonylag körülményes. Ezen kívül az egyik legalkalmasabb mutató az úgynevezett Herfindahl-index. Kiszámolása a Z értékekből történik:
Az eredeti táblázatunkban ezt kiszámolva
A Herfindahl-index, a kiszámolásának módja miatt mindig 1/N és 1 közötti értékkel méri a koncentráció fokát. Ha HI=1/N akkor minden egység egyformán részesedik a teljes értékösszegből, ha pedig HI=1, akkor a lehető legerősebb a koncentráció.
Statisztika és valszám alapok epizód.