Barion Pixel Mozgóátlagok, trendszámítás mozgóátlagolással | mateking
 

Adatelemzés 2 epizód tartalma:

Állapot idősor, tartam idősor, változás üteme és mértéke, kronologikus átlag, mozgóátlagok, mozgóátlagolású trend, simítás, szűrés, dekompozíciós idősormodellek, lineáris trend, exponenciális trend, trendegyenlet, normálegyenletek, szezonalitás, szezonális eltérés, szezonindex, szezonalitással kiigazított trend, szezonalitástól megtisztított trend.

A képsor tartalma

IDŐSOROK ELEMZÉSE

Azokat az adatsorokat nevezzük idősornak, melyek egy vagy több ismérv időben történő megoszlását írják le. Nézzünk erre egy példát.

Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.

év

megbukott

vizsgázók száma

2009

340

2010

350

2011

380

2012

420

2013

450

Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa általában ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik mezőbe mondjuk két év megbukott hallgatóinak számát írjuk, azt hihetjük, hogy a bukások száma hirtelen megugrott.

Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.

Nézzünk meg egy másik idősort is. Vegyük, mondjuk egy országban a gépkocsi

tulajdonosok és a közúti balesetek számának évenkénti megoszlását.

év

közúti

balesetek száma

gépkocsi

tulajdonosok száma

2010

81 256

2 315 421

2011

80 578

2 531 254

2012

79 875

2 624 322

2013

79 756

2 598 378

A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.

Ha az első oszlop tartalmát, vagyis a balesetek számát összeadjuk, akkor kiderül, hány baleset volt a négy év során, ez teljesen rendben is van.

Ha viszont a második oszlopot, vagyis a gépkocsi tulajdonosok számát nézzük, az adatok összeadásával kapott eredmény nem értelmes.

Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.

A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák, innen ered a nevük is, tehát mondjuk egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb. ilyenkor az adatok összeadása értelmes eredményt ad.

Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, például az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában, stb. és ilyenkor az adatok összeadása nem értelmes eredményt ad.

Az alábbi táblázat mondjuk egy üzlet havi fogkrémeladásait és raktárkészletét

tartalmazza.

hónap

TARTAMIDŐSOR

eladás

(db)

ÁLLAPOTIDŐSOR

raktárkészlet

(db, hónap 1-én)

Jan.

640

120

Febr.

720

150

Márc.

740

160

Ápr.

760

110

Máj.

730

100

Jún.

760

120

A havi eladás tartamidősor, míg a raktárkészlet állapotidősor.

Számoljuk ki az első negyedév átlagos forgalmát és raktárkészletét.

Az átlagos eladás a szokásos átlag:

Az átlagos raktárkészlet kiszámolásánál viszont van egy kis gond.

Az első negyedév az első három hónapot jelenti, valahogy így.

A táblázatban szereplő adatok a hónap elsejére vonatkoznak.

Ha az tehát az első három hónap raktárkészletét nézzük, az így kapott időszak nem három hónap, hanem csak két hónap + egy nap, ez pedig marhára nem az első negyedév. Ahhoz, hogy a vizsgált időszak valóban három hónap legyen, hozzá kell vennünk még egy adatot, az április elsejét is.

Az átlagot tehát négy hónap adataiból számoljuk ki, viszont csak három hónapos időtartamra. Az így kapott átlag egy speciális átlag, az úgynevezett kronologikus átlag.

Az átlagot tartamidősor esetében a szokásos módon számoljuk:

Állapotidősornál viszont mindig úgynevezett kronologikus átlagot számolunk:

Az idősorban bekövetkező változásokat általában százalékosan szokás megadni. Ezeket a változásokat a dinamikus viszonyszámok írják le. Kétféle van belőlük, vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.

Számoljuk ki például a havi eladás bázisviszonyszámait. Meg kell adnunk egy bázist, vagyis azt a hónapot amihez viszonyítunk. Legyen ez mondjuk a január.

hónap

TARTAMIDŐSOR

eladás

(db)

bázis

viszonyszám

(jan.=100%)

Jan.

Febr.

Márc.

Ápr.

Máj.

Jún.

A láncviszonyszámok mindig az előző évhez viszonyítanak.

hónap

TARTAMIDŐSOR

eladás

(db)

bázis

viszonyszám

(jan.=100%)

lánc-

viszonyszám

(előző hónap=100%)

Jan.

nincs

Febr.

Márc.

Ápr.

Máj.

Jún.

A bázisviszonyszámok és a láncviszonyszámok közötti kapcsolat a következő:

Egy másik nagyon fontos összefüggés, hogy

Vagyis a láncviszonyszám nem csak a konkrét adatokból, hanem a

bázisviszonyszámokból is számolható. Másként fogalmazva bázisviszonyszám pont olyan, mintha konkrét adat lenne. Nézzük meg.

Számoljuk ki mondjuk a táblázatunkban mennyi

és

A bázis természetesen nem csak január lehet, hanem bármelyik másik hónap is, például május is. Nézzük meg ezt is.

hónap

TARTAMIDŐSOR

eladás

(db)

bázis

viszonyszám

(jan.=100%)

bázis

viszonyszám

(máj.=100%)

lánc-

viszonyszám

(előző hónap=100%)

Jan.

nincs

Febr.

Márc.

Ápr.

Máj.

Jún.

Továbbra is igaz marad, hogy a bázisviszonyszám pont olyan, mintha konkrét adat lenne, tehát

és és

Mindegy tehát, hogy mit tekintünk bázisnak, a bázisviszonyszámokkal ugyanúgy számolhatunk, mint a konkrét adatokkal. Egyvalamit azonban nem tehetünk.

Két különböző bázis alapján számolt bázisviszonyszámot nem szabad összehasonlítani.

A hónapok során bekövetkezett változást kétféleképpen is szemléltethetjük.

Az egyik lehetőség az átlagos különbség, ami azt jelenti, hogy hány darabbal többet adtak el átlagosan havonta. Ezt a változás mértékének szokás nevezni.

A változás átlagos mértéke

Tehát összeadogatjuk a változásokat, aztán elosztjuk mivel is? A hónapok száma n, de nem n-el osztunk. Azért nem n-el, mert a változások számával kell osztanunk és az nem n, hanem n-1, az egyik hónapról a másikra történő ugrások száma. Most a vizsgált időszak januártól tart júniusig, ami hat hónap ugyan, de ugrásból csak öt van, ezért kell öttel osztani:

tehát átlagosan havonta 24 darabbal nő az eladás. Ha valaki jártas az általános iskolai

matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:

Nem csak azt kérdezhetjük meg, hogy hány darabbal nőtt az eladás, hanem azt is, hogy hány százalékos volt ez a növekedés. Ezt a változás ütemének hívjuk.

A változás üteme

Itt is azért van a gyökkitevőben n-1, mert nem a hónapok száma kell nekünk, hanem a változások száma, egyik hónapról másikra. Ez pedig n-1.

A változás üteme:

Az eladás átlagosan havonta 3,5%-al nőtt.

Mozgóátlagok

Az idősorok hosszabb távú trendjeinek meghatározásához a legegyszerűbb eljárás az úgynevezett mozgóátlagolás, aminek lényege, hogy az idősor egyes elemeit a körülötte lévő elemek átlagával helyettesítjük, kisimítva ezzel az esetleges erős hullámzásokat. Minél több tagú mozgóátlagot veszünk, a hullámzások annál jobban kisimulnak. Nézzük például a kőolaj hordónkénti árának alakulását 20 egymást követő napon. A tényleges idősor adatait először háromnapos mozgóátlaggal simítjuk.

A tényleges idősor

A három napos mozgó átlag

Most nézzük meg az öt napos mozgóátlagot is.

A tényleges idősor

nap

Hordónkénti ár

(USD)

1.

90

2.

91

3.

88

4.

87

5.

87

6.

86

7.

88

8.

91

9.

93

10.

94

11.

93

12.

95

13.

97

14.

98

15.

97

16.

100

17.

99

18.

102

19.

98

20.

95

Az öt napos mozgóátlag

nap

Hordónkénti ár

(USD)

1.

-

2.

-

3.

88,6

4.

87,8

5.

87,2

6.

87,8

7.

89

8.

90,4

9.

91,8

10.

93,2

11.

94,4

12.

95,4

13.

96

14.

97,4

15.

98,2

16.

99,2

17.

99,2

18.

98,8

19.

20.

A tényleges idősor

Az öt napos mozgóátlag

A mozgóátlagok gyakorlati jelentőssége egyrészt az ingadozások felesleges és zavaró hatásának kiszűrése. Ha rápillantunk a grafikonra, jól látjuk, hogy a hatodik naptól egészen a 17-ik napig az olajár tulajdonképpen folyamatosan drágult, hiába voltak néha egykét dolláros ingadozások. A mozgóátlag másik haszna, a jóslásban rejlik, vagyis segíthet előrejelezni a jövőben bekövetkező folyamatokat. Ha megfigyeljük, az öt napos mozgóátlag a 17-ik naptól csökkenni kezd, pedig az olajár ott még növekszik. A mozgóátlagnak ez a csökkenése a 18-ik naptól kezdődő tényleges csökkenést vetíti előre. Egyetlen aprócska gond ezzel az előrejelzéssel az, hogy az öt napos mozgóátlag számolásából adódóan mindig két nappal az események után kullog. Úgy pedig – mármint két nappal a sorsolás után – már a lottószámok is viszonylag könnyen megjósolhatók. Ha azonban képesek vagyunk nem túl pontatlan becslést adni a következő két nap árfolyamára, a mozgóátlag már viszonylag megbízható jóslatot tud adni a trend várható alakulására. De a jóslásokra még visszatérünk később.

Próbáljunk most meg kiszámolni egy négy napos mozgóátlagot is. Az eddigi számolási módszerünk, miszerint az adott elem körül elhelyezkedő elemeket átlagoljuk sajna csődöt mond. Páros számoknál ugyanis a szimmetria elvész. Vagy egy elem van a kiszemelt elem előtt és kettő utána, vagy fordítva. Nos ezt a rettenetes problémát szerencsére sikerül áthidalni a következő megoldással. Vegyünk a kiszemelt elem előtt is és után is másfél elemet, mégpedig így:

A tényleges idősor

nap

Hordónkénti ár

(USD)

1.

90

2.

91

3.

88

4.

87

5.

87

6.

86

7.

88

8.

91

9.

93

10.

94

11.

93

12.

95

13.

97

14.

98

15.

97

16.

100

17.

99

18.

102

19.

98

20.

95

Ezzel a problémát megoldottuk.

A mozgóátlagok kiszámolásának képlete tehát páros és páratlan tagú átlagok esetén eltérő.

Ha a tagok száma páratlan:

Ha pedig a tagok száma páros

 

Mozgóátlagok, trendszámítás mozgóátlagolással

05
hang
BelépekvagyRegisztrálok Back arrow Ugrás az
összeshez