Idősorok

Amikor szumma t nulla

Idősorok elemzése, a lineáris trend

Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot jelöli.

A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
a hosszú távú folyamatokat leíró trendből,
az ettől szabályos ingadozással eltérő szezonális komponensből,
a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
a véletlen összetevőből.

Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.

Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni. A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is.

vagy Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd

vagy Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.

vagy Ez a véletlen komponens.

Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.
vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.

Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.

Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket.
A keresett lineáris trend egyenes egyenlete legyen
A tényleges értékektől az eltérés ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.

A szóban forgó négyzetösszeg tehát

ami tulajdonképpen egy kétváltozós függvény, változói és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.

A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a

normálegyenlet a szerinti derivált, csak elosztva 2-vel és átrendezve, a

normálegyenlet pedig a szerinti derivált, csak ez is elosztva 2-vel és átrendezve.

Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend és együtthatóit megkapjuk.

Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne.

év forgalom (1000 gombóc)

I. negyedév
II. negyedév III. negyedév IV. negyedév

2008

2009

2010

2011

Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.

és

A normálegyenletek tehát

Megoldva az egyenletrendszert kapjuk, hogy
és

A lineáris trend tehát

Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője.

A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.

A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:

A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16.
jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.

Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:

A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.

Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.

Most éppen

A korrigált szezonális eltérések így:

A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az

másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy

azt azonban igen, hogy

és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges -okat és a szezonalitással kiigazított trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.

év forgalom (1000 gombóc)
VALÓS

I. negyedév
II. negyedév III. negyedév IV. negyedév

év forgalom (1000 gombóc)
SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév
II. negyedév III. negyedév IV. negyedév

Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:

A szezonalitással kiigazítva pedig

Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.

Szezonális eltérés a lineáris trendben

Dekompozíciós modellek

A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:

a hosszú távú folyamatokat leíró trendből,

az ettől szabályos ingadozással eltérő szezonális komponensből,

a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és

a véletlen összetevőből.

[Szövegdoboz: A fagylaltárus jó fagyikat árul, ezért minden évben egyre többet ad el.]

lineáris trend

exponenciális trend

[Szövegdoboz: Nyáron azonban mindig többet, télen pedig kevesebbet ad el.]

[Szövegdoboz: Néha jön a szalmonella, ilyenkor pár hétre bezárják a boltot, ami ront a forgalmon.]

[Szövegdoboz: Egyszer a fagylaltmaffia felgyújtotta az üzletet és ez szintén okozott egy kis visszaesést az üzletmenetben.]

vagy Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd

vagy Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.

vagy Ez a véletlen komponens.

Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.

vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.

A keresett lineáris trend egyenes egyenlete legyen

A tényleges értékektől az eltérés ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.

A szóban forgó négyzetösszeg tehát

ami tulajdonképpen egy kétváltozós függvény, változói és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.

A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a

normálegyenlet a szerinti derivált, csak elosztva 2-vel és átrendezve, a

normálegyenlet pedig a szerinti derivált, csak ez is elosztva 2-vel és átrendezve.

év

forgalom (1000 gombóc)

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

2008

2009

2010

2011

Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.

és

A normálegyenletek tehát

Megoldva az egyenletrendszert kapjuk, hogy

és

A lineáris trend tehát

A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.

jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.

Most éppen

A korrigált szezonális eltérések így:

A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az

másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy

azt azonban igen, hogy

év

forgalom (1000 gombóc)

VALÓS

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

év

forgalom (1000 gombóc)

SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

A szezonalitással kiigazítva pedig

Az exponenciális trend

A trendszámítás másik legegyszerűbb és igen gyakori trendje az exponenciális trend. A valóságban azonban az exponenciális jellegű trendek jelentős része nem valódi exponenciális trend, hanem úgynevezett s-görbe. Az s-görbe kezdetben megegyezik az exponenciális trenddel, de egyszer aztán megtorpan. Tipikusan ilyen folyamat például egy járvány terjedése. Minél több ember fertőződik meg, a járvány annál gyorsabban terjed, tehát a trend exponenciális jellegű, ám egyszer eztán eléri a telítettségi szintet, amikor már nem tud több ember megfertőződni és a növekedés megáll. Szintén ilyen például a mobiltelefonok elterjedése, vagy az internetes közösségi oldalak felhasználói számának alakulása. A növekedés egyre gyorsuló ütemben folyik egy adott pontig, de amikor már a lakosság nagyon nagy része rendelkezik az adott termékkel, a növekedés lelassul.

Nézzünk meg egy ilyen exponenciális jellegű trendet. Vegyük például a januárban influenzában sajnálatosan megbetegedettek számát, adjuk meg az erre illeszkedő exponenciális trendet és elemezzük a kapott eredményt!

Influenzában megbetegedettek

száma január 1 és január 28 között

(ezer fő)

Az exponenciális trend egyenlete:

Ha mindkét oldalnak vesszük a logaritmusát, azzal visszavezetjük a feladatot a lineáris trendre.

ahol a logaritmus azonosságok miatt

És itt keressük az ln-es bétákat. Csakhogy ekkor az y-ok is ln-esek lesznek, tehát vennünk kell az eredeti táblázatunk adatainak a logaritmusát. Vagyis nem az eredeti adatokhoz illesztünk exponenciális trendet, hanem a logaritmizált adatokhoz lineárisat. Nem túl nehéz végiggondolni, hogy ez a módszer pici eltéréssel ugyan, de tulajdonképpen azt adja, ami nekünk kell.

Influenzában megbetegedettek

száma január 1 és január 28 között

(ezer fő)

Most pedig jönnek a normálegyenletek.

és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát vagyis

Hasonlítsuk össze a tényleges adatokat a trendvonallal.

Az ábrán jól látszik, hogy a tényleges adatok alakulását jól követi a trendvonal. Ezáltal viszonylag pontosnak számít az exponenciális trend alkalmazása januárban. Ha az adatokból szeretnénk megbecsülni, hogy hány beteg lesz január 31-én, nincs más dolgunk, mint megnézni, mit ad a képletünk, ha t=31.

Ami annyit jelent, hogy várhatóan 168 ezer megbetegedés lesz január 31-én. Feltéve, hogy a megbetegedések számának görbéje akkor még nem tér le az exponenciális ösvényről. A betegek száma ugyanis s-görbe mentén növekedik, tehát előbb-utóbb letér az exponenciális útról és a növekedése lelassul, majd megáll.

A lineáris és az exponenciális trend és szezonalitás

Az összehasonlítás kedvéért nézzük meg a lineáris és az exponenciális trendet is egy utazási iroda forgalmának elemzéséhez. Az iroda főleg sítúrákat, és nyári utakat szervez, így a téli és nyári szezonban nagyobb, a köztes időszakban kisebb a forgalma.

ÉV

forgalom

(1000 fő)

2011

TÉL

16,9

TAVASZ

13,6

NYÁR

20,6

ŐSZ

16,7

2012

TÉL

23,9

TAVASZ

20,4

NYÁR

26,5

ŐSZ

24,1

2013

TÉL

32,5

TAVASZ

30,1

NYÁR

39,7

ŐSZ

36,5

Először lássuk a lineáris trendet.

A normálegyenletek

és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

Nézzük meg!

Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.

Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.

ÉV

forgalom

(1000 fő)

forgalom

(1000 fő)

2011

TÉL

16,9

lg16,9=1,23

TAVASZ

13,6

lg13,6=1,13

NYÁR

20,6

lg20,6=1,31

ŐSZ

16,7

lg16,7=1,22

2012

TÉL

23,9

lg23,9=1,38

TAVASZ

20,4

lg20,4=1,31

NYÁR

26,5

lg26,5=1,42

ŐSZ

24,1

lg24,1=1,38

2013

TÉL

32,5

lg32,5=1,51

TAVASZ

30,1

lg30,1=1,48

NYÁR

39,7

lg39,7=1,59

ŐSZ

36,5

lg36,5=1,56

A normálegyenletek ugyanazok.

és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát vagyis

Nézzük meg ezt is!

Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.

LINEÁRIS TREND és EXPONENCIÁLIS TREND

VALÓS LIN. EXP.

16,9

13,54

14,98

13,6

15,65

16,32

20,6

17,76

17,79

16,7

19,87

19,39

23,9

21,98

21,14

20,4

24,09

23,04

26,5

26,2

25,12

24,1

28,31

27,38

32,5

30,42

29,84

30,1

32,53

39,7

34,64

35,45

36,5

36,75

38,65

Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele

A lineáris trend reziduális szórása

Az exponenciális trend reziduális szórása

Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.

Most térjünk rá a szezonalitás vizsgálatára.

A lineáris trend esetén a szezonális eltérés

VALÓS LIN. EXP.

16,9

13,54

14,98

13,6

15,65

16,32

20,6

17,76

17,79

16,7

19,87

19,39

23,9

21,98

21,14

20,4

24,09

23,04

26,5

26,2

25,12

24,1

28,31

27,38

32,5

30,42

29,84

30,1

32,53

39,7

34,64

35,45

36,5

36,75

38,65

itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.

A tél szezonalitása

A tavasz szezonalitása

A nyár szezonalitása

Az ősz szezonalitása

A korrigált szezonalitás pedig

Így

ÉV

forgalom

LIN.+szezon

2011

TÉL

16,01

TAVASZ

12,95

NYÁR

20,51

ŐSZ

17,35

2012

TÉL

24,45

TAVASZ

21,39

NYÁR

28,95

ŐSZ

25,79

2013

TÉL

32,89

TAVASZ

29,83

NYÁR

37,39

ŐSZ

34,23

Most jön az exponenciális trend.

A képlet ugyanaz, csak kivonás helyett osztás.

VALÓS LIN. EXP.

16,9

13,54

14,98

13,6

15,65

16,32

20,6

17,76

17,79

16,7

19,87

19,39

23,9

21,98

21,14

20,4

24,09

23,04

26,5

26,2

25,12

24,1

28,31

27,38

32,5

30,42

29,84

30,1

32,53

39,7

34,64

35,45

36,5

36,75

38,65

A tél szezonindexe

A tavasz szezonindexe

A nyár szezonindexe

Az ősz szezonindexe

Ezek átlaga lényegében 1, tehát a szezonindexeket most nem kell korrigálnunk.

ÉV

forgalom

EXP. x szezon

2011

TÉL

16,77

TAVASZ

14,36

NYÁR

19,75

ŐSZ

17,45

2012

TÉL

23,68

TAVASZ

20,28

NYÁR

27,88

ŐSZ

24,64

2013

TÉL

33,42

TAVASZ

28,62

NYÁR

39,35

ŐSZ

34,78

Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy

Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:

és

De mivel ugye

és

És így azt kapjuk, hogy

Lássuk csak, hogyan tudnánk teljesíteni, a feltételt.

Ha páratlan sok adat van, akkor könnyű:

adatok

-2

-1

De ha páros sok, akkor baj van:

adatok

-2

-1

Vagyis páratlan számú adatnál mindig a nulla van középen, páros számúnál viszont nincs középső elem, itt csak úgy lesz az összeg nulla, ha egy kis trükköt alkalmazunk:

adatok

-5

-3

-1

A konkrét esetre visszatérve, itt páros számú adatunk van, tehát

t VALÓS LIN. EXP.

-11

16,9

13,54

14,98

-9

13,6

15,65

16,32

-7

20,6

17,76

17,79

-5

16,7

19,87

19,39

-3

23,9

21,98

21,14

-1

20,4

24,09

23,04

26,5

26,2

25,12

24,1

28,31

27,38

32,5

30,42

29,84

30,1

32,53

39,7

34,64

35,45

36,5

36,75

38,65

A normálegyenletek:

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

6.0. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.

Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.

Előállított mennyiség

Raktározva

(a hónap elején)

jan.=100%

előző hónap=100%

marc.=100%

előző hónap=100%

jan.

125

febr.

120

110

1100

marc.

3500

apr.

150

3750

87,5

Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor

Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak

107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.

Előállított mennyiség

Raktárkészlet

(a hónap elején)

jan.=100%

előző hónap=100%

marc.=100%

előző hónap=100%

jan.

2500

1,25

1000

febr.

1,2

3000

1,375

1,1

1100

marc.

1,4

1,167

3500

0,7272

800

apr.

1,5

1,071

3750

0,875

700

Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?

Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor

Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.

A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:

6.1. Egy részvény árfolyamának alakulását 20 napig figyeltük. Illesszünk az adatokra három napos mozgóátlagolású trendet, majd lineáris trendet. Számítsuk ki a változás átlagos napi mértékét és hasonlítsuk össze a lineáris trend megfelelő paraméterével.

A tényleges idősor

A három napos mozgó átlag

Nézzük meg a lineáris trendet.

A normálegyenletek

és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

A lineáris trend együtthatója az árfolyam átlagos napi növekedését becsüli meg, a pedig a tengelymetszetet adja, vagyis a t=0 pillanatban a részvény becsült értékét. Most ami azt jelenti, hogy a napi átlagos árfolyam növekedés a lineáris trend szerint 0,697 USD. Az árfolyam napi változásának átlagos mértékét kiszámolhatjuk a

képlettel is.

A két eredmény eléggé eltér, aminek magyarázata az, hogy a lineáris trend sem vizsgált időszak elején, sem a végén nem jól illeszkedik a valós árfolyamokat jelentő görbére.

6.2. Egy új termék piacra történő bevezetésének adatai az alábbiak voltak.

év

1000 emberből a termékkel rendelkezők száma

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

2008

2009

2010

2011

Illesszünk az adatokra lineáris, majd exponenciális trendet és döntsük el, hogy melyik illeszkedik jobban. Mindkét esetben vizsgáljuk meg a szezonalitást.

Először lássuk a lineáris trendet.

A normálegyenletek

és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

Nézzük meg!

Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.

év

1000 emberből a termékkel rendelkezők száma

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

2008

2009

2010

2011

A normálegyenletek ugyanazok.

és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát vagyis

Nézzük meg ezt is!

Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.

LINEÁRIS TREND EXPONENCIÁLIS TREND

VALÓS LIN. EXP.

7,71

10,648

9,99

11,7128

12,27

12,88408

14,55

14,17249

16,83

15,58974

19,11

17,14871

21,39

18,86358

23,67

20,74994

25,95

22,82493

28,23

25,10743

30,51

27,61817

32,79

30,37999

35,07

33,41799

37,35

36,75978

39,63

40,43576

41,91

44,47934

A lineáris trend reziduális szórása

Az exponenciális trend reziduális szórása

Az exponenciális trend reziduális szórása jóval kisebb, tehát valóban az illeszkedik jobban.

Most térjünk rá a szezonalitás vizsgálatára.

A lineáris trend esetén a szezonális eltérés

itt n az összes szezon száma, most 16, p pedig a szezontípusok száma, ami 4.

Ekkor az első negyedév szezonalitása

Az második negyedév szezonalitása

A harmadik negyedév szezonalitása

A negyedik negyedév szezonalitása

A korrigált szezonalitás pedig

Így

év

1000 emberből a termékkel rendelkezők száma

SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

Most jön az exponenciális trend.

A képlet ugyanaz, csak kivonás helyett osztás.

Az első negyedév szezonindexe

Az második negyedév szezonindexe

A harmadik negyedév szezonindexe

A negyedik negyedév szezonindexe

A korrigált szezonalitás pedig

Így

év

1000 emberből a termékkel rendelkezők száma

SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

10,5

11,7

13,1

13,9

15,4

17,1

19,2

20,5

22,5

25,1

28,2

29,9

32,9

36,7

41,2

43,8

6.3. Egy üzem termelése három egymást követő évben az alábbiak szerint alakult. Illesszünk az adatsorra lineáris majd exponenciális trendet, vizsgáljuk meg, hogy melyik illeszkedik jobban, és adjuk meg a szezonalitást.

ÉV

termelés

(1000 tonna)

2011

TÉL

120

TAVASZ

142

NYÁR

166

ŐSZ

196

2012

TÉL

240

TAVASZ

256

NYÁR

324

ŐSZ

360

2013

TÉL

420

TAVASZ

512

NYÁR

576

ŐSZ

600

Először lássuk a lineáris trendet.

A normálegyenletek

és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

Nézzük meg!

Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.

Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.

ÉV

termelés

(1000 tonna)

termelés

(1000 tonna)

2011

TÉL

120

lg120=2,08

TAVASZ

142

lg142=2,15

NYÁR

166

lg166=2,22

ŐSZ

196

lg196=2,29

2012

TÉL

240

lg240=2,38

TAVASZ

256

lg256=2,41

NYÁR

324

lg324=2,51

ŐSZ

360

lg360=2,56

2013

TÉL

420

lg420=2,62

TAVASZ

512

lg512=2,71

NYÁR

576

lg576=2,76

ŐSZ

600

lg600=2,78

A normálegyenletek ugyanazok.

és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát vagyis

Nézzük meg ezt is!

Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.

LINEÁRIS TREND és EXPONENCIÁLIS TREND

VALÓS LIN. EXP.

120

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

A lineáris trend reziduális szórása

Az exponenciális trend reziduális szórása

Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.

Most térjünk rá a szezonalitás vizsgálatára.

A lineáris trend esetén a szezonális eltérés

VALÓS LIN. EXP.

120

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.

A tél szezonalitása

A tavasz szezonalitása

A nyár szezonalitása

Az ősz szezonalitása

Most marhajók a szezonális eltéréseink, mert

Így aztán nem is kell korrigálni.

VALÓS LIN. EXP.

120

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

ÉV

forgalom

LIN.+szezon

2011

TÉL

TAVASZ

119,33

NYÁR

171,33

ŐSZ

201,33

2012

TÉL

260

TAVASZ

303,33

NYÁR

355,33

ŐSZ

385,34

2013

TÉL

444

TAVASZ

487,33

NYÁR

539,33

ŐSZ

569,67

Most jön az exponenciális trend.

A képlet ugyanaz, csak kivonás helyett osztás.

VALÓS LIN. EXP.

120

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

A tél szezonindexe

A tavasz szezonindexe

A nyár szezonindexe

Az ősz szezonindexe

Ezek is elég jók, így korrigálni itt sem kell.

Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy

Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:

és

De mivel ugye

és

Exponenciális trend

Lineáris, exponenciális és mozgóátlagolású trend 3.0

FELADAT | Mozgóátlagolású és lineáris trend

FELADAT | Lineáris és exponenciális trend

Szezonindexek az exponenciális trendben

Mozgóátlagok, trendszámítás mozgóátlagolással

Azokat az adatsorokat nevezzük idősornak, amely egy – vagy több – ismérv időben történő megoszlását írja le. Legjobb lesz, ha nézünk néhány példát.

Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.

év

megbukott

vizsgázók száma

2007

350

2008

380

2009

420

2010

450

Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa szerencsés esetben mindig ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem volna ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik rubrikában két év megbukott hallgatóinak száma szerepel, akkor például a bukottak száma 350, 380, 870. A látszólagos ugrás azonban csak a csalás miatt van.

Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.

Nézzünk egy másik példát is idősorra. Vegyük, mondjuk egy országban a gépkocsi tulajdonosok és a közúti balesetek számának évenkénti megoszlását.

év

gépkocsi

tulajdonosok száma

közúti

balesetek száma

2007

2 315 421

81 256

2008

2 531 254

80 578

2009

2 624 322

79 875

2010

2 598 378

79 756

A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.

Ha az adatok összeadásával kapott eredmény értelmes,

az idősort tartamidősornak nevezzük. Ilyen például táblázatunkban a közúti balesetek száma. Ezeket összeadva kiderül, hány baleset volt a négy év során.

Ha az adatok összeadásával kapott eredmény nem értelmes,

az idősort állapotidősornak nevezzük. Ilyen a táblázatban a gépkocsi tulajdonosok száma. Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.

A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák – innen ered a nevük is – tehát egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb.

Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában.

Az idősorban bekövetkező változásokat általában százalékosan szokás megadni, az úgynevezett viszonyszámokkal. Vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.

Nézzünk egy feladatot!

Az alábbi táblázat egy mozi forgalmának és jegyárainak évenkénti megoszlását tartalmazza.

év

TARTAMIDŐSOR

forgalom

(millió fő)

ÁLLAPOTIDŐSOR

Jegyár

(jan.1-én)

2007

950

2008

5,4

1150

2009

5,1

1300

2010

4,9

1450

2011

1500

Lássuk a viszonyszámokat! A forgalom oszlopban tekintsük bázisévnek 2007-et. Ekkor a bázisviszonyszámok

év

TARTAMIDŐSOR

forgalom

(millió fő)

bázis

viszonyszám

(2007=100%)

ÁLLAPOTIDŐSOR

jegyár

2007

950

2008

1150

2009

1300

2010

1450

2011

1500

év

TARTAMIDŐSOR

forgalom

(millió fő)

bázis

viszonyszám

(2007=100%)

ÁLLAPOTIDŐSOR

jegyár

2007

950

2008

1150

2009

1300

2010

1450

2011

1500

A láncviszonyszámok mindig az előző évhez viszonyítanak.

év

TARTAMIDŐSOR

forgalom

(millió fő)

bázis

viszonyszám

(2007=100%)

lánc-

viszonyszám

(előző év=100%)

ÁLLAPOTIDŐSOR

jegyár

2007

nincs

950

2008

1150

2009

1300

2010

1450

2011

1500

A bázisviszonyszám és a láncviszonyszám jelentése mindig százalékos változás.

Ha például a 2009-et nézzük, 1,020 azt jelenti, hogy 2%-al volt nagyobb a forgalom, mint a bázisévben, 0,944 pedig azt jelenti, hogy 0,056-al tehát 5,6%-al volt kisebb a forgalom, mint az előző évben.

A láncviszonyszámokat nézzük meg a jegyárakra is,

a bázisviszonyszámot meg egy időre felejtsük el.

év

forgalom

(millió fő)

lánc-

viszonyszám

(előző év=100%)

Jegyár

lánc-

viszonyszám

(előző év=100%)

2007

nincs

2008

2009

2010

2011

Az évek során bekövetkezett változást kétféleképpen is szemléltethetjük. Az egyik lehetőség az átlagos különbség, ami a jegyáraknál például azt jelenti, hogy hány forinttal drágultak a jegyek átlagosan egy év alatt. Ezt a változás mértékének szokás nevezni.

Az átlagos változás mértéke

Tehát összeadogatjuk a drágulásokat, aztán elosztjuk – mivel is? Az évek száma n, de nem n-el osztunk. Azért nem n-el, mert a drágulások számával kell osztanunk és az nem n, hanem n-1, az egyik évről a másikra történő ugrások száma. Most a vizsgált időszak 2007-től 2011-ig tart, ami öt év ugyan, de ugrásból csak négy van, ezért kell néggyel osztani:

tehát átlagosan évente 137,5 forinttal drágult a mozizás. Ha valaki jártas az általános iskola matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:

Nem csak azt kérdezhetjük meg, hogy hány forinttal drágult a mozi, hanem azt is, hogy hány százalékos volt az éves áremelés. Ezt a változás ütemének hívjuk.

A változás üteme

Itt is azért van a gyökkitevőben n-1, mert nem az évek száma kell nekünk, hanem a változások száma, egyik évről másikra. Ez pedig n-1. A mozijegyek árának évenkénti változása tehát:

A változás mértéke:

A változás üteme:

A jegyek átlagosan 137,5 forinttal, 12%-al drágultak.

Ugyanezt megnézhetjük a mozilátogatók számának esetében is.

A változás mértéke:

A változás üteme:

Most térjünk rá az átlagok kiszámolására. Az átlagos nézőszám esetében tartamidősorunk van, vagyis van értelme összeadni az idősor adatait. Itt az átlagot a szokásos módon számoljuk:

Más a helyzet az átlagos jegyár esetében, ami állapotidősor, így az adatok összege értelmetlen. Ilyenkor úgynevezett kronologikus átlagot számolunk, ami

Nézzünk egy másik példát, ahol összefoglaljuk az eddigieket.

A következő táblázat egy autókereskedés raktárkészletének és eladásainak időbeli eloszlását tartalmazza. Számoljuk ki az összes eddigi állatfajtát.

hónap

raktárkészlet

(a hónap elején)

eladott

mennyiség

jan.

210

150

feb.

350

120

mar.

310

100

apr.

300

120

maj.

290

A változások mértéke és üteme:

hónap

ÁLLAPOTIDŐSOR

raktárkészlet

(a hónap elején)

TARTAMIDŐSOR

eladott

mennyiség

jan.

feb.

mar.

apr.

maj.

hónap

ÁLLAPOTIDŐSOR

raktárkészlet

TARTAMIDŐSOR

eladott mennyiség

jan.

feb.

mar.

apr.

maj.

Változás

mértéke

Változás

üteme

átlag

2.4. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.

Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.

Előállított mennyiség

Raktározva

(a hónap elején)

jan.=100%

előző hónap=100%

marc.=100%

előző hónap=100%

jan.

125

febr.

120

110

1100

marc.

3500

apr.

150

3750

87,5

Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor

Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak

107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.

Előállított mennyiség

Raktárkészlet

(a hónap elején)

jan.=100%

előző hónap=100%

marc.=100%

előző hónap=100%

jan.

2500

1,25

1000

febr.

1,2

3000

1,375

1,1

1100

marc.

1,4

1,167

3500

0,7272

800

apr.

1,5

1,071

3750

0,875

700

Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?

Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.

A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:

2.5. Egy áruház raktárkészlete valamely termékből az alábbiak szerint alakult:

hónap

Készlet

Jan=100%

Előző

hónap=100%

Változás %-ban

február=100%

Változás

februárhoz képest (db)

Aktuális készlet a hónap végén (db)

Jan.

100

-20

-10

Febr.

Márc.

110

Ápr.

+16

Máj.

600

Jún.

Júl.

130

a) Töltsük ki a hiányzó részeket!

b) Mekkora volt az átlagos raktárkészlet ebből a termékből a második negyedévben?

Lineáris, exponenciális és mozgóátlagolású trend 1.0

Lineáris, exponenciális és mozgóátlagolású trend 2.0

Negyedévek		forgalom (1000 gombóc)
2018	Q1	\( y_1=100 \)
	Q2	\( y_2=122 \)
	Q3	\( y_3=154 \)
	Q4	\( y_4=132 \)
2019	Q1	\( y_5=111 \)
	Q2	\( y_6=144\)
	Q3	\( y_7=196\)
	Q4	\( y_8=140\)
2020	Q1	\( y_9=133\)
	Q2	\( y_{10}=156\)
	Q3	\( y_{11}=216\)
	Q4	\( y_{12}=181 \)
2021	Q1	\( y_{13}=160\)
	Q2	\( y_{14}=190\)
	Q3	\( y_{15}=242\)
	Q4	\( y_{16}=199\)

Influenzában megbetegedettek száma január 1 és január 28 között (ezer fő)
\( y_1=10 \)	\( y_8=19\)	\( y_{15}=35 \)	\( y_{22}=76\)
\( y_2=11\)	\( y_9=21\)	\( y_{16}=39\)	\( y_{23}=86\)
\( y_3=12\)	\( y_{10}=23\)	\( y_{17}=45\)	\( y_{24}=90\)
\( y_4=14\)	\( y_{11}=26\)	\( y_{18}=49\)	\( y_{25}=98\)
\( y_5=15\)	\( y_{12}=28 \)	\( y_{19}=57\)	\( y_{26}=110\)
\( y_6=17\)	\( y_{13}=31\)	\( y_{20}=63\)	\( y_{27}=120\)
\( y_7=18\)	\( y_{14}=33\)	\( y_{21}=69\)	\( y_{28}=132\)

Repülőtér forgalma (ezer fő)
Január.	2307
Február	2198
Március	2276
Április	2329
Május	2375

év	1000 emberből a termékkel rendelkezők száma
év	I. negyedév	II. negyedév	III. negyedév	IV. negyedév
2008	\( y_1=10 \)	\( y_2=12\)	\( y_3=14\)	\( y_4=15\)
2009	\( y_5=17\)	\( y_6=19\)	\( y_7=20\)	\( y_8=21\)
2010	\( y_9=23\)	\( y_{10}=25\)	\( y_{11}=28\)	\( y_{12}=30\)
2011	\( y_{13}=35\)	\( y_{14}=39 \)	\( y_{15}=43\)	\( y_{16}=46 \)

Adatelemzés 1

Ennek a témakörnek a képletei

Dekompozíciós modell

Lineáris trend egyenlete

Szezonalitás

Korrigált szezonális eltérések

Tartamidősor

Állapotidősor

Kronologikus átlag

Amikor szumma t nulla

Ennek a témakörnek a feladatai