Idősorok
Dekompozíciós modell
A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
- a hosszú távú folyamatokat leíró trendből,
- az ettől szabályos ingadozással eltérő szezonális komponensből,
- a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
- a véletlen összetevőből.
Lineáris trend egyenlete
A lineáris trend egyenlete nagyon egyszerű:
\( \hat{y}_t = \hat{b}_0 + \hat{b}_1 \cdot t \)
A \( \hat{b}_0 \) és \( \hat{b}_1 \) paramétereket Excelben vagy bármilyen statisztikai programban néhány kattintással megkapjuk.
Ha kézzel szeretnénk őket kiszámolni, akkor pedig ezekre a normálegyenletekre lesz hozzá szükség:
\( \sum_{t=1}^{n} y_t = n \cdot \hat{b}_0 + \hat{b}_1 \sum_{t=1}^{n} t \qquad \sum_{t=1}^{n} t \cdot y_t = \hat{b}_0 \cdot \sum_{t=1}^{n} t + \hat{b}_1 \sum_{t=1}^{n} t^2 \)
Szezonalitás
A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből.
Pl. ha a négy évszakot vesszük, akkor négy szezonunk van, van egy téli, egy tavaszi, egy nyári és egy őszi, ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is.
A szezonalitás képlete a következő:
\( s_j = \frac{\sum_{i=1}^{n/p} \left( y_{ij}-\hat{y}_{ij} \right) }{n/p} \)
A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket.
Vagyis a képletben $p$ a szezontípusok száma, $n$ pedig az összes szezon száma, $y_{ij}$ jelenti a tényleges értéket, ahol az $ij$-t úgy kell érteni, hogy az $i$-edik év $j$-edik szezonja. $\hat{y}_{ij}$ pedig ennek a trend szerinti megfelelője.
Korrigált szezonális eltérések
Ha összeadjuk a nyers szezonális eltéréseket, és ezek összege nem nulla, akkor vesszük az átlagukat.
\( \overline{s} = \frac{s_1+s_2+s_3+s_4}{4} \)
És ezt az átlagot mindegyik nyers szezonális eltérésből levonjuk.
\( \tilde{s}_1 = s_1 - \overline{s} \)
\( \tilde{s}_2 = s_2 - \overline{s} \)
\( \tilde{s}_3 = s_3 - \overline{s} \)
\( \tilde{s}_4 = s_4 - \overline{s} \)
Így kapjuk meg a korrigált szezonális eltéréseket
Függvények paritása
Minden olyan függvényt, ami az $y$ tengelyre szimmetrikus, páros függvénynek hívunk. Ezek a függvények azt tudják, hogy bármely $x$-re amelyre értelmezve vannak:
\( f(-x) = f(x) \)
Azokat a függvényeket, amelyek az origóra szimmetrikusak, páratlan függvénynek nevezzük. A páratlan függvények úgy működnek, hogy bármely $x$-re amelyre értelmezve vannak:
\( f(-x) = - f(x) \)
Polinomfüggvény
Ha az $x$ különböző pozitív egész kitevős hatványait összeadjuk vagy kivonjuk, akkor polinomokat kapunk.
A polinomfüggvény általános alakja:
\( f(x) = a_n x^n + a_{n-1} x^{n-1} + \dots a_1 x + a_0 \)
A legmagasabb fokú tag együtthatóját hívjuk főegyütthatónak.
Mozgóátlag
A mozgóátlagolás lényege, hogy az idősor egyes elemeit a körülötte lévő elemek átlagával helyettesítjük, kisimítva ezzel az esetleges erős hullámzásokat.
A mozgóátlagok kiszámolásának képlete páros és páratlan tagú átlagok esetén eltérő.
Ha a tagok száma páratlan:
\( \hat{y}_t = \frac{y_{t-k}+\dots+y_{t-1}+y_t+y_{t+1}+\dots+y_{t+k}}{2k+1} \)
Ha pedig a tagok száma páros:
\( \hat{y}_t = \frac{\frac{y_{t-k}}{2}+\dots+y_{t-1}+y_t+y_{t+1}+\dots+\frac{y_{t+k}}{2}}{2k} \)
Amikor szumma t nulla
Jelentősen csökkenthetjük a normálegyenletek által okozott szenvedéseket, ha az idő múlását jelentő $t$ paramétert úgy adjuk meg, hogy az összege éppen nulla legyen.
Ekkor
\( \sum y_t = n \cdot \hat{b}_0 \qquad \sum t\cdot y_t = \hat{b}_1 \sum t^2 \)
Íme 4 év fagyieladásai negyedéves bontásban:
Negyedévek | forgalom (1000 gombóc) |
|
2018 | Q1 | \( y_1=100 \) |
Q2 | \( y_2=122 \) | |
Q3 | \( y_3=154 \) | |
Q4 | \( y_4=132 \) | |
2019 | Q1 | \( y_5=111 \) |
Q2 | \( y_6=144\) | |
Q3 | \( y_7=196\) | |
Q4 | \( y_8=140\) | |
2020 | Q1 | \( y_9=133\) |
Q2 | \( y_{10}=156\) | |
Q3 | \( y_{11}=216\) | |
Q4 | \( y_{12}=181 \) | |
2021 | Q1 | \( y_{13}=160\) |
Q2 | \( y_{14}=190\) | |
Q3 | \( y_{15}=242\) | |
Q4 | \( y_{16}=199\) |
Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet.
Influenzában megbetegedettek száma január 1 és január 28 között (ezer fő) |
|||
\( y_1=10 \) | \( y_8=19\) | \( y_{15}=35 \) | \( y_{22}=76\) |
\( y_2=11\) | \( y_9=21\) | \( y_{16}=39\) | \( y_{23}=86\) |
\( y_3=12\) | \( y_{10}=23\) | \( y_{17}=45\) | \( y_{24}=90\) |
\( y_4=14\) | \( y_{11}=26\) | \( y_{18}=49\) | \( y_{25}=98\) |
\( y_5=15\) | \( y_{12}=28 \) | \( y_{19}=57\) | \( y_{26}=110\) |
\( y_6=17\) | \( y_{13}=31\) | \( y_{20}=63\) | \( y_{27}=120\) |
\( y_7=18\) | \( y_{14}=33\) | \( y_{21}=69\) | \( y_{28}=132\) |
Adjuk meg az exponenciális trendet.
A valóságban az exponenciális jellegű trendek jelentős része nem valódi exponenciális trend, hanem úgynevezett logisztikai görbe.
A logisztikai görbe kezdetben megegyezik az exponenciális trenddel, de egyszer aztán megtorpan.
Tipikusan ilyen folyamat például egy járvány terjedése. Minél több ember fertőződik meg, a járvány annál gyorsabban terjed, tehát a trend exponenciális jellegű, ám egyszer aztán eléri a telítettségi szintet, amikor már nem tud több ember megfertőződni és a növekedés megáll.
Ez itt az exponenciális trend egyenlete:
\( \hat{y}_t = \hat{b}_0 \cdot \hat{b}_1^t \)
Ha mindkét oldalnak vesszük a logaritmusát, azzal visszavezethetjük a feladatot a lineáris trendre...
EXPONENCIÁLIS TREND: \( \ln{\hat{y}_t} = \ln{\hat{b}_0} + \ln{\hat{b}_1}\cdot t \)
LINEÁRIS TREND: \( \hat{y}_t = \hat{b}_0 + \hat{b}_1 \cdot t \)
Egy webáruház havi forgalma három egymást követő évben az alábbiak szerint alakul. Illesszünk az adatsorra exponenciális trendet, adjuk meg a szezonindexeket és értelmezzük ezek jelentését.
ÉV | Forgalom (1000 fő) |
|
2020 | TÉL | 120 |
TAVASZ | 142 | |
NYÁR | 164 | |
ŐSZ | 196 | |
2021 | TÉL | 240 |
TAVASZ | 256 | |
NYÁR | 324 | |
ŐSZ | 360 | |
2022 | TÉL | 420 |
TAVASZ | 512 | |
NYÁR | 576 | |
ŐSZ | 600 |
Írjuk fel a repülőtér forgalmát közelítő lineáris trendet.
Repülőtér forgalma (ezer fő) |
|
Január. | 2307 |
Február | 2198 |
Március | 2276 |
Április | 2329 |
Május | 2375 |
Egy hegyi üdülőfalu forgalma főleg a téli síszezonban és a nyári túraszezonban erős, a köztes időszakokban gyengébb. Három év forgalmát vizsgáltuk meg. Az adatok alapján határozzuk meg a lineáris és az exponenciális trendet, majd készítsünk mozgóátlagolású trendet is.
ÉV | forgalom (1000 fő) |
|
2020 | TÉL | 16,9 |
TAVASZ | 13,6 | |
NYÁR | 20,6 | |
ŐSZ | 16,7 | |
2021 | TÉL | 23,9 |
TAVASZ | 20,4 | |
NYÁR | 26,5 | |
ŐSZ | 24,1 | |
2022 | TÉL | 32,5 |
TAVASZ | 30,1 | |
NYÁR | 39,7 | |
ŐSZ | 36,5 |
Egy részvény árfolyamának alakulását 20 napig figyeltük. Illesszünk az adatokra három napos mozgóátlagolású trendet, majd lineáris trendet. Számítsuk ki a változás átlagos napi mértékét és hasonlítsuk össze a lineáris trend megfelelő paramétereivel.
nap | Részvény ára (USD) |
1. | 90 |
2. | 91 |
3. | 88 |
4. | 87 |
5. | 87 |
6. | 86 |
7. | 88 |
8. | 91 |
9. | 93 |
10. | 94 |
11. | 93 |
12. | 95 |
13. | 97 |
14. | 98 |
15. | 97 |
16. | 100 |
17. | 99 |
18. | 102 |
19. | 98 |
20. | 95 |
Egy új termék piacra történő bevezetésének adatai az alábbiak voltak.
év | 1000 emberből a termékkel rendelkezők száma | |||
I. negyedév | II. negyedév | III. negyedév | IV. negyedév | |
2008 | \( y_1=10 \) | \( y_2=12\) | \( y_3=14\) | \( y_4=15\) |
2009 | \( y_5=17\) | \( y_6=19\) | \( y_7=20\) | \( y_8=21\) |
2010 | \( y_9=23\) | \( y_{10}=25\) | \( y_{11}=28\) | \( y_{12}=30\) |
2011 | \( y_{13}=35\) | \( y_{14}=39 \) | \( y_{15}=43\) | \( y_{16}=46 \) |
Illesszünk az adatokra lineáris, majd exponenciális trendet és döntsük el, hogy melyik illeszkedik jobban. Mindkét esetben vizsgáljuk meg a szezonalitást.
Egy üzem sörtermelése három egymást követő évben az alábbiak szerint alakult. Illesszünk az adatsorra lineáris majd exponenciális trendet, vizsgáljuk meg, hogy melyik illeszkedik jobban, és adjunk becslést a következő év sörtermelésére a jobban illeszkedő trend alapján, szezonalitással korrigálva.
ÉV | termelés (1000 liter) | |
első | TÉL | 560 |
TAVASZ | 576 | |
NYÁR | 590 | |
ŐSZ | 565 | |
második | TÉL | 558 |
TAVASZ | 581 | |
NYÁR | 602 | |
ŐSZ | 579 | |
harmadik | TÉL | 567 |
TAVASZ | 598 | |
NYÁR | 607 | |
ŐSZ | 600 |
IDŐSOROK ELEMZÉSE
Azokat az adatsorokat nevezzük idősornak, melyek egy vagy több ismérv időben történő megoszlását írják le. Nézzünk erre egy példát.
Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.
év
megbukott
vizsgázók száma
2009
340
2010
350
2011
380
2012
420
2013
450
Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa általában ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik mezőbe mondjuk két év megbukott hallgatóinak számát írjuk, azt hihetjük, hogy a bukások száma hirtelen megugrott.
Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.
Nézzünk meg egy másik idősort is. Vegyük, mondjuk egy országban a gépkocsi
tulajdonosok és a közúti balesetek számának évenkénti megoszlását.
év
közúti
balesetek száma
gépkocsi
tulajdonosok száma
2010
81 256
2 315 421
2011
80 578
2 531 254
2012
79 875
2 624 322
2013
79 756
2 598 378
A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.
Ha az első oszlop tartalmát, vagyis a balesetek számát összeadjuk, akkor kiderül, hány baleset volt a négy év során, ez teljesen rendben is van.
Ha viszont a második oszlopot, vagyis a gépkocsi tulajdonosok számát nézzük, az adatok összeadásával kapott eredmény nem értelmes.
Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.
A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák, innen ered a nevük is, tehát mondjuk egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb. ilyenkor az adatok összeadása értelmes eredményt ad.
Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, például az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában, stb. és ilyenkor az adatok összeadása nem értelmes eredményt ad.
Az alábbi táblázat mondjuk egy üzlet havi fogkrémeladásait és raktárkészletét
tartalmazza.
hónap
TARTAMIDŐSOR
eladás
(db)
ÁLLAPOTIDŐSOR
raktárkészlet
(db, hónap 1-én)
Jan.
640
120
Febr.
720
150
Márc.
740
160
Ápr.
760
110
Máj.
730
100
Jún.
760
120
A havi eladás tartamidősor, míg a raktárkészlet állapotidősor.
Számoljuk ki az első negyedév átlagos forgalmát és raktárkészletét.
Az átlagos eladás a szokásos átlag:
Az átlagos raktárkészlet kiszámolásánál viszont van egy kis gond.
Az első negyedév az első három hónapot jelenti, valahogy így.
A táblázatban szereplő adatok a hónap elsejére vonatkoznak.
Ha az tehát az első három hónap raktárkészletét nézzük, az így kapott időszak nem három hónap, hanem csak két hónap + egy nap, ez pedig marhára nem az első negyedév. Ahhoz, hogy a vizsgált időszak valóban három hónap legyen, hozzá kell vennünk még egy adatot, az április elsejét is.
Az átlagot tehát négy hónap adataiból számoljuk ki, viszont csak három hónapos időtartamra. Az így kapott átlag egy speciális átlag, az úgynevezett kronologikus átlag.
Az átlagot tartamidősor esetében a szokásos módon számoljuk:
Állapotidősornál viszont mindig úgynevezett kronologikus átlagot számolunk:
Az idősorban bekövetkező változásokat általában százalékosan szokás megadni. Ezeket a változásokat a dinamikus viszonyszámok írják le. Kétféle van belőlük, vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.
Számoljuk ki például a havi eladás bázisviszonyszámait. Meg kell adnunk egy bázist, vagyis azt a hónapot amihez viszonyítunk. Legyen ez mondjuk a január.
hónap
TARTAMIDŐSOR
eladás
(db)
bázis
viszonyszám
(jan.=100%)
Jan.
Febr.
Márc.
Ápr.
Máj.
Jún.
A láncviszonyszámok mindig az előző évhez viszonyítanak.
hónap
TARTAMIDŐSOR
eladás
(db)
bázis
viszonyszám
(jan.=100%)
lánc-
viszonyszám
(előző hónap=100%)
Jan.
nincs
Febr.
Márc.
Ápr.
Máj.
Jún.
A bázisviszonyszámok és a láncviszonyszámok közötti kapcsolat a következő:
Egy másik nagyon fontos összefüggés, hogy
Vagyis a láncviszonyszám nem csak a konkrét adatokból, hanem a
bázisviszonyszámokból is számolható. Másként fogalmazva bázisviszonyszám pont olyan, mintha konkrét adat lenne. Nézzük meg.
Számoljuk ki mondjuk a táblázatunkban mennyi
és
A bázis természetesen nem csak január lehet, hanem bármelyik másik hónap is, például május is. Nézzük meg ezt is.
hónap
TARTAMIDŐSOR
eladás
(db)
bázis
viszonyszám
(jan.=100%)
bázis
viszonyszám
(máj.=100%)
lánc-
viszonyszám
(előző hónap=100%)
Jan.
nincs
Febr.
Márc.
Ápr.
Máj.
Jún.
Továbbra is igaz marad, hogy a bázisviszonyszám pont olyan, mintha konkrét adat lenne, tehát
és és
Mindegy tehát, hogy mit tekintünk bázisnak, a bázisviszonyszámokkal ugyanúgy számolhatunk, mint a konkrét adatokkal. Egyvalamit azonban nem tehetünk.
Két különböző bázis alapján számolt bázisviszonyszámot nem szabad összehasonlítani.
A hónapok során bekövetkezett változást kétféleképpen is szemléltethetjük.
Az egyik lehetőség az átlagos különbség, ami azt jelenti, hogy hány darabbal többet adtak el átlagosan havonta. Ezt a változás mértékének szokás nevezni.
A változás átlagos mértéke
Tehát összeadogatjuk a változásokat, aztán elosztjuk mivel is? A hónapok száma n, de nem n-el osztunk. Azért nem n-el, mert a változások számával kell osztanunk és az nem n, hanem n-1, az egyik hónapról a másikra történő ugrások száma. Most a vizsgált időszak januártól tart júniusig, ami hat hónap ugyan, de ugrásból csak öt van, ezért kell öttel osztani:
tehát átlagosan havonta 24 darabbal nő az eladás. Ha valaki jártas az általános iskolai
matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:
Nem csak azt kérdezhetjük meg, hogy hány darabbal nőtt az eladás, hanem azt is, hogy hány százalékos volt ez a növekedés. Ezt a változás ütemének hívjuk.
A változás üteme
Itt is azért van a gyökkitevőben n-1, mert nem a hónapok száma kell nekünk, hanem a változások száma, egyik hónapról másikra. Ez pedig n-1.
A változás üteme:
Az eladás átlagosan havonta 3,5%-al nőtt.
Mozgóátlagok
Az idősorok hosszabb távú trendjeinek meghatározásához a legegyszerűbb eljárás az úgynevezett mozgóátlagolás, aminek lényege, hogy az idősor egyes elemeit a körülötte lévő elemek átlagával helyettesítjük, kisimítva ezzel az esetleges erős hullámzásokat. Minél több tagú mozgóátlagot veszünk, a hullámzások annál jobban kisimulnak. Nézzük például a kőolaj hordónkénti árának alakulását 20 egymást követő napon. A tényleges idősor adatait először háromnapos mozgóátlaggal simítjuk.
A tényleges idősor
A három napos mozgó átlag
Most nézzük meg az öt napos mozgóátlagot is.
A tényleges idősor
nap
Hordónkénti ár
(USD)
1.
90
2.
91
3.
88
4.
87
5.
87
6.
86
7.
88
8.
91
9.
93
10.
94
11.
93
12.
95
13.
97
14.
98
15.
97
16.
100
17.
99
18.
102
19.
98
20.
95
Az öt napos mozgóátlag
nap
Hordónkénti ár
(USD)
1.
-
2.
-
3.
88,6
4.
87,8
5.
87,2
6.
87,8
7.
89
8.
90,4
9.
91,8
10.
93,2
11.
94,4
12.
95,4
13.
96
14.
97,4
15.
98,2
16.
99,2
17.
99,2
18.
98,8
19.
20.
A tényleges idősor
Az öt napos mozgóátlag
A mozgóátlagok gyakorlati jelentőssége egyrészt az ingadozások felesleges és zavaró hatásának kiszűrése. Ha rápillantunk a grafikonra, jól látjuk, hogy a hatodik naptól egészen a 17-ik napig az olajár tulajdonképpen folyamatosan drágult, hiába voltak néha egykét dolláros ingadozások. A mozgóátlag másik haszna, a jóslásban rejlik, vagyis segíthet előrejelezni a jövőben bekövetkező folyamatokat. Ha megfigyeljük, az öt napos mozgóátlag a 17-ik naptól csökkenni kezd, pedig az olajár ott még növekszik. A mozgóátlagnak ez a csökkenése a 18-ik naptól kezdődő tényleges csökkenést vetíti előre. Egyetlen aprócska gond ezzel az előrejelzéssel az, hogy az öt napos mozgóátlag számolásából adódóan mindig két nappal az események után kullog. Úgy pedig – mármint két nappal a sorsolás után – már a lottószámok is viszonylag könnyen megjósolhatók. Ha azonban képesek vagyunk nem túl pontatlan becslést adni a következő két nap árfolyamára, a mozgóátlag már viszonylag megbízható jóslatot tud adni a trend várható alakulására. De a jóslásokra még visszatérünk később.
Próbáljunk most meg kiszámolni egy négy napos mozgóátlagot is. Az eddigi számolási módszerünk, miszerint az adott elem körül elhelyezkedő elemeket átlagoljuk sajna csődöt mond. Páros számoknál ugyanis a szimmetria elvész. Vagy egy elem van a kiszemelt elem előtt és kettő utána, vagy fordítva. Nos ezt a rettenetes problémát szerencsére sikerül áthidalni a következő megoldással. Vegyünk a kiszemelt elem előtt is és után is másfél elemet, mégpedig így:
A tényleges idősor
nap
Hordónkénti ár
(USD)
1.
90
2.
91
3.
88
4.
87
5.
87
6.
86
7.
88
8.
91
9.
93
10.
94
11.
93
12.
95
13.
97
14.
98
15.
97
16.
100
17.
99
18.
102
19.
98
20.
95
Ezzel a problémát megoldottuk.
A mozgóátlagok kiszámolásának képlete tehát páros és páratlan tagú átlagok esetén eltérő.
Ha a tagok száma páratlan:
Ha pedig a tagok száma páros
Dekompozíciós modellek
Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot jelöli.
A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
a hosszú távú folyamatokat leíró trendből,
az ettől szabályos ingadozással eltérő szezonális komponensből,
a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
a véletlen összetevőből.
[Szövegdoboz: A fagylaltárus jó fagyikat árul, ezért minden évben egyre többet ad el.]
lineáris trend
exponenciális trend
[Szövegdoboz: Nyáron azonban mindig többet, télen pedig kevesebbet ad el.]
[Szövegdoboz: Néha jön a szalmonella, ilyenkor pár hétre bezárják a boltot, ami ront a forgalmon.]
[Szövegdoboz: Egyszer a fagylaltmaffia felgyújtotta az üzletet és ez szintén okozott egy kis visszaesést az üzletmenetben.]
Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.
Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni. A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is.
vagy Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd
vagy Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.
vagy Ez a véletlen komponens.
Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.
vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.
Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.
Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket.
A keresett lineáris trend egyenes egyenlete legyen
A tényleges értékektől az eltérés ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.
A szóban forgó négyzetösszeg tehát
ami tulajdonképpen egy kétváltozós függvény, változói és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.
A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a
normálegyenlet a szerinti derivált, csak elosztva 2-vel és átrendezve, a
normálegyenlet pedig a szerinti derivált, csak ez is elosztva 2-vel és átrendezve.
Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend és együtthatóit megkapjuk.
Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne.
év
forgalom (1000 gombóc)
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
2008
2009
2010
2011
Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.
és
A normálegyenletek tehát
Megoldva az egyenletrendszert kapjuk, hogy
és
A lineáris trend tehát
Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője.
A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.
A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:
A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16.
jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.
Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:
A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.
Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.
Most éppen
A korrigált szezonális eltérések így:
A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az
másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy
azt azonban igen, hogy
és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges -okat és a szezonalitással kiigazított trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.
év
forgalom (1000 gombóc)
VALÓS
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
09
10
11
év
forgalom (1000 gombóc)
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
09
10
11
Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:
A szezonalitással kiigazítva pedig
Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.
Az exponenciális trend
A trendszámítás másik legegyszerűbb és igen gyakori trendje az exponenciális trend. A valóságban azonban az exponenciális jellegű trendek jelentős része nem valódi exponenciális trend, hanem úgynevezett s-görbe. Az s-görbe kezdetben megegyezik az exponenciális trenddel, de egyszer aztán megtorpan. Tipikusan ilyen folyamat például egy járvány terjedése. Minél több ember fertőződik meg, a járvány annál gyorsabban terjed, tehát a trend exponenciális jellegű, ám egyszer eztán eléri a telítettségi szintet, amikor már nem tud több ember megfertőződni és a növekedés megáll. Szintén ilyen például a mobiltelefonok elterjedése, vagy az internetes közösségi oldalak felhasználói számának alakulása. A növekedés egyre gyorsuló ütemben folyik egy adott pontig, de amikor már a lakosság nagyon nagy része rendelkezik az adott termékkel, a növekedés lelassul.
Nézzünk meg egy ilyen exponenciális jellegű trendet. Vegyük például a januárban influenzában sajnálatosan megbetegedettek számát, adjuk meg az erre illeszkedő exponenciális trendet és elemezzük a kapott eredményt!
Influenzában megbetegedettek
száma január 1 és január 28 között
(ezer fő)
Az exponenciális trend egyenlete:
Ha mindkét oldalnak vesszük a logaritmusát, azzal visszavezetjük a feladatot a lineáris trendre.
ahol a logaritmus azonosságok miatt
És itt keressük az ln-es bétákat. Csakhogy ekkor az y-ok is ln-esek lesznek, tehát vennünk kell az eredeti táblázatunk adatainak a logaritmusát. Vagyis nem az eredeti adatokhoz illesztünk exponenciális trendet, hanem a logaritmizált adatokhoz lineárisat. Nem túl nehéz végiggondolni, hogy ez a módszer pici eltéréssel ugyan, de tulajdonképpen azt adja, ami nekünk kell.
Influenzában megbetegedettek
száma január 1 és január 28 között
(ezer fő)
Most pedig jönnek a normálegyenletek.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Hasonlítsuk össze a tényleges adatokat a trendvonallal.
Az ábrán jól látszik, hogy a tényleges adatok alakulását jól követi a trendvonal. Ezáltal viszonylag pontosnak számít az exponenciális trend alkalmazása januárban. Ha az adatokból szeretnénk megbecsülni, hogy hány beteg lesz január 31-én, nincs más dolgunk, mint megnézni, mit ad a képletünk, ha t=31.
Ami annyit jelent, hogy várhatóan 168 ezer megbetegedés lesz január 31-én. Feltéve, hogy a megbetegedések számának görbéje akkor még nem tér le az exponenciális ösvényről. A betegek száma ugyanis s-görbe mentén növekedik, tehát előbb-utóbb letér az exponenciális útról és a növekedése lelassul, majd megáll.
A lineáris és az exponenciális trend és szezonalitás
Az összehasonlítás kedvéért nézzük meg a lineáris és az exponenciális trendet is egy utazási iroda forgalmának elemzéséhez. Az iroda főleg sítúrákat, és nyári utakat szervez, így a téli és nyári szezonban nagyobb, a köztes időszakban kisebb a forgalma.
ÉV
forgalom
(1000 fő)
2011
TÉL
16,9
TAVASZ
13,6
NYÁR
20,6
ŐSZ
16,7
2012
TÉL
23,9
TAVASZ
20,4
NYÁR
26,5
ŐSZ
24,1
2013
TÉL
32,5
TAVASZ
30,1
NYÁR
39,7
ŐSZ
36,5
Először lássuk a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
Nézzük meg!
Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.
Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.
ÉV
forgalom
(1000 fő)
forgalom
(1000 fő)
2011
TÉL
16,9
lg16,9=1,23
TAVASZ
13,6
lg13,6=1,13
NYÁR
20,6
lg20,6=1,31
ŐSZ
16,7
lg16,7=1,22
2012
TÉL
23,9
lg23,9=1,38
TAVASZ
20,4
lg20,4=1,31
NYÁR
26,5
lg26,5=1,42
ŐSZ
24,1
lg24,1=1,38
2013
TÉL
32,5
lg32,5=1,51
TAVASZ
30,1
lg30,1=1,48
NYÁR
39,7
lg39,7=1,59
ŐSZ
36,5
lg36,5=1,56
A normálegyenletek ugyanazok.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Nézzük meg ezt is!
Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.
LINEÁRIS TREND és EXPONENCIÁLIS TREND
VALÓS LIN. EXP.
16,9
13,54
14,98
13,6
15,65
16,32
20,6
17,76
17,79
16,7
19,87
19,39
23,9
21,98
21,14
20,4
24,09
23,04
26,5
26,2
25,12
24,1
28,31
27,38
32,5
30,42
29,84
30,1
32,53
32,53
39,7
34,64
35,45
36,5
36,75
38,65
Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele
A lineáris trend reziduális szórása
Az exponenciális trend reziduális szórása
Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.
Most térjünk rá a szezonalitás vizsgálatára.
A lineáris trend esetén a szezonális eltérés
VALÓS LIN. EXP.
16,9
13,54
14,98
13,6
15,65
16,32
20,6
17,76
17,79
16,7
19,87
19,39
23,9
21,98
21,14
20,4
24,09
23,04
26,5
26,2
25,12
24,1
28,31
27,38
32,5
30,42
29,84
30,1
32,53
32,53
39,7
34,64
35,45
36,5
36,75
38,65
itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.
A tél szezonalitása
A tavasz szezonalitása
A nyár szezonalitása
Az ősz szezonalitása
A korrigált szezonalitás pedig
Így
ÉV
forgalom
LIN.+szezon
2011
TÉL
16,01
TAVASZ
12,95
NYÁR
20,51
ŐSZ
17,35
2012
TÉL
24,45
TAVASZ
21,39
NYÁR
28,95
ŐSZ
25,79
2013
TÉL
32,89
TAVASZ
29,83
NYÁR
37,39
ŐSZ
34,23
Most jön az exponenciális trend.
A képlet ugyanaz, csak kivonás helyett osztás.
VALÓS LIN. EXP.
16,9
13,54
14,98
13,6
15,65
16,32
20,6
17,76
17,79
16,7
19,87
19,39
23,9
21,98
21,14
20,4
24,09
23,04
26,5
26,2
25,12
24,1
28,31
27,38
32,5
30,42
29,84
30,1
32,53
32,53
39,7
34,64
35,45
36,5
36,75
38,65
A tél szezonindexe
A tavasz szezonindexe
A nyár szezonindexe
Az ősz szezonindexe
Ezek átlaga lényegében 1, tehát a szezonindexeket most nem kell korrigálnunk.
ÉV
forgalom
EXP. x szezon
2011
TÉL
16,77
TAVASZ
14,36
NYÁR
19,75
ŐSZ
17,45
2012
TÉL
23,68
TAVASZ
20,28
NYÁR
27,88
ŐSZ
24,64
2013
TÉL
33,42
TAVASZ
28,62
NYÁR
39,35
ŐSZ
34,78
Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy
Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:
és
De mivel ugye
és
És így azt kapjuk, hogy
Lássuk csak, hogyan tudnánk teljesíteni, a feltételt.
Ha páratlan sok adat van, akkor könnyű:
t
adatok
-2
y
-1
y
0
y
1
y
2
y
De ha páros sok, akkor baj van:
t
adatok
-2
y
-1
y
0
y
1
y
2
y
3
y
Vagyis páratlan számú adatnál mindig a nulla van középen, páros számúnál viszont nincs középső elem, itt csak úgy lesz az összeg nulla, ha egy kis trükköt alkalmazunk:
t
adatok
-5
y
-3
y
-1
y
1
y
3
y
5
y
A konkrét esetre visszatérve, itt páros számú adatunk van, tehát
t VALÓS LIN. EXP.
-11
16,9
13,54
14,98
-9
13,6
15,65
16,32
-7
20,6
17,76
17,79
-5
16,7
19,87
19,39
-3
23,9
21,98
21,14
-1
20,4
24,09
23,04
1
26,5
26,2
25,12
3
24,1
28,31
27,38
5
32,5
30,42
29,84
7
30,1
32,53
32,53
9
39,7
34,64
35,45
11
36,5
36,75
38,65
A normálegyenletek:
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
6.0. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.
Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.
Előállított mennyiség
Raktározva
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
-
125
-
febr.
120
110
1100
marc.
3500
apr.
150
3750
87,5
Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor
Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak
107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.
Előállított mennyiség
Raktárkészlet
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
1
-
2500
1,25
-
1000
febr.
1,2
1,2
3000
1,375
1,1
1100
marc.
1,4
1,167
3500
1
0,7272
800
apr.
1,5
1,071
3750
0,875
0,875
700
Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?
Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor
Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.
A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:
6.1. Egy részvény árfolyamának alakulását 20 napig figyeltük. Illesszünk az adatokra három napos mozgóátlagolású trendet, majd lineáris trendet. Számítsuk ki a változás átlagos napi mértékét és hasonlítsuk össze a lineáris trend megfelelő paraméterével.
A tényleges idősor
A három napos mozgó átlag
Nézzük meg a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
A lineáris trend együtthatója az árfolyam átlagos napi növekedését becsüli meg, a pedig a tengelymetszetet adja, vagyis a t=0 pillanatban a részvény becsült értékét. Most ami azt jelenti, hogy a napi átlagos árfolyam növekedés a lineáris trend szerint 0,697 USD. Az árfolyam napi változásának átlagos mértékét kiszámolhatjuk a
képlettel is.
A két eredmény eléggé eltér, aminek magyarázata az, hogy a lineáris trend sem vizsgált időszak elején, sem a végén nem jól illeszkedik a valós árfolyamokat jelentő görbére.
6.2. Egy új termék piacra történő bevezetésének adatai az alábbiak voltak.
év
1000 emberből a termékkel rendelkezők száma
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
2008
2009
2010
2011
Illesszünk az adatokra lineáris, majd exponenciális trendet és döntsük el, hogy melyik illeszkedik jobban. Mindkét esetben vizsgáljuk meg a szezonalitást.
Először lássuk a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
Nézzük meg!
Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.
év
1000 emberből a termékkel rendelkezők száma
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
2008
2009
2010
2011
A normálegyenletek ugyanazok.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Nézzük meg ezt is!
Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.
LINEÁRIS TREND EXPONENCIÁLIS TREND
VALÓS LIN. EXP.
10
7,71
10,648
12
9,99
11,7128
14
12,27
12,88408
15
14,55
14,17249
17
16,83
15,58974
19
19,11
17,14871
20
21,39
18,86358
21
23,67
20,74994
23
25,95
22,82493
25
28,23
25,10743
28
30,51
27,61817
30
32,79
30,37999
35
35,07
33,41799
39
37,35
36,75978
43
39,63
40,43576
46
41,91
44,47934
Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele
A lineáris trend reziduális szórása
Az exponenciális trend reziduális szórása
Az exponenciális trend reziduális szórása jóval kisebb, tehát valóban az illeszkedik jobban.
Most térjünk rá a szezonalitás vizsgálatára.
A lineáris trend esetén a szezonális eltérés
itt n az összes szezon száma, most 16, p pedig a szezontípusok száma, ami 4.
Ekkor az első negyedév szezonalitása
Az második negyedév szezonalitása
A harmadik negyedév szezonalitása
A negyedik negyedév szezonalitása
A korrigált szezonalitás pedig
Így
év
1000 emberből a termékkel rendelkezők száma
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
09
10
11
Most jön az exponenciális trend.
A képlet ugyanaz, csak kivonás helyett osztás.
Az első negyedév szezonindexe
Az második negyedév szezonindexe
A harmadik negyedév szezonindexe
A negyedik negyedév szezonindexe
A korrigált szezonalitás pedig
Így
év
1000 emberből a termékkel rendelkezők száma
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
10,5
11,7
13,1
13,9
09
15,4
17,1
19,2
20,5
10
22,5
25,1
28,2
29,9
11
32,9
36,7
41,2
43,8
6.3. Egy üzem termelése három egymást követő évben az alábbiak szerint alakult. Illesszünk az adatsorra lineáris majd exponenciális trendet, vizsgáljuk meg, hogy melyik illeszkedik jobban, és adjuk meg a szezonalitást.
ÉV
termelés
(1000 tonna)
2011
TÉL
120
TAVASZ
142
NYÁR
166
ŐSZ
196
2012
TÉL
240
TAVASZ
256
NYÁR
324
ŐSZ
360
2013
TÉL
420
TAVASZ
512
NYÁR
576
ŐSZ
600
Először lássuk a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
Nézzük meg!
Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.
Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.
ÉV
termelés
(1000 tonna)
termelés
(1000 tonna)
2011
TÉL
120
lg120=2,08
TAVASZ
142
lg142=2,15
NYÁR
166
lg166=2,22
ŐSZ
196
lg196=2,29
2012
TÉL
240
lg240=2,38
TAVASZ
256
lg256=2,41
NYÁR
324
lg324=2,51
ŐSZ
360
lg360=2,56
2013
TÉL
420
lg420=2,62
TAVASZ
512
lg512=2,71
NYÁR
576
lg576=2,76
ŐSZ
600
lg600=2,78
A normálegyenletek ugyanazok.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Nézzük meg ezt is!
Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.
LINEÁRIS TREND és EXPONENCIÁLIS TREND
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele
A lineáris trend reziduális szórása
Az exponenciális trend reziduális szórása
Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.
Most térjünk rá a szezonalitás vizsgálatára.
A lineáris trend esetén a szezonális eltérés
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.
A tél szezonalitása
A tavasz szezonalitása
A nyár szezonalitása
Az ősz szezonalitása
Most marhajók a szezonális eltéréseink, mert
Így aztán nem is kell korrigálni.
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
ÉV
forgalom
LIN.+szezon
2011
TÉL
76
TAVASZ
119,33
NYÁR
171,33
ŐSZ
201,33
2012
TÉL
260
TAVASZ
303,33
NYÁR
355,33
ŐSZ
385,34
2013
TÉL
444
TAVASZ
487,33
NYÁR
539,33
ŐSZ
569,67
Most jön az exponenciális trend.
A képlet ugyanaz, csak kivonás helyett osztás.
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
A tél szezonindexe
A tavasz szezonindexe
A nyár szezonindexe
Az ősz szezonindexe
Ezek is elég jók, így korrigálni itt sem kell.
Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy
Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:
és
De mivel ugye
és
Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot jelöli.
A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
a hosszú távú folyamatokat leíró trendből,
az ettől szabályos ingadozással eltérő szezonális komponensből,
a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
a véletlen összetevőből.
Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.
Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni. A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is.
vagy Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd
vagy Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.
vagy Ez a véletlen komponens.
Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.
vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.
Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.
Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket.
A keresett lineáris trend egyenes egyenlete legyen
A tényleges értékektől az eltérés ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.
A szóban forgó négyzetösszeg tehát
ami tulajdonképpen egy kétváltozós függvény, változói és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.
A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a
normálegyenlet a szerinti derivált, csak elosztva 2-vel és átrendezve, a
normálegyenlet pedig a szerinti derivált, csak ez is elosztva 2-vel és átrendezve.
Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend és együtthatóit megkapjuk.
Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne.
év forgalom (1000 gombóc)
I. negyedév
II. negyedév III. negyedév IV. negyedév
2008
2009
2010
2011
Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.
és
A normálegyenletek tehát
Megoldva az egyenletrendszert kapjuk, hogy
és
A lineáris trend tehát
Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője.
A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.
A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:
A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16.
jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.
Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:
A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.
Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.
Most éppen
A korrigált szezonális eltérések így:
A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az
másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy
azt azonban igen, hogy
és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges -okat és a szezonalitással kiigazított trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.
év forgalom (1000 gombóc)
VALÓS
I. negyedév
II. negyedév III. negyedév IV. negyedév
08
09
10
11
év forgalom (1000 gombóc)
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév III. negyedév IV. negyedév
08
09
10
11
Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:
A szezonalitással kiigazítva pedig
Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.