Idősorok
Dekompozíciós modell
A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
- a hosszú távú folyamatokat leíró trendből,
- az ettől szabályos ingadozással eltérő szezonális komponensből,
- a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
- a véletlen összetevőből.
Lineáris trend egyenlete
A lineáris trend egyenlete nagyon egyszerű:
\( \hat{y}_t = \hat{b}_0 + \hat{b}_1 \cdot t \)
A \( \hat{b}_0 \) és \( \hat{b}_1 \) paramétereket Excelben vagy bármilyen statisztikai programban néhány kattintással megkapjuk.
Ha kézzel szeretnénk őket kiszámolni, akkor pedig ezekre a normálegyenletekre lesz hozzá szükség:
\( \sum_{t=1}^{n} y_t = n \cdot \hat{b}_0 + \hat{b}_1 \sum_{t=1}^{n} t \qquad \sum_{t=1}^{n} t \cdot y_t = \hat{b}_0 \cdot \sum_{t=1}^{n} t + \hat{b}_1 \sum_{t=1}^{n} t^2 \)
Szezonalitás
A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből.
Pl. ha a négy évszakot vesszük, akkor négy szezonunk van, van egy téli, egy tavaszi, egy nyári és egy őszi, ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is.
A szezonalitás képlete a következő:
\( s_j = \frac{\sum_{i=1}^{n/p} \left( y_{ij}-\hat{y}_{ij} \right) }{n/p} \)
A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket.
Vagyis a képletben $p$ a szezontípusok száma, $n$ pedig az összes szezon száma, $y_{ij}$ jelenti a tényleges értéket, ahol az $ij$-t úgy kell érteni, hogy az $i$-edik év $j$-edik szezonja. $\hat{y}_{ij}$ pedig ennek a trend szerinti megfelelője.
Korrigált szezonális eltérések
Ha összeadjuk a nyers szezonális eltéréseket, és ezek összege nem nulla, akkor vesszük az átlagukat.
\( \overline{s} = \frac{s_1+s_2+s_3+s_4}{4} \)
És ezt az átlagot mindegyik nyers szezonális eltérésből levonjuk.
\( \tilde{s}_1 = s_1 - \overline{s} \)
\( \tilde{s}_2 = s_2 - \overline{s} \)
\( \tilde{s}_3 = s_3 - \overline{s} \)
\( \tilde{s}_4 = s_4 - \overline{s} \)
Így kapjuk meg a korrigált szezonális eltéréseket
Tartamidősor
A tartamidősorok egy vizsgált időtartamra vonatkozó megfigyeléseket tartalmaznak.
Például egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb. Ilyenkor az adatok összeadása értelmes eredményt ad.
Állapotidősor
Az állapotidősorok egy vizsgált időtartam egy adott pillanatára vonatkozó megfigyeléseket tartalmazzák, például az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában, stb. és ilyenkor az adatok összeadásával nem kapunk értelmezhető eredményt.
Kronologikus átlag
Egy speciális átlag, például ha négy hónap adataiból számoljuk ki az átlagot, viszont csak három hónapos időtartamra.
Az állapotidősornál mindig kronologikus átlagot számolunk:
\( \overline{y}_k = \frac{\frac{y_1}{2}+y_2+y_3+\dots+\frac{y_n}{2}}{n-1} \)
Amikor szumma t nulla
Jelentősen csökkenthetjük a normálegyenletek által okozott szenvedéseket, ha az idő múlását jelentő $t$ paramétert úgy adjuk meg, hogy az összege éppen nulla legyen.
Ekkor
\( \sum y_t = n \cdot \hat{b}_0 \qquad \sum t\cdot y_t = \hat{b}_1 \sum t^2 \)
Íme 4 év fagyieladásai negyedéves bontásban:
Negyedévek | forgalom (1000 gombóc) |
|
2018 | Q1 | \( y_1=100 \) |
Q2 | \( y_2=122 \) | |
Q3 | \( y_3=154 \) | |
Q4 | \( y_4=132 \) | |
2019 | Q1 | \( y_5=111 \) |
Q2 | \( y_6=144\) | |
Q3 | \( y_7=196\) | |
Q4 | \( y_8=140\) | |
2020 | Q1 | \( y_9=133\) |
Q2 | \( y_{10}=156\) | |
Q3 | \( y_{11}=216\) | |
Q4 | \( y_{12}=181 \) | |
2021 | Q1 | \( y_{13}=160\) |
Q2 | \( y_{14}=190\) | |
Q3 | \( y_{15}=242\) | |
Q4 | \( y_{16}=199\) |
Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet.
Influenzában megbetegedettek száma január 1 és január 28 között (ezer fő) |
|||
\( y_1=10 \) | \( y_8=19\) | \( y_{15}=35 \) | \( y_{22}=76\) |
\( y_2=11\) | \( y_9=21\) | \( y_{16}=39\) | \( y_{23}=86\) |
\( y_3=12\) | \( y_{10}=23\) | \( y_{17}=45\) | \( y_{24}=90\) |
\( y_4=14\) | \( y_{11}=26\) | \( y_{18}=49\) | \( y_{25}=98\) |
\( y_5=15\) | \( y_{12}=28 \) | \( y_{19}=57\) | \( y_{26}=110\) |
\( y_6=17\) | \( y_{13}=31\) | \( y_{20}=63\) | \( y_{27}=120\) |
\( y_7=18\) | \( y_{14}=33\) | \( y_{21}=69\) | \( y_{28}=132\) |
Adjuk meg az exponenciális trendet.
A valóságban az exponenciális jellegű trendek jelentős része nem valódi exponenciális trend, hanem úgynevezett logisztikai görbe.
A logisztikai görbe kezdetben megegyezik az exponenciális trenddel, de egyszer aztán megtorpan.
Tipikusan ilyen folyamat például egy járvány terjedése. Minél több ember fertőződik meg, a járvány annál gyorsabban terjed, tehát a trend exponenciális jellegű, ám egyszer aztán eléri a telítettségi szintet, amikor már nem tud több ember megfertőződni és a növekedés megáll.
Ez itt az exponenciális trend egyenlete:
\( \hat{y}_t = \hat{b}_0 \cdot \hat{b}_1^t \)
Ha mindkét oldalnak vesszük a logaritmusát, azzal visszavezethetjük a feladatot a lineáris trendre...
EXPONENCIÁLIS TREND: \( \ln{\hat{y}_t} = \ln{\hat{b}_0} + \ln{\hat{b}_1}\cdot t \)
LINEÁRIS TREND: \( \hat{y}_t = \hat{b}_0 + \hat{b}_1 \cdot t \)
Egy webáruház havi forgalma három egymást követő évben az alábbiak szerint alakul. Illesszünk az adatsorra exponenciális trendet, adjuk meg a szezonindexeket és értelmezzük ezek jelentését.
ÉV | Forgalom (1000 fő) |
|
2020 | TÉL | 120 |
TAVASZ | 142 | |
NYÁR | 164 | |
ŐSZ | 196 | |
2021 | TÉL | 240 |
TAVASZ | 256 | |
NYÁR | 324 | |
ŐSZ | 360 | |
2022 | TÉL | 420 |
TAVASZ | 512 | |
NYÁR | 576 | |
ŐSZ | 600 |
Az alábbi táblázat egy üzlet havi fogkrémeladásait és raktárkészletét tartalmazza.
Hónap | Eladás (db) |
Raktárkészlet (db, hónap 1-én) |
Jan. | 640 | 120 |
Febr. | 720 | 150 |
Márc. | 740 | 160 |
Ápr. | 760 | 110 |
Máj. | 730 | 100 |
Jún. | 760 | 120 |
Számoljuk ki az első negyedév átlagos forgalmát és raktárkészletét.
Írjuk fel a repülőtér forgalmát közelítő lineáris trendet.
Repülőtér forgalma (ezer fő) |
|
Január. | 2307 |
Február | 2198 |
Március | 2276 |
Április | 2329 |
Május | 2375 |
Egy hegyi üdülőfalu forgalma főleg a téli síszezonban és a nyári túraszezonban erős, a köztes időszakokban gyengébb. Három év forgalmát vizsgáltuk meg. Az adatok alapján határozzuk meg a lineáris és az exponenciális trendet, majd készítsünk mozgóátlagolású trendet is.
ÉV | forgalom (1000 fő) |
|
2020 | TÉL | 16,9 |
TAVASZ | 13,6 | |
NYÁR | 20,6 | |
ŐSZ | 16,7 | |
2021 | TÉL | 23,9 |
TAVASZ | 20,4 | |
NYÁR | 26,5 | |
ŐSZ | 24,1 | |
2022 | TÉL | 32,5 |
TAVASZ | 30,1 | |
NYÁR | 39,7 | |
ŐSZ | 36,5 |
Egy új termék piacra történő bevezetésének adatai az alábbiak voltak.
év | 1000 emberből a termékkel rendelkezők száma | |||
I. negyedév | II. negyedév | III. negyedév | IV. negyedév | |
2008 | \( y_1=10 \) | \( y_2=12\) | \( y_3=14\) | \( y_4=15\) |
2009 | \( y_5=17\) | \( y_6=19\) | \( y_7=20\) | \( y_8=21\) |
2010 | \( y_9=23\) | \( y_{10}=25\) | \( y_{11}=28\) | \( y_{12}=30\) |
2011 | \( y_{13}=35\) | \( y_{14}=39 \) | \( y_{15}=43\) | \( y_{16}=46 \) |
Illesszünk az adatokra lineáris, majd exponenciális trendet és döntsük el, hogy melyik illeszkedik jobban. Mindkét esetben vizsgáljuk meg a szezonalitást.
Egy üzem sörtermelése három egymást követő évben az alábbiak szerint alakult. Illesszünk az adatsorra lineáris majd exponenciális trendet, vizsgáljuk meg, hogy melyik illeszkedik jobban, és adjunk becslést a következő év sörtermelésére a jobban illeszkedő trend alapján, szezonalitással korrigálva.
ÉV | termelés (1000 liter) | |
első | TÉL | 560 |
TAVASZ | 576 | |
NYÁR | 590 | |
ŐSZ | 565 | |
második | TÉL | 558 |
TAVASZ | 581 | |
NYÁR | 602 | |
ŐSZ | 579 | |
harmadik | TÉL | 567 |
TAVASZ | 598 | |
NYÁR | 607 | |
ŐSZ | 600 |
Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot jelöli.
A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
a hosszú távú folyamatokat leíró trendből,
az ettől szabályos ingadozással eltérő szezonális komponensből,
a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
a véletlen összetevőből.
Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.
Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni. A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is.
vagy Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd
vagy Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.
vagy Ez a véletlen komponens.
Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.
vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.
Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.
Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket.
A keresett lineáris trend egyenes egyenlete legyen
A tényleges értékektől az eltérés ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.
A szóban forgó négyzetösszeg tehát
ami tulajdonképpen egy kétváltozós függvény, változói és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.
A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a
normálegyenlet a szerinti derivált, csak elosztva 2-vel és átrendezve, a
normálegyenlet pedig a szerinti derivált, csak ez is elosztva 2-vel és átrendezve.
Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend és együtthatóit megkapjuk.
Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne.
év forgalom (1000 gombóc)
I. negyedév
II. negyedév III. negyedév IV. negyedév
2008
2009
2010
2011
Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.
és
A normálegyenletek tehát
Megoldva az egyenletrendszert kapjuk, hogy
és
A lineáris trend tehát
Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője.
A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.
A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:
A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16.
jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.
Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:
A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.
Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.
Most éppen
A korrigált szezonális eltérések így:
A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az
másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy
azt azonban igen, hogy
és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges -okat és a szezonalitással kiigazított trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.
év forgalom (1000 gombóc)
VALÓS
I. negyedév
II. negyedév III. negyedév IV. negyedév
08
09
10
11
év forgalom (1000 gombóc)
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév III. negyedév IV. negyedév
08
09
10
11
Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:
A szezonalitással kiigazítva pedig
Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.
Dekompozíciós modellek
Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot jelöli.
A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
a hosszú távú folyamatokat leíró trendből,
az ettől szabályos ingadozással eltérő szezonális komponensből,
a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
a véletlen összetevőből.
[Szövegdoboz: A fagylaltárus jó fagyikat árul, ezért minden évben egyre többet ad el.]
lineáris trend
exponenciális trend
[Szövegdoboz: Nyáron azonban mindig többet, télen pedig kevesebbet ad el.]
[Szövegdoboz: Néha jön a szalmonella, ilyenkor pár hétre bezárják a boltot, ami ront a forgalmon.]
[Szövegdoboz: Egyszer a fagylaltmaffia felgyújtotta az üzletet és ez szintén okozott egy kis visszaesést az üzletmenetben.]
Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.
Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni. A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is.
vagy Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd
vagy Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.
vagy Ez a véletlen komponens.
Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.
vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.
Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.
Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket.
A keresett lineáris trend egyenes egyenlete legyen
A tényleges értékektől az eltérés ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.
A szóban forgó négyzetösszeg tehát
ami tulajdonképpen egy kétváltozós függvény, változói és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.
A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a
normálegyenlet a szerinti derivált, csak elosztva 2-vel és átrendezve, a
normálegyenlet pedig a szerinti derivált, csak ez is elosztva 2-vel és átrendezve.
Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend és együtthatóit megkapjuk.
Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne.
év
forgalom (1000 gombóc)
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
2008
2009
2010
2011
Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.
és
A normálegyenletek tehát
Megoldva az egyenletrendszert kapjuk, hogy
és
A lineáris trend tehát
Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője.
A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.
A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:
A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16.
jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.
Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:
A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.
Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.
Most éppen
A korrigált szezonális eltérések így:
A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az
másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy
azt azonban igen, hogy
és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges -okat és a szezonalitással kiigazított trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.
év
forgalom (1000 gombóc)
VALÓS
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
09
10
11
év
forgalom (1000 gombóc)
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
09
10
11
Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:
A szezonalitással kiigazítva pedig
Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.
Az exponenciális trend
A trendszámítás másik legegyszerűbb és igen gyakori trendje az exponenciális trend. A valóságban azonban az exponenciális jellegű trendek jelentős része nem valódi exponenciális trend, hanem úgynevezett s-görbe. Az s-görbe kezdetben megegyezik az exponenciális trenddel, de egyszer aztán megtorpan. Tipikusan ilyen folyamat például egy járvány terjedése. Minél több ember fertőződik meg, a járvány annál gyorsabban terjed, tehát a trend exponenciális jellegű, ám egyszer eztán eléri a telítettségi szintet, amikor már nem tud több ember megfertőződni és a növekedés megáll. Szintén ilyen például a mobiltelefonok elterjedése, vagy az internetes közösségi oldalak felhasználói számának alakulása. A növekedés egyre gyorsuló ütemben folyik egy adott pontig, de amikor már a lakosság nagyon nagy része rendelkezik az adott termékkel, a növekedés lelassul.
Nézzünk meg egy ilyen exponenciális jellegű trendet. Vegyük például a januárban influenzában sajnálatosan megbetegedettek számát, adjuk meg az erre illeszkedő exponenciális trendet és elemezzük a kapott eredményt!
Influenzában megbetegedettek
száma január 1 és január 28 között
(ezer fő)
Az exponenciális trend egyenlete:
Ha mindkét oldalnak vesszük a logaritmusát, azzal visszavezetjük a feladatot a lineáris trendre.
ahol a logaritmus azonosságok miatt
És itt keressük az ln-es bétákat. Csakhogy ekkor az y-ok is ln-esek lesznek, tehát vennünk kell az eredeti táblázatunk adatainak a logaritmusát. Vagyis nem az eredeti adatokhoz illesztünk exponenciális trendet, hanem a logaritmizált adatokhoz lineárisat. Nem túl nehéz végiggondolni, hogy ez a módszer pici eltéréssel ugyan, de tulajdonképpen azt adja, ami nekünk kell.
Influenzában megbetegedettek
száma január 1 és január 28 között
(ezer fő)
Most pedig jönnek a normálegyenletek.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Hasonlítsuk össze a tényleges adatokat a trendvonallal.
Az ábrán jól látszik, hogy a tényleges adatok alakulását jól követi a trendvonal. Ezáltal viszonylag pontosnak számít az exponenciális trend alkalmazása januárban. Ha az adatokból szeretnénk megbecsülni, hogy hány beteg lesz január 31-én, nincs más dolgunk, mint megnézni, mit ad a képletünk, ha t=31.
Ami annyit jelent, hogy várhatóan 168 ezer megbetegedés lesz január 31-én. Feltéve, hogy a megbetegedések számának görbéje akkor még nem tér le az exponenciális ösvényről. A betegek száma ugyanis s-görbe mentén növekedik, tehát előbb-utóbb letér az exponenciális útról és a növekedése lelassul, majd megáll.
A lineáris és az exponenciális trend és szezonalitás
Az összehasonlítás kedvéért nézzük meg a lineáris és az exponenciális trendet is egy utazási iroda forgalmának elemzéséhez. Az iroda főleg sítúrákat, és nyári utakat szervez, így a téli és nyári szezonban nagyobb, a köztes időszakban kisebb a forgalma.
ÉV
forgalom
(1000 fő)
2011
TÉL
16,9
TAVASZ
13,6
NYÁR
20,6
ŐSZ
16,7
2012
TÉL
23,9
TAVASZ
20,4
NYÁR
26,5
ŐSZ
24,1
2013
TÉL
32,5
TAVASZ
30,1
NYÁR
39,7
ŐSZ
36,5
Először lássuk a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
Nézzük meg!
Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.
Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.
ÉV
forgalom
(1000 fő)
forgalom
(1000 fő)
2011
TÉL
16,9
lg16,9=1,23
TAVASZ
13,6
lg13,6=1,13
NYÁR
20,6
lg20,6=1,31
ŐSZ
16,7
lg16,7=1,22
2012
TÉL
23,9
lg23,9=1,38
TAVASZ
20,4
lg20,4=1,31
NYÁR
26,5
lg26,5=1,42
ŐSZ
24,1
lg24,1=1,38
2013
TÉL
32,5
lg32,5=1,51
TAVASZ
30,1
lg30,1=1,48
NYÁR
39,7
lg39,7=1,59
ŐSZ
36,5
lg36,5=1,56
A normálegyenletek ugyanazok.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Nézzük meg ezt is!
Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.
LINEÁRIS TREND és EXPONENCIÁLIS TREND
VALÓS LIN. EXP.
16,9
13,54
14,98
13,6
15,65
16,32
20,6
17,76
17,79
16,7
19,87
19,39
23,9
21,98
21,14
20,4
24,09
23,04
26,5
26,2
25,12
24,1
28,31
27,38
32,5
30,42
29,84
30,1
32,53
32,53
39,7
34,64
35,45
36,5
36,75
38,65
Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele
A lineáris trend reziduális szórása
Az exponenciális trend reziduális szórása
Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.
Most térjünk rá a szezonalitás vizsgálatára.
A lineáris trend esetén a szezonális eltérés
VALÓS LIN. EXP.
16,9
13,54
14,98
13,6
15,65
16,32
20,6
17,76
17,79
16,7
19,87
19,39
23,9
21,98
21,14
20,4
24,09
23,04
26,5
26,2
25,12
24,1
28,31
27,38
32,5
30,42
29,84
30,1
32,53
32,53
39,7
34,64
35,45
36,5
36,75
38,65
itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.
A tél szezonalitása
A tavasz szezonalitása
A nyár szezonalitása
Az ősz szezonalitása
A korrigált szezonalitás pedig
Így
ÉV
forgalom
LIN.+szezon
2011
TÉL
16,01
TAVASZ
12,95
NYÁR
20,51
ŐSZ
17,35
2012
TÉL
24,45
TAVASZ
21,39
NYÁR
28,95
ŐSZ
25,79
2013
TÉL
32,89
TAVASZ
29,83
NYÁR
37,39
ŐSZ
34,23
Most jön az exponenciális trend.
A képlet ugyanaz, csak kivonás helyett osztás.
VALÓS LIN. EXP.
16,9
13,54
14,98
13,6
15,65
16,32
20,6
17,76
17,79
16,7
19,87
19,39
23,9
21,98
21,14
20,4
24,09
23,04
26,5
26,2
25,12
24,1
28,31
27,38
32,5
30,42
29,84
30,1
32,53
32,53
39,7
34,64
35,45
36,5
36,75
38,65
A tél szezonindexe
A tavasz szezonindexe
A nyár szezonindexe
Az ősz szezonindexe
Ezek átlaga lényegében 1, tehát a szezonindexeket most nem kell korrigálnunk.
ÉV
forgalom
EXP. x szezon
2011
TÉL
16,77
TAVASZ
14,36
NYÁR
19,75
ŐSZ
17,45
2012
TÉL
23,68
TAVASZ
20,28
NYÁR
27,88
ŐSZ
24,64
2013
TÉL
33,42
TAVASZ
28,62
NYÁR
39,35
ŐSZ
34,78
Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy
Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:
és
De mivel ugye
és
És így azt kapjuk, hogy
Lássuk csak, hogyan tudnánk teljesíteni, a feltételt.
Ha páratlan sok adat van, akkor könnyű:
t
adatok
-2
y
-1
y
0
y
1
y
2
y
De ha páros sok, akkor baj van:
t
adatok
-2
y
-1
y
0
y
1
y
2
y
3
y
Vagyis páratlan számú adatnál mindig a nulla van középen, páros számúnál viszont nincs középső elem, itt csak úgy lesz az összeg nulla, ha egy kis trükköt alkalmazunk:
t
adatok
-5
y
-3
y
-1
y
1
y
3
y
5
y
A konkrét esetre visszatérve, itt páros számú adatunk van, tehát
t VALÓS LIN. EXP.
-11
16,9
13,54
14,98
-9
13,6
15,65
16,32
-7
20,6
17,76
17,79
-5
16,7
19,87
19,39
-3
23,9
21,98
21,14
-1
20,4
24,09
23,04
1
26,5
26,2
25,12
3
24,1
28,31
27,38
5
32,5
30,42
29,84
7
30,1
32,53
32,53
9
39,7
34,64
35,45
11
36,5
36,75
38,65
A normálegyenletek:
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
6.0. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.
Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.
Előállított mennyiség
Raktározva
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
-
125
-
febr.
120
110
1100
marc.
3500
apr.
150
3750
87,5
Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor
Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak
107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.
Előállított mennyiség
Raktárkészlet
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
1
-
2500
1,25
-
1000
febr.
1,2
1,2
3000
1,375
1,1
1100
marc.
1,4
1,167
3500
1
0,7272
800
apr.
1,5
1,071
3750
0,875
0,875
700
Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?
Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor
Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.
A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:
6.1. Egy részvény árfolyamának alakulását 20 napig figyeltük. Illesszünk az adatokra három napos mozgóátlagolású trendet, majd lineáris trendet. Számítsuk ki a változás átlagos napi mértékét és hasonlítsuk össze a lineáris trend megfelelő paraméterével.
A tényleges idősor
A három napos mozgó átlag
Nézzük meg a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
A lineáris trend együtthatója az árfolyam átlagos napi növekedését becsüli meg, a pedig a tengelymetszetet adja, vagyis a t=0 pillanatban a részvény becsült értékét. Most ami azt jelenti, hogy a napi átlagos árfolyam növekedés a lineáris trend szerint 0,697 USD. Az árfolyam napi változásának átlagos mértékét kiszámolhatjuk a
képlettel is.
A két eredmény eléggé eltér, aminek magyarázata az, hogy a lineáris trend sem vizsgált időszak elején, sem a végén nem jól illeszkedik a valós árfolyamokat jelentő görbére.
6.2. Egy új termék piacra történő bevezetésének adatai az alábbiak voltak.
év
1000 emberből a termékkel rendelkezők száma
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
2008
2009
2010
2011
Illesszünk az adatokra lineáris, majd exponenciális trendet és döntsük el, hogy melyik illeszkedik jobban. Mindkét esetben vizsgáljuk meg a szezonalitást.
Először lássuk a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
Nézzük meg!
Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.
év
1000 emberből a termékkel rendelkezők száma
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
2008
2009
2010
2011
A normálegyenletek ugyanazok.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Nézzük meg ezt is!
Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.
LINEÁRIS TREND EXPONENCIÁLIS TREND
VALÓS LIN. EXP.
10
7,71
10,648
12
9,99
11,7128
14
12,27
12,88408
15
14,55
14,17249
17
16,83
15,58974
19
19,11
17,14871
20
21,39
18,86358
21
23,67
20,74994
23
25,95
22,82493
25
28,23
25,10743
28
30,51
27,61817
30
32,79
30,37999
35
35,07
33,41799
39
37,35
36,75978
43
39,63
40,43576
46
41,91
44,47934
Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele
A lineáris trend reziduális szórása
Az exponenciális trend reziduális szórása
Az exponenciális trend reziduális szórása jóval kisebb, tehát valóban az illeszkedik jobban.
Most térjünk rá a szezonalitás vizsgálatára.
A lineáris trend esetén a szezonális eltérés
itt n az összes szezon száma, most 16, p pedig a szezontípusok száma, ami 4.
Ekkor az első negyedév szezonalitása
Az második negyedév szezonalitása
A harmadik negyedév szezonalitása
A negyedik negyedév szezonalitása
A korrigált szezonalitás pedig
Így
év
1000 emberből a termékkel rendelkezők száma
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
09
10
11
Most jön az exponenciális trend.
A képlet ugyanaz, csak kivonás helyett osztás.
Az első negyedév szezonindexe
Az második negyedév szezonindexe
A harmadik negyedév szezonindexe
A negyedik negyedév szezonindexe
A korrigált szezonalitás pedig
Így
év
1000 emberből a termékkel rendelkezők száma
SZEZONALITÁSSAL KIIGAZÍTOTT TREND
I. negyedév
II. negyedév
III. negyedév
IV. negyedév
08
10,5
11,7
13,1
13,9
09
15,4
17,1
19,2
20,5
10
22,5
25,1
28,2
29,9
11
32,9
36,7
41,2
43,8
6.3. Egy üzem termelése három egymást követő évben az alábbiak szerint alakult. Illesszünk az adatsorra lineáris majd exponenciális trendet, vizsgáljuk meg, hogy melyik illeszkedik jobban, és adjuk meg a szezonalitást.
ÉV
termelés
(1000 tonna)
2011
TÉL
120
TAVASZ
142
NYÁR
166
ŐSZ
196
2012
TÉL
240
TAVASZ
256
NYÁR
324
ŐSZ
360
2013
TÉL
420
TAVASZ
512
NYÁR
576
ŐSZ
600
Először lássuk a lineáris trendet.
A normálegyenletek
és
Itt
Ekkor a normálegyenletek:
Megoldjuk az egyenletrendszert.
A lineáris trend:
Nézzük meg!
Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.
Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.
ÉV
termelés
(1000 tonna)
termelés
(1000 tonna)
2011
TÉL
120
lg120=2,08
TAVASZ
142
lg142=2,15
NYÁR
166
lg166=2,22
ŐSZ
196
lg196=2,29
2012
TÉL
240
lg240=2,38
TAVASZ
256
lg256=2,41
NYÁR
324
lg324=2,51
ŐSZ
360
lg360=2,56
2013
TÉL
420
lg420=2,62
TAVASZ
512
lg512=2,71
NYÁR
576
lg576=2,76
ŐSZ
600
lg600=2,78
A normálegyenletek ugyanazok.
és
A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!
Ekkor a normálegyenletek
Megoldjuk az egyenletrendszert.
És így
Az exponenciális trend tehát vagyis
Nézzük meg ezt is!
Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.
LINEÁRIS TREND és EXPONENCIÁLIS TREND
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele
A lineáris trend reziduális szórása
Az exponenciális trend reziduális szórása
Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.
Most térjünk rá a szezonalitás vizsgálatára.
A lineáris trend esetén a szezonális eltérés
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.
A tél szezonalitása
A tavasz szezonalitása
A nyár szezonalitása
Az ősz szezonalitása
Most marhajók a szezonális eltéréseink, mert
Így aztán nem is kell korrigálni.
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
ÉV
forgalom
LIN.+szezon
2011
TÉL
76
TAVASZ
119,33
NYÁR
171,33
ŐSZ
201,33
2012
TÉL
260
TAVASZ
303,33
NYÁR
355,33
ŐSZ
385,34
2013
TÉL
444
TAVASZ
487,33
NYÁR
539,33
ŐSZ
569,67
Most jön az exponenciális trend.
A képlet ugyanaz, csak kivonás helyett osztás.
VALÓS LIN. EXP.
120
73
123,42
142
119
143,17
166
165
166,08
196
211
192,65
240
257
223,48
256
303
259,23
324
349
300,71
360
395
348,82
420
441
404,64
512
487
469,38
576
533
544,48
600
579
631,59
A tél szezonindexe
A tavasz szezonindexe
A nyár szezonindexe
Az ősz szezonindexe
Ezek is elég jók, így korrigálni itt sem kell.
Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy
Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:
és
De mivel ugye
és
Azokat az adatsorokat nevezzük idősornak, amely egy – vagy több – ismérv időben történő megoszlását írja le. Legjobb lesz, ha nézünk néhány példát.
Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.
év
megbukott
vizsgázók száma
2007
350
2008
380
2009
420
2010
450
Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa szerencsés esetben mindig ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem volna ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik rubrikában két év megbukott hallgatóinak száma szerepel, akkor például a bukottak száma 350, 380, 870. A látszólagos ugrás azonban csak a csalás miatt van.
Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.
Nézzünk egy másik példát is idősorra. Vegyük, mondjuk egy országban a gépkocsi tulajdonosok és a közúti balesetek számának évenkénti megoszlását.
év
gépkocsi
tulajdonosok száma
közúti
balesetek száma
2007
2 315 421
81 256
2008
2 531 254
80 578
2009
2 624 322
79 875
2010
2 598 378
79 756
A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.
Ha az adatok összeadásával kapott eredmény értelmes,
az idősort tartamidősornak nevezzük. Ilyen például táblázatunkban a közúti balesetek száma. Ezeket összeadva kiderül, hány baleset volt a négy év során.
Ha az adatok összeadásával kapott eredmény nem értelmes,
az idősort állapotidősornak nevezzük. Ilyen a táblázatban a gépkocsi tulajdonosok száma. Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.
A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák – innen ered a nevük is – tehát egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb.
Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában.
Az idősorban bekövetkező változásokat általában százalékosan szokás megadni, az úgynevezett viszonyszámokkal. Vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.
Nézzünk egy feladatot!
Az alábbi táblázat egy mozi forgalmának és jegyárainak évenkénti megoszlását tartalmazza.
év
TARTAMIDŐSOR
forgalom
(millió fő)
ÁLLAPOTIDŐSOR
Jegyár
(jan.1-én)
2007
5
950
2008
5,4
1150
2009
5,1
1300
2010
4,9
1450
2011
5
1500
Lássuk a viszonyszámokat! A forgalom oszlopban tekintsük bázisévnek 2007-et. Ekkor a bázisviszonyszámok
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
950
2008
1150
2009
1300
2010
1450
2011
1500
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
950
2008
1150
2009
1300
2010
1450
2011
1500
A láncviszonyszámok mindig az előző évhez viszonyítanak.
év
TARTAMIDŐSOR
forgalom
(millió fő)
bázis
viszonyszám
(2007=100%)
lánc-
viszonyszám
(előző év=100%)
ÁLLAPOTIDŐSOR
jegyár
2007
nincs
950
2008
1150
2009
1300
2010
1450
2011
1500
A bázisviszonyszám és a láncviszonyszám jelentése mindig százalékos változás.
Ha például a 2009-et nézzük, 1,020 azt jelenti, hogy 2%-al volt nagyobb a forgalom, mint a bázisévben, 0,944 pedig azt jelenti, hogy 0,056-al tehát 5,6%-al volt kisebb a forgalom, mint az előző évben.
A láncviszonyszámokat nézzük meg a jegyárakra is,
a bázisviszonyszámot meg egy időre felejtsük el.
év
forgalom
(millió fő)
lánc-
viszonyszám
(előző év=100%)
Jegyár
lánc-
viszonyszám
(előző év=100%)
2007
nincs
2008
2009
2010
2011
Az évek során bekövetkezett változást kétféleképpen is szemléltethetjük. Az egyik lehetőség az átlagos különbség, ami a jegyáraknál például azt jelenti, hogy hány forinttal drágultak a jegyek átlagosan egy év alatt. Ezt a változás mértékének szokás nevezni.
Az átlagos változás mértéke
Tehát összeadogatjuk a drágulásokat, aztán elosztjuk – mivel is? Az évek száma n, de nem n-el osztunk. Azért nem n-el, mert a drágulások számával kell osztanunk és az nem n, hanem n-1, az egyik évről a másikra történő ugrások száma. Most a vizsgált időszak 2007-től 2011-ig tart, ami öt év ugyan, de ugrásból csak négy van, ezért kell néggyel osztani:
tehát átlagosan évente 137,5 forinttal drágult a mozizás. Ha valaki jártas az általános iskola matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:
Nem csak azt kérdezhetjük meg, hogy hány forinttal drágult a mozi, hanem azt is, hogy hány százalékos volt az éves áremelés. Ezt a változás ütemének hívjuk.
A változás üteme
Itt is azért van a gyökkitevőben n-1, mert nem az évek száma kell nekünk, hanem a változások száma, egyik évről másikra. Ez pedig n-1. A mozijegyek árának évenkénti változása tehát:
A változás mértéke:
A változás üteme:
A jegyek átlagosan 137,5 forinttal, 12%-al drágultak.
Ugyanezt megnézhetjük a mozilátogatók számának esetében is.
A változás mértéke:
A változás üteme:
Most térjünk rá az átlagok kiszámolására. Az átlagos nézőszám esetében tartamidősorunk van, vagyis van értelme összeadni az idősor adatait. Itt az átlagot a szokásos módon számoljuk:
Más a helyzet az átlagos jegyár esetében, ami állapotidősor, így az adatok összege értelmetlen. Ilyenkor úgynevezett kronologikus átlagot számolunk, ami
Nézzünk egy másik példát, ahol összefoglaljuk az eddigieket.
A következő táblázat egy autókereskedés raktárkészletének és eladásainak időbeli eloszlását tartalmazza. Számoljuk ki az összes eddigi állatfajtát.
hónap
raktárkészlet
(a hónap elején)
eladott
mennyiség
jan.
210
150
feb.
350
120
mar.
310
100
apr.
300
120
maj.
290
A változások mértéke és üteme:
hónap
ÁLLAPOTIDŐSOR
raktárkészlet
(a hónap elején)
TARTAMIDŐSOR
eladott
mennyiség
jan.
feb.
mar.
apr.
maj.
hónap
ÁLLAPOTIDŐSOR
raktárkészlet
TARTAMIDŐSOR
eladott mennyiség
jan.
feb.
mar.
apr.
maj.
Változás
mértéke
Változás
üteme
átlag
2.4. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.
Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.
Előállított mennyiség
Raktározva
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
-
125
-
febr.
120
110
1100
marc.
3500
apr.
150
3750
87,5
Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor
Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak
107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.
Előállított mennyiség
Raktárkészlet
(a hónap elején)
jan.=100%
előző hónap=100%
db
marc.=100%
előző hónap=100%
db
jan.
1
-
2500
1,25
-
1000
febr.
1,2
1,2
3000
1,375
1,1
1100
marc.
1,4
1,167
3500
1
0,7272
800
apr.
1,5
1,071
3750
0,875
0,875
700
Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?
Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor
Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.
A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:
2.5. Egy áruház raktárkészlete valamely termékből az alábbiak szerint alakult:
hónap
Készlet
Jan=100%
Előző
hónap=100%
Változás %-ban
február=100%
Változás
februárhoz képest (db)
Aktuális készlet a hónap végén (db)
Jan.
100
-
-20
-10
Febr.
Márc.
110
Ápr.
+16
Máj.
600
Jún.
80
Júl.
130
a) Töltsük ki a hiányzó részeket!
b) Mekkora volt az átlagos raktárkészlet ebből a termékből a második negyedévben?