Barion Pixel Idősorok elemzése, a lineáris trend | mateking
 

Statisztika epizód tartalma:

Mozgóátlagok, mozgóátlagolású trend, simítás, szűrés, dekompozíciós idősormodellek, lineáris trend, exponenciális trend, trendegyenlet, normálegyenletek, szezonalitás, szezonális eltérés, szezonindex, szezonalitással kiigazított trend, szezonalitástól megtisztított trend.

A képsor tartalma

Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot jelöli.

A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
a hosszú távú folyamatokat leíró trendből,
az ettől szabályos ingadozással eltérő szezonális komponensből,
a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
a véletlen összetevőből.


Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.

Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni. A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is.

vagy Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd

vagy Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.

vagy Ez a véletlen komponens.

Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.
vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.

Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.


Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket.
A keresett lineáris trend egyenes egyenlete legyen
A tényleges értékektől az eltérés ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.

A szóban forgó négyzetösszeg tehát


ami tulajdonképpen egy kétváltozós függvény, változói és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.

A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a

normálegyenlet a szerinti derivált, csak elosztva 2-vel és átrendezve, a

normálegyenlet pedig a szerinti derivált, csak ez is elosztva 2-vel és átrendezve.


Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend és együtthatóit megkapjuk.

Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne.


év forgalom (1000 gombóc)

I. negyedév
II. negyedév III. negyedév IV. negyedév

2008



2009



2010

2011


Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.


és


A normálegyenletek tehát

Megoldva az egyenletrendszert kapjuk, hogy
és

A lineáris trend tehát

Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője.

A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.

A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:

A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16.
jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.

Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:

A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.

Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.

Most éppen


A korrigált szezonális eltérések így:





A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az

másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy

azt azonban igen, hogy

és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges -okat és a szezonalitással kiigazított trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.


év forgalom (1000 gombóc)
VALÓS

I. negyedév
II. negyedév III. negyedév IV. negyedév

08



09



10

11

év forgalom (1000 gombóc)
SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév
II. negyedév III. negyedév IV. negyedév

08



09



10



11




Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:




A szezonalitással kiigazítva pedig




Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.

 

Idősorok elemzése, a lineáris trend

01
hang
BelépekvagyRegisztrálok Back arrow Ugrás az
összeshez