Jump to navigation

Belépés
  • Elfelejtettem a jelszavam
Regisztráció
 
  • Hogyan működik a mateking?
  • Mire jó a matek?
  • Matek érettségi
  • Képletgyűjtemény
  • Feladatgyűjtemény
  • Rólunk
  • Matek 5. osztály próbaüzem
  • Matek 6. osztály próbaüzem
  • Matek 7. osztály próbaüzem
  • Matek 8. osztály próbaüzem
  • Matek 9. osztály
  • Matek 10. osztály
  • Matek 11. osztály
  • Matek 12. osztály
  • Középiskolai matek (teljes)
  • Középszintű matek érettségi
  • Emelt szintű matek érettségi
  • Egyetemi matek alapozó
Összes egyetemi tantárgy
Legnépszerűbb tantárgyak:
  • Analízis 1
  • Analízis 2
  • Analízis 3
  • Valószínűségszámítás
  • Lineáris algebra
  • Diszkrét matematika
  • Statisztika

mateking

Login
 

Adatelemzés 2

Kategóriák
  • Kombinatorika
  • Valszám alapok, klasszikus valszám
  • Teljes valószínűség tétele, Bayes tétel
  • Eloszlás, eloszlásfüggvény, sűrűségfüggvény
  • Várható érték és szórás
  • Markov és Csebisev egyenlőtlenségek
  • A binomiális eloszlás és a hipergeometriai eloszlás
  • Nevezetes diszkrét és folytonos eloszlások
  • Becslések
  • Hipotézisvizsgálat
  • Regressziószámítás
  • Idősorok

Idősorok

  • Epizódok
  • Feladatok
  • Képletek
01
 
Idősorok elemzése, a lineáris trend
02
 
Szezonális eltérés a lineáris trendben
03
 
Exponenciális trend
04
 
Szezonindexek az exponenciális trendben
05
 
Mozgóátlagok, trendszámítás mozgóátlagolással
06
 
Amikor szumma t nulla
07
 
Lineáris, exponenciális és mozgóátlagolású trend 1.0
08
 
Lineáris, exponenciális és mozgóátlagolású trend 2.0
09
 
Lineáris, exponenciális és mozgóátlagolású trend 3.0
10
 
FELADAT
11
 
FELADAT
12
 
FELADAT

Dekompozíciós modell

A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:

  • a hosszú távú folyamatokat leíró trendből,
  • az ettől szabályos ingadozással eltérő szezonális komponensből,
  • a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és
  • a véletlen összetevőből.
Megnézem a kapcsolódó epizódot

Lineáris trend egyenlete

A lineáris trend egyenlete nagyon egyszerű:

\( \hat{y}_t = \hat{b}_0 + \hat{b}_1 \cdot t \)

A \( \hat{b}_0 \) és \( \hat{b}_1 \) paramétereket Excelben vagy bármilyen statisztikai programban néhány kattintással megkapjuk.

Ha kézzel szeretnénk őket kiszámolni, akkor pedig ezekre a normálegyenletekre lesz hozzá szükség:

\( \sum_{t=1}^{n} y_t = n \cdot \hat{b}_0 + \hat{b}_1 \sum_{t=1}^{n} t \qquad \sum_{t=1}^{n} t \cdot y_t = \hat{b}_0 \cdot \sum_{t=1}^{n} t + \hat{b}_1 \sum_{t=1}^{n} t^2 \)

Megnézem a kapcsolódó epizódot

Korrigált szezonális eltérések

Ha összeadjuk a nyers szezonális eltéréseket, és ezek összege nem nulla, akkor vesszük az átlagukat.

\( \overline{s} = \frac{s_1+s_2+s_3+s_4}{4} \)

És ezt az átlagot mindegyik nyers szezonális eltérésből levonjuk.

\( \tilde{s}_1 = s_1 - \overline{s} \)

\( \tilde{s}_2 = s_2 - \overline{s} \)

\( \tilde{s}_3 = s_3 - \overline{s} \)

\( \tilde{s}_4 = s_4 - \overline{s} \)

Így kapjuk meg a korrigált szezonális eltéréseket

Megnézem a kapcsolódó epizódot

Szezonalitás

A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből.

Pl. ha a négy évszakot vesszük, akkor négy szezonunk van, van egy téli, egy tavaszi, egy nyári és egy őszi, ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is.

A szezonalitás képlete a következő:

\( s_j = \frac{\sum_{i=1}^{n/p} \left( y_{ij}-\hat{y}_{ij} \right) }{n/p} \)

A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket.

Vagyis a képletben $p$ a szezontípusok száma, $n$ pedig az összes szezon száma, $y_{ij}$ jelenti a tényleges értéket, ahol az $ij$-t úgy kell érteni, hogy az $i$-edik év $j$-edik szezonja. $\hat{y}_{ij}$ pedig ennek a trend szerinti megfelelője.

Megnézem a kapcsolódó epizódot

Mozgóátlag

A mozgóátlagolás lényege, hogy az idősor egyes elemeit a körülötte lévő elemek átlagával helyettesítjük, kisimítva ezzel az esetleges erős hullámzásokat.

A mozgóátlagok kiszámolásának képlete páros és páratlan tagú átlagok esetén eltérő.

Ha a tagok száma páratlan:

\( \hat{y}_t = \frac{y_{t-k}+\dots+y_{t-1}+y_t+y_{t+1}+\dots+y_{t+k}}{2k+1} \)

Ha pedig a tagok száma páros:

\( \hat{y}_t = \frac{\frac{y_{t-k}}{2}+\dots+y_{t-1}+y_t+y_{t+1}+\dots+\frac{y_{t+k}}{2}}{2k} \)

Megnézem a kapcsolódó epizódot

Amikor szumma t nulla

Jelentősen csökkenthetjük a normálegyenletek által okozott szenvedéseket, ha az idő múlását jelentő $t$ paramétert úgy adjuk meg, hogy az összege éppen nulla legyen.

Ekkor

\( \sum y_t = n \cdot \hat{b}_0 \qquad \sum t\cdot y_t = \hat{b}_1 \sum t^2 \)

Megnézem a kapcsolódó epizódot

inverzfüggvény

Minden függvény egy $x \mapsto y$ hozzárendelés, aminek az inverze, ha az egyáltalán létezik, az $y \mapsto x$ fordított hozzárendelés.

Inverze csak azoknak a függvényeknek van, amik két különböző $x$-hez különböző $y$-okat rendelnek, ezt úgy mondjuk, hogy kölcsönesen egyértelműek, vagy kicsit rövidebben injektívek.

Megnézem a kapcsolódó epizódot

1.

Íme 4 év fagyieladásai negyedéves bontásban:

Negyedévek forgalom
(1000 gombóc)
2018 Q1 \( y_1=100 \)
Q2 \( y_2=122 \)
Q3 \( y_3=154 \)
Q4 \( y_4=132 \)
2019 Q1 \( y_5=111 \)
Q2 \( y_6=144\)
Q3 \( y_7=196\)
Q4 \( y_8=140\)
2020 Q1 \( y_9=133\)
Q2 \( y_{10}=156\)
Q3 \( y_{11}=216\)
Q4 \( y_{12}=181 \)
2021 Q1 \( y_{13}=160\)
Q2 \( y_{14}=190\)
Q3 \( y_{15}=242\)
Q4 \( y_{16}=199\)

Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet.

Megnézem, hogyan kell megoldani

2.
Influenzában megbetegedettek száma
január 1 és január 28 között (ezer fő)
\( y_1=10 \) \( y_8=19\) \( y_{15}=35 \) \( y_{22}=76\)
\( y_2=11\) \( y_9=21\) \( y_{16}=39\) \( y_{23}=86\)
\( y_3=12\) \( y_{10}=23\) \( y_{17}=45\) \( y_{24}=90\)
\( y_4=14\) \( y_{11}=26\) \( y_{18}=49\) \( y_{25}=98\)
\( y_5=15\) \( y_{12}=28 \) \( y_{19}=57\) \( y_{26}=110\)
\( y_6=17\) \( y_{13}=31\) \( y_{20}=63\) \( y_{27}=120\)
\( y_7=18\) \( y_{14}=33\) \( y_{21}=69\) \( y_{28}=132\)

Adjuk meg az exponenciális trendet.

Megnézem, hogyan kell megoldani

3.

A valóságban az exponenciális jellegű trendek jelentős része nem valódi exponenciális trend, hanem úgynevezett logisztikai görbe.

A logisztikai görbe kezdetben megegyezik az exponenciális trenddel, de egyszer aztán megtorpan.

Tipikusan ilyen folyamat például egy járvány terjedése. Minél több ember fertőződik meg, a járvány annál gyorsabban terjed, tehát a trend exponenciális jellegű, ám egyszer aztán eléri a telítettségi szintet, amikor már nem tud több ember megfertőződni és a növekedés megáll.

Megnézem, hogyan kell megoldani

4.

Ez itt az exponenciális trend egyenlete:

\( \hat{y}_t = \hat{b}_0 \cdot \hat{b}_1^t \)

Ha mindkét oldalnak vesszük a logaritmusát, azzal visszavezethetjük a feladatot a lineáris trendre...

EXPONENCIÁLIS TREND: \( \ln{\hat{y}_t} = \ln{\hat{b}_0} + \ln{\hat{b}_1}\cdot t \)

LINEÁRIS TREND: \( \hat{y}_t = \hat{b}_0 + \hat{b}_1 \cdot t \)

Megnézem, hogyan kell megoldani

5.

Egy webáruház havi forgalma három egymást követő évben az alábbiak szerint alakul. Illesszünk az adatsorra exponenciális trendet, adjuk meg a szezonindexeket és értelmezzük ezek jelentését.

ÉV   Forgalom
(1000 fő)
2020 TÉL 120
  TAVASZ 142
  NYÁR 164
  ŐSZ 196
2021 TÉL 240
  TAVASZ 256
  NYÁR 324
  ŐSZ 360
2022 TÉL 420
  TAVASZ 512
  NYÁR 576
  ŐSZ 600
Megnézem, hogyan kell megoldani

6.

Írjuk fel a repülőtér forgalmát közelítő lineáris trendet.

Repülőtér forgalma
(ezer fő)
Január. 2307
Február 2198
Március 2276
Április 2329
Május 2375
Megnézem, hogyan kell megoldani

7.

Egy hegyi üdülőfalu forgalma főleg a téli síszezonban és a nyári túraszezonban erős, a köztes időszakokban gyengébb. Három év forgalmát vizsgáltuk meg. Az adatok alapján határozzuk meg a lineáris és az exponenciális trendet, majd készítsünk mozgóátlagolású trendet is.

ÉV   forgalom
(1000 fő)
2020 TÉL 16,9
  TAVASZ 13,6
  NYÁR 20,6
  ŐSZ 16,7
2021 TÉL 23,9
  TAVASZ 20,4
  NYÁR 26,5
  ŐSZ 24,1
2022 TÉL 32,5
  TAVASZ 30,1
  NYÁR 39,7
  ŐSZ 36,5
Megnézem, hogyan kell megoldani

8.

Egy részvény árfolyamának alakulását 20 napig figyeltük. Illesszünk az adatokra három napos mozgóátlagolású trendet, majd lineáris trendet. Számítsuk ki a változás átlagos napi mértékét és hasonlítsuk össze a lineáris trend megfelelő paramétereivel.

nap Részvény ára (USD)
1. 90
2. 91
3. 88
4. 87
5. 87
6. 86
7. 88
8. 91
9. 93
10. 94
11. 93
12. 95
13. 97
14. 98
15. 97
16. 100
17. 99
18. 102
19. 98
20. 95
Megnézem, hogyan kell megoldani

9.

Egy új termék piacra történő bevezetésének adatai az alábbiak voltak.

év 1000 emberből a termékkel rendelkezők száma
I. negyedév II. negyedév III. negyedév IV. negyedév
2008 \( y_1=10 \) \( y_2=12\) \( y_3=14\) \( y_4=15\)
2009 \( y_5=17\) \( y_6=19\) \( y_7=20\) \( y_8=21\)
2010 \( y_9=23\) \( y_{10}=25\) \( y_{11}=28\) \( y_{12}=30\)
2011 \( y_{13}=35\) \( y_{14}=39 \) \( y_{15}=43\) \( y_{16}=46 \)

Illesszünk az adatokra lineáris, majd exponenciális trendet és döntsük el, hogy melyik illeszkedik jobban. Mindkét esetben vizsgáljuk meg a szezonalitást.

Megnézem, hogyan kell megoldani

10.

Egy üzem sörtermelése három egymást követő évben az alábbiak szerint alakult. Illesszünk az adatsorra lineáris majd exponenciális trendet, vizsgáljuk meg, hogy melyik illeszkedik jobban, és adjunk becslést a következő év sörtermelésére a jobban illeszkedő trend alapján, szezonalitással korrigálva.

ÉV   termelés (1000 liter)
első TÉL 560
  TAVASZ 576
  NYÁR 590
  ŐSZ 565
második TÉL 558
  TAVASZ 581
  NYÁR 602
  ŐSZ 579
harmadik TÉL 567
  TAVASZ 598
  NYÁR 607
  ŐSZ 600
Megnézem, hogyan kell megoldani

A témakör tartalma


Mozgóátlagok, trendszámítás mozgóátlagolással

IDŐSOROK ELEMZÉSE

Azokat az adatsorokat nevezzük idősornak, melyek egy vagy több ismérv időben történő megoszlását írják le. Nézzünk erre egy példát.

Vegyük például a statisztikából megbukott hallgatók évenkénti megoszlását.

év

megbukott

vizsgázók száma

2009

340

2010

350

2011

380

2012

420

2013

450

Ez a táblázat egy idősor. Az első oszlopban a megfigyelés időpontja látható, ennek periódusa általában ugyanakkora. Ilyenkor az idősort ekvidisztans idősornak nevezzük. Ha nem ugyanakkora az egymást követő megfigyelések közt eltelt idő, akkor nem ekvidisztans idősorról beszélünk, ami komoly félreértéseket eredményezhet, hisz ha az egyik mezőbe mondjuk két év megbukott hallgatóinak számát írjuk, azt hihetjük, hogy a bukások száma hirtelen megugrott.

Ezeket az időben változó értékeket -vel szokás jelölni. A t indexelés az időre utal.

Nézzünk meg egy másik idősort is. Vegyük, mondjuk egy országban a gépkocsi

tulajdonosok és a közúti balesetek számának évenkénti megoszlását.

év

közúti

balesetek száma

gépkocsi

tulajdonosok száma

2010

81 256

2 315 421

2011

80 578

2 531 254

2012

79 875

2 624 322

2013

79 756

2 598 378

A táblázatban szereplő két adatsor között van egy jelentős különbség. Ezt a különbséget szemléletesen úgy lehetne kimutatni, hogy összeadjuk az oszlopban szereplő adatokat, és megnézzük, a kapott eredmény értelmes-e vagy sem.

Ha az első oszlop tartalmát, vagyis a balesetek számát összeadjuk, akkor kiderül, hány baleset volt a négy év során, ez teljesen rendben is van.

Ha viszont a második oszlopot, vagyis a gépkocsi tulajdonosok számát nézzük, az adatok összeadásával kapott eredmény nem értelmes.

Ha összeadjuk ezeket a négy évre, nem tudunk meg semmit, hiszen valakinek lehet, hogy minden évben volt autója, azt négyszer számoltuk, de olyan is lehet akinek egy évig volt, azt csak egyszer.

A tartamidősorok a vizsgált időtartamra vonatkozó megfigyeléseket tartalmazzák, innen ered a nevük is, tehát mondjuk egy év baleseteinek a számát, egy hónapban eladott fogkrémek számát, stb. ilyenkor az adatok összeadása értelmes eredményt ad.

Az állapotidősorok a vizsgált időtartam egy pillanatára vonatkozó megfigyeléseket tartalmazzák, például az ország lakosságának számát egy adott év adott pillanatában, vagy a raktáron lévő fogkrémkészletet egy adott hónap adott pillanatában, stb. és ilyenkor az adatok összeadása nem értelmes eredményt ad.

Az alábbi táblázat mondjuk egy üzlet havi fogkrémeladásait és raktárkészletét

tartalmazza.

hónap

TARTAMIDŐSOR

eladás

(db)

ÁLLAPOTIDŐSOR

raktárkészlet

(db, hónap 1-én)

Jan.

640

120

Febr.

720

150

Márc.

740

160

Ápr.

760

110

Máj.

730

100

Jún.

760

120

A havi eladás tartamidősor, míg a raktárkészlet állapotidősor.

Számoljuk ki az első negyedév átlagos forgalmát és raktárkészletét.

Az átlagos eladás a szokásos átlag:

Az átlagos raktárkészlet kiszámolásánál viszont van egy kis gond.

Az első negyedév az  első három hónapot jelenti, valahogy így.

A táblázatban szereplő adatok a hónap elsejére vonatkoznak.

Ha az tehát az első három hónap raktárkészletét nézzük, az így kapott időszak nem három hónap, hanem csak két hónap + egy nap, ez pedig marhára nem az első negyedév. Ahhoz, hogy a vizsgált időszak valóban három hónap legyen, hozzá kell vennünk még egy adatot, az április elsejét is.

Az átlagot tehát négy hónap adataiból számoljuk ki, viszont csak három hónapos időtartamra. Az így kapott átlag egy speciális átlag, az úgynevezett kronologikus átlag.

Az átlagot tartamidősor esetében a szokásos módon számoljuk:

Állapotidősornál viszont mindig úgynevezett kronologikus átlagot számolunk:

Az idősorban bekövetkező változásokat általában százalékosan szokás megadni. Ezeket a változásokat a dinamikus viszonyszámok írják le. Kétféle van belőlük, vannak bázisviszonyszámok, amik mindig egy adott évhez viszonyítanak, és vannak láncviszonyszámok, amik mindig az előző évhez viszonyítanak. Kiszámolásuknál a későbbi/korábbi elvet alkalmazzuk.

Számoljuk ki például a havi eladás bázisviszonyszámait. Meg kell adnunk egy bázist, vagyis azt a hónapot amihez viszonyítunk. Legyen ez mondjuk a január.

hónap

TARTAMIDŐSOR

eladás

(db)

bázis

viszonyszám

(jan.=100%)

Jan.

Febr.

Márc.

Ápr.

Máj.

Jún.

A láncviszonyszámok mindig az előző évhez viszonyítanak.

hónap

TARTAMIDŐSOR

eladás

(db)

bázis

viszonyszám

(jan.=100%)

lánc-

viszonyszám

(előző hónap=100%)

Jan.

nincs

Febr.

Márc.

Ápr.

Máj.

Jún.

A bázisviszonyszámok és a láncviszonyszámok közötti kapcsolat a következő:

Egy másik nagyon fontos összefüggés, hogy

Vagyis a láncviszonyszám nem csak a konkrét adatokból, hanem a

bázisviszonyszámokból is számolható. Másként fogalmazva bázisviszonyszám pont olyan, mintha konkrét adat lenne. Nézzük meg.

Számoljuk ki mondjuk a táblázatunkban mennyi

  és  

A bázis természetesen nem csak január lehet, hanem bármelyik másik hónap is, például május is. Nézzük meg ezt is.

hónap

TARTAMIDŐSOR

eladás

(db)

bázis

viszonyszám

(jan.=100%)

bázis

viszonyszám

(máj.=100%)

lánc-

viszonyszám

(előző hónap=100%)

Jan.

nincs

Febr.

Márc.

Ápr.

Máj.

Jún.

Továbbra is igaz marad, hogy a bázisviszonyszám pont olyan, mintha konkrét adat lenne, tehát

  és  és

Mindegy tehát, hogy mit tekintünk bázisnak, a bázisviszonyszámokkal ugyanúgy számolhatunk, mint a konkrét adatokkal. Egyvalamit azonban nem tehetünk.

Két különböző bázis alapján számolt bázisviszonyszámot nem szabad összehasonlítani.

A hónapok során bekövetkezett változást kétféleképpen is szemléltethetjük.

Az egyik lehetőség az átlagos különbség, ami azt jelenti, hogy hány darabbal többet adtak el átlagosan havonta. Ezt a változás mértékének szokás nevezni.

A változás átlagos mértéke

Tehát összeadogatjuk a változásokat, aztán elosztjuk mivel is? A hónapok száma n, de nem n-el osztunk. Azért nem n-el, mert a változások számával kell osztanunk és az nem n, hanem n-1, az egyik hónapról a másikra történő ugrások száma. Most a vizsgált időszak januártól tart júniusig, ami hat hónap ugyan, de ugrásból csak öt van, ezért kell öttel osztani:

tehát átlagosan havonta 24 darabbal nő az eladás. Ha valaki jártas az általános iskolai

matekban, akkor rájöhet, hogy ez még egyszerűbben kijön:

Nem csak azt kérdezhetjük meg, hogy hány darabbal nőtt az eladás, hanem azt is, hogy hány százalékos volt ez a növekedés. Ezt a változás ütemének hívjuk.

A változás üteme

Itt is azért van a gyökkitevőben n-1, mert nem a hónapok száma kell nekünk, hanem a változások száma, egyik hónapról másikra. Ez pedig n-1.

A változás üteme:

Az eladás átlagosan havonta 3,5%-al nőtt.

Mozgóátlagok

Az idősorok hosszabb távú trendjeinek meghatározásához a legegyszerűbb eljárás az úgynevezett mozgóátlagolás, aminek lényege, hogy az idősor egyes elemeit a körülötte lévő elemek átlagával helyettesítjük, kisimítva ezzel az esetleges erős hullámzásokat. Minél több tagú mozgóátlagot veszünk, a hullámzások annál jobban kisimulnak. Nézzük például a kőolaj hordónkénti árának alakulását 20 egymást követő napon. A tényleges idősor adatait először háromnapos mozgóátlaggal simítjuk.

A tényleges idősor

A három napos mozgó átlag

Most nézzük meg az öt napos mozgóátlagot is.

A tényleges idősor

nap

Hordónkénti ár

(USD)

1.

90

2.

91

3.

88

4.

87

5.

87

6.

86

7.

88

8.

91

9.

93

10.

94

11.

93

12.

95

13.

97

14.

98

15.

97

16.

100

17.

99

18.

102

19.

98

20.

95

Az öt napos mozgóátlag

nap

Hordónkénti ár

(USD)

1.

-

2.

-

3.

88,6

4.

87,8

5.

87,2

6.

87,8

7.

89

8.

90,4

9.

91,8

10.

93,2

11.

94,4

12.

95,4

13.

96

14.

97,4

15.

98,2

16.

99,2

17.

99,2

18.

98,8

19.

20.

A tényleges idősor

Az öt napos mozgóátlag

A mozgóátlagok gyakorlati jelentőssége egyrészt az ingadozások felesleges és zavaró hatásának kiszűrése. Ha rápillantunk a grafikonra, jól látjuk, hogy a hatodik naptól egészen a 17-ik napig az olajár tulajdonképpen folyamatosan drágult, hiába voltak néha egykét dolláros ingadozások. A mozgóátlag másik haszna, a jóslásban rejlik, vagyis segíthet előrejelezni a jövőben bekövetkező folyamatokat. Ha megfigyeljük, az öt napos mozgóátlag a 17-ik naptól csökkenni kezd, pedig az olajár ott még növekszik. A mozgóátlagnak ez a csökkenése a 18-ik naptól kezdődő tényleges csökkenést vetíti előre. Egyetlen aprócska gond ezzel az előrejelzéssel az, hogy az öt napos mozgóátlag számolásából adódóan mindig két nappal az események után kullog. Úgy pedig – mármint két nappal a sorsolás után – már a lottószámok is viszonylag könnyen megjósolhatók. Ha azonban képesek vagyunk nem túl pontatlan becslést adni a következő két nap árfolyamára, a mozgóátlag már viszonylag megbízható jóslatot tud adni a trend várható alakulására. De a jóslásokra még visszatérünk később.

Próbáljunk most meg kiszámolni egy négy napos mozgóátlagot is. Az eddigi számolási módszerünk, miszerint az adott elem körül elhelyezkedő elemeket átlagoljuk sajna csődöt mond. Páros számoknál ugyanis a szimmetria elvész. Vagy egy elem van a kiszemelt elem előtt és kettő utána, vagy fordítva. Nos ezt a rettenetes problémát szerencsére sikerül áthidalni a következő megoldással. Vegyünk a kiszemelt elem előtt is és után is másfél elemet, mégpedig így:

A tényleges idősor

nap

Hordónkénti ár

(USD)

1.

90

2.

91

3.

88

4.

87

5.

87

6.

86

7.

88

8.

91

9.

93

10.

94

11.

93

12.

95

13.

97

14.

98

15.

97

16.

100

17.

99

18.

102

19.

98

20.

95

Ezzel a problémát megoldottuk.

A mozgóátlagok kiszámolásának képlete tehát páros és páratlan tagú átlagok esetén eltérő.

Ha a tagok száma páratlan:

Ha pedig a tagok száma páros


Szezonális eltérés a lineáris trendben

Dekompozíciós modellek

Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot  jelöli.

A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:

a hosszú távú folyamatokat leíró trendből,

az ettől szabályos ingadozással eltérő szezonális komponensből,

a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és

a véletlen összetevőből.

[Szövegdoboz: A fagylaltárus jó fagyikat árul, ezért minden évben egyre többet ad el.]

lineáris trend

exponenciális trend

[Szövegdoboz: Nyáron azonban mindig többet, télen pedig kevesebbet ad el.]

[Szövegdoboz: Néha jön a szalmonella, ilyenkor pár hétre bezárják a boltot, ami ront a forgalmon.]

[Szövegdoboz: Egyszer a fagylaltmaffia felgyújtotta az üzletet és ez szintén okozott egy kis visszaesést az üzletmenetben.]

Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.

  Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni.   A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is.

 vagy  Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd

 vagy  Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.

 vagy  Ez a véletlen komponens.

Nézzük meg, hogy mit tudunk mondani az egyes komponensekről.

 vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható.

Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.

Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket.

A keresett lineáris trend egyenes egyenlete legyen   

A tényleges  értékektől az eltérés  ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen.

A szóban forgó négyzetösszeg tehát

ami tulajdonképpen egy kétváltozós függvény, változói  és . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek.

A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a

normálegyenlet a  szerinti derivált, csak elosztva 2-vel és átrendezve, a

normálegyenlet pedig a  szerinti derivált, csak ez is elosztva 2-vel és átrendezve.

Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend  és  együtthatóit megkapjuk.

Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne.

év

forgalom (1000 gombóc)

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

2008

2009

2010

2011

Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.

  és 

A normálegyenletek tehát

Megoldva az egyenletrendszert kapjuk, hogy

és   

A lineáris trend tehát

Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője.

A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.

A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:

A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16.

jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.

Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:

A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.

Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.

Most éppen

A korrigált szezonális eltérések így:

A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az

másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy

azt azonban igen, hogy

és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges -okat és a szezonalitással kiigazított  trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.

év

forgalom (1000 gombóc)

VALÓS

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

08

09

10

11

év

forgalom (1000 gombóc)

SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

08

09

10

11

Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:

A szezonalitással kiigazítva pedig

Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.

Az exponenciális trend

A trendszámítás másik legegyszerűbb és igen gyakori trendje az exponenciális trend. A valóságban azonban az exponenciális jellegű trendek jelentős része nem valódi exponenciális trend, hanem úgynevezett s-görbe. Az s-görbe kezdetben megegyezik az exponenciális trenddel, de egyszer aztán megtorpan. Tipikusan ilyen folyamat például egy járvány terjedése. Minél több ember fertőződik meg, a járvány annál gyorsabban terjed, tehát a trend exponenciális jellegű, ám egyszer eztán eléri a telítettségi szintet, amikor már nem tud több ember megfertőződni és a növekedés megáll. Szintén ilyen például a mobiltelefonok elterjedése, vagy az internetes közösségi oldalak felhasználói számának alakulása. A növekedés egyre gyorsuló ütemben folyik egy adott pontig, de amikor már a lakosság nagyon nagy része rendelkezik az adott termékkel, a növekedés lelassul.

Nézzünk meg egy ilyen exponenciális jellegű trendet. Vegyük például a januárban influenzában sajnálatosan megbetegedettek számát, adjuk meg az erre illeszkedő exponenciális trendet és elemezzük a kapott eredményt!

Influenzában megbetegedettek

száma január 1 és január 28 között

 (ezer fő)

Az exponenciális trend egyenlete:

Ha mindkét oldalnak vesszük a logaritmusát, azzal visszavezetjük a feladatot a lineáris trendre.

    ahol a logaritmus azonosságok miatt

És itt keressük az ln-es bétákat. Csakhogy ekkor az y-ok is ln-esek lesznek, tehát vennünk kell az eredeti táblázatunk adatainak a logaritmusát. Vagyis nem az eredeti adatokhoz illesztünk exponenciális trendet, hanem a logaritmizált adatokhoz lineárisat. Nem túl nehéz végiggondolni, hogy ez a módszer pici eltéréssel ugyan, de tulajdonképpen azt adja, ami nekünk kell.

Influenzában megbetegedettek

száma január 1 és január 28 között

 (ezer fő)

Most pedig jönnek a normálegyenletek.

           és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát  vagyis

Hasonlítsuk össze a tényleges adatokat a trendvonallal.

Az ábrán jól látszik, hogy a tényleges adatok alakulását jól követi a trendvonal. Ezáltal viszonylag pontosnak számít az exponenciális trend alkalmazása januárban. Ha az adatokból szeretnénk megbecsülni, hogy hány beteg lesz január 31-én, nincs más dolgunk, mint megnézni, mit ad a képletünk, ha t=31.

Ami annyit jelent, hogy várhatóan 168 ezer megbetegedés lesz január 31-én. Feltéve, hogy a megbetegedések számának görbéje akkor még nem tér le az exponenciális ösvényről. A betegek száma ugyanis s-görbe mentén növekedik, tehát előbb-utóbb letér az exponenciális útról és a növekedése lelassul, majd megáll.

A lineáris és az exponenciális trend és szezonalitás

Az összehasonlítás kedvéért nézzük meg a lineáris és az exponenciális trendet is egy utazási iroda forgalmának elemzéséhez. Az iroda főleg sítúrákat, és nyári utakat szervez, így a téli és nyári szezonban nagyobb, a köztes időszakban kisebb a forgalma.

ÉV

forgalom

(1000 fő)

2011

TÉL

16,9

TAVASZ

13,6

NYÁR

20,6

ŐSZ

16,7

2012

TÉL

23,9

TAVASZ

20,4

NYÁR

26,5

ŐSZ

24,1

2013

TÉL

32,5

TAVASZ

30,1

NYÁR

39,7

ŐSZ

36,5

Először lássuk a lineáris trendet.

A normálegyenletek

           és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

Nézzük meg!

Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.

Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.

ÉV

forgalom

(1000 fő)

forgalom

(1000 fő)

2011

TÉL

16,9

lg16,9=1,23

TAVASZ

13,6

lg13,6=1,13

NYÁR

20,6

lg20,6=1,31

ŐSZ

16,7

lg16,7=1,22

2012

TÉL

23,9

lg23,9=1,38

TAVASZ

20,4

lg20,4=1,31

NYÁR

26,5

lg26,5=1,42

ŐSZ

24,1

lg24,1=1,38

2013

TÉL

32,5

lg32,5=1,51

TAVASZ

30,1

lg30,1=1,48

NYÁR

39,7

lg39,7=1,59

ŐSZ

36,5

lg36,5=1,56

A normálegyenletek ugyanazok.

           és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát  vagyis

Nézzük meg ezt is!

Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.

LINEÁRIS TREND és EXPONENCIÁLIS TREND

VALÓS       LIN.        EXP.

16,9

13,54

14,98

13,6

15,65

16,32

20,6

17,76

17,79

16,7

19,87

19,39

23,9

21,98

21,14

20,4

24,09

23,04

26,5

26,2

25,12

24,1

28,31

27,38

32,5

30,42

29,84

30,1

32,53

32,53

39,7

34,64

35,45

36,5

36,75

38,65

Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele

A lineáris trend reziduális szórása

Az exponenciális trend reziduális szórása

Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.

Most térjünk rá a szezonalitás vizsgálatára.

A lineáris trend esetén a szezonális eltérés

VALÓS       LIN.        EXP.

16,9

13,54

14,98

13,6

15,65

16,32

20,6

17,76

17,79

16,7

19,87

19,39

23,9

21,98

21,14

20,4

24,09

23,04

26,5

26,2

25,12

24,1

28,31

27,38

32,5

30,42

29,84

30,1

32,53

32,53

39,7

34,64

35,45

36,5

36,75

38,65

itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.

A tél szezonalitása

A tavasz szezonalitása

A nyár szezonalitása

Az ősz szezonalitása

A korrigált szezonalitás pedig

Így

ÉV

forgalom

LIN.+szezon

2011

TÉL

16,01

TAVASZ

12,95

NYÁR

20,51

ŐSZ

17,35

2012

TÉL

24,45

TAVASZ

21,39

NYÁR

28,95

ŐSZ

25,79

2013

TÉL

32,89

TAVASZ

29,83

NYÁR

37,39

ŐSZ

34,23

Most jön az exponenciális trend.

A képlet ugyanaz, csak kivonás helyett osztás.

VALÓS       LIN.        EXP.

16,9

13,54

14,98

13,6

15,65

16,32

20,6

17,76

17,79

16,7

19,87

19,39

23,9

21,98

21,14

20,4

24,09

23,04

26,5

26,2

25,12

24,1

28,31

27,38

32,5

30,42

29,84

30,1

32,53

32,53

39,7

34,64

35,45

36,5

36,75

38,65

A tél szezonindexe

A tavasz szezonindexe

A nyár szezonindexe

Az ősz szezonindexe

Ezek átlaga lényegében 1, tehát a szezonindexeket most nem kell korrigálnunk.

ÉV

forgalom

EXP. x szezon

2011

TÉL

16,77

TAVASZ

14,36

NYÁR

19,75

ŐSZ

17,45

2012

TÉL

23,68

TAVASZ

20,28

NYÁR

27,88

ŐSZ

24,64

2013

TÉL

33,42

TAVASZ

28,62

NYÁR

39,35

ŐSZ

34,78

Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy

Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:

           és

De mivel ugye

           és

És így azt kapjuk, hogy

Lássuk csak, hogyan tudnánk teljesíteni, a  feltételt.

Ha páratlan sok adat van, akkor könnyű:

t

adatok

-2

y

-1

y

0

y

1

y

2

y

De ha páros sok, akkor baj van:

t

adatok

-2

y

-1

y

0

y

1

y

2

y

3

y

Vagyis páratlan számú adatnál mindig a nulla van középen, páros számúnál viszont nincs középső elem, itt csak úgy lesz az összeg nulla, ha egy kis trükköt alkalmazunk:

t

adatok

-5

y

-3

y

-1

y

1

y

3

y

5

y

A konkrét esetre visszatérve, itt páros számú adatunk van, tehát

       t      VALÓS       LIN.        EXP.

-11

16,9

13,54

14,98

-9

13,6

15,65

16,32

-7

20,6

17,76

17,79

-5

16,7

19,87

19,39

-3

23,9

21,98

21,14

-1

20,4

24,09

23,04

1

26,5

26,2

25,12

3

24,1

28,31

27,38

5

32,5

30,42

29,84

7

30,1

32,53

32,53

9

39,7

34,64

35,45

11

36,5

36,75

38,65

A normálegyenletek:

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:  

6.0. Az alábbi táblázat egy üzem által gyártott, illetve elszállítás előtt raktározott üveges pálinkák mennyiségét tartalmazza. Töltsük ki. Mármint a hiányzó részeket a táblázatban.

Állapítsuk meg az átlagosan előállított mennyiséget és az átlagos raktárkészletet.

Előállított mennyiség

Raktározva

(a hónap elején)

jan.=100%

előző hónap=100%

db

marc.=100%

előző hónap=100%

db

jan.

-

125

-

febr.

120

110

1100

marc.

3500

apr.

150

3750

87,5

Kezdjük az előállított mennyiséggel. Ha 3750 a januárinak a 150%-a, akkor

Februárban az előző hónap 120%-a: . Mivel márciusban 3500 üveg van, az a januárinak 140%-a és az előző havinak 116,7%-a. Végül 3750 a 3500-nak

107,1%-a. Hasonlóan fondorlatosan kitöltjük a raktárkészletes adatokat is.

Előállított mennyiség

Raktárkészlet

(a hónap elején)

jan.=100%

előző hónap=100%

db

marc.=100%

előző hónap=100%

db

jan.

1

-

2500

1,25

-

1000

febr.

1,2

1,2

3000

1,375

1,1

1100

marc.

1,4

1,167

3500

1

0,7272

800

apr.

1,5

1,071

3750

0,875

0,875

700

Most számoljunk átlagokat! Az előállított mennyiség állapotidősor vagy tartamidősor?

Az előállítás bizony eltart egy darabig, tehát ez tartam, mellesleg itt van értelme az adatok összesítésének, összeadva őket megkapjuk, hogy ezalatt a négy hónap alatt összesen mennyi pálinka készült. Az átlag ekkor

Vagyis átlagosan havonta 3187,5 üveg pálinkát állítottak elő.

A raktárkészlet állapotidősor. Gyanakvásra ad okot például ez az információ is. Itt az átlag:

6.1. Egy részvény árfolyamának alakulását 20 napig figyeltük. Illesszünk az adatokra három napos mozgóátlagolású trendet, majd lineáris trendet. Számítsuk ki a változás átlagos napi mértékét és hasonlítsuk össze a lineáris trend megfelelő paraméterével.

A tényleges idősor

A három napos mozgó átlag

Nézzük meg a lineáris trendet.

A normálegyenletek

           és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

A lineáris trend együtthatója az árfolyam átlagos napi növekedését becsüli meg, a  pedig a tengelymetszetet adja, vagyis a t=0 pillanatban a részvény becsült értékét. Most ami azt jelenti, hogy a napi átlagos árfolyam növekedés a lineáris trend szerint 0,697 USD. Az árfolyam napi változásának átlagos mértékét kiszámolhatjuk a

képlettel is.

A két eredmény eléggé eltér, aminek magyarázata az, hogy a lineáris trend sem vizsgált időszak elején, sem a végén nem jól illeszkedik a valós árfolyamokat jelentő görbére.

6.2. Egy új termék piacra történő bevezetésének adatai az alábbiak voltak.

év

1000 emberből a termékkel rendelkezők száma

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

2008

2009

2010

2011

Illesszünk az adatokra lineáris, majd exponenciális trendet és döntsük el, hogy melyik illeszkedik jobban. Mindkét esetben vizsgáljuk meg a szezonalitást.

Először lássuk a lineáris trendet.

A normálegyenletek

           és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

Nézzük meg!

Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.

év

1000 emberből a termékkel rendelkezők száma

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

2008

2009

2010

2011

A normálegyenletek ugyanazok.

           és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy ln. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát  vagyis

Nézzük meg ezt is!

Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.

LINEÁRIS TREND                                    EXPONENCIÁLIS TREND

VALÓS       LIN.        EXP.

10

7,71

10,648

12

9,99

11,7128

14

12,27

12,88408

15

14,55

14,17249

17

16,83

15,58974

19

19,11

17,14871

20

21,39

18,86358

21

23,67

20,74994

23

25,95

22,82493

25

28,23

25,10743

28

30,51

27,61817

30

32,79

30,37999

35

35,07

33,41799

39

37,35

36,75978

43

39,63

40,43576

46

41,91

44,47934

Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele

A lineáris trend reziduális szórása

Az exponenciális trend reziduális szórása

Az exponenciális trend reziduális szórása jóval kisebb, tehát valóban az illeszkedik jobban.

Most térjünk rá a szezonalitás vizsgálatára.

A lineáris trend esetén a szezonális eltérés

itt n az összes szezon száma, most 16, p pedig a szezontípusok száma, ami 4.

Ekkor az első negyedév szezonalitása

Az második negyedév szezonalitása

A harmadik negyedév szezonalitása

A negyedik negyedév szezonalitása

A korrigált szezonalitás pedig

Így

év

1000 emberből a termékkel rendelkezők száma

SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

08

09

10

11

Most jön az exponenciális trend.

A képlet ugyanaz, csak kivonás helyett osztás.

Az első negyedév szezonindexe

Az második negyedév szezonindexe

A harmadik negyedév szezonindexe

A negyedik negyedév szezonindexe

A korrigált szezonalitás pedig

Így

év

1000 emberből a termékkel rendelkezők száma

SZEZONALITÁSSAL KIIGAZÍTOTT TREND

I. negyedév

II. negyedév

III. negyedév

IV. negyedév

08

10,5

11,7

13,1

13,9

09

15,4

17,1

19,2

20,5

10

22,5

25,1

28,2

29,9

11

32,9

36,7

41,2

43,8

6.3. Egy üzem termelése három egymást követő évben az alábbiak szerint alakult. Illesszünk az adatsorra lineáris majd exponenciális trendet, vizsgáljuk meg, hogy melyik illeszkedik jobban, és adjuk meg a szezonalitást.

ÉV

termelés

(1000 tonna)

2011

TÉL

120

TAVASZ

142

NYÁR

166

ŐSZ

196

2012

TÉL

240

TAVASZ

256

NYÁR

324

ŐSZ

360

2013

TÉL

420

TAVASZ

512

NYÁR

576

ŐSZ

600

Először lássuk a lineáris trendet.

A normálegyenletek

           és

Itt

Ekkor a normálegyenletek:

Megoldjuk az egyenletrendszert.

A lineáris trend:

Nézzük meg!

Most írjuk föl az exponenciális trendet is. Jönnek a logaritmusok.

Teljesen mindegy, hogy milyen logaritmust használunk, most mondjuk legyen lg vagyis 10-es alapú logaritmus.

ÉV

termelés

(1000 tonna)

termelés

(1000 tonna)

2011

TÉL

120

lg120=2,08

TAVASZ

142

lg142=2,15

NYÁR

166

lg166=2,22

ŐSZ

196

lg196=2,29

2012

TÉL

240

lg240=2,38

TAVASZ

256

lg256=2,41

NYÁR

324

lg324=2,51

ŐSZ

360

lg360=2,56

2013

TÉL

420

lg420=2,62

TAVASZ

512

lg512=2,71

NYÁR

576

lg576=2,76

ŐSZ

600

lg600=2,78

A normálegyenletek ugyanazok.

           és

A különbség csak annyi, hogy y-ok és a béták elé oda kell írni, hogy lg. De a t-k elé nem!

Ekkor a normálegyenletek

Megoldjuk az egyenletrendszert.

És így

Az exponenciális trend tehát  vagyis

Nézzük meg ezt is!

Hasonlítsuk össze, hogy vajon a két trend közül melyik illeszkedik jobban a valós adatok zöld színű görbéjéhez.

LINEÁRIS TREND és EXPONENCIÁLIS TREND

VALÓS       LIN.        EXP.

120

73

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

Első ránézésre úgy tűnik, hogy az exponenciális trend a nyerő, de ennek eldöntéséhez az úgynevezett reziduális szórásra van szükségünk. Ez a valós és a trend által kapott értékek eltérését méri, jele

A lineáris trend reziduális szórása

Az exponenciális trend reziduális szórása

Az exponenciális trend reziduális szórása kisebb, tehát valóban az illeszkedik jobban.

Most térjünk rá a szezonalitás vizsgálatára.

A lineáris trend esetén a szezonális eltérés

VALÓS       LIN.        EXP.

120

73

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

itt n az összes szezon száma, most 12, p pedig a szezontípusok száma, ami tél, tavasz, nyár, ősz, vagyis 4.

A tél szezonalitása

A tavasz szezonalitása

A nyár szezonalitása

Az ősz szezonalitása

Most marhajók a szezonális eltéréseink, mert

Így aztán nem is kell korrigálni.

VALÓS       LIN.        EXP.

120

73

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

ÉV

forgalom

LIN.+szezon

2011

TÉL

76

TAVASZ

119,33

NYÁR

171,33

ŐSZ

201,33

2012

TÉL

260

TAVASZ

303,33

NYÁR

355,33

ŐSZ

385,34

2013

TÉL

444

TAVASZ

487,33

NYÁR

539,33

ŐSZ

569,67

Most jön az exponenciális trend.

A képlet ugyanaz, csak kivonás helyett osztás.

VALÓS       LIN.        EXP.

120

73

123,42

142

119

143,17

166

165

166,08

196

211

192,65

240

257

223,48

256

303

259,23

324

349

300,71

360

395

348,82

420

441

404,64

512

487

469,38

576

533

544,48

600

579

631,59

A tél szezonindexe

A tavasz szezonindexe

A nyár szezonindexe

Az ősz szezonindexe

Ezek is elég jók, így korrigálni itt sem kell.

Az idősoroknál szoktak alkalmazni egy olyan bűvészmutatványt, hogy

Ennek megvan az az előnye, hogy a normálegyenletek megoldása rendkívül barátságossá válik. Íme a normálegyenletek:

           és

De mivel ugye

           és


Exponenciális trend

Lineáris, exponenciális és mozgóátlagolású trend 1.0

Amikor szumma t nulla

FELADAT

FELADAT

FELADAT

Szezonindexek az exponenciális trendben

Idősorok elemzése, a lineáris trend

Az idősorok elemzésének legegyszerűbb és máig legnépszerűbb módszerei az úgynevezett dekompozíciós modellek. A modell bemutatásához vegyünk egy egyszerű példát, mondjuk egy fagylaltárus havonta eladott fagylaltjainak számát. A havi eladási számot   jelöli.

A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze:
a hosszú távú folyamatokat leíró trendből, 
az ettől szabályos ingadozással eltérő szezonális komponensből, 
a többnyire hosszú távú hullámzást kifejező ciklikus komponensből és 
a véletlen összetevőből.


 

Előfordulhat, hogy az idősor nem lineáris trendet mutat, hanem exponenciális trendet. Ilyenkor a dekompozíciós modellünket úgy módosítjuk, hogy összeadás helyett összeszorozzuk az egyes komponenseket.

   Ez maga a trend. Általában lineáris vagy exponenciális trendeket szoktak alkalmazni.   A trend meghatározására az úgynevezett analitikus trendszámítást fogjuk használni, de történhet egyszerű mozgóátlagolással is. 

  vagy   Ez a szezonalitás, általában rövid távú szabályos ingadozás, meghatározására számos módszer kínálkozik majd

  vagy   Ez a szabálytalanabb és általában hosszabb hullámzásokat leíró ciklus komponens.

  vagy   Ez a véletlen komponens.

Nézzük meg, hogy mit tudunk mondani az egyes komponensekről. 
  vagyis a trend meghatározása lineáris trend esetén roppant egyszerű, exponenciális trend esetén nem túl bonyolult, más esetekben azonban adódhatnak komolyabb számítások is. A mozgóátlagolással ugyan jóval pontatlanabb trendvonalat tudunk megadni, előnye viszont, hogy bármilyen görbe esetén használható. 

Térjünk most rá a lineáris majd az exponenciális trend meghatározására. A most következő módszert analitikus trendszámítás néven szokás emlegetni. Lényege a természettudományokban elterjedt trendszámítási módszer, az úgynevezett legkisebb négyzetek módszere. A lineáris trend esetében a módszer tömören összefoglalva azt tudja, hogy egy olyan egyenest ad meg, aminek a koordinátarendszer valódi mérésen alapuló pontjaitól mért távolságainak négyzetösszege a legkisebb. Ezáltal ez az egyenes illeszkedik a legjobban az adott pontokhoz, megadva ezzel a trend irányát.


Fontos figyelmeztetés! Az alábbiakban a nyugalom megzavarására alkalmas szavak fognak elhangzani, úgymint deriválás, szélsőérték, meg ilyenek. Akiben ezek rosszérzést keltenek, ugorja át őket. 
A keresett lineáris trend egyenes egyenlete legyen    
A tényleges   értékektől az eltérés   ezeknek az eltéréseknek a négyzetösszege kell, hogy minimális legyen. 

A szóban forgó négyzetösszeg tehát 
 
 
ami tulajdonképpen egy kétváltozós függvény, változói   és  . Ha deriváljuk ezen változók szerint, majd a deriváltakat egyenlővé tesszük nullával, megkapjuk a függvény lehetséges szélsőértékét. A helyzet az, hogy itt valóban van is szélsőérték, ráadásul pont az ami nekünk kell, vagyis minimum. A nullával egyenlővé tett parciális deriváltakat hívjuk normálegyenleteknek. 

A normálegyenleteken nem látszik semmi gyanús, hogy bármi közük is volna a deriváláshoz, de akinek van kedve belegondolni, a

normálegyenlet a   szerinti derivált, csak elosztva 2-vel és átrendezve, a
 

normálegyenlet pedig a   szerinti derivált, csak ez is elosztva 2-vel és átrendezve.


Akinek mindebbe nincs kedve belegondolni, az jegyezze meg, hogy az analitikus trendszámításhoz az alábbi úgynevezett normálegyenleteket kell felírni ahhoz, hogy a lineáris trend   és   együtthatóit megkapjuk.

Térjünk vissza a fagylalt-bizniszhez. Az alábbi táblázat 6 év eladásait tartalmazza negyedéves bontásban. Adjuk meg az analitikus trendszámítás segítségével a lineáris trendet. Azért lineárisat, mert az adatok alapján azt tételezzük föl, hogy a növekedés üteme lineáris. Ha a fagyiárus évente nem mindig 30 000-el több gombóc fagyit adna el, hanem mindig 2-szer annyit, mint előző évben, akkor a trend exponenciális lenne. 


év    forgalom (1000 gombóc)

    I. negyedév
    II. negyedév    III. negyedév    IV. negyedév

2008
    
 

    
  
 

2009
    
 

    
  
 

2010
    
 

2011
    
 


Először meghatározzuk a lineáris trendet, aztán kiszámoljuk a szezonális ingadozást. A lineáris trendhez szükségünk van a normálegyenletekre.


 

   és   


A normálegyenletek tehát 

Megoldva az egyenletrendszert kapjuk, hogy 
 és    

A lineáris trend tehát

Ha rápillantunk a grafikonra, látszik, ahogyan a trendvonal kettészeli a tényleges értékeket mutató zöld görbét. Mivel nyáron több fagyit lehet eladni, ilyenkor a zöld görbe a trendvonal felett tartózkodik, télen viszont kevesebbet, ezért ilyenkor a trendvonal alatt. Ezt az ingadozást veszi figyelembe a szezonalitás, a dekompozíciós modell következő összetevője. 

A négy összetevőből térjünk tehát rá a másodikra, a szezonalitásra.
 

A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből. Most négy szezonunk van, egy téli, egy tavaszi egy nyári és egy őszi ezért négy szezonalitást kell számolnunk. Más idősorok esetében természetesen ez lehet több is és kevesebb is. A szezonalitás képlete a következő:

A képlet roppant barátságos, de némi magyarázatra szorul. Mindössze arról van szó, hogy minden egyes szezonra átlagoljuk a trendvonal és a tényleges értékek közötti eltéréseket. Vagyis a képletben p a szezontípusok száma, ami most tavasz, nyár, ősz, tél, vagyis úgy tűnik négy, n pedig az összes szezon száma, ami 4 év alatt összesen 16. 
 jelenti a tényleges értékeket, ahol az ij-t úgy kell érteni, hogy az i-edik év j-edik szezonja.

Az így kiszámolt szezonális eltéréseket nyers szezonális eltéréseknek nevezzük. A nyers szezonális eltérés helyett egy hangyányival jobban járunk az úgynevezett korrigált szezonális eltérésekkel, aminek jele:
  

A szezonális ingadozások ugyanis természetüknél fogva olyanok, hogy összegük éppen nulla, ezt azonban kerekítési hibák illetve egyéb problémák miatt a nyers szezonális eltérés nem mindig tudja nekünk teljesíteni. A korrigált szezonális eltérés viszont igen.

Vagyis a nagy szenvedések árán előállított szezonális eltérésekből egyszerűen csak ki kell vonni az átlagukat és máris megvan a korrigált szezonális eltérés. Ha már maguknak a nyers szezonális eltérések összege is nulla, akkor az átlaguk is nulla, tehát nem vonunk ki semmit. Ha viszont az összegük nem nulla, akkor saját magukból kivonva az átlagukat, megkapjuk a korrigált szezonális eltéréseket.

Most éppen

 
A korrigált szezonális eltérések így:

 
 
 
 


A dekompozíciós idősor-modell két legfontosabb összetevőjével tehát megvolnánk. Az

másik két komponensével a továbbiakban fogunk majd foglalkozni. Hatásuk nem elhanyagolható, tehát nem feledkezhetünk meg róluk. Vagyis nem mondhatjuk, hogy 
 

azt azonban igen, hogy
 

és az eltérés általában igen minimális. Összehasonlításképpen nézzük meg a tényleges  -okat és a szezonalitással kiigazított   trendvonal értékeket. Azt látjuk, hogy az két táblázat adatai alig térnek el. Ezt még jobban szemlélteti, a két adatsor grafikonja. Vagyis sok-sok számolás árán sikerült rekonstruálnunk azokat az adatokat, amiket már az egész történet elején amúgy is tudtunk. Mi értelme volt mindennek? Nos a válasz kétféle. Egyrészt az összehasonlítással lehetőségünk van az adatsor elemzésére. Például a harmadik negyedévek adatait nézve az látszik, hogy a 2008-as valós adat jóval nagyobb, mint a szezonálisan kiigazított trend, a többi évben viszont lényegében megegyeznek. Ebből arra következtethetünk, hogy 2008-ban nagy valószínűséggel történnie kellett valaminek: finomabbak voltak a fagyik; melegebb volt a nyár; nagyobb volt az emberek fagyikvótája; nem tudni, de akit érdekel, ezen statisztikai információk birtokában már nyomozhat a valódi okok után. Vagyis a kétféle adatsor összehasonlítása egyfajta elemzésre ad lehetőséget.


év    forgalom (1000 gombóc)
VALÓS  

    I. negyedév
    II. negyedév    III. negyedév    IV. negyedév

08
    
 

    
  
 

09
    
 

    
  
 

10
    
 

11
    
 

év    forgalom (1000 gombóc)
SZEZONALITÁSSAL KIIGAZÍTOTT TREND  

    I. negyedév
    II. negyedév    III. negyedév    IV. negyedév

08
    
 

    
  
 

09
    
 

    
  
 

10
    
 

    
  
 

11
    
 

    
  
 


 

Másrészt, kezdetlegesen ugyan, de képesek leszünk előre jelezni a következő évek eladási adatait a szezonálisan kiigazított trend segítségével. A trendvonal képletébe ugyanis tetszés szerint irogathatunk t-ket. Ha tehát kíváncsiak vagyunk a 2050-es eladásokra, lássuk csak az 2012-nél t=17, 18, 19, 20 aztán 2013-nál t=21, 22, 23, 24, aztán… 2050-nél t=169, 170, 171, 172 és íme az adatok:

 
 
 
 

A szezonalitással kiigazítva pedig

 
 
 
 

Ezek az adatok persze nyilvánvalóan banálisak, hiszen 2050-ig még akár ki is pusztulhat az egész emberiség, vagy leszokhat a fagyievésről, vagy ki tudja még milyen valóban szörnyű dolgok történhetnek. Néhány negyedévre előre azonban már viszonylag jó pontosságú becslést tudunk adni.


Lineáris, exponenciális és mozgóátlagolású trend 2.0

Lineáris, exponenciális és mozgóátlagolású trend 3.0

Kapcsolatfelvétel
  • Segítségnyújtás
  • Hibabejelentés
  • Kapcsolatfelvétel
  • Mateking torrent bejelentés
Rólunk
  • A projektről
  • Médiamegjelenések
  • Legyen élmény a matek
  • Mire jó a matek?
Tartalomjegyzék
  • Középiskolai matek
  • Analízis 1
  • Analízis 2
  • Analízis 3
  • Lineáris algebra
  • Valószínűségszámítás
  • Diszkrét matematika
  • Statisztika
  • További tantárgyak
  • Egyetemi tematikák
  • Matek érettségi
GYIK Általános szerződési feltételek Adatkezelési tájékoztató Felhasználás oktatási célra

Cookie-használat módosítása

© Minden jog fenntartva!

Az oldalon található tartalmak részének vagy egészének másolása, elektronikus úton történő tárolása vagy továbbítása, harmadik fél számára nyújtott oktatási célra való hasznosítása kizárólag az üzemeltető írásos engedélyével történhet. Ennek hiányában a felsorolt tevékenységek űzése büntetést von maga után!

barion
macroweb
  • Tantárgyaim