Regisztráció

form.antibot { display: none !important; } You must have JavaScript enabled to use this form.

Adatelemzés 2

12 témakör, 217 rövid és szuper érthető epizód

Ezt a nagyon laza Adatelemzés 2 kurzust úgy terveztük meg, hogy egy csapásra megértsd a lényeget. Tudásszinttől függetlenül, teljesen az alapoktól magyarázzuk el a tananyagot, a saját ritmusodban lépésről lépésre. Így tudjuk a legbonyolultabb dolgokat is elképesztően egyszerűen elmagyarázni.

4 980 Ft fél évre

Tartalomjegyzék:

A kurzus 12 szekcióból áll: Kombinatorika, Valszám alapok, klasszikus valszám, Teljes valószínűség tétele, Bayes tétel, Eloszlás, eloszlásfüggvény, sűrűségfüggvény, Várható érték és szórás, Markov és Csebisev egyenlőtlenségek, A binomiális eloszlás és a hipergeometriai eloszlás, Nevezetes diszkrét és folytonos eloszlások, Becslések, Hipotézisvizsgálat, Regressziószámítás, Idősorok

STATISZTIKAI BECSLÉSEK - Statisztikai becslések, pontbecslés, intervallumbecslés, standard hiba, mintavételi hiba, nemmintavételi hiba, FAE-minta, EV-minta,rétegzett minta, többlépcsős minta, torzítatlanság, minimális variancia elve, konfidencia szint, konfidencia tartomány, sokasági átlag becslése, sokasági arány becslése, sokasági variancia.

HIPOTÉZISVIZSGÁLAT - A hipotézisvizsgálat menete, nullhipotézis, ellenhipotézis, szignifikanciaszint, elsőfajú és másodfajú hiba, próbafüggvény, próbák, kritikus tartomány, kritikus érték, paraméteres próbák, nemparaméteres próbák, Z-próba, t-próba, khí-négyzet-próba, homogenitás- vizsgálat, illeszkedésvizsgálat, függetlenségvizsgálat, F-próba, varianciaanalízis, Bartlett-próba.

REGRESSZIÓSZÁMÍTÁS - Regresszió alapötlete, magyarázó változók, eredményváltozó, proxy változó, dummy változó, lineáris kétváltozós regresszió, reziduumok, reziduális szórás, korreláció, kovariancia, elaszticitás, többváltozós lineáris regressziós modell, paraméterek becslése, elaszticitás, korrelációs mátrix, kovariancia mátrix, standard lineáris modell, paraméterek intervallumbecslése, paraméterek szeparált tesztelése, t-próba, modell tesztelése, autokorreláció, nem lineáris regressziók.

IDŐSOROK - Állapot idősor, tartam idősor, változás üteme és mértéke, kronologikus átlag, mozgóátlagok, mozgóátlagolású trend, simítás, szűrés, dekompozíciós idősormodellek, lineáris trend, exponenciális trend, trendegyenlet, normálegyenletek, szezonalitás, szezonális eltérés, szezonindex, szezonalitással kiigazított trend, szezonalitástól megtisztított trend.

Kombinatorika

Ismétléses permutáció
-
Ismétléses permutációról akkor beszélünk, ha n elem sorrendjére vagyunk kiváncsiak, de ezen elemek között vannak megegyezőek is.
Ismétléses variáció
-
Ismétléses variációról akkor beszélünk, ha n különböző elem közül kiválasztunk k db.-ot úgy, hogy a kiválasztott elemek sorrendje is számít és egy elemet többször is választhatunk.
Ciklikus permutáció
-
Ha kör alakban helyezünk el n különböző elemet és azok sorrendjét vizsgáljuk, akkor ciklikus permutációról beszélünk.

Valszám alapok, klasszikus valszám

Események
-
Eseményeknek nevezzük a valószínűségi kísérlet során bekövetkező lehetséges kimeneteleket.
Valószínűség kiszámításának klasszikus modellje
-
A valószínűség kiszámításának klasszikus modellje az, hogy megszámoljuk hány elemi eseményből áll a vizsgált esemény és ezt elosztjuk az összes elemi esemény számával.
Független események
-
Mikor mondjuk, hogy két esemény egymástól független? Példák független eseményekre.
Kizáró események
-
Mikor kizáró két esemény? Példák kizáró eseményekre.
Feltételes valószínűség
-
A feltételes valószínűség. Az A feltéva B valószínűség azt jelenti, hogy mekkora eséllyel következik be az A esemény, ha a B esemény biztosan bekövetkezik..
Műveletek eseményekkel
-
Események metszetének, uniójának, különbségének és komplementerének valószínűségei.

Teljes valószínűség tétele, Bayes tétel

Teljes valószínűség tétele
-
A teljes valószínűség tétele azt mondja ki, hogy ha ismerjük egy A esemény feltételes valószínűségét egy teljes eseményrendszer valamennyi eseményére, akkor ebből az A esemény valószínűsége kiszámítható.
Bayes tétel
-
Olyankor használjuk, ha egy korábban bekövetkezett $B_k$ esemény valószínűségére vagyunk kíváncsiak egy később bekövetkezett A esemény tükrében.

Eloszlás, eloszlásfüggvény, sűrűségfüggvény

Folytonos valószínűségi változó
-
Folytonosnak nevezzük azokat a valószínűségi változókat, amik folytonos mennyiségeket mérnek, ilyen például az idő, a távolság.
Diszkrét valószínűségi változó
-
Diszkrétnek nevezzük azokat a valószínűségi változókat, amik megszámlálhatóan sok értéket vesznek fel.
Eloszlásfüggvény
-
Az X valószínűségi változó eloszlásfüggvénye F(x). F(x)=P(x<X) Vagyis minden x számhoz hozzárendeli annak a valószínűségét, hogy X<x. Nos ez elég izgi..
Sűrűségfüggvény
-
A sűrűségfüggvény a görbe alatti területekkel írja le egy esemény valószínűségét.
Eloszlásfüggvény tulajdonságai
-
Az eloszlásfüggvény határértéke minusz végtelenben 0, plusz végtelenben 1, monoton nő és balról folytonos.
Sűrűségfüggvény tulajdonságai
-
A sűrűségfüggvény integrálja minusz végtelentől plusz végtelenig 1, és nem negatív.
Összefüggések eloszlásfüggvény és sűrűségfüggvény között
-
Három nagyon fontos összefüggés eloszlásfüggvény és sűrűségfüggvény között.
Sűrűségfüggvényből eloszlásfüggvény és fordítva
-
Az $X$ valószínűségi változó $F(x)$ eloszlásfüggvényéből úgy kapjuk meg az $f(x)$ sűrűségfüggvényét, hogy az $F(x)$ eloszlásfüggvényt deriváljuk. Fordítva pedig integrálni kell.

Várható érték és szórás

Várható érték diszkrét esetben
-
A valószínűségi változó értékeinek valószínűségekkel súlyozott átlaga. De valójában ez rém egyszerű, nézzünk rá néhány példát.
Szórás diszkrét esetben
-
A szórás azt mutatja meg, hogy a várható érték körül milyen nagy ingadozásra számíthatunk.
Várható érték folytonos esetben
-
Folytonos valószínűségi változók esetén a várható értéket egy integrálás segítségével számítjuk.
Szórás folytonos esetben
-
Folytonos valószínűségi változó esetén a szórást ugyanúgy kell számolni, mint diszkrét valószínűségi változó esetén:

Markov és Csebisev egyenlőtlenségek

Markov egyenlőtlenség
-
A Markov egyenlőtlenség arról szól, hogy az X valószínűségi változó a várható értéknél nem lehet sokkal nagyobb.
Csebisev egyenlőtlenség
-
A Csebisev egyenlőtlenség azt írja le, hogy az X valószínűségi változó várható értéktől való eltérése nem lehet túl nagy.
Nagy számok törvénye
-
Ha egy esemény bekövetkezésének elméleti valószínűsége $p$, akkor minél többször végezzük el a kísérletet, a relatív gyakoriság és az elméleti valószínűség eltérése annál kisebb lesz.

A binomiális eloszlás és a hipergeometriai eloszlás

Binomiális eloszlás
-
Ha a szövegben valószínűségek vannak megadva, akkor a binomiális eloszlást szoktuk használni.
Visszatevéses mintavétel
-
A visszatevées mintavételhez kapcsolódó eloszlás a binomiális eloszlás.
Visszatevés nélküli mintavétel
-
Ha húzásokat vizsgálunk úgy, hogy a kihúzott elemeket nem tesszük vissza, akkor ez egy visszatevés nélküli mintavétel.
Hipergeometriai eloszlás
-
A hipergeometriai eloszlás a visszatevés nélküli mintavételhez kapcsolódó eloszlás.

Nevezetes diszkrét és folytonos eloszlások

Hipergeometriai eloszlás
-
A hipergeometriai eloszlás egy diszkrét eloszlás, ahol N darab elem közül kiválasztunk n darab elemet visszatevés nélkül. Az összes elem között K darab selejtes található. Az eloszlás annak valószínűségét írja le, hogy a kiválasztott elemek között éppen k darab selejtes van.
Binomiális eloszlás
-
A binomiális eloszlás egy diszkrét eloszlás, ahol egy esemény bekövetkezésének a valószínűsége p és egymástól függetlenül elvégzünk n darab kísérletet, ahol a kísérletek mindegyikében az esemény vagy bekövetkezik vagy nem. Az eloszlás annak valószínűségét írja le, hogy az esemény éppen k-szor következik be.
Poisson eloszlás
-
A Poisson eloszlás egy diszkrét eloszlás, ahol egy esemény bekövetkezésének a várható előfordulása lambda darab. Az eloszlás annak valószínűségét írja le, hogy az esemény éppen k-szor következik be.
Exponenciális eloszlás
-
Az eltelt idők és a távolságok eloszlása.
Egyenletes eloszlás
-
Ez egy folytonos eloszlás, ahol egy esemény bekövetkezésének valószínűsége valamely intervallumon konstans.
Normális eloszlás
-
Mennyiségek eloszlása.

Becslések

Becslés
-
Olyan esetekben, amikor valamiért nem tudjuk vagy nem akarjuk a teljes sokaságot megvizsgálni, hogy meghatározzuk a fontosabb statisztikai mutatóit, becslést alkalmazunk.
Konfidencia szint
-
A megbízhatósági szintet konfidencia szintnek nevezzük.
Konfidencia intervallum
-
Az $1- \alpha$ megbízhatósági szinthez, vagy másként konfidencia szinthez tartozó konfidencia intervallumok azok az intervallumok, amik a sokasági átlagot $1-\alpha$ valószínűséggel tartalmazzák.
Átlag intervallumbecslése, ha a sokasági szórás ismert (FAE minta)
-
Módszer az átlag intervallumbecslésére, ha a sokasági szórás ismert.
FAE minta
-
A FAE minta azt jelenti, hogy a mintavétel során bármely mintaelemet azonos eséllyel választunk ki.
Átlag intervallumbecslése, ha a sokasági szórás nem ismert (FAE minta)
-
Módszer átlag intervallumbecslésére, ha a sokasági szórás nem ismert.
Arány intervallumbecslése (FAE minta)
-
Módszer arány intervallumbecslésére.
Variancia intervallumbecslése (FAE minta)
-
Módszer variancia intervallumbecslésre.
EV-minta
-
Az EV-minta abban különbözik a FAE-mintától, hogy a kiválasztott mintaelemek nem függetlenek egymástól.
Átlag intervallumbecslése, ha a sokasági szórás nem ismert (EV-minta)
-
Módszer átlag intervallumbecslésre, ha a sokasági szórás nem ismert (EV-minta).
Arány intervallumbecslése (EV-minta)
-
Módszer arány intervallumbecslésére EV-minta esetén.
Átlag intervallumbecslése rétegzett mintából
-
Ha a teljes sokaságot felosztjuk viszonylag homogén rétegekre, és a mintát is ezen a rétegek szerint vizsgáljuk, a variancia csökkenthető.
Kétmintás becslés
-
A kétmintás becslésekre akkor van szükség, amikor két sokaság valamilyen paraméterét, leginkább az átlagát szeretnénk összehasonlítani.
Két átlag különbségének becslése
-
Ha mindkét sokaság közel normális eloszlású, akkor az átlagok különbségének becslésére ez a formula van forgalomban.
Statisztikai becslések torzítatlansága
-
Egy becslést torzítatlannak nevezünk, ha az egyes mintákból kapott becslések várható értéke megegyezik a becsülni kívánt mennyiséggel.
Becslések versenyeztetése
-
A kérdés az, hogy ha egy sokasági jellemzőre több becslés jöhet szóba, hogyan válasszunk közülük, vagyis mikor tekintünk egy becslést jónak, kettő közül melyiket tekintjük jobbnak és kijelenthetjük-e valamelyikről, hogy a legjobb?
MSE
-
Két becslés közül azt részesítjük előnyben, amelyre MSE kisebb.
Standard hiba
-
A standard hiba azt mondja meg, hogy a mintaátlagok mekkora szórással ingadoznak a tényleges sokasági átlag körül.
Mintavételi hibák
-
Mintavételi hibának azokat a hibákat nevezzük, amik kimondottan azért fordulnak elő, mert nem tudjuk, vagy nem akarjuk a teljes sokaságot vizsgálni.
Trigonometriai összefüggések
-
Trigonometriai képlet összefoglaló. Összefüggések a tangens és kotangens között. A trigonometria alapegyenlete. Szögek kétszeresének szinusza és koszinusza.
Koszinusz
-
Az egységkör egy szöggel elforgatott egységvektorának végpontjának x koordinátáját nevezzük a szög koszinuszának
Szinusz
-
Az egységkör egy szöggel elforgatott egységvektorának végpontjának y koordinátáját nevezzük a szög szinuszának.
Tangens
-
Egy szög tangense a szög szinuszának és koszinuszának hányadosával egyenlő.

Hipotézisvizsgálat

Elfogadási tartomány
-
Az elfogadási tartomány az a tartomány, ahová ha a próba értéke kerül, akkor a nullhipotézist elfogadjuk.
Kritikus tartomány
-
A kritikus tartomány az a tartomány, ahová ha a próba értéke kerül, akkor a nullhipotézist elvetjük.
Szignifikanciaszint
-
A szignifikanciaszint a hibás döntés valószínűsége.
Hipotézis vizsgálat lépései
-
A hipotézis megfogalmazása. A próbafüggvény kiválasztása. Szignifikanciaszint és kritikus tartomány. Mintavétel és döntés.
Z-próba
-
A sokaság normális eloszlású, szórása $\sigma$, $H_0$ a sokaság átlagára vonatkozik, a minta elemszáma $n$.
t-próba
-
A sokaság normális eloszlású, szórása nem ismert, $H_0$ a sokaság átlagára vonatkozik, a minta elemszáma $n$
Aszimptotikus Z-próba
-
A sokaság tetszőleges eloszlású, szórása nem ismert, $H_0$ a sokaság átlagára vonatkozik, a minta $n$ elemű, elemszáma nagy.
Z-próba sokasági arányra
-
A sokaság tetszőleges eloszlású, $H_0$ a sokasági arányra vonatkozik, a minta $n$ elemű, elemszáma nagy
Khi-négyzet próba
-
A sokaság normális eloszlású, $H_0$ a sokasági szórásra vonatkozik, a minta $n$ elemű.
Khi-négyzet próba illeszkedésvizsgálat
-
A sokaság eloszlására irányuló vizsgálat.
Khi-négyzet próba függetlenség vizsgálat
-
A sokaságon belül két ismérv függetlenségére irányuló vizsgálat. $H_0$: a két ismérv független, az ellenhipotézis pedig, $H_1$: a két ismérv közti kapcsolat sztochasztikus vagy függvényszerű.
Khi-négyzet próba homogenitásvizsgálat
-
Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. $H_0$: a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, $H_1$: a két eloszlás nem egyező.
Kétmintás Z-próba
-
Mindkét sokaság normális eloszlású, szórásaik $\sigma_X$ és $\sigma_Y$.
Kétmintás t-próba
-
A két sokaság normális eloszlású és szórásaik egyformák.
Kétmintás aszimptotikus Z-próba
-
A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.
F-próba
-
Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis $H_0$: $\sigma_1^2 = \sigma_2^2$
Varianciaanalízis
-
Több sokaság várható értékének összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású és azonos szórású.
Bartlett-próba
-
A Bartlett-próba több sokaság szórásának összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású.

Regressziószámítás

Lineáris regresszió
-
A regressziószámítás lényege annak vizsgálata, hogy egy bizonyos változó, amit eredményváltozónak hívunk, hogyan függ más változók, az úgynevezett magyarázó változók alakulásától.
Reziduum
-
A regressziós egyenes egy lineáris függvény, ami mindegyik x-hez hozzárendel valamilyen y-t. Ezek általánan eltérnek a valódi y-októl. Ezeket az eltéréseket reziduumoknak nevezzük.
SSE
-
A reziduumokból képzett mutató az úgynevezett SSE, jelentése sum of squares of the errors vagyis eltérés-négyzetösszeg.
Reziduális szórás
-
Ha az SSE értékeit elosztjuk a megfigyelt pontok számával és a kapott eredménynek vesszük a gyökét, akkor kapjuk a reziduális szórást.
Lineáris korrelációs együttható
-
A lineáris korrelációs együttható azt méri, hogy x és y között milyen szoros lineáris kapcsolat van.
Determinációs együttható
-
A magyarázóerőt méri az úgynevezett determinációs együttható.
Hatványkitevős regresszió
-
A hatványkitevős modellben y helyett lg y, x helyett lg x van, $\hat{b}_1$ viszont marad $\hat{b}_1$
Exponenciális regresszió
-
Az exponenciális modellben y helyett lg y van, az x viszont marad x, $\hat{b}_1$ helyett pedig $\lg{ \hat{b}_1}$ van.
Elaszticitás
-
Az elaszticitás két összefüggő jelenség közti kapcsolat.
Standard lineáris modell feltételei
-
5 feltétel standard lineáris modellhez.
Becslések a standard lineáris modellben
-
A paraméterek és a regresszió becslése standard lineáris modellben.
Trigonometriai összefüggések
-
Trigonometriai képlet összefoglaló. Összefüggések a tangens és kotangens között. A trigonometria alapegyenlete. Szögek kétszeresének szinusza és koszinusza.
Koszinusz
-
Az egységkör egy szöggel elforgatott egységvektorának végpontjának x koordinátáját nevezzük a szög koszinuszának
Szinusz
-
Az egységkör egy szöggel elforgatott egységvektorának végpontjának y koordinátáját nevezzük a szög szinuszának.
Tangens
-
Egy szög tangense a szög szinuszának és koszinuszának hányadosával egyenlő.
Többváltozós lineáris regresszió
-
A többváltozós regressziós modelleket olyankor alkalmazzuk, amikor az eredményváltozó alakulását több magyarázó változó tükrében vizsgáljuk.
Korrelációs mátrix többváltozós esetben
-
A kétváltozós esethez hasonlóan a korreláció itt is a változók közti kapcsolat szorosságát írja le, csakhogy itt egy fokkal rosszabb a helyzet, ugyanis most bármely két változó korrelációját vizsgálhatjuk. Ezt tartalmazza a korrelációmátrix.
Többváltozós regresszió tesztelése hipotézisvizsgálattal
-
A tesztelés úgy zajlik, hogy nullhipotézisnek tekintjük a $H_0 : b_i = 0$ feltevést, ellenhipotézisnek pedig azt, hogy $H_1 : b_i \neq 0$.
Varianciaanalízis-táblázat
-
Négyzetösszeg, szabadságfok, átlagos négyzetösszeg, F.
Multikollinearitás
-
A multikollinearitás röviden összefoglalva azt jelenti, hogy két vagy több magyarázó változó között túl szoros korrelációs kapcsolat van, és ez zavarja a becslést.
Autokorreláció
-
Az autokorreláció a regresszió maradéktagjának a saját későbbi értékeivel való korrelációját jelenti, vagyis egyfajta szabályszerűséget a maradékváltozóban.
Durbin-Wattson teszt
-
A Durbin-Wattson-teszt lényegében egy hipotizésvizsgálat.

Idősorok

Dekompozíciós modell
-
A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze.
Lineáris trend egyenlete
-
A lineáris trend egyenlete Excellel és kézzel is kiszámolható.
Szezonalitás
-
A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből.
Korrigált szezonális eltérések
-
Korrigált szezonális eltérés akkor lesz, ha a nyers szezonális eltérések összege nem nulla.
Mozgóátlag
-
A mozgóátlagok abban segítenek nekünk, hogy megmutatják az árfolyam mozgásának nagyobb léptékű tendenciáját, és kiszűrik a sokszor zavaró naponkénti ingadozásokat.
Amikor szumma t nulla
-
Ezzel a trükkel jelentősen csökkenthetjük a normálegyenletek által okozott szenvedéseket.
inverzfüggvény
-
A függvény hozzárendelésének megfordításával kapjuk a függvény inverzfüggvényét, amennyiben a megfordított hozzárendelés is egy egyértelmű hozzárendelés.

Az oldalon található tartalmak részének vagy egészének másolása, elektronikus úton történő tárolása vagy továbbítása, harmadik fél számára nyújtott oktatási célra való hasznosítása kizárólag az üzemeltető írásos engedélyével történhet. Ennek hiányában a felsorolt tevékenységek űzése büntetést von maga után!