Barion Pixel Adatelemzés 1 | mateking
 
9 témakör, 157 rövid és szuper érthető epizód
Ezt a nagyon laza Adatelemzés 1 kurzust úgy terveztük meg, hogy egy csapásra megértsd a lényeget. Tudásszinttől függetlenül, teljesen az alapoktól magyarázzuk el a tananyagot, a saját ritmusodban lépésről lépésre. Így tudjuk a legbonyolultabb dolgokat is elképesztően egyszerűen elmagyarázni.
4 980 Ft / fél év

Tartalomjegyzék: 

A kurzus 9 szekcióból áll: Alapfogalmak, Becslések, Egy ismérv szerinti elemzés, Hipotézisvizsgálat, Idősorok, Indexszámítás, Két ismérv szerinti elemzés, Regressziószámítás, Standardizálás

Alapfogalmak

  • -

    Az ismérvek olyan vizsgálati szempontok, amelyek alapján a sokaság részekre osztható.

  • -

    A nominális (névleges) mérési skála a sokaság elemeit valamilyen tulajdonság szerint csoportokba sorolja, de a csoportok között nincsen semmilyen sorrendiség.

  • -

    Az ordinális (sorrendi) mérési skála a sokaság elemeit valamilyen tulajdonság szerint csoportokba sorolja, és a csoportok között van sorrendiség.

  • -

    Az intervallum-skála a sokaság elemeit valamilyen mérés szerint rendezi sorba.

  • -

    Az arány-skála a sokaság elemeit szintén valamilyen mérés szerint rendezi sorba, de abban különbözik az intervallum-skálától, hogy ennek van valódi nullpontja.

  • -

    Hogyha egy sokaság elemei egymástól jól elkülöníthető egységek, akkor a sokaság diszkrét.

  • -

    Hogyha egy sokaság nem diszkrét, akkor az folytonos.

  • -

    Az időpontra vonatkozó sokaságokat álló sokaságnak nevezzük.

  • -

    Az időtartamra vonatkozó sokaságokat mozgó sokaságnak nevezzük.

  • -

    A viszonyszámok kiszámolásának módja meglehetősen semmitmondó.

  • -

    Ha több viszonyszámunk van, fölmerülhet az igény ezek átlagolására.

  • -

    Ha több viszonyszámunk van, fölmerülhet az igény ezek átlagolására.

  • -

    A dinamikus viszonyszámok idősorok adataiból számított hányadosok.

  • -

    A megoszlási viszonyszám egy sokaság valamely részének az egészhez viszonított arányát írja le.

  • -

    Az intenzitási viszonyszám két, egymással valamilyen kapcsolatban álló sokaság mennyiségeinek hányadosa.

  • -

    Azokat az adatsorokat nevezzük idősornak, melyek egy vagy több ismérv időben történő megoszlását írják le.

  • -

    A bázisviszonyszámok mindig a bázishoz viszonyítanak.

  • -

    A láncviszonyszámok mindig az előző évhez viszonyítanak.

  • -

    Összeadogatjuk a változásokat, aztán elosztjuk...

  • -

    A változás üteme azt adja meg, hogy hány százalékos volt a változás.

  • -

    A tartamidősorok egy vizsgált időtartamra vonatkozó megfigyeléseket tartalmaznak.

  • -

    Az állapotidősorok egy vizsgált időtartam egy adott pillanatára vonatkozó megfigyeléseket tartalmazzák.

  • -

    Egy speciális átlag, például ha négy hónap adataiból számoljuk ki az átlagot, viszont csak három hónapos időtartamra.

  • -

    Ezek tulajdonképpen egymás mellett szerepeltetett valamilyen adatok.

  • -

    Lényege, hogy az adatokat valamelyik ismérv szerint tudjuk összesíteni.

  • -

    Mindegyik ismérv szerint tudjuk az adatokat összesíteni.

Becslések

Egy ismérv szerinti elemzés

  • -

    A módusz a leggyakoribb érték.

  • -

    A medián a növekvő sorba rendezett adatsor középső értéke.

  • -

    Az átlag az összes elem összege osztva az elemszámmal.

  • -

    Az átlagtól való átlagos eltérést szórásnak nevezzük és egy szigma nevű görög betűvel jelöljük.

  • -

    Az adatsor első felének a felezőpontja az alsó kvartilis.

  • -

    Az adatsor második felének a felezőpontja a felső kvartilis.

  • -

    A kvartilisek és a medián azt szemlélteti, hogyan oszlanak el az adatsorban szereplő adatok.

  • -

    A relatív szórás azt mondja meg, hogy a szórás az átlagnak hány százaléka:

  • -

    A módusz gyakorisági sorok esetében már másképp számolható ki, mint ahogy középiskolában megszoktuk.

  • -

    Gyakorisági sorok esetében a medián kiszámítása másképp zajlik, mint azt középiskolában megszoktuk.

  • -

    A kvartiliseket gyakorisági sorok esetében máshogy kell kiszámolni, mint azt középiskolában tettük.

  • -

    A relatív gyakoriságot úgy kell kiszámolni, hogy a gyakoriságot osztjuk az összes elemszámmal.

  • -

    Az értékösszeget úgy kapjuk meg, hogy az osztályközepeket megszorozzuk a gyakorisággal.

  • -

    A Herfindahl-index egy eszköz a koncentráció vizsgálatára.

  • -

    A Lorenz-görbe egy eszköz a koncentráció vizsgálatára.

  • -

    Az egyik legegyszerűbb és leggyakrabban használt alakmutatók, az úgynevezett Pearson-féle mérőszámok:

  • -

    Az egyik legegyszerűbb és leggyakrabban használt alakmutatók, az úgynevezett Pearson-féle mérőszámok mellett az F-mutatók.

  • -

    A csúcsosság azt jelenti, hogy az eloszlás görbéje mennyire csúcsosodik ki.

Hipotézisvizsgálat

  • -

    Az elfogadási tartomány az a tartomány, ahová ha a próba értéke kerül, akkor a nullhipotézist elfogadjuk.

  • -

    A kritikus tartomány az a tartomány, ahová ha a próba értéke kerül, akkor a nullhipotézist elvetjük.

  • -

    A szignifikanciaszint a hibás döntés valószínűsége.

  • -

    A hipotézis megfogalmazása. A próbafüggvény kiválasztása. Szignifikanciaszint és kritikus tartomány. Mintavétel és döntés.

  • -

    A sokaság normális eloszlású, szórása $\sigma$, $H_0$ a sokaság átlagára vonatkozik, a minta elemszáma $n$.

  • -

    A sokaság normális eloszlású, szórása nem ismert, $H_0$ a sokaság átlagára vonatkozik, a minta elemszáma $n$

  • -

    A sokaság tetszőleges eloszlású, szórása nem ismert, $H_0$ a sokaság átlagára vonatkozik, a minta $n$ elemű, elemszáma nagy.

  • -

    A sokaság tetszőleges eloszlású, $H_0$ a sokasági arányra vonatkozik, a minta $n$ elemű, elemszáma nagy

  • -

    A sokaság normális eloszlású, $H_0$ a sokasági szórásra vonatkozik, a minta $n$ elemű.

  • -

    A sokaság eloszlására irányuló vizsgálat.

  • -

    A sokaságon belül két ismérv függetlenségére irányuló vizsgálat. $H_0$: a két ismérv független, az ellenhipotézis pedig, $H_1$: a két ismérv közti kapcsolat sztochasztikus vagy függvényszerű.

  • -

    Két sokaságban valamely változó eloszlásának egyezőségére irányuló vizsgálat. $H_0$: a két sokaságban az eloszlás egyező, az ellenhipotézis pedig, $H_1$: a két eloszlás nem egyező.

  • -

    Mindkét sokaság normális eloszlású, szórásaik $\sigma_X$ és $\sigma_Y$.

  • -

    A két sokaság normális eloszlású és szórásaik egyformák.

  • -

    A két sokaság eloszlása és szórása nem ismert, mindkettő szórása véges, és mindkét minta elemszáma elég nagy.

  • -

    Két sokaság szórásának összehasonlítására irányuló próba, ha mindkét sokaság normális eloszlású. A nullhipotézis $H_0$: $\sigma_1^2 = \sigma_2^2$

  • -

    Több sokaság várható értékének összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású és azonos szórású.

  • -

    A Bartlett-próba több sokaság szórásának összehasonlítására vonatkozó próba, ha mindegyik sokaság normális eloszlású.

Idősorok

  • -

    A dekompozíciós modellek lényege, hogy az idősorok négy, egymástól elkülöníthető komponensből tevődnek össze.

  • -

    A lineáris trend egyenlete Excellel és kézzel is kiszámolható.

  • -

    A szezonalitást úgy kell elképzelni, hogy az minden nyári szezonban ugyanannyit hozzáad, minden téliben pedig ugyanannyit elvesz a trendvonal által meghatározott értékből.

  • -

    Korrigált szezonális eltérés akkor lesz, ha a nyers szezonális eltérések összege nem nulla.

  • -

    A tartamidősorok egy vizsgált időtartamra vonatkozó megfigyeléseket tartalmaznak.

  • -

    Az állapotidősorok egy vizsgált időtartam egy adott pillanatára vonatkozó megfigyeléseket tartalmazzák.

  • -

    Egy speciális átlag, például ha négy hónap adataiból számoljuk ki az átlagot, viszont csak három hónapos időtartamra.

  • -

    Ezzel a trükkel jelentősen csökkenthetjük a normálegyenletek által okozott szenvedéseket.

Indexszámítás

  • -

    A volumenindex a forgalom változásának mértéke.

  • -

    Az árindex a szektort érintő árváltozást méri.

  • -

    A legtöbb feladatban nincs külön megadva $p_0$ és $p_1$ valamint $q_0$ és $q_1$ pontos értéke, ezért különböző bűvészmutatványokra lesz szükség.

  • -

    A Fischer-féle árindex és volumenindex kiszámítása.

  • -

    Képletek az értékindex kiszámításához.

  • -

    A vásárlóerő mérésére van forgalomban az úgynevezett vásárlóerő-paritás.

Két ismérv szerinti elemzés

Regressziószámítás

  • -

    A regressziószámítás lényege annak vizsgálata, hogy egy bizonyos változó, amit eredményváltozónak hívunk, hogyan függ más változók, az úgynevezett magyarázó változók alakulásától.

  • -

    A regressziós egyenes egy lineáris függvény, ami mindegyik x-hez hozzárendel valamilyen y-t. Ezek általánan eltérnek a valódi y-októl. Ezeket az eltéréseket reziduumoknak nevezzük.

  • -

    A reziduumokból képzett mutató az úgynevezett SSE, jelentése sum of squares of the errors vagyis eltérés-négyzetösszeg.

  • -

    Ha az SSE értékeit elosztjuk a megfigyelt pontok számával és a kapott eredménynek vesszük a gyökét, akkor kapjuk a reziduális szórást.

  • -

    A lineáris korrelációs együttható azt méri, hogy x és y között milyen szoros lineáris kapcsolat van.

  • -

    A magyarázóerőt méri az úgynevezett determinációs együttható.

  • -

    A hatványkitevős modellben y helyett lg y, x helyett lg x van, $\hat{b}_1$ viszont marad $\hat{b}_1$

  • -

    Az exponenciális modellben y helyett lg y van, az x viszont marad x, $\hat{b}_1$ helyett pedig $\lg{ \hat{b}_1}$ van.

  • -

    Az elaszticitás két összefüggő jelenség közti kapcsolat.

  • -

    5 feltétel standard lineáris modellhez.

  • -

    A paraméterek és a regresszió becslése standard lineáris modellben.

  • -

    A többváltozós regressziós modelleket olyankor alkalmazzuk, amikor az eredményváltozó alakulását több magyarázó változó tükrében vizsgáljuk.

  • -

    A kétváltozós esethez hasonlóan a korreláció itt is a változók közti kapcsolat szorosságát írja le, csakhogy itt egy fokkal rosszabb a helyzet, ugyanis most bármely két változó korrelációját vizsgálhatjuk. Ezt tartalmazza a korrelációmátrix.

  • -

    A tesztelés úgy zajlik, hogy nullhipotézisnek tekintjük a $H_0 :  b_i = 0$ feltevést, ellenhipotézisnek pedig azt, hogy $H_1  :  b_i \neq 0$.

  • -

    Négyzetösszeg, szabadságfok, átlagos négyzetösszeg, F.

  • -

    A multikollinearitás röviden összefoglalva azt jelenti, hogy két vagy több magyarázó változó között túl szoros korrelációs kapcsolat van, és ez zavarja a becslést.

  • -

    Az autokorreláció a regresszió maradéktagjának a saját későbbi értékeivel való korrelációját jelenti, vagyis egyfajta szabályszerűséget a maradékváltozóban.

  • -

    A Durbin-Wattson-teszt lényegében egy hipotizésvizsgálat.

Standardizálás