- Kombinatorika
- Valszám alapok, klasszikus valszám
- Teljes valószínűség tétele, Bayes tétel
- Eloszlás, eloszlásfüggvény, sűrűségfüggvény
- Geometriai valószínűség, Binomiális tétel
- Várható érték és szórás
- Markov és Csebisev egyenlőtlenségek
- A binomiális eloszlás és a hipergeometriai eloszlás
- Nevezetes diszkrét és folytonos eloszlások
- Kétváltozós eloszlások
- Statisztikai alapfogalmak
- Becslések
- Hipotézisvizsgálat
- Regressziószámítás
- Nem hátrány, ha tudunk integrálni
Statisztikai alapfogalmak
Módusz
Az adatsor legyakoribb értéke a módusz. Hogyha például Bob matekjegyei ezek:
2, 3, 1, 4, 1, 2, 2, 3, 5, 2, 3, 2, 3, 2, 4, 3, 2, 4, 2, 4
Akkor egyszerűen meg kell számolni, hogy melyikből van a legtöbb, és az a matekjegy lesz a módusz. Most 2-esből van a legtöbb, így Bob matekjegyeinek a módusza 2. A módusz jele Mo és így most Mo=2.
Léteznek olyan eloszlások is, amelyeknek több módusza van. Hogyha például Bob jegyei:
1, 2, 2, 3, 5, 3, 3, 4, 2
Itt 2-esből és 3-asból ugyanannyi van, mindkettőből 3 darab. Ez egy kétmóduszú eloszlás.
Medián
A medián a növekvő sorba rendezett adatsor középső értéke. Ha az adatsorban páros sok elem van, akkor nincs középső elem, ilyenkor a két középső elem átlagát vesszük.
Hogyha például Bob matekjegyei ezek:
2, 3, 1, 4, 1, 2, 2, 3, 5, 2, 3, 2, 3, 2, 4, 3, 2, 4, 2, 4
Akkor egyszerűen növekvő sorba kell rakni..
1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5
És aztán meg kell keresni melyik a középső. Most nincsen középső, mert páros sok elem van, így ilyenkor a két középen lévőt átlagoljuk:
1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5
Ezeknek az átlaga 2,5 vagyis a medián most 2,5. A medián jele Me, így Me=2,5
Átlag
Az átlagot úgy kapjuk meg, hogy az összes elemet összeadjuk, és aztán elosztjuk az elemek számával.
Jele: $\overline{x}$
Szórás
Az átlagtól való átlagos eltérés egyik legjobb mérőszáma a szórás. Hátránya, hogy egy kicsit ronda a szórás képlete. A szórást egy szigma nevű görög betűvel jelöljük.
\( \sigma = \sqrt{ \frac{(x_1-\overline{x})^2+(x_2-\overline{x})^2+\dots+(x_n-\overline{x})^2}{n} } \)
Alsó kvartilis
Az adatsor első felének a felezőpontja az alsó kvartilis.
Az alsó kvartilis jele: $Q_1$
Felső kvartilis
Az adatsor második felének a felezőpontja a felső kvartilis.
A felső kvartilis jele: $Q_3$
Dobozdiagram, doboz-ábra (box plot)
A kvartilisek és a medián azt szemlélteti, hogyan oszlanak el az adatsorban szereplő adatok. Ezek segítségével készíthető el a doboz-ábra, vagy másnéven dobozdiagram. Szokás még sodrófa diagramnak is nevezni, és az angol elnevezést is gyakran használják, ami a box plot.
Egy sobarendezett adatsorban öt darab speciális negyedelőpontot fogunk használni. Az első az adatsor legkisebb értéke, ez a Q0 . Aztán a következő negyedelő az alsó kvartilis, ami Q1 utána jön a felezőpont vagyis a medián, ezt Me-vel és Q2-vel is jelöljük, végül a felső kvartilis, ami a Q3. Az adatsor legnagyobb értéke pedig Q4. A legnagyobb és a legkisebb érték különbsége a terjedelem, míg a két kvartilis különbségét félterjedelemnek vagy más néven interkvartilisnek hívjuk. Ezekből épül föl a doboz-ábra vagy másként dobozdiagram.
Előfordulhat, hogy az adatsorban kiugró értékek is szerepelnek. A kiugró érték az, ami az alsó kvartilisnál legalább a félterjedelem másfélszeresénél kisebb, vagy pedig a felső kvartilisnél legalább a félterjedelem másfélszeresénél nagyobb. Huh, ez elég bonyolultan hangzik. De valójában nagyon egyszerű, csak nézd meg kapcsolódó epizódot és kiderül.
Relatív szórás
A relatív szórás azt mondja meg, hogy a szórás az átlagnak hány százaléka:
\( V = \frac{\sigma}{\overline{X}} \)
Számítsuk ki Bob matekjegyeinek móduszát és mediánját.
Ezek a matek jegyek:
2, 3, 1, 4, 1, 2, 2, 3, 5, 2, 3, 2, 3, 2, 4, 3, 2, 4, 2, 4
Bob nem kedveli a kémiát.
Ezt a jegyei alapján bárki megállapíthatja.
2, 3, 3, 2, 3
Alfréd viszont rajong a kémia egyes területeiért... de csak azokért.
5, 5, 1, 1, 1
Számítsuk ki Bob és Alfréd jegyeinek átlagát és szórását.
a) Egy futóversenyen 10-en vesznek részt.
A futók eredményei (percben):
98, 73, 68, 92, 110, 75, 87, 96, 108, 130
Készítsünk doboz-ábrát az eredményekről.
b) A naprendszer bolygóinak aránya a Földhöz képest a következők:
Merkúr | 0,06 |
Mars | 0,12 |
Vénusz | 0,82 |
Föld | 1 |
Uránusz | 14 |
Neptunusz | 17 |
Szaturnusz | 95 |
Jupiter | 318 |
Készítsünk dobozdiagramot a bolygók tömegének eloszlásáról.
Egy futóversenyen 10-en vesznek részt.
A futók eredményei (percben):
98, 73, 68, 92, 110, 75, 87, 96, 108, 130
Készítsünk doboz-ábrát az eredményekről.
Egy futóversenyen több országból indultak versenyzők.
Íme, itt látható, hogy milyen eredményeket értek el, és melyik országból jöttek.
Ország | Eredmény (percben) |
Németország | 68 |
Franciaország | 73 |
Németország | 74 |
Ausztria | 87 |
Olaszország | 92 |
Olaszország | 96 |
Olaszország | 98 |
Németország | 108 |
Németország | 110 |
Olaszország | 130 |
Németország | 134 |
Németország | 140 |
Ábrázoljuk a versenyzők nemzetiség szerinti eloszlását.
Egy futóversenyen 150 versenyző vett részt. A versenyzők eredményeit tartalmazza ez a táblázat
Eredmény (perc) |
Versenyzők száma |
50-59 | 12 |
60-69 | 18 |
70-79 | 27 |
80-89 | 39 |
90-99 | 32 |
100-109 | 22 |
Számoljuk ki az átlagot, a szórást és a relatív szórást, valamint ábrázoljuk a verseny eredményét hisztogrammal.
a) Egy csoportban hatan írnak tesztet, a teszt eredménye 1-es, 2-es, 3-as, 4-es vagy 5-ös lehet. Tudjuk, hogy csak egy 3-as van és az átlag 4,5. Mik voltak az eredmények?
b) 11 darab nem negatív egész számról tudjuk, hogy egyetlen móduszuk a 2, mediánja 3, átlaga 4 és terjedelme 5. Adjunk meg a feltételnek eleget tevő 11 darab ilyen számot.
Egy vonat utasainak száma hétfőn 200, kedden 190, szerdán 90, csütörtökön 170. Hány utas volt pénteken, ha tudjuk, hogy az öt adat átlaga is szerepel az adatok között, és egyik nap sem utaztak 200-nál többen, sem pedig 90-nél kevesebben?
Egy vonat utasainak száma hétfőn 200, kedden 160, szerdán 90, csütörtökön 150. Hány utas volt pénteken, ha tudjuk, hogy az öt adat átlaga is szerepel az adatok között, továbbá az adatok egyetlen módusza nem egyenlő a mediánjukkal?
Egy piacon az almát egy olyan csomagolásban árulják, melynek felirata 5 kg \( \pm \) 10 dkg. A minőségellenőrzés során véletlenszerűen kiválasztanak 8 csomagot, és ezeket lemérik. Az almák árusítását csak akkor engedélyezik, ha egyik csomag tömege sem kisebb 4 kg 90 dkg-nál, és a mérési adatok 5 kg-tól mért átlagos abszolút eltérése nem haladja meg a 10 dkg-ot.
a) Engedélyezik-e az árusítást?
b) Határozzuk meg a mérési eredmények átlagát és szórását!
Mérés sorszáma | 1. | 2. | 3. | 4. | 5. | 6. | 7. | 8. |
mért tömeg (dkg) | 506 | 491 | 493 | 512 | 508 | 517 | 493 | 512 |
Egy városkában 30 szálloda üzemel. A szállodák között van kétcsillagos, háromcsillagos, négycsillagos és ötcsillagos is.
a) Számoljuk ki, hogy átlagosan hány csillagosak a szállodák a városkában. Adjuk meg a mediánt és a móduszt is.
b) Ábrázoljuk kördiagramon a szállodák csillagok szerinti megoszlását.
* | 0 |
** | 2 |
*** | 12 |
**** | 9 |
***** | 7 |
Egy taxitársaságnál a telefonos rendeléstől a helyszínre érkezésig eltelt idő egy hét leforgása alatt az alábbi volt:
Eltelt idő (perc) |
Esetek száma |
0-4 | 1654 |
5-9 | 2470 |
10-19 | 680 |
20-29 | 46 |
Számoljuk ki az átlagot, a szórást és a relatív szórást.
Egy tesztet 12 vizsgázó írja meg. A maximálisan elérhető pontszám 100, az eredmények pedig a következők: 56, 47, 60, 86, 71, 96, 55, 24, 76, 81, 72, 91
Készítsünk box plot diagramot.
Egy adathalmazról ezt a dobozdiagramot készítették.
a) Mennyi az alsó és felső kvartilis, a medián, és mekkora a terjedelem?
b) Adjunk meg egy olyan tizenkettő elemű adathalmazt, amiről egy ilyen dobozdiagram készülhetett.
Egy tesztet 12 vizsgázó írja meg. A maximálisan elérhető pontszám 100, az eredmények pedig a következők:
56, 47, 60, 86, 71, 96, 55, 24, 76, 81, 72, 91.
Készítsünk doboz-ábrát.
30 napon keresztül vizsgálták, hogy egy úton naponta hány baleset történik.
Balesetek száma | napok száma |
0 | 7 |
1 | 8 |
2 | 6 |
3 | 4 |
4 | 3 |
5 | 2 |
Számoljuk ki az átlagot, a szórást, a móduszt, a mediánt és ábrázoljuk a táblázat adatait oszlopdiagrammal.
Egy versenyen 5 országból összesen 30 versenyző vett részt. A résztvevők megoszlását mutatja ez a diagram. Adjuk meg a móduszt és a mediánt, és ábrázoljuk a versenyzők megoszlását kördiagramon.
Egy újságárús havi lapeladását tartalmazza a következő táblázat.
Eladott mennyiség | napok száma |
215 | 2 |
217 | 4 |
218 | 2 |
220 | 5 |
222 | 8 |
225 | 7 |
230 | 3 |
Számoljuk ki az átlagot, a szórást és a relatív szórást.
Egy teszt 5 kérdésből áll, minden kérdésre három lehetőség közül lehet választani. A helyes válaszra 1 pont jár, a rossz válaszra 0 pont. A tesztet 20-an írják meg, és az elért összpontszám 48.
a) Melyik feladatra adták a legtöbb helyes választ?
b) Melyikre adták a legkevesebb jó választ?