Tartalomjegyzék
Statisztika
A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati tevékenység és tudomány.
Leíró statisztika
Célja egy már rendelkezésre álló, valóságra vonatkozó adathalmaz összefoglalása, elemzése, egyszóval az információtömörítés.
Nagy mennyiségű adat az ember számára áttekinthetetlen, értelmezhetetlen, „túl sok”. Az értelmezéshez egyszerűsítenünk kell a feladatot, amit néhány jellemző összesítő adat segítségével érünk el. Ezeket nevezzük statisztikai mutatóknak. A statisztikai mutatók által nyújtott információ természetesen egyáltalán nem egyenértékű a teljes adatsor által nyújtott információval, de kezelhető és sok esetben elegendő lehet bizonyos kérdések vizsgálatakor. Ugyanakkor tudnunk kell, hogy teljesen eltérő adatsorok is adhatnak azonos statisztikai mutatókat.
Következtető (matematikai) statisztika
Célja a megfelelő – vagyis a sokaság egészének paramétereit legjobban tükröző, reprezentáló – minta kiválasztása, a sokasági paramétereknek a minta paramétereivel történő becslése, illetve a sokasági paraméterekre vonatkozó feltételezések, hipotézisek elfogadása vagy elvetése. Foglalkozik továbbá a valóság összefüggéseinek egyszerűsített megragadására törekvő modellekkel is, mint az idősor- és regressziós modellek.
Statisztikai közepek
Átlag
vagyis az adott értékek számtani közepe.
Vegyük az n db elemet, és jelöljük őket a képletben a1-től an-ig. Ezeknek az elemeknek a számtani közepe:
Említést kell tennünk még a súlyozott átlag fogalmáról. Ezt olyan esetben használjuk, ha az adatokhoz bizonyos értékek társulnak, tehát például egyes adatok előfordulása gyakoribb, mint másoké. Tehát ha adott egy x1, … , xn adatsor a1, … , an értékekkel, akkor az átlag:
Módusz
Az adatsorban leggyakrabban előforduló elem.
Medián
Az adatsor elemeinek növekvő sorrendbe való rendezésekor a középső elem. (Páros számú elem esetén a két középső elem számtani közepe.) Jele: M
Ritkábban használt középértékek
Középértékek jellemzői
- Középérték mindig a legkisebb és legnagyobb elem közé esik.
- Az adatok sorrendjétől független.
- Ha az adatsor minden elemét egy A értékkel növeljük, akkor a középérték is A-val növekszik. (Mértani középre nem lesz igaz.)
- Ha az adatsor minden elemét B-vel megszorozzuk, akkor a középérték is B-szeresére változik.
Szóródási mérőszámok
Az x1, …, xn számsokaság A számtól való átlagos abszolút eltérése:
A = x esetén a számsokaság átlagos abszolút eltéréséről beszélünk.
A = M esetén a számsokaság átlagos minimális eltérése.
Az x1, …, xn számsokaság A számtól való átlagos négyzetes eltérése:
A = x esetén a számsokaság szórásnégyzetéről beszélünk. Jelölés:D2
Szórásnégyzet négyzetgyöke a számsokaság szórása. Jelölés:D
Terjedelem: a legnagyobb és legkisebb elem különbsége.
Szóródási mérőszámok tulajdonságai
- Adatok sorrendjétől nem függ.
- Akkor és csak akkor nulla, ha az összes elem egyenlő, különben pozitív.
- Ha a számsokaság minden tagjához hozzáadjuk ugyanazt az A értéket, akkor a szóródási mérőszám nem változik.
- Ha a számsokaság minden tagját megszorozzuk ugyanazzal a B értékkel, akkor a szóródási mérőszám |B|-szeresére változik.
Markov tulajdonság
x1, …, xn adatok, emelett adott egy A > xátlag. Maximum hány A-nál nagyobb érték lehet a számok között? (k db ilyen érték van)
Csebisev tulajdonság
Adott egy B>1 szám. Vegyük B-nek és az adott adathalmaz szórásának szorzatát.
Az átlagnál ennél jobban eltérő számok legfeljebb
lehetnek.