A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati tevékenység és tudomány.
Célja egy már rendelkezésre álló, valóságra vonatkozó adathalmaz összefoglalása, elemzése, egyszóval az információtömörítés.
Nagy mennyiségű adat az ember számára áttekinthetetlen, értelmezhetetlen, „túl sok”. Az értelmezéshez egyszerűsítenünk kell a feladatot, amit néhány jellemző összesítő adat segítségével érünk el. Ezeket nevezzük statisztikai mutatóknak. A statisztikai mutatók által nyújtott információ természetesen egyáltalán nem egyenértékű a teljes adatsor által nyújtott információval, de kezelhető és sok esetben elegendő lehet bizonyos kérdések vizsgálatakor. Ugyanakkor tudnunk kell, hogy teljesen eltérő adatsorok is adhatnak azonos statisztikai mutatókat.
Célja a megfelelő – vagyis a sokaság egészének paramétereit legjobban tükröző, reprezentáló – minta kiválasztása, a sokasági paramétereknek a minta paramétereivel történő becslése, illetve a sokasági paraméterekre vonatkozó feltételezések, hipotézisek elfogadása vagy elvetése. Foglalkozik továbbá a valóság összefüggéseinek egyszerűsített megragadására törekvő modellekkel is, mint az idősor- és regressziós modellek.
Átlag
vagyis az adott értékek számtani közepe.
Vegyük az n db elemet, és jelöljük őket a képletben a1-től an-ig. Ezeknek az elemeknek a számtani közepe:
Említést kell tennünk még a súlyozott átlag fogalmáról. Ezt olyan esetben használjuk, ha az adatokhoz bizonyos értékek társulnak, tehát például egyes adatok előfordulása gyakoribb, mint másoké. Tehát ha adott egy x1, … , xn adatsor a1, … , an értékekkel, akkor az átlag:
Módusz
Az adatsorban leggyakrabban előforduló elem.
Medián
Az adatsor elemeinek növekvő sorrendbe való rendezésekor a középső elem. (Páros számú elem esetén a két középső elem számtani közepe.) Jele: M
Az x1, …, xn számsokaság A számtól való átlagos abszolút eltérése:
A = x esetén a számsokaság átlagos abszolút eltéréséről beszélünk.
A = M esetén a számsokaság átlagos minimális eltérése.
Az x1, …, xn számsokaság A számtól való átlagos négyzetes eltérése:
A = x esetén a számsokaság szórásnégyzetéről beszélünk. Jelölés:D2
Szórásnégyzet négyzetgyöke a számsokaság szórása. Jelölés:D
Terjedelem: a legnagyobb és legkisebb elem különbsége.
x1, …, xn adatok, emelett adott egy A > xátlag. Maximum hány A-nál nagyobb érték lehet a számok között? (k db ilyen érték van)
Adott egy B>1 szám. Vegyük B-nek és az adott adathalmaz szórásának szorzatát.
Az átlagnál ennél jobban eltérő számok legfeljebb
lehetnek.