Turinys

Statistika

:!: Medžiaga nurašyta iš sąsiuvinio, ją padiktavo mokytoja; Creative Commons turbūt nepritaikoma.

Sąvokos

Tomas per pirmąjį semestrą iš matematikos gavo šiuos pažymius:

7; 10; 6; 8; 9; 8; 10; 9; 10; 8.

Populiacija (generalinė aibė)

Nagrinėjama objektų arba individų aibė statistikoje vadinama populiacija arba generaline aibe.

Pavyzdyje generalinė aibė būtų visi Tomo gauti pažymiai iš visų dalykų (ne tik matematikos).

Daugiau: http://lt.wikipedia.org/wiki/Generalin%C4%97_aib%C4%97

Imtis, imties didumas

Iš populiacijos (generalinės aibės) tyrimui atrinktų asmenų arba objektų grupė vadinama imtimi.

Pavyzdyje imtis būtų Tomo matematikos pažymiai.

Imties elementų skaičius vadinamas imties didumu ir žymimas n:

Pavyzdyje n = 10.

Imties elementų žymėjimas

x1 = 7; x2 = 10; x3 = 6; …; x10 = 8

Variacinė imties eilutė

Visus statistinius duomenis lengva apdoroti, jeigu jie išdėstyti eilės tvarka. Duomenis surašę didėjimo tvarka gausime sutvarkytą imtį, kuri vadinama variacine imties eilute.

Pavyzdžio variacinė imties eilutė: 6; 7; 8; 8; 8; 9; 9; 10; 10; 10.

Dažnių lentelė, elemento dažnis

Dažnių lentelės pirmoje eilutėje surašome skirtingas variacinės eilutės reikšmes xk, o antroje - kiek kartų ši reikšmė pasikartoja. Skaičius, rodantis kiek kartų elementas pasikartoja, vadinamas to elemento dažniu ir žymimas fk.

FIXME kas yra imties skirstinys?

xk 6 7 8 9 10
fk 1 1 3 2 3

Santykinis dažnis

Elemento dažnio fk santykis su imties elementų skaičiumi (imties didumu) vadinamas santykiniu dažniu ir žymimas f_k / n arba m_k.

x_k 6 7 8 9 10
f_k 1 1 3 2 3
f_k/n 1/10 arba 10% 1/10 arba 10% 3/10 arba 30% 2/10 arba 20% 3/10 arba 30%

Savybės

Diagramos

Duomenys pateikiami grafiškai diagramomis.

FIXME diagramų pavyzdžiai.

Taškinė diagrama

Taškinė diagrama - ją sudaro taškai, žymintys duomenų dažnių reikšmes.

Linijinė diagrama

Linijinė diagrama - tai laužtė, gauta taškinės diagramos taškus sujungus atkarpomis.

Stulpelinė diagrama

Stulpelinė diagrama - bet kuri iš stačiakampių stulpelių sudaryta diagrama

Požymiai

Histograma

Histograma - tai stulpelinė diagrama, sudaryta iš besiliečiančių stačiakampių, kurių aukščiai lygūs dažniams (dažniausiai - santykiniams), o duomenų reikšmės yra stačiakampio pločių vidurio taškai.

Skritulinė diagrama

Skritulinė diagrama - skritulys, padalintas į išpjovas, kurių plotas proporcingas duomenų dažniams, išreikštiems procentais.

Skaitinės charakteristikos

Skaitinės charakteristikos - tai yra kurią nors imties savybę nusakantys skaičiai.

Moda

Kokybinius duomenis nusako tik moda. Imties reikšmė(-s), kurios dažnis (santykinis dažnis) didžiausias, vadinamas imties moda ir žymimas M0.

Pavyzdyje M0 = 8 ir M0 = 10.

Modos nėra, kai visi dažniai vienodi.

Imties vidurkis

Imties vidurkis (aritmetinis vidurkis) - skaičius, vidutiniškai artimiausias visiems duomenims ir žymimas overline{x}.

{x_1 + x_2 + ... + x_k} / n = overline{x}

Mediana

Mediana - vidurinė duomenų, surašytų didėjimo tvarka, reikšmė, žymima Md. Kai duomenų skaičius yra nelyginis, mediana lygi vidurinio dėmens reikšmei. Kai lyginis - dviejų vidurinių duomenų reikšmių sumos pusei.

Pavyzdyje M_d = {8+9}/2 = 8,5

Plotis

Plotis - skaičius, nurodantis, kokio ilgio intervale išsibarstę duomenys. Jis lygus didžiausios ir mažiausios duomenų reikšmių skirtumui ir žymimas r.

Pavyzdyje r = 10 - 6 = 4

Imties centras

Imties centru vadinamas didžiausios ir mažiausios imties reikšmių aritmetinis vidurkis ir žymimas c.

Pavyzdyje c = {10+6}/2 = 8

Standartinis kvadratinis nuokrypis

Standartinis kvadratinis nuokrypis - skaičius, rodantis duomenų sklaidą apie vidurkį ir žymimas s.

s = sqrt{S^2}

Imties dispersija

S^2 - imties dispersija, t.y. duomenų skirtumų nuo imties vidurkio kvadratų suma, padalinta iš n-1.

FIXME kuo jos skiriasi? Kodėl http://devcenter.linija.org/mathematics/zinyn/index.php?s=20 formulės kitokios?

Skiriasi: nagrinėdami imtis statistikai nustatė, kad pakeitus vardiklį n į n-1, gaunamas geresnių savybių turintis imties duomenų išsisklaidymo matas.

Pavyzdyje:

FIXME skaičiavimai gali būti neteisingi.

Koreliacija

:!: Informacija nurašyta iš vadovėlio, Creative Commons licencija nėra taikoma.

Jei matuojant du atrinktųjų objektų požymius x ir y gauti duomenys:

…tai šių požymių koreliacijos koeficientu vadiname skaičių

r = {(x_1 - overline{x})(y_1 - overline{y}) + (x_2 - overline{x})(y_2 - overline{y}) + ... + (x_n - overline{x})(y_n - overline{y})} / {(n-1)*s_x*s_y}

Čia:

Požymiai

Dar viena formulė

r = {(x_1*y_1 + x_2*y_2 + ... + x_n*y_n) - n*(overline{x} * overline{y})}/{(n-1)*s_x*s_y}