Statistika

:!: Medžiaga nurašyta iš sąsiuvinio, ją padiktavo mokytoja; Creative Commons turbūt nepritaikoma.

Sąvokos

Tomas per pirmąjį semestrą iš matematikos gavo šiuos pažymius:

7; 10; 6; 8; 9; 8; 10; 9; 10; 8.

Populiacija (generalinė aibė)

Nagrinėjama objektų arba individų aibė statistikoje vadinama populiacija arba generaline aibe.

Pavyzdyje generalinė aibė būtų visi Tomo gauti pažymiai iš visų dalykų (ne tik matematikos).

Daugiau: http://lt.wikipedia.org/wiki/Generalin%C4%97_aib%C4%97

Imtis, imties didumas

Iš populiacijos (generalinės aibės) tyrimui atrinktų asmenų arba objektų grupė vadinama imtimi.

Pavyzdyje imtis būtų Tomo matematikos pažymiai.

Imties elementų skaičius vadinamas imties didumu ir žymimas n:

Pavyzdyje n = 10.

Imties elementų žymėjimas

x1 = 7; x2 = 10; x3 = 6; …; x10 = 8

Variacinė imties eilutė

Visus statistinius duomenis lengva apdoroti, jeigu jie išdėstyti eilės tvarka. Duomenis surašę didėjimo tvarka gausime sutvarkytą imtį, kuri vadinama variacine imties eilute.

Pavyzdžio variacinė imties eilutė: 6; 7; 8; 8; 8; 9; 9; 10; 10; 10.

Dažnių lentelė, elemento dažnis

Dažnių lentelės pirmoje eilutėje surašome skirtingas variacinės eilutės reikšmes xk, o antroje - kiek kartų ši reikšmė pasikartoja. Skaičius, rodantis kiek kartų elementas pasikartoja, vadinamas to elemento dažniu ir žymimas fk.

FIXME kas yra imties skirstinys?

xk 6 7 8 9 10
fk 1 1 3 2 3

Santykinis dažnis

Elemento dažnio fk santykis su imties elementų skaičiumi (imties didumu) vadinamas santykiniu dažniu ir žymimas f_k / n arba m_k.

x_k 6 7 8 9 10
f_k 1 1 3 2 3
f_k/n 1/10 arba 10% 1/10 arba 10% 3/10 arba 30% 2/10 arba 20% 3/10 arba 30%

Savybės

  • x_1 + x_2 + ... + x_k = n
  • f_1/n + f_2/n + ... + f_k/n = 1

Diagramos

Duomenys pateikiami grafiškai diagramomis.

FIXME diagramų pavyzdžiai.

Taškinė diagrama

Taškinė diagrama - ją sudaro taškai, žymintys duomenų dažnių reikšmes.

Linijinė diagrama

Linijinė diagrama - tai laužtė, gauta taškinės diagramos taškus sujungus atkarpomis.

Stulpelinė diagrama

Stulpelinė diagrama - bet kuri iš stačiakampių stulpelių sudaryta diagrama

Požymiai

  • stulpelių pločiai vienodi
  • tarpai tarp stulpelių vienodi

Histograma

Histograma - tai stulpelinė diagrama, sudaryta iš besiliečiančių stačiakampių, kurių aukščiai lygūs dažniams (dažniausiai - santykiniams), o duomenų reikšmės yra stačiakampio pločių vidurio taškai.

Skritulinė diagrama

Skritulinė diagrama - skritulys, padalintas į išpjovas, kurių plotas proporcingas duomenų dažniams, išreikštiems procentais.

Skaitinės charakteristikos

Skaitinės charakteristikos - tai yra kurią nors imties savybę nusakantys skaičiai.

Moda

Kokybinius duomenis nusako tik moda. Imties reikšmė(-s), kurios dažnis (santykinis dažnis) didžiausias, vadinamas imties moda ir žymimas M0.

Pavyzdyje M0 = 8 ir M0 = 10.

Modos nėra, kai visi dažniai vienodi.

Imties vidurkis

Imties vidurkis (aritmetinis vidurkis) - skaičius, vidutiniškai artimiausias visiems duomenims ir žymimas overline{x}.

{x_1 + x_2 + ... + x_k} / n = overline{x}

Mediana

Mediana - vidurinė duomenų, surašytų didėjimo tvarka, reikšmė, žymima Md. Kai duomenų skaičius yra nelyginis, mediana lygi vidurinio dėmens reikšmei. Kai lyginis - dviejų vidurinių duomenų reikšmių sumos pusei.

Pavyzdyje M_d = {8+9}/2 = 8,5

Plotis

Plotis - skaičius, nurodantis, kokio ilgio intervale išsibarstę duomenys. Jis lygus didžiausios ir mažiausios duomenų reikšmių skirtumui ir žymimas r.

Pavyzdyje r = 10 - 6 = 4

Imties centras

Imties centru vadinamas didžiausios ir mažiausios imties reikšmių aritmetinis vidurkis ir žymimas c.

Pavyzdyje c = {10+6}/2 = 8

Standartinis kvadratinis nuokrypis

Standartinis kvadratinis nuokrypis - skaičius, rodantis duomenų sklaidą apie vidurkį ir žymimas s.

s = sqrt{S^2}

Imties dispersija

S^2 - imties dispersija, t.y. duomenų skirtumų nuo imties vidurkio kvadratų suma, padalinta iš n-1.

  • imties dispersijos formulė: S^2 = {(x_1 - overline{x})^2 + (x_2 - overline{x})^2 + ... + (x_n - overline{x})^2} / {n-1}
  • sugrupuotos imties dispersijos formulė: S^2 = {(x_1 - overline{x})^2*m_1 + (x_2 - overline{x})^2*m_2 + ... + (x_n - overline{x})^2*m_n} / {n-1}

FIXME kuo jos skiriasi? Kodėl http://devcenter.linija.org/mathematics/zinyn/index.php?s=20 formulės kitokios?

Skiriasi: nagrinėdami imtis statistikai nustatė, kad pakeitus vardiklį n į n-1, gaunamas geresnių savybių turintis imties duomenų išsisklaidymo matas.

Pavyzdyje:

  • S^2 = {(6-8.5)^2*1 + (7 - 8.5)^2*1 + (8-8.5)^2*3 + (9-8.5)^2*2 + (10-8.5)^2*3}/{10-1} = {6.25 + 6.75 + 0.75 + 0.50 + 6.75} / 9 approx 2.33333
  • S = sqrt{2.33333} approx 1.528

FIXME skaičiavimai gali būti neteisingi.

Koreliacija

:!: Informacija nurašyta iš vadovėlio, Creative Commons licencija nėra taikoma.

Jei matuojant du atrinktųjų objektų požymius x ir y gauti duomenys:

  • x1, x2, …, xn
  • y1, y2, …, yn
  • n > 1

…tai šių požymių koreliacijos koeficientu vadiname skaičių

r = {(x_1 - overline{x})(y_1 - overline{y}) + (x_2 - overline{x})(y_2 - overline{y}) + ... + (x_n - overline{x})(y_n - overline{y})} / {(n-1)*s_x*s_y}

Čia:

  • overline{x} = {x_1 + x_2 + ... + x_n}/n
  • overline{y} = {y_1 + y_2 + ... + y_n}/n
  • s_x = sqrt{{(x_1 - overline{x})^2 + (x_2 - overline{x})^2 + ... + (x_n - overline {x})^2}/{n-1}}
  • s_y = sqrt{{(y_1 - overline{y})^2 + (y_2 - overline{y})^2 + ... + (y_n - overline {y})^2}/{n-1}}

Požymiai

  • Jeigu dviejų požymių koreliacijos koeficientas yra teigiamas, tada požymiai teigiamai koreliuoti
  • Jeigu dviejų požymių koreliacijos koeficientas yra neigiamas, tada požymiai neigiamai koreliuoti
  • Jeigu dviejų požymių koreliacijos koeficientas yra lygus nuliui, tada požymiai yra nekoreliuoti

Dar viena formulė

r = {(x_1*y_1 + x_2*y_2 + ... + x_n*y_n) - n*(overline{x} * overline{y})}/{(n-1)*s_x*s_y}

This website uses cookies for visitor traffic analysis. By using the website, you agree with storing the cookies on your computer.More information
 
Jei nenurodyta kitaip, šio wiki turinys ginamas tokia licencija: CC Attribution-Noncommercial-Share Alike 4.0 International
Recent changes RSS feed Powered by PHP Valid XHTML 1.0 Valid CSS Driven by DokuWiki