Kolegij: ROLP Statistička terminologija I. - raspodjela i prikaz podataka 017. Neki temeljni statistički postupci u znanstvenom istraživanju odabir uzorka prikupljanje podataka određivanje mjerne ljestvice obrada podataka raspodjela podataka opis podataka (prikazi,...) VRSTE PODATAKA (mjerne ljestvice) OMJERNA BMI Krvni tlak Razina glukoze u krvi ORDINALNA Stupanj karcinoma Bolje, jednako, lošije Ne slažem se, neopredijeljen/a, slažem se (Likertova ljestvica (stavovi) KVANTITATIVNI (BROJČANI) KVALITATIVNI (SKUPNI, KATEGORIČKI ) INTERVALNA Broj djece Broj napadaja tjedno Dob (god) NOMINALNA Spol Pozitivan i negativan nalaz Krvna grupa Pripadnost rasi Kvalitativni podatci - nominalna ljestvica frekvencije i relativne frekvencije - N(%) grafički prikaz - stupčasti grafikon Kvalitativni podatci - ordinalna ljestvica sve kao kod nominalne ljestvice ali i mjere središnjice i raspršenja - medijan, mod Medcalc - kategorijski podatci 1
http://t.gstatic.com/images?q=tbn:and9gcrh6n8dpi9 IyT-R8g_XRiUZ84EiKaVOTLCWGVJbi3x1t4TRzfu-vg Kada se ispituje vrsta raspodjele?... SAMO kada podaci vaših istraživanja pripadaju INTERVALNOJ ili OMJERNOJ mjernoj ljestvici - kontinuirani brojčani podatci: vrijednosti hemoglobina, broj leukocita u krvi, tjelesna težina, stav prema radu Zašto je važno znati kakva je raspodjela podataka? za odabir mjere središnjice i mjere varijabilnosti za odabir statističkog testa u slikovnom prikazu daje jasan uvid u podatke Mjere središnjice i odstupanja Najčešće se upotrebljavaju: aritmetička sredina i standardna devijacija (normalna raspodjela, velik uzorak) medijan i raspon (percentili, interkvartili) interval pouzdanosti (aritmetičku sredina, medijan) Rjeđe se upotrebljavaju: varijanca, raspon, standardna pogrješka, mod Mjere središnjice Prikazuju prosječnu vrijednost neke skupine rezultata Aritmetička sredina Medijan (središnja vrijednost) Mod (najčešća vrijednost) Aritmetička sredina (M, X) srednja ili prosječna vrijednost X X 1 X X Prosječna visina studenata Srednja ocjena svih ispitanika na testu znanja N 3... X N Izračunavanje aritmetičke sredine 1 3 4 5 7 8 7 5 8 5 7 7 8 8 35 X 7 5 5
Medijan (C) centralna vrijednost vrijednost koja se u nizu rezultata poredanih po rastućem iznosu nalazi točno u sredini 1 3... 6... 49 50 51 Mod (D) najčešća vrijednost u nizu rezultata poredanih po rastućem iznosu 5 5 6 6 6 6 7 8 8 9 9 10 18 0... 5... 80 81 90 Raspodjela ispitanika prema životnoj dobi Vrijeme provedeno u bolnici Mjere raspršenja iskazuju odstupanja rezultata oko neke od mjera središnjice standardna devijacija raspon kvartili, percentili Standardna devijacija (SD) vrijednost prosječnog odstupanja od aritmetičke sredine SD prikaz rezultata mjerenja (x 1 SD) 95% granice pouzdanosti (x 1,96 SD) varijanca = SD X X N 1 Raspon (R) površna mjera raspršenja (varijabilnosti) razlika između najveće i najmanje vrijednosti rezultata R = x najveći -x najmanji 1 3... 6... 49 50 51 10 18 0... 5... 80 81 89 Raspon životne dobi od 10-89; R=79 Kvartil 1 5... 6... 47 50 51 10 18 34... 5... 71 81 89 Min 1. kvartil. kvartil 3. kvartil max medijan Kvartil je rezultat koji se nalazi točno na četvrtini raspona Interkvartilni raspon (IR) Raspon 5 i 75 percentila (1 i 3 kvartila) Razlika vrijednosti 3. i 1. kvartila 3
Percentil vrijednost odstupanja od medijana određena mjestom gdje se nalazi u nizu rezultata Percentilna krivulja 1... 5... 6... 47... 50 51 10 18... 34... 5... 71... 81 89 10. percentila 90. percentila Vrsta raspodjele određuje odabir mjere središnjice i mjere raspršenja Prikaz rezultata deskriptivne statistike u programu MedCalc Normalna raspodjela: M i SD Srednja vrijednost membranskog biopotencijala iznosila je (70 3,5) mv. Odstupajuća raspodjela: medijan i percentil Prosječna životna dob ispitanika iznosila je 5 (34-71) godine. Krivulja normalne raspodjele ili Gaussova krivulja simetrična u odnosu na aritmetičku sredinu zvonolika oblika koji ovisi o aritmetičkoj sredini i standardnoj devijaciji Svojstva normalne raspodjele: (x 1 SD) 68,6% (x SD) 95,44% (x 3 SD) 99,73% Normalna raspodjela f x 0,15%,% 13,6% -3SD -SD-1SD 99.7 % 95 % 68 % 34% 34% 13,6% aritmetička sredina,% 0,15% +1SD +SD +3SD X 4
N Normalna raspodjela 110 100 90 Odstupajuća raspodjela 16 14 80 70 60 50 40 30 0 broj radova 1 10 8 6 4 10 0 1500 000 500 3000 3500 4000 4500 5000 rodna masa podatci se opisuju s pomoću aritmetičke sredine i standardne devijacije 0 10 0 30 40 50 60 70 80 90 % prepisanog teksta podaci se opisuju s pomoću medijana i percentila (kvartila, raspona) Kako ispitati normalnost raspodjele? Testiranje normalnosti raspodjele Kolmogorov-Smirnovljev test P 0,05 empirijska raspodjela je normalna P < 0,05 empirijska raspodjela značajno odstupa od normalne raspodjele Vrsta raspodjele određuje odabir statističkog testa Koji prikaz podataka odabrati? Normalna raspodjela podatci Nezavisni Zavisni broj skupina test t-test parni t-test Ovisi o podatcima populaciji kojoj se prezentiraju našem znanju i vještinama Odstupajuća raspodjela Nezavisni Zavisni Mann-Whitney Wilcoxon Najčešće se koriste tablice slike (grafikoni) 5
Tablični prikaz podataka RB skupina dob spol... Vertikalni stupčasti grafikon ( skupine) Raspodjela ispitanika prema mjestu korištenja računala 1 kontrola 56 M.................. 1 ispitanici 45 Ž.................. % 40 35 30 5 0 15 10 5 0 KBC RI KBD ne služim se kod kuće na radnom mjestu kod kuće i na radnom mjestu Kružni dijagram Grafikon okvira s ručicama 65 60 55 50 45 40 35 30 5 odstupnici maksimum 75. percentil medijan 5. percentil 0 15 minimum SE0 SE3 vrijednosti sedimentacije eritrocita prije (SE0) i tri tjedna poslije terapije (SE3) Medijan Minimum Maximum 5. - 75. perc. SE0 4 5 63 35-50 SE3 34 18 63 30-63 I na kraju 6