Apresentação do PowerPoint

Слични документи
Raspodjela i prikaz podataka

Microsoft PowerPoint - PDPL FBF ZG spec 2011.ppt [Read-Only] [Compatibility Mode]

Uvod u statistiku

Zadatak 1 U tablici se nalaze podaci dobiveni odredivanjem bilirubina u 24 uzoraka seruma (µmol/l):

IRL201_STAR_sylab_ 2018_19

Paper Title (use style: paper title)

χ2 test

Upala pluća – koji su faktori rizika i uzročnici, liječenje

No Slide Title

PLAN I PROGRAM ZA DOPUNSKU (PRODUŽNU) NASTAVU IZ MATEMATIKE (za 1. razred)

Sadržaj 1 Diskretan slučajan vektor Definicija slučajnog vektora Diskretan slučajan vektor

Matrice. Algebarske operacije s matricama. - Predavanje I

Slide 1

(Microsoft Word - Rje\232enja zadataka)

Microsoft PowerPoint - Ispitivanje povezanosti Regresija redovni decembar 2007 [Compatibility Mode]

Microsoft PowerPoint - Bazdaric_vrste istrazivanja 2014_ pptx [Read-Only]

ŽUPANIJSKO NATJECANJE IZ MATEMATIKE 28. veljače razred - rješenja OVDJE SU DANI NEKI NAČINI RJEŠAVANJA ZADATAKA. UKOLIKO UČENIK IMA DRUGAČIJI

Microsoft Word - predavanje8

knjiga.dvi

Microsoft PowerPoint - jkoren10.ppt

DUBINSKA ANALIZA PODATAKA

Slide 1

Numeričke metode u fizici 1, Projektni zadataci 2018./ Za sustav običnih diferencijalnih jednadžbi, koje opisuju kretanje populacije dviju vrs

35-Kolic.indd

(Microsoft Word - MATB - kolovoz osnovna razina - rje\232enja zadataka)

Microsoft Word - 6ms001

Istraživanje kvalitete zraka Slavonski Brod: Izvještaj 3 – usporedba podataka hitnih medicinskih intervencija za godine i

Matematika 1 - izborna

PROGRAMIRANJE Program je niz naredbi razumljivih računalu koje rješavaju neki problem. Algoritam je postupak raščlanjivanja problema na jednostavnije

Microsoft PowerPoint - PDPL FBF ZG SPEC uvodno 2013 I.ppt [Read-Only] [Compatibility Mode]

(Microsoft Word - Dr\236avna matura - kolovoz ni\236a razina - rje\232enja)

Statistika, Prehrambeno-tehnološki fakultet 1 Zaključivanje o jednoj slučajnoj varijabli Numeričke karakteristike distribucije populacije nazivamo par

ALIP1_udzb_2019.indb

(Microsoft Word - Dr\236avna matura - studeni osnovna razina - rje\232enja)

6-Lizacic.indd

ТЕОРИЈА УЗОРАКА 2

Hej hej bojiš se matematike? Ma nema potrebe! Dobra priprema je pola obavljenog posla, a da bi bio izvrsno pripremljen tu uskačemo mi iz Štreberaja. D

Slide 1

Infokup - Školsko Osnovne škole Algoritmi BaPaCpp

JMBAG IME I PREZIME BROJ BODOVA MJERA I INTEGRAL 2. kolokvij 29. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!) 1. (

07jeli.DVI

CIJELI BROJEVI 1.) Kako još nazivamo pozitivne cijele brojeve? 1.) Za što je oznaka? 2.) Ispiši skup prirodnih brojeva! 3.) Kako označavamo skup priro

Microsoft Word - 15ms261

SIJEČANJ 2017 Decembar NEDJELJA 17 UTORAK Februar Četvrtak 2 Petak 3 Subota 4 Nedjelja 5 Ponedjeljak 6 Utorak 7 Srijeda 8 Četvrtak 9 Pet

Uvod u obične diferencijalne jednadžbe Metoda separacije varijabli Obične diferencijalne jednadžbe Franka Miriam Brückler

Državna matura iz informatike

Sveučilište J.J. Strossmayera Fizika 2 FERIT Predložak za laboratorijske vježbe Određivanje relativne permitivnosti sredstva Cilj vježbe Određivanje r

8. razred kriteriji pravi

JMBAG IME I PREZIME BROJ BODOVA MJERA I INTEGRAL završni ispit 6. srpnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!) 1.

Kvantna enkripcija

Igre na sreću i patološko kockanje

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet organizacije i informatike O

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Hrvatski studiji Psihologija Ured za

Numerička matematika 11. predavanje dodatak Saša Singer web.math.pmf.unizg.hr/~singer PMF Matematički odsjek, Zagreb NumMat 2019, 11. p

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Hrvatski studiji Kroatologija Ured za

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Grafički fakultet Grafička tehnnologi

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet organizacije i informatike I

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet kemijskog inženjerstva i teh

My_P_Red_Bin_Zbir_Free

Metode psihologije

Matematika kroz igru domino

7. predavanje Vladimir Dananić 14. studenoga Vladimir Dananić () 7. predavanje 14. studenoga / 16

Algoritmi SŠ P1

Elementi praćenja i ocjenjivanja za nastavni predmet Matematika u 4. razredu Elementi praćenja i ocjenjivanja za nastavni predmet Matematika u 4. razr

Slide 1

Sveučilište J.J. Strossmayera Fizika 2 FERIT Predložak za laboratorijske vježbe Lom i refleksija svjetlosti Cilj vježbe Primjena zakona geometrijske o

I

48-Blazevic.indd

84-Knjaz.indd

CVRSTOCA

Verovatnoća - kolokvijum 17. decembar Profesor daje dva tipa ispita,,,težak ispit i,,lak ispit. Verovatnoća da student dobije težak ispit je

8 2 upiti_izvjesca.indd

23. siječnja od 13:00 do 14:00 Školsko natjecanje / Osnove informatike Srednje škole RJEŠENJA ZADATAKA S OBJAŠNJENJIMA Sponzori Medijski pokrovi

Mere slicnosti

(Microsoft Word vje\236ba - LIMES FUNKCIJE.doc)

Algoritmi SŠ P1

I

РЕШЕЊА 1. (2) Обележја статистичких јединица посматрања су: а) особине које су заједничке за јединице посматрања б) особине које се проучавају, а подр

I

0255_Uvod.p65

Matematka 1 Zadaci za vežbe Oktobar Uvod 1.1. Izračunati vrednost izraza (bez upotrebe pomoćnih sredstava): ( ) [ a) : b) 3 3

М А Т Е М А Т И К А Први разред (180) Предмети у простору и односи међу њима (10; 4 + 6) Линија и област (14; 5 + 9) Класификација предмета према свој

Microsoft Word - 12ms121

Vol 5, Broj 17, 7. siječnja Zdravlje u Virovitičko podravskoj županiji Trendovi konzumiranja droga među mladima Virovitičko podravske županije (

JMBAG IME I PREZIME BROJ BODOVA 1. (ukupno 6 bodova) MJERA I INTEGRAL 1. kolokvij 4. svibnja (Knjige, bilježnice, dodatni papiri i kalkulatori n

VELEUČILIŠTE VELIKA GORICA REZULTATI STUDENTSKE ANKETE PROVEDENE NA VELEUČILIŠTU VELIKA GORICA ZA ZIMSKI SEMESTAR AKADEMSKE 2013/2014 GODINE 1. Uvod E

Slide 1

Hrvatska regulatorna agencija za mrežne djelatnosti Istraživanje poznavanja ispitanika o poštanskim uslugama i njihova zamjenjivost s EK uslugama stud

ŠKOLSKO/GRADSKO NATJECANJE IZ MATEMATIKE 21. siječnja razred-rješenja OVDJE SU DANI NEKI NAČINI RJEŠAVANJA ZADATAKA. UKOLIKO UČENIK IMA DRUGA

Microsoft Word - PusenjeNaRadnomMjestu.doc

(Microsoft Word - Dr\236avna matura - svibanj osnovna razina - rje\232enja)

INDIKATOR SVJETLA FUNKCIJE TIPKI 1. Prikazuje se temperatura i parametri upravljanja 2. Crveno svjetlo svijetli kad grijalica grije 3. Indikator zelen

Dvostruki integrali Matematika 2 Erna Begović Kovač, Literatura: I. Gusić, Lekcije iz Matematike 2

10_Perdavanja_OPE [Compatibility Mode]

Microsoft Word - DIOFANTSKE JEDNADŽBE ZADACI docx

“ZNAM, MOGU, ŽELIM”

SVEUČILIŠTE U ZAGREBU PRIRODOSLOVNO-MATEMATIČKI FAKULTET MATEMATIČKI ODSJEK Maja Cundić PROGRESIVNOST U OPOREZIVANJU DOHOTKA OD RADA U ZEMLJAMA EU - H

65-Petric.indd

Programiranje 2 popravni kolokvij, 15. lipnja Ime i prezime: JMBAG: Upute: Na kolokviju je dozvoljeno koristiti samo pribor za pisanje i brisanj

Classroom Expectations

Транскрипт:

III.3. Primjer neparametrijskog testa: χ 2 -test (hi-kvadrat test) III.3.1. Općenito o χ 2 -testu Često je potrebno usporediti razne skupine ispitanika po učestalostima (frekvencijama) i vidjeti razlikuju li se te skupine ili se ne razlikuju. UtvrĎivanje tih razlika treba obaviti upotrebom statistike a ne procjenom razlika od oka, tako da se govori o statistički značajnim razlikama. Kako frekvencije u biostatistici ima odreďeno značenje, to se moţe govoriti o različitim slučajevima: da se usporeďuju dobivene frekvencije jedne skupine s teoretskima, ili se frekvencije za dvije ili više skupina meďusobno usporeďuju u odnosu na referentne teoretske vrijednosti. Dakle, radi se o jednom obiljeţju ili o dva obiljeţja u vidu klasa (razreda) u koje je svaka skupina podijeljena. UsporeĎuju se raspodjele kojima frekvencije tih razreda pripadaju, dakle pitanje razlika izmeďu nizova frekvencija svodi se na pitanje da li su njihove raspodjele iste ili su različite u odnosu na očekivane raspodjele. Razlike izmeďu raspodjela se pak mogu utvrditi ako se ispitaju razlike izmeďu frekvencija razreda tih raspodjela. Nizovi frekvencija koje se ispituju predstavljaju kategorijske varijable. Mjera za odstupanje opaţenih frekvencija od očekivanih zove se vrijednost hi-kvadrata ili χ 2 -vrijednost, a najčešći statistički test u kojem se ovaj parametar koristi je hi-kvadrat test ili χ 2 -test. Prema definiciji, χ 2 -vrijednost za k stupnjeva slobode je zbroj od k odreďenih z-vrijednosti standardizirane normalne raspodjele. Ovakav zbroj z-vrijednosti podlijeţe zakonu χ 2 -raspodjele a ne normalne raspodjele:

U χ 2 -testu računa se tzv. χ 2 -parametar, χ 2 -vrijednost ili χ 2 -statistika (slijedi χ 2 -raspodjelu), koji je za praktičnu primjenu za statističke uzorke i skupove definiran kao aproksimacija, zbroj normaliziranih razlika izmeďu opaţenih (O i ) i očekivanih (E i ) frekvencija svih C razreda u tzv. kontingencijskoj tablici (C je broj ćelija za vrijednosti O i ili E i u kontingencijskoj tablici). Što je χ 2 -vrijednost veća, to ukupna razlika izmeďu opaţenih i očekivanih frekvencija statistički značajnija. χ 2 -vrijednost se u praksi moţe računati na dva načina, pri čemu sve očekivane frekvencije moraju biti E i 5: Često je kod malih uzoraka, malih i problematičnih kontingencijskih tablica zbog nedovoljno velikih razreda, potrebno uvesti Yatesovu korekciju. U toj korekciji, apsolutna vrijednost razlike izmeďu opaţene i očekivane frekvencije umanjuje se za 0.5, te se potom vrijednost kvadrira i normalizira s E i :

χ 2 -test uveo je statističar Karl Pearson 1900. godine u časopisu Philosophical Magazine Series 5, vol. 50 (302), str. 157-175: Broj statističkih uzoraka i varijabli koji se uključuju u χ 2 -test: 1 uzorak, 1 varijabla χ 2 -test slaganja, prilagodbe ili aproksimacije (rijetko u biostatistici) 1 uzorak, 2 varijable χ 2 -test nezavisnosti dviju varijabli (ne tako često u biostatistici): -običan ili Pearsonov χ 2 -test nezavisnosti -χ 2 -test nezavisnosti s Yatesovom korekcijom 2 i više uzoraka, 2 varijable χ 2 -test homogenosti skupa (često u biostatistici) -običan ili Pearsonov χ 2 -test homogenosti -χ 2 -test homogenosti s Yatesovom korekcijom

χ 2 -test slaganja ili aproksimacije: ispituje se koliko jedan niz opaţenih frekvencija odstupa od očekivanih frekvencija, tj. da li raspodjela uzorka bitno odstupa od raspodjele populacije za koju se očekuje da je iz nje uzet uzorak. χ 2 -test homogenosti skupa: ispituje se kolike su razlike unutar skupa odnosno izmeďu dvaju ili više uzoraka, tj. da li se uzorci meďusobno bitno razlikuju. Ova provjera se temelji na ispitivanju razlika niza opaţenih frekvencija uzoraka u odnosu na frekvencije jedne pretpostavljene raspodjele. χ 2 -test nezavisnosti dviju varijabli: ispituje se koliko su dvije varijable meďusobno povezane tj. zavisne unutar jednog uzorka (cijeli skup je shvaćen kao jedan uzorak). Ova provjera pretpostavlja da dvije kategorijske varijable nisu korelirane ili sparene. Korelirane varijable su one koje imaju iste ispitanike ili statističke jedinice, a sparene varijable su one koje imaju parove ispitanika ili statističke jedinice meďusobno strogo pridruţene u parovima. Svaki χ 2 -test je detaljno objašnjen i pokazan na primjerima u ovom predavanju. U svakom χ 2 -testu svaki ispitanik ili statistička jedinica pojavljuje se u podacima samo jednom, a ne dva ili više puta. Radi boljeg razumijevanja χ 2 -testa potrebno je pojasniti χ 2 -raspodjelu.

df vjerojatnost (α) 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83 2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82 3 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27 4 0.71 1.06 1.65 2.20 3.36 4.88 5.99 7.78 9.49 13.28 18.47 5 1.14 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 15.09 20.52 6 1.63 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 16.81 22.46 7 2.17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 18.48 24.32 8 2.73 3.49 4.59 5.53 7.34 9.52 11.03 13.36 15.51 20.09 26.12 9 3.32 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 21.67 27.88 10 3.94 4.86 6.18 7.27 9.34 11.78 13.44 15.99 18.31 23.21 29.59 Nije značajno Značajno χ 2 -raspodjela: kritične vrijednosti χ 2* desnog kraka raspodjele ovise o df i α; kritične vrijednosti prikazane su za prvih 10 vrijednosti df i za 11 vrijednost α (od 0.95 do 0.001) Funkcija f k (x) je funkcija χ 2 -raspodjele vjerojatnosti, koja jako ovisi o broju stupnjeva slobode k (često i u oznaci df). Za velike k (k > 50) ova raspodjela pribliţuje se normalnoj raspodjeli. Nezavisna varijabla funkcije f k (x) je x = χ 2 α = Σ i (O i - E i )/E i, tj. zbroj normiranih kvadrata odstupanja opaţenih frekvencija (O i ) od očekivanih (E i ).

Osnovni oblici četiriju najčešćih funkcija raspodjele vjerojatnosti: standardizirana Gaussova (z-vrijednost), Studentova (t-vrijednost), Fisherova (F-vrijednost) i hi-kvadrat raspodjela (χ 2 -vrijednost). χ 2 -raspodjela općenito nije simetrična, ali postaje simetrična za velike df, kada se pribliţuje normalnoj raspodjeli. Oblik f k (x) funkcije χ 2 -raspodjele: x = χ 2 i vjerojatnost p = α na desnom su kraku raspodjele.

χ 2 -raspodjela: kritične vrijednosti χ 2* desnog kraka raspodjele ovise o df i α. Statistički značajnim smatra se vjerojatnost P < 0.05, tj. razlika je značajna na razini α = 0.05 ili manjoj.

χ 2 -raspodjela: kritične vrijednosti χ 2* desnog kraka. Dane su vrijednosti za prvih 30 vrijednosti df i za vrijednosti α od 0.99 do 0.001.

III.3.2. χ 2 -test slaganja ili aproksimacije Ovaj χ 2 -test nosi različita imena: test slaganja, test o prilagodbi modela podacima, test aproksimacije empirijske raspodjele teorijskoj (Engl. chi-square goodness-of-fit test, one-sample chi-square test). Ovdje je x statističko obiljeţje od interesa, tj. 1 varijabla izmjerena za 1 uzorak. Ovim testom se provjerava je li uzorak reprezentativan za populaciju, tj. je li razlika izmeďu opaţene raspodjele uzorka i pretpostavljene raspodjele populacije statistički značajna. Statistička hipoteza je: H 0 : Varijabla x ima pretpostavljenu (očekivanu) raspodjelu. H 1 : Varijabla x nema pretpostavljenu (očekivanu) raspodjelu. UsporeĎuju se dvije raspodjele za uzorak opaţena i očekivana raspodjela. Opaţena raspodjela: empirijska raspodjela apsolutnih frekvencija po razredima (O 1, O 2, O 3,, O C ), raspodjela dobivena mjerenjem odnosno eksperimentom, skupljanjem podataka uzorak je podijeljen na dva ili više razreda, kategorija ili klasa (tj. podskupova, poduzoraka) po nekoj osobini. Očekivana raspodjela: raspodjela koja se očekuje, bilo da se radi o nekoj teorijskoj raspodjeli (diskretna uniformna, normalna, binomna, Poissonova i dr.), bilo da se radi o prethodno ustanovljenoj empirijskoj raspodjeli ili kojoj drugoj raspodjeli koja se pretpostavlja raspodjela apsolutnih frekvencija po razredima (E 1, E 2, E 3,, E C ) izračunava se kao produkti veličine uzorka N (ukupna frekvencija) i očekivanih relativnih frekvencija ili vjerojatnosti p 1, p 2, p 3,, p C. Broj razreda je C 2, a broj stupnjeva slobode (često i u oznaci k) je df = C - 1.

χ 2 -test slaganja ili aproksimacije nije čest u biostatistici. Uglavnom se koristi za kategorijske varijable nominalne i ordinalne varijable. RjeĎe se koristi za druge tipove varijabli koje se transformiraju u kategorijske varijable: 1) Likertova ljestvica, koja je po prirodi ordinalna varijabla, ovdje se strogo shvaća kao ordinalna varijabla, tj. varijabla s kategorijama (razredima, klasama) koje su poredane u odreďeni niz ili red; 2) diskretna varijabla se transformira u ordinalnu varijablu tako što se svakoj brojevnoj vrijednosti pripisuje tzv. klasni razred, ili se intervalima brojevnih vrijednosti pripisuju klasni razredi (intervali moraju biti iste veličine), a sam klasni razred je oznaka za klasu (brojevna vrijednost postaje samo brojevna oznaka za razred); 3) kontinuirana varijabla se takoďer transformira u ordinalnu varijablu, tako što se razlomi u intervale brojevnih vrijednosti kojima se pripisuju klasni razredi (intervali moraju biti iste veličine), a sam klasni razred je oznaka za klasu (brojevna vrijednost postaje samo brojevna oznaka za razred). Na početku testiranja potrebno je načiniti kontingencijsku tablicu (slijedeći slajd) i ispuniti je): prvo se definiraju razredi, zatim se odreďuju opaţene frekvencije prebrojavanjem u skupu dobivenih podataka, te se potom izračunavaju očekivane frekvencije. Svi ovi podaci se upišu u tablicu (zelena polja), a kontrola zbrajanjem obavlja se na rubu, izvan tablice (ţuta polja).

Kontingencijska tablica opaţenih (O ij ) i očekivanih (E ij ) frekvencija s C razreda: Razredi (kategorije) Opaţene frekvencije (O i ) Očekivane frekvencije (E i ) razred 1 O 1 E 1 razred 2 O 2 E 2 razred 3 O 3 E 3......... razred C O C E C Ukupno (N) N N Nakon što je kontingencijska tablica popunjena i provjerena, pristupa se izračunavaju niza vrijednosti: χ 2 -vrijednosti, broja stupnjeva slobode df, vjerojatnosti P za nul-hipotezu H 0, te kritične vrijednosti χ 2 * za zadanu razinu statističke značajnosti α. Nakon toga slijedi statistička odluka prihvatiti ili odbaciti nul-hipotezu H 0 te slijedno tome odbaciti ili prihvatiti alternativnu hipotezu H 1 za postojanje značajnih razlika izmeďu opaţenih i očekivanih frekvencija tj. hipotezu da postoji značajno neslaganje izmeďu podataka i teorijskog modela. Drugim riječima, alternativna hipoteza tvrdi da empirijska raspodjela i raspodjela teorijskog modela nisu iste ili pribliţno iste, da se značajno razlikuju s vjerojatnošću 1 - P. χ 2 -test slaganja ili aproksimacije NE koristi se za male uzorke (N < 20).

Primjer 1. Postpartum (postporoďajna) depresija (PPD). Dva američka istraţivača postavljanju različite hipoteze s obzirom na postpartum depresiju majke (PPD), koja se javlja 4-8 tjedana nakon poroda ili kasnije tijekom prve godine djetetovog ţivota. Istraţivač A tvrdi da 1/3 majki bude manje depresivna, 1/3 više depresivna, a 1/3 majki ni manje ni više depresivna nakon poroda nego što su bile prije poroda. Istraţivač B tvrdi da je istraţivač A u krivu i odluči skupiti podatke za potvrdu svoje hipoteze. Intervjuirano je 60 majki prije i nakon poroďaja. Iskusni kliničari poslušali su snimke svih intervjua te su svrstali 60 ispitanica u tri razreda s obzirom na stupanj depresije nakon poroda u odnosu na stanje prije poroda: ocjena -1 (više depresivne) za 13 ispitanica, ocjena 0 (ni manje ni više depresivne) za 33 ispitanica, te 1 (manje depresivne) za 14 ispitanica. Koji istraţivač je u pravu? Jesu li majke podjednako zastupljene u trima razredima, ili je njihova zastupljenost bitno drugačija? ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Majke su podjednako zastupljene u sve tri kategorije, tj. ne postoji značajna razlika izmeďu opaţenih i očekivanih frekvencija (razlika je nula). H 1 : Majke nisu podjednako zastupljene u sve tri kategorije, tj. postoji značajna razlika izmeďu opaţenih i očekivanih frekvencija (razlika nije nula). 2) Izbor testa: χ 2 -test slaganja. 3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.05

4) Izračunavanje: N = 60 ---- veličina cijelog uzorka (sve ispitivane majke) = ukupna frekvencija C = 3 ---- broj razreda broj stupnjeva slobode df = C - 1 = 2 O 1 = 13 ---- opaţena frekvencija za poduzorak više postpartum depresivnih majki O 2 = 33 ---- opaţena frekvencija za poduzorak majki koje nisu ni više ni manje postpartum depresivne O 3 = 14 --- opaţena frekvencija za poduzorak manje postpartum depresivnih majki -provjera ukupne frekvencije: N = O 1 + O 2 + O 3 = 13 + 33 + 14 = 60 -računanje očekivanih frekvencija (pretpostavlja se diskretna uniformna raspodjela): E 1 = E 2 = E 3 = N/C = 60/3 = 20, gdje su vjerojatnosti p 1 = p 2 = p 3 = 1/N, tj. prema definiciji je E 1 = N p 1, E 2 = N p 2, E 3 = N p 3 -izrada kontingencijske tablice: ------------------------ Postpartum depresija majki Opaţene frekvencije (O i ) Očekivane frekvencije (E i ) više depresivne 13 20 ni manje ni više depresivne 33 20 manje depresivne 14 20 Ukupno (N) 60 60

-računanje χ 2 -vrijednosti: a) sloţeniji način (po definiciji): χ 2 = Σ i (O i - E i ) 2 /E i = (13-20) 2 /20 + (33-20) 2 /20 + (14-20) 2 /20 = 12.7 b) jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 13 2 /20 + 33 2 /20 + 14 2 /20-60 = 12.7 df = C - 1 = 2 ---- broj stupnjeva slobode U tablici kritičnih vrijednosti χ 2 -raspodjele (prethodni slajdovi) nalazi se za df = 2 i za α = 0.05 kritična vrijednost χ 2 * = 5.991. Stoga je P < 0.005. 5) Zaključivanje: χ 2 > χ 2 * H 0 se ne moţe zadrţati odbacuje se, a H 1 se prihvaća. Odgovor: Opaţene frekvencije postpartum razina depresija majki značajno se razlikuju od očekivanih (df = 2, χ 2 = 12.7, χ 2 * = 5.991 za α = 0.05, P < 0.005). Razlika je značajna i na razini α = 0.005 (χ 2 * = 10.597). Drugim riječima, hipoteza istraţivača B pokazala se točnom, a hipoteza istraţivača A netočnom. To znači da majke uglavnom ne podlijeţu jačoj ili slabijoj postpartum depresiji zbog poroďaja, a manji broj ih podlijeţe. Tako na primjer, u jednom članku ispitano je 450 majki [L. I. Alasoom, M. R. Koura. Predictors of Postpartum Depression in the Eastern Province Capital of Saudi Arabia. Journal of Family Medicine and Primary Care, 3(2), (2014), 146-150.], od kojih je 82.2% (370 ispitanica) bilo bez PPD, 9.8% (44 majki) je imalo umjerenu PPD, a samo 8.0% (36 majki) je imalo tešku PPD. Razina postpartum depresije je ordinalna varijabla,

Primjer 2. Zastupljenost spolova u uzorku. U jednom istraţivanju nasumično je odabrano 100 osoba iz populacije koja ima 50% muškaraca i 50% ţena. Uzorak su činila 44 muškarca i 56 ţena. Jesu li spolovi podjednako zastupljeni u uzorku, ili je njihova zastupljenost bitno drugačija od očekivane? ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Spolovi su podjednako zastupljeni u uzorku, tj. ne postoji značajna razlika izmeďu opaţenih i očekivanih frekvencija (razlika je nula). H 1 : Spolovi nisu podjednako zastupljeni u uzroku, tj. postoji značajna razlika izmeďu opaţenih i očekivanih frekvencija (razlika nije nula). 2) Izbor testa: χ 2 -test slaganja. 3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.05 4) Izračunavanje: N = 100 ---- veličina cijelog uzorka = ukupna frekvencija C = 2 ---- broj razreda broj stupnjeva slobode df = C - 1 = 1 O 1 = 44 ---- opaţena frekvencija za poduzorak muškaraca O 2 = 56 ---- opaţena frekvencija za poduzorak ţena -provjera ukupne frekvencije: N = O 1 + O 2 = 44 + 56 = 60 -računanje očekivanih frekvencija (pretpostavlja se uniformna raspodjela): E 1 = E 2 = N/C = 100/2 = 50 Spol je nominalna varijabla.

-izrada kontingencijske tablice: ----------------------------------------------------------------- Spol Opažene frekvencije (O i ) Očekivane frekvencije (E i ) muški 44 50 ženski 56 50 Ukupno (N) 100 100 -računanje χ 2 -vrijednosti: a) sloţeniji način (po definiciji): χ 2 = Σ i (O i - E i ) 2 /E i = (44-50) 2 /50 + (56-50) 2 /50 = 1.44 b) jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 44 2 /50 + 56 2 /50-100 = 1.44 df = C - 1 = 1 ---- broj stupnjeva slobode U tablici kritičnih vrijednosti χ 2 -raspodjele (prethodni slajdovi) nalazi se za df = 1 i za α = 0.05 kritična vrijednost χ 2 * = 3.841. Stoga je P > 0.05. 5) Zaključivanje: χ 2 < χ 2 * H 0 se ne moţe odbaciti zadrţava se, a H 1 se odbacuje. Odgovor: Opaţene frekvencije spolova u danom uzorku značajno se ne razlikuju od očekivanih (df = 1, χ 2 = 1.44, χ 2 * = 3.841 za α = 0.05, P > 0.05). Razlika nije značajna ni na razini α = 0.10 (χ 2 * = 2.706), što znači da je i P > 0.10. Drugim riječima, spolovi su podjednako zastupljeni u uzorku, kao što bi se i očekivalo na njihovu zastupljenosti u populaciji.

Primjer 3. Promjena etničke strukture. Pet godina nakon zadnjeg popisa stanovništva u jednoj saveznoj drţavi u SAD nasumično je odabran uzorak za istraţivanje od 2500 ispitanika sa slijedećom etničkom strukturom: Skupina Broj ----------------------------------- Bijelci 1732 Crnci 538 Izvorni Amerikanci 32 Hispanoamerikanci 42 Azijati 133 Ostali 23 ----------------------------------- Udio etničkih skupina u spomenutom popisu stanovništva je bio: Skupina Udio -------------------------------------- Bijelci 0.743 Crnci 0.216 Izvorni Amerikanci 0.012 Hispanoamerikanci 0.012 Azijati 0.008 Ostali 0.009 --------------------------------------

Provjeriti na temelju uzorka ima li dovoljno dokaza na razini značajnosti 1% da se raspodjela etničkih skupina promijenila od zadnjeg popisa stanovništva. ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Etnička zastupljenost se nije značajno promijenila u zadnjih pet godina. H 1 : Etnička zastupljenost se je značajno promijenila u zadnjih pet godina. 2) Izbor testa: χ 2 -test slaganja. 3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.01 4) Izračunavanje: N = 2500 ---- veličina cijelog uzorka = ukupna frekvencija C = 6 ---- broj razreda broj stupnjeva slobode df = C - 1 = 5 -opaţene apsolutne frekvencije su dane u tablici zadatka: zbroj je točno 2500 -računanje očekivanih frekvencija prema prethodno utvrďenoj raspodjeli popisom stanovništva: etnička skupina je nominalna varijabla E i = N f r,i = ukupan broj udio (relativna frekvencija) E 1 = 2500 0.743 = 1857.5 E 2 = 2500 0.216 = 540 E 3 = 2500 0.012 = 30 E 4 = 2500 0.012 = 30 E 5 = 2500 0.008 = 20 E 6 = 2500 0.009 = 22.5

-izrada kontingencijske tablice: ----------------------------------------------------------------- Etnička skupina Opažene frekvencije (O i ) Očekivane frekvencije (E i ) Bijelci 1732 1857.5 Crnci 538 540 Izvorni Amerikanci 32 30 Hispanoamerikanci 42 30 Azijati 133 20 Ostali 23 22.5 Ukupno (N) 2500 2500 -računanje χ 2 -vrijednosti na jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 1732 2 /1857.5 + 538 2 /540 + 32 2 /30 + 42 2 /30 + 133 2 /20 + + 23 2 /22.5-2500 = 651.88113 651.881 df = C - 1 = 5 ---- broj stupnjeva slobode U tablici kritičnih vrijednosti χ 2 -raspodjele (slika na idućem slajdu) nalazi se za df = 5 i za α = 0.01 kritična vrijednost χ 2 * = 15.086. Stoga je P < 0.001. 5) Zaključivanje: χ 2 > χ 2 * H 0 se ne moţe zadrţati odbacuje se, a H 1 se prihvaća. Odgovor: Opaţene frekvencije etničkih skupina značajno se razlikuju od onih prije pet godina (df = 5, χ 2 = 1651.881, χ 2 * = 15.086 za α = 0.01, P < 0.001). Dakle, etnička struktura savezne drţave se promijenila u zadnjih pet godina.

-dobivena vrijednost χ 2 = 651.881 veća je od bilo koje granične vrijednost u tablici χ 2 -raspodjele, stoga se uzima da je P < 0.001. Desni krak raspodjele od granične vrijednosti znači vjerojatnost α da je hipoteza H 0 točna. Lijevo od te granične vrijednosti površina ispod krivulje je jednaka vjerojatnosti 1 - α, tj. vjerojatnost da je H 1 točna. Primjer 4. Koncentracija α-1-antitripsina. Kod 135 ţena starosti od 46 do 65 godina odreďena je koncentracija (u g/l) α-1-antitripsina. Dobiveni podaci ureďeni su u klasne intervale i prikazani kao raspodjela frekvencija, a zatim su iz izračunate srednje vrijednosti i standardne devijacije izračunate očekivane frekvencije za normalnu raspodjelu. Pokazati da li je dobijena raspodjela normalna. Podaci za opaţene i očekivane frekvencije su u tablici (idući slajd). ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Dobivene frekvencije slijede očekivanu normalnu raspodjelu. H 1 : Dobivene frekvencije ne slijede očekivanu normalnu raspodjelu.

2) Izbor testa: χ 2 -test slaganja. Klasni interval metričke varijable je ordinalna varijabla. 3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu stat. značaj. α = 0.01 4) Izračunavanje: N = 135 ---- veličina uzorka C = 8 ---- broj razreda broj st. slob. df = C - 1 = 7 -zbroj svih opaţenih frekvencija je 135 -zbroj svih očekivanih frekvencija je točno 135 -računanje χ 2 -vrijednosti na jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 2 2 /2 + 10 2 /9 + 27 2 /24 + 41 2 /38 + 31 2 /36 + 16 2 /19 + 6 2 /6 + 2 2 /1-135 = 2.8910819 2.891 U tablici χ 2 -raspodjele nalazi se za df = 7 i za α = 0.05 kritična vrijednost χ 2 * = 14.067. Stoga je P > 0.05. 5) Zaključivanje: χ 2 < χ 2 * H 0 se zadrţava prihvaća se, a H 1 se odbacuje. Odgovor: Empirijska raspodjela ne razlikuje se značajno od normalne raspodjele (df = 7, χ 2 = 2.891, χ 2 * = 14.067 za α = 0.05, P > 0.05).

Primjer 5. Učestalost prometnih nesreća. U jednom tjednu zabiljeţen je slijedeći broj prometnih nesreća na jednoj opasnoj cesti, posljedica kojih je bila hitan transport unesrećenih u obliţnju bolnicu: Dan u tjednu Broj nesreća ------------------------------------------ ponedjeljak 4 utorak 2 srijeda 2 četvrtak 3 petak 6 subota 5 nedjelja 7 ------------------------------------------ Što se moţe zaključiti iz ove empirijske raspodjele? Jesu li frekvencije prometnih nesreća podjednake kroz taj tjedan? ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Broj prometnih nesreća je podjednak kroz taj tjedan. H 1 : Broj prometnih nesreća je podjednak kroz taj tjedan. 2) Izbor testa: χ 2 -test slaganja. 3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga

4) Izračunavanje: N = O 1 + O 2 + + O 7 = 28 ---- veličina cijelog uzorka = ukupna frekvencija C = 7 ---- broj razreda = broj dana u tjednu broj stup. slobode df = C - 1 = 6 -opaţene apsolutne frekvencije su dane u tablici zadatka: zbroj je točno 2500 -računanje očekivanih frekvencija prema uniformnoj raspodjeli da su frekvencije kroz tjedan potpuno jednake: E 1 = E 2 = = E 7 = N/C = 28/7 = 4.0 -izrada kontingencijske tablice: dan u tjednu je ordinalna varijabla ----------------------------------------------------------------- Dan u tjednu Opažene frekvencije (O i ) Očekivane frekvencije (E i ) ponedjeljak 4 4 utorak 2 4 srijeda 2 4 četvrtak 3 4 petak 6 4 subota 5 4 nedjelja 7 4 Ukupno (N) 28 28 -računanje χ 2 -vrijednosti na jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 4 2 /4 + 2 2 /4 + 2 2 /4 + 3 2 /4 + 6 2 /4 + 5 2 /4 + 7 2 /4-28 = 7.75 U tablici χ 2 -raspodjele nalazi se za df = 6 i za α = 0.05 kritična vrijednost χ 2 * = 12.592. Stoga je P > 0.05.

5) Zaključivanje: χ 2 < χ 2 * H 0 se ne moţe odbaciti - prihvaća se, a H 1 se ne moţe zadrţati - odbacuje se. Odgovor: Frekvencije prometnih nesreća kroz taj tjedan na cesti ne razlikuje se značajno po danima (df = 6, χ 2 = 7.75, χ 2 * = 12.592 za α = 0.05, P > 0.05). Primjer 6. Autosomno recesivno nasljedne bolesti. U genetičkom testiranju na jednu autosomno recesivnu nasljednu bolest sudjelovalo je 100 ispitanika s njihovim roditeljima. Dobivene su slijedeće učestalosti tih 100 ispitanika za bolesne osobe (kombinacija alela ƇƇ), zdrave nositelje bolesti (kombinacije alela ƇC) i zdrave nenositelje (kombinacija alela CC): Genotip Učestalost --------------------------------- ƇƇ 26 ƇC 45 CC 29 --------------------------------- Shema s primjerom genetičkog nasljeďivanja dana je na idućem slajdu. Teorijske relativne frekvencije prema toj shemi jesu: 25% za ƇƇ, 50% za ƇC i 25% za CC. Jesu li razlike izmeďu empirijske i teorijske raspodjele značajne, tj. obaraju li ove razlike ili potvrďuju Hardy-Weinbergov zakon? Ovaj zakon je zakon genetičke ravnoteţe populacije, prema kojemu se relativne frekvencije alela odreďenog lokusa odrţavaju na istoj razini u nizu sukcesivnih generacija ako nisu prisutni drugi evolucijski čimbenici.

Shema autosomno recesivnog naslijeďivanja: Co zdrav gen oca Cm zdrav gen majke Ƈo oštećeni gen oca Ƈm oštećeni gen majke Postoji osam kombinacija roditeljskih gena: ƇoCm (sin, kćer) CoƇm (sin, kćer) ƇoCm (sin, kćer) ƇoƇm (sin, kćer)

---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Razlike u frekvencijama nisu značajne, tj. vrijedi spomenuti genetički zakon. H 1 : Razlike u frekvencijama jesu značajne - ne vrijedi spomenuti genet. zakon. 2) Izbor testa: χ 2 -test slaganja. 3) Izbor testnog kriterija: kritična vrijednost za dani df i α = 0.05 4) Izračunavanje: N = O 1 + O 2 + O 3 = 100, C = 3, df = C - 1 = 2 -računanje očekivanih frekvencija prema teorijskim relativnim frekvencijama (vjerojatnostima): E 1 = E 3 = 0.25 100 = 25, E 2 = 0.50 100 = 50 -izrada kontingencijske tablice: genotip je nominalna varijabla Genotip Opažene frekvencije (O i ) Očekivane frekvencije (E i ) ƇƇ 26 25 ƇC 45 50 CC 29 25 Ukupno (N) 100 100 -računanje χ 2 -vrijednosti na jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 26 2 /25 + 45 2 /50 + 29 2 /25-100 = 1.18 U tablici χ 2 -rasp. za df = 2 i za α = 0.05 je χ 2 * = 5.991. Stoga je P > 0.05. 5) Zaključivanje: χ 2 < χ 2 * H 0 se prihvaća, a H 1 se odbacuje. Odgovor: Razlike frekvencija nisu značajne (df = 2, χ 2 = 1.18, χ 2 * = 15.991 za α = 0.05, P > 0.05), što potvrďuje valjanost spomenutog genetičkog zakona.

III.3.3. χ 2 -test homogenosti skupa i χ 2 -test nezavisnosti dviju varijabli χ 2 -test homogenosti skupa je čest test, a χ 2 -test nezavisnosti dviju varijabli nije čest u biostatistici. Izračunavanja su jednaka za oba testa, ali su razlike u shvaćanju skupa podataka, u statističkoj hipotezi i interpretaciji rezultata. Uglavnom se koriste za kategorijske varijable nominalne i ordinalne varijable, a rjeđe za druge tipove varijabli koje se shvaćaju kao ordinalne ili se transformiraju u ordinalnu varijablu (vrijede ista pravila kao kod χ 2 -testa slaganja ili aproksimacije). Ovdje postoje dva statistička obiljeţja od interesa, tj. 2 varijable izmjerene za statistički skup koji se moţe shvatiti na više načina (kao jedan uzorak, ili kao dva i više uzoraka). Zato kontingencijska tablica ima oblik matrice, i ona se posebno radi za opaţene frekvencije i za očekivane frekvencije (idući slajd). Brojevi se upisuju u zelene ćelije, a sume se provjeravaju izvan tablice (ţuto). χ 2 -test homogenosti skupa (Engl. chi-square test for/of homogeneity, chisquare test for homogeneity of populations, chi-square test for homogeneity of proportions): cijeli statistički skup shvaća se kao cijela populacija, a sastoji se od dva ili više podskupova tj. uzoraka ili populacija ova podjela skupa na klase (razrede, kategorije) je tzv. vertikalna kategorijska varijabla A u kontingencijskoj tablici (idući slajd). Varijabla B je svojstvo čija nas raspodjela zanima po klasama varijable A podjela horizontalne kategorijske varijable B na klase ispitivanog svojstva vidljiva je u kontingencijskoj tablici (idući slajd).

Kontingencijska tablica opaţenih frekvencija (O ij ) tipa C1 C2: Varijabla B Varijabla A razred B1 razred B2 razred B3... razred BC2 Ukupno razred A1 O 11 O 12 O 13... O 1C2 A 1 razred A2 O 21 O 22 O 23... O 2C2 A 2 razred A3 O 31 O 32 O 33... O 3C2 A 3..................... razred AC1 O C11 O C12 O C13... O C1C2 A C1 Ukupno B 1 B 2 B 3... B C2 T (N) Kontingencijska tablica očekivanih frekvencija (E ij ) tipa C1 C2: Varijabla B Varijabla A razred B1 razred B2 razred B3... razred BC2 Ukupno razred A1 E 11 E 12 E 13... E 1C2 A 1 razred A2 E 21 E 22 E 23... E 2C2 A 2 razred A3 E 31 E 32 E 33... E 3C2 A 3..................... razred AC1 E C11 E C12 E C13... E C1C2 A C1 Ukupno B 1 B 2 B 3... B C2 T (N)

Ovim testom se provjerava postoje li statistički značajne razlike unutar skupa tj. izmeďu dvaju ili više uzoraka. Ako takve razlike postoje, skup je nehomogen, a ako razlike ne postoje onda je skup homogen. Dakle, kao i u slučaju χ 2 -testa slaganja, i ovdje se usporeďuju opaţene i očekivane frekvencije, koje se definiraju, odreďuju i izračunavaju na isti način. No kod χ 2 -testa slaganja radilo se o jednodimenzionalnoj empirijskoj raspodjeli jer je postojala samo jedna varijabla. U slučaju χ 2 -testa homogenosti postoje dvije varijable, pa je teorijska raspodjela dvodimenzionalna, a empirijska raspodjela moţe imati i više dimenzija ako uzorci predstavljaju meďusobno različite raspodjele i još k tome različite raspodjele u odnosu na teorijsku. Statistička hipoteza je: H 0 : Ne postoje značajne razlike u raspodjeli uzoraka tj. skup je homogen (svi uzorci imaju istu pretpostavljenu, očekivanu raspodjelu). H 1 : Postoje značajne razlike u raspodjeli uzoraka tj. skup je nehomogen (svi uzorci nemaju istu pretpostavljenu, očekivanu raspodjelu - barem jedan uzorak ju nema). Najmanja kontingencijska tablica ima dimenzije 2 2, tj. tipa je 2 2. Ako je broj klasa za varijablu A jednak C1, a broj klasa za varijablu B je C2, onda kontingencijska tablica je tipa C1 C2. Zbrojevi po razredima varijable A jesu A 1, A 2, A 3,, a zbrojevi po razredima varijable B jesu B 1, B 2, B 3, Ukupan zbroj po svim A i ili B j je jednak N (u čestoj oznaci i T). Element kontingencijske tablice O ij ili E ij pripada i-tom razredu varijable A i j-tom razredu varijable B.

Orijentacija kontingencijske tablice tj. izbor dviju varijabli A i B: -bilo koji izbor dviju varijabli za orijentaciju tablice, tj. koja od dviju varijabli bude A a koja B, ne utječe na χ 2 -vrijednost i rezultat statističkog testa, s Yatesovom korekcijom ili bez korekcije, neovisno takoďer o tipu tablice; -preporučuje se za vertikalnu varijablu A uzeti varijablu koja je nezavisna varijabla, kontrolna varijabla, ili je moguće da bude nezavisna varijabla ili više nezavisna nego druga varijabla; -preporučuje se za horizontalnu varijablu B uzeti varijablu koja je zavisna, nije kontrolna kada je druga kontrolna, ili je moguće da bude zavisna varijabla ili više zavisna nego druga varijabla; -ustaljena orijentacija tablice omogućuje bolje razumijevanje i interpretaciju statističkog testa. χ 2 -test nezavisnosti dviju varijabli (Engl. chi-square test for/of independence): cijeli statistički skup shvaća se kao jedinstvena populacija ili uzorak, a sastoji se od dva ili više podskupova tj. poduzoraka ova podjela skupa na klase (razrede, kategorije) varijabli A i B je ista kao za χ 2 -test homogenosti. Ovim testom se provjerava postoji li statistički značajna veza tj. zavisnost izmeďu dviju varijabli koje nisu korelirane ili sparene, drugim riječima jesu li dvije takve varijable meďusobno zavisne ili nezavisne. Takva provjera nezavisnosti moguća je samo kada se ispituju dva obiljeţja istog uzorka. Često je teško utvrditi što je uzorak a što ispitivani skup, tako da je za mnoge skupove podataka moguće obaviti i χ 2 -test homogenosti i χ 2 -test nezavisnosti.

Statistička hipoteza je: H 0 : Dvije kategorijske varijable meďusobno su nezavisne. H 1 : Dvije kategorijske varijable nisu meďusobno nezavisne. χ 2 -test homogenosti skupa vrlo je čest u biostatistici, dok χ 2 -test nezavisnosti dviju varijabli i nije baš čest. Općenito se svaki običan χ 2 -test tj. χ 2 -test bez ikakve korekcije zove i Pearsonov χ 2 -test (Engl. Pearson s χ 2 -test). U slučaju Yatesove korekcije, χ 2 -test se zove Yatesov χ 2 -test ili χ 2 -test s Yatesovom korekcijom (Engl. Yates s χ 2 -test, χ 2 -test with Yates s correction). Yatesovu korekciju preporučeno je učiniti u slučajevima da: 1- kontingencijska tablica ima dimenzije 2 2, dok je N izmeďu 20 i 40 ili barem jedna ćelija sadrţi očekivanu frekvenciju koja je manja od 5; 2- više od 20% ćelija u kontingencijskoj tablici većih dimenzija sadrţi očekivane frekvencije koje su manje od 5 (ili se neke ćelije spajaju da se ovo izbjegne); 3- ukupna frekvencija N je manja od 20 tj. radi se o malom skupu. U slučaju da jedna ili više ćelija sadrži nulu kao očekivanu frekvenciju, onda se χ 2 -test nikako ne može izvesti. Prilikom određivanja opaženih frekvencija za bilo koji χ 2 -test, svaka statistička jedinica (osoba, ispitanik, bolesnik itd.) smije se pojaviti samo jednom a ne dvaput ili više puta. Za male skupove, umjesto χ 2 -testa izvodi se Fisherov egzaktni test (Engl. Fisher s exact test, koji nije predmet ovog kolegija).

Primjer 1A. Liječenje abdominalne boli. U slijedećoj tablici navedeni su rezultati (frekvencije) za 154 bolesnika s abdominalnom boli, od kojih je jedna grupa bila liječena pinaverij bromidom (dvije tablete dnevno), a druga placebom. Bol prisutna Terapija DA NE Ukupno pinaverij bromid 6 57 63 placebo 30 61 91 Ukupno 36 118 154 Testirati efikasnost soli (pinaverij bromida) u liječenju abdominalne boli upotrebom χ 2 -testa. ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Grupe s različitim terapijama se bitno ne razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od nule). H 1 : Grupe s različitim terapijama se bitno razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija jesu bitne (bitno su različite od nule). 2) Izbor testa: χ 2 -test homogenosti skupa, uz Yatesovu korekciju jer se radi o kontingencijskoj tablici tipa 2 2.

Broj uzoraka: 2 uzorka uzorak bolesnika liječen pinaverij bromidnom terapijom i uzorak bolesnika liječen placebo terapijom. Skup = 2 uzorka Varijable (nominalne): vrsta terapije - nezavisna varijabla s dvije vrijednosti (pinaverij bromid i placebo), prisutnost boli zavisna varijabla s dvije vrijednosti (DA i NE) 3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga df = (broj redova - 1) (broj stupaca - 1) = (2-1) ( 2-1) = 1 4) Izračunavanje: T = 154 ---- ukupna frekvencija A 1 = 63, A 2 = 91 --- frekvencije nezavisne varijable (vrsta terapije) B 1 = 36, B 2 = 118 --- frekvencije zavisne varijable (prisutnost boli) -opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka -računanje očekivanih frekvencija prema uniformnoj raspodjeli za svaku varijablu: općenito je E ij = A i B j /T tj. E ij : A i = B j : T odnosno E ij : B j = A i : T, kako slijedi: E 11 :36 = 63:154 tj. E 11 :63= 36:154 E 11 = 36 63/154 = 14.727273 14.73 E 12 :118 = 63:154 tj. E 12 :63= 118:154 E 12 = 118 63/154 = 48.272727 48.27 E 21 :36 = 91:154 tj. E 21 :91= 36:154 E 21 = 36 91/154 = 21.272727 21.27 E 22 :118 = 63:154 tj. E 22 :63= 118:154 E 22 = 118 91/154 = 69.727273 69.73 Najlakše je koristiti opću formulu E ij = A i B j /T -izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu): -----------------------------------------------------------------

Bol prisutna Terapija DA NE Ukupno pinaverij bromid 14.73 48.27 63 placebo 21.27 69.73 91 Ukupno 36 118 154 -Pearsonov ili običan χ 2 -test: a) računanje χ 2 -vrijednosti na sloţeniji način (po definiciji): χ 2 = Σ i (O i - E i ) 2 /E i = (6-14.73) 2 /14.73 + (57-48.27) 2 /48.27 + + (30-21.27) 2 /21.27 + (61-69.73) 2 /69.73 = 11.428968 11.429 b) računanje χ 2 -vrijednosti na jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 6 2 /14.73 + 57 2 /48.27 + 30 2 /21.27 + 61 2 /69.73-154 = = 11.428968 11.429 -Yatesov χ 2 -test ili χ 2 -test s Yatesovom korekcijom: χ 2 = Σ i ( O i - E i - 0.5) 2 /E i = ( 6-14.73-0.5) 2 /14.73 + ( 57-48.27-0.5) 2 /48.27 + + ( 30-21.27-0.5) 2 / 21.27 + ( 61-69.73-0.5) 2 /69.73 = 10.157298 10.157 U tablici χ 2 -rasp. za df = 1 i α = 0.05 je χ 2 * = 3.841. Stoga je P < 0.002. 5) Zaključivanje: χ 2 > χ 2 * H 0 se odbacuje, a H 1 se prihvaća. Odgovor: Razlike opaţenih i očekivanih frekvencija su značajne (df = 1, χ 2 * = 3.841 za α = 0.05; bez korekcije - χ 2 = 11.429, P < 0.001; s korekcijom - χ 2 = 10.157, P < 0.002), što potvrďuje učinkovitost pinaverij bromida.

Primjer 1B. Isti problem (primjer 1A), s istim podacima. Zadatak je χ 2 -testom utvrditi jesu li dvije kategorijske varijable (vrsta terapije i prisutnost boli) meďusobno nezavisne. Izračunavanje je istovjetno, samo je interpretacija rezultata drugačija. ---------------------------------------------------- U odnosu na prethodni primjer 1A, razlike postoje svega na nekoliko mjesta, dok je računski postupak u svemu isti: -1) Postavljanje statističke hipoteze: H 0 : Dvije kategorijske varijable meďusobno su nezavisne. H 1 : Dvije kategorijske varijable nisu meďusobno nezavisne. -2) Izbor testa: χ 2 -test nezavisnosti dviju varijabli, uz Yatesovu korekciju jer se radi o kontingencijskoj tablici tipa 2 2. Skup od 154 ispitanika moţe se smatrati jednim uzorkom koji je izvučen iz iste populacije (svi bolesnici imaju abdominalnu bolest, samo se liječe na dva različita načina). -5) Zaključivanje: χ 2 > χ 2 * H 0 se ne moţe zadrţati odbacuje se, a H 1 se ne moţe odbaciti - prihvaća se. Vrijednost χ 2 odreďuje razinu meďusobne povezanosti dviju varijabli što je ova vrijednost veća varijable su jače povezane tj. manje neovisne. -Odgovor: Dvije varijable su značajno zavisne (df = 1, χ 2 * = 3.841 za α = 0.05; bez korekcije - χ 2 = 11.429, P < 0.001; s korekcijom - χ 2 = 10.157, P < 0.002), što potvrďuje učinkovitost pinaverij bromida. Drugim riječima, pinaverij bromid je bolja terapija, a placebo slabija terapija za abdominalnu bol.

Primjer 2A. Liječenje Hodgkinovog limfoma. U slijedećoj tablici navedeni su rezultati (frekvencije) za 140 bolesnika s Hodgkinovim limfomom, od kojih je jedna grupa bila liječena kemoterapijom, a druga radioterapijom. Odgovor na terapiju Terapija potpun djelomičan nikakav Ukupno kemoterapija 50 20 10 80 radioterapija 20 20 20 60 Ukupno 70 40 30 140 Testirati efikasnost vrsta terapija u liječenju Hodgkinovog limfoma upotrebom χ 2 -testa. ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Grupe s različitim terapijama se bitno ne razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od nule). H 1 : Grupe s različitim terapijama se bitno razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija jesu bitne (bitno su različite od nule). 2) Izbor testa: χ 2 -test homogenosti skupa, bez Yatesove korekciju jer se radi o kontingencijskoj tablici tipa 2 3, s velikom ukupnom frekvencijom (T = 140 > 40) i velikim brojem u svakoj ćeliji (10-50). Skup = 2 uzorka

Broj uzoraka: 2 uzorka uzorak bolesnika liječen kemoterapijom i uzorak bolesnika liječen radioterapijom. Varijable: vrsta terapije (nominalna) - nezavisna varijabla s dvije vrijednosti (kemoterapija i radioterapija), odgovor bolesti na terapiju (ordinalna) - zavisna varijabla s tri vrijednosti (potpuna, djelomična i nikakva) 3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.05 uzima se ova vrijednost ako nije navedena neka druga df = (broj redova - 1) (broj stupaca - 1) = (3-1) (2-1) = 2 4) Izračunavanje: T = 140 ---- ukupna frekvencija A 1 = 80, A 2 = 60 --- frekvencije nezavisne varijable (vrsta terapije) B 1 = 70, B 2 = 40, B 3 = 30 --- frekvencije zavisne varijable (odgovor na terapiju) -opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka -računanje očekivanih frekvencija prema uniformnoj raspodjeli za svaku varijablu: E ij = A i B j /T E 11 = 70 80/140 = 40 E 12 = 40 80/140 = 22.857143 23 E 13 = 30 80/140 = 17.142857 17 E 21 = 70 60/140 = 30 E 22 = 40 60/140 = 17.142857 17 E 23 = 30 60/140 = 12.857143 13 -izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu): -----------------------------------------------------------------

Odgovor na terapiju Terapija potpun djelomičan nikakav Ukupno kemoterapija 40 23 17 80 radioterapija 30 17 13 60 Ukupno 70 40 30 140 -Pearsonov ili običan χ 2 -test: a) računanje χ 2 -vrijednosti na sloţeniji način (po definiciji): χ 2 = Σ i (O i - E i ) 2 /E i = (50-40) 2 /40 + (20-23) 2 /23 + (10-17) 2 /17 + (20-30) 2 /30 + (20-17) 2 /17 + (20-13) 2 /13 = 13.405633 13.406 b) računanje χ 2 -vrijednosti na jednostavniji način (po izvedenom izrazu): χ 2 = Σ i (O i ) 2 /E i - N = 50 2 /40 + 20 2 /23 + 10 2 /17 + 20 2 /30 + 20 2 /17 + 20 2 /13-140 = = 13.405633 13.406 U tablici χ 2 -rasp. za df = 2 i α = 0.05 je χ 2 * = 5.991. Stoga je P < 0.002. 5) Zaključivanje: χ 2 > χ 2 * H 0 se odbacuje, a H 1 se prihvaća. Odgovor: Razlike izmeďu opaţenih i očekivanih frekvencija su značajne (df = 2, χ 2 * = 5.991 za α = 0.05; χ 2 = 13.406, P < 0.002), što potvrďuje bitne razlike meďu terapijama. Kemoterapija se pokazala učinkovitijom od radioterapije.

Primjer 2B. Isti problem (primjer 2A), s istim podacima. Zadatak je χ 2 -testom utvrditi jesu li dvije kategorijske varijable (vrsta terapije i odgovor Hodgkinovog limfoma na terapiju) meďusobno nezavisne. Izračunavanje je istovjetno, samo je interpretacija rezultata drugačija. ---------------------------------------------------- U odnosu na prethodni primjer 2A, razlike postoje svega na nekoliko mjesta, dok je računski postupak u svemu isti: -1) Postavljanje statističke hipoteze: H 0 : Dvije kategorijske varijable meďusobno su nezavisne. H 1 : Dvije kategorijske varijable nisu meďusobno nezavisne. -2) Izbor testa: χ 2 -test nezavisnosti dviju varijabli. Skup od 140 ispitanika moţe se smatrati jednim uzorkom koji je izvučen iz iste populacije (svi bolesnici imaju Hodgkinov limfom, samo se liječe na dva različita načina). -5) Zaključivanje: χ 2 > χ 2 * H 0 se ne moţe zadrţati odbacuje se, a H 1 se ne moţe odbaciti - prihvaća se. Vrijednost χ 2 odreďuje razinu meďusobne povezanosti dviju varijabli što je ova vrijednost veća varijable su jače povezane tj. manje neovisne. -Odgovor: Dvije varijable su značajno zavisne (df = 2, χ 2 * = 5.991 za α = 0.05, χ 2 = 11.429, P < 0.002), što potvrďuje učinkovitost kemoterapije u odnosu na radioterapiju. Drugim riječima, kemoterapija je bolja terapija, a radioterapija je slabija terapija za Hodgkinov limfom.

Primjer 3. Odnos astme i gripe. U jednom eksperimentu se provjeravao odnos izmeďu astmatične krize i pojave gripe. Ispitano je 150 nasumično odabrana djeteta u domu zdravlja u jednoj gradskoj četvrti. Dobiveni su slijedeći podaci o frekvencijama za vremensko razdoblje od jednog tjedna: Astma/Gripa DA NE DA 27 34 NE 42 47 Jesu li astmatični napadi i pojava gripe meďusobno nezavisni? Uzeti α = 4%. ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Dvije kategorijske varijable meďusobno su nezavisne. H 1 : Dvije kategorijske varijable nisu meďusobno nezavisne. 2) χ 2 -test nezavisnosti dviju varijabli. Yatesova korekcija je potrebna jer se radi od kontingencijskoj tablici tipa 2 2, s velikom ukupnom frekvencijom i velikim brojem u svakoj ćeliji. Skup = 1 uzorak Broj uzoraka: 1 uzorak djeca koja imaju ili nemaju astmatičnu krizu i/ili gripu. Varijable: astmatična kriza (nominalna) - varijabla s dvije vrijednosti (DA i NE), pojava gripe (nominalna) - varijabla s dvije vrijednosti (DA i NE). Sama astma je nezavisna varijabla u odnosu na gripu, pa je pogodnije astmatične napade staviti formalno na mjesto nezavisne varijable tj. u vertikalan poloţaj, a pojavu gripe u horizontalan poloţaj.

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.04 df = (broj redova - 1) (broj stupaca - 1) = (2-1) (2-1) = 1 4) Izračunavanje: -puna kontingencijska tablica opaţenih frekvencija, na osnovu danih podataka: Pojava gripe Astmatična kriza DA NE Ukupno DA 27 34 61 NE 42 47 89 Ukupno 69 81 150 T = 150 ---- ukupna frekvencija A 1 = 61, A 2 = 89 --- frekvencije formalno nezavisne varijable (astmatična kriza) B 1 = 69, B 2 = 81 --- frekvencije formalno zavisne varijable (pojava gripe) -računanje očekivanih frekvencija prema uniformnoj raspodjeli: E ij = A i B j /T E 11 = 61 69/150 = 28.06 E 12 = 61 81/150 = 32.94 E 21 = 89 69/150 = 40.94 E 22 = 89 81/150 = 48.06 -izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu): -----------------------------------------------------------------

Pojava gripe Astmatična kriza DA NE Ukupno DA 28.06 32.94 61 NE 40.94 48.06 89 Ukupno 69 81 150 -Pearsonov ili običan χ 2 -test: računanje χ 2 -vrijednosti po definiciji: χ 2 = Σ i (O i - E i ) 2 /E i = (27-28.06) 2 /28.06 + (34-32.94) 2 /32.94 + + (42-40.94) 2 /40.94 + (47-48.06) 2 /48.06 = 0.1249774 0.125 -Yatesov χ 2 -test ili χ 2 -test s Yatesovom korekcijom: χ 2 = Σ i ( O i - E i - 0.5) 2 /E i = ( 27-28.06-0.5) 2 /28.06 + ( 34-32.94-0.5) 2 /32.94 + ( 42-40.94-0.5) 2 /40.94 + ( 47-48.06-0.5) 2 /48.06 = 0.0348816 0.034 U tablici χ 2 -rasp. za df = 1 i α = 0.04 je χ 2 * = 4.218. Stoga je P > 0.04. 5) Zaključivanje: χ 2 < χ 2 * H 0 se ne moţe odbaciti pa se prihvaća, a H 1 se ne moţe zadrţati pa se odbacuje. Odgovor: Za ispitan uzorak djece, dvije varijable nisu značajno zavisne (df = 1, χ 2 * = 4.218 za α = 0.04; bez korekcije - χ 2 = 0.125, P > 0.04; s korekcijom χ 2 = 0.034, P > 0.04). Drugim riječima, astmatični napadi nisu uzrokovani ili pojačani gripom, niti oni utječu na pojavnost gripe.

Primjer 4. Liječenje HIV pozitivnih osoba. Provedeno je istraţivanje o kvaliteti liječenja HIV pozitivnih osoba u sustavu javnog zdravstva u Brazilu. U gradu A, nasumično je odabrano 150 HIV pozitivnih osoba, a u gradu B 200 HIV pozitivnih osoba. Koristeći podatke dane u slijedećoj tablici, moţe li se tvrditi da vlada isto mišljenje u oba grada, uz α = 5%? Grad/Liječenje dobro zadovoljavajuće loše A 73 37 40 B 94 61 45 ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Gradovi se bitno ne razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od nule). H 1 : Gradovi se bitno razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija nisu bitne (bitno su različite od nule). 2) Izbor testa: χ 2 -test homogenosti skupa, bez Yatesove korekciju jer se radi o kontingencijskoj tablici tipa 2 3, s velikom ukupnom frekvencijom i velikim brojem u svakoj ćeliji. Skup = 2 uzorka Broj uzoraka: 2 uzorka ispitanici u gradu A i ispitanici u gradu B. Varijable: grad (nominalna) - nezavisna varijabla s dvije vrijednosti (A i B), kvaliteta liječenja HIV pozitivnih osoba (ordinalna) - zavisna varijabla s tri vrijednosti (dobro, zadovoljavajuće, loše)

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.05; df = (broj redova - 1) (broj stupaca - 1) = (2-1) (3-1) = 2 4) Izračunavanje: -puna kontingencijska tablica opaţenih frekvencija, na osnovu danih podataka: Kvaliteta liječenja HIV pozitivnih osoba Grad dobro zadovoljavajuće loše Ukupno A 73 37 40 150 B 94 61 45 200 Ukupno 167 98 85 350 4) Izračunavanje: T = 350 ---- ukupna frekvencija A 1 = 150, A 2 = 200 --- frekvencije nezavisne varijable (grad) B 1 = 167, B 2 = 98, B 3 = 85 --- frekvencije zavisne varijable (kvaliteta liječenja) -računanje očekivanih frekvencija prema uniformnoj raspodjeli: E ij = A i B j /T E 11 = 150 167/350 = 71.571429 72 E 12 = 150 98/350 = 42 E 13 = 150 85/350 = 36.428571 36 E 21 = 200 167/350 = 95.428571 95 E 22 = 200 98/350 = 56 E 23 = 200 85/350 = 48.571429 49 -izrada kontingencijske tablice za očekivane frekvencije (na idućem slajdu):

Kvaliteta liječenja HIV pozitivnih osoba Grad dobro zadovoljavajuće loše Ukupno A 72 42 36 150 B 95 56 49 200 Ukupno 167 98 85 350 -Pearsonov ili običan χ 2 -test: računanje χ 2 -vrijednosti po definiciji: χ 2 = Σ i (O i - E i ) 2 /E i = (73-72) 2 /72 + (37-42) 2 /42 + (40-36) 2 /36 + (94-95) 2 /95 + (61-56) 2 /56 + (45-49) 2 /49 = 1.8370569 1.837 U tablici χ 2 -rasp. za df = 2 i α = 0.05 je χ 2 * = 5.991. Stoga je P > 0.05. 5) Zaključivanje: χ 2 < χ 2 * H 0 se ne moţe odbaciti pa se prihvaća, a H 1 se ne moţe zadrţati pa se odbacuje. Odgovor: Razlike izmeďu opaţenih i očekivanih frekvencija nisu značajne (df = 2, χ 2 * = 5.991 za α = 0.05; χ 2 = 1.837, P > 0.05). Drugim riječima, anketirane HIV pozitivne osobe u dva brazilska grada imaju isto mišljenje o kvaliteti liječenja HIV pozitivnih osoba u sustavu javnog zdravstva. Primjer 5. Učinkovitost kemoterapije. Ispitivana je reakcija karcinoma na kemoterapiju u četiri skupine onkoloških bolesnika. Bolesnici su svrstani u tri skupine, prema reakciji karcinoma na kemoterapiju: slaba, osrednja i jaka. Ispitati za α = 2% reagiraju li svi tipovi karcinoma na isti način. Podaci u tablici:

Razina reakcije karcinoma na kemoterapiju Tip karcinoma slaba osrednja jaka Ukupno Tip I 51 33 16 100 Tip II 58 29 13 100 Tip III 48 42 30 120 Tip IV 26 38 16 80 Ukupno 183 142 75 400 ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Tipovi karcinoma se bitno ne razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija nisu bitne (nisu bitno različite od nule). H 1 : Tipovi karcinoma se bitno razlikuju u frekvencijama, tj. razlike izmeďu opaţenih i očekivanih frekvencija su bitne (bitno su različite od nule). 2) Izbor testa: χ 2 -test homogenosti skupa, bez Yatesove korekciju jer se radi o kontingencijskoj tablici tipa 4 3, s velikom ukupnom frekvencijom i velikim brojem u svakoj ćeliji. Skup = 4 uzorka Broj uzoraka: 4 uzorka ispitanici s tipovima karcinoma I, II, III i IV. Varijable: tip karcinoma (nominalna) - nezavisna varijabla s četiri vrijednosti (tipovi: I, II, III i IV), razina reakcije karcinoma na kemoterapiju (ordinalna) - zavisna varijabla s tri vrijednosti (slaba, osrednja, jaka)

3) Izbor testnog kriterija: kritična vrijednost za dani df i razinu statističke značajnosti α = 0.02 df = (broj redova - 1) (broj stupaca - 1) = (4-1) (3-1) = 6 4) Izračunavanje: T = 140 ---- ukupna frekvencija A 1 = 100, A 2 = 100, A 3 = 120, A 4 = 80 --- frekvencije nezavisne varijable (tip karcinoma) B 1 = 183, B 2 = 142, B 3 = 75 --- frekvencije zavisne varijable (razina reakcije karcinoma na kemoterapiju) -opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka -računanje očekivanih frekvencija prema uniformnoj raspodjeli: E ij = A i B j /T E 11 = 100 183/400 = 45.75 E 12 = 100 142/400 = 35.5 E 13 = 100 75/400 = 18.75 E 21 = 100 183/400 = 45.75 E 22 = 100 142/400 = 35.5 E 23 = 100 75/400 = 18.75 E 31 = 120 183/400 = 54.9 E 32 = 120 142/400 = 42.6 E 33 = 120 75/400 = 22.5 E 41 = 80 183/400 = 36.6 E 42 = 80 142/400 = 28.4 E 43 = 80 75/400 = 15

-izrada kontingencijske tablice za očekivane frekvencije: ----------------------------------------------------------------- Razina reakcije karcinoma na kemoterapiju Tip karcinoma slaba osrednja jaka Ukupno Tip I 45.75 35.5 18.75 100 Tip II 45.75 35.5 18.75 100 Tip III 54.9 42.6 22.5 120 Tip IV 36.6 28.4 15 80 Ukupno 183 142 75 400 -Pearsonov ili običan χ 2 -test: računanje χ 2 -vrijednosti po definiciji: χ 2 = Σ i (O i - E i ) 2 /E i = (51-45.75) 2 /45.75 + (33-35.5) 2 /35.5 + (16-18.75) 2 /18.75 + (58-45.75) 2 /45.75 + (29-35.5) 2 /35.5 + (13-18.75) 2 /18.75 + (48-54.9) 2 / 54.9 + (42-42.6) 2 /42.6 + (30-22.5) 2 /22.5 + (26-36.6) 2 /36.6 + (38-28.4) 2 / 28.4 + (16-15) 2 /15 = 17.172724 17.173 U tablici χ 2 -rasp. za df = 6 i α = 0.02 je χ 2 * = 15.033. Stoga je P < 0.02. 5) Zaključivanje: χ 2 > χ 2 * H 0 se ne moţe zadrţati pa se odbacuje, a H 1 se ne moţe odbaciti pa se prihvaća. Odgovor: Razlike izmeďu reakcija različitih tipova karcinoma na kemoterapiju su značajne (df = 6, χ 2 * = 15.033 za α = 0.02; χ 2 = 17.173, P < 0.02). Dakle, tipovi karcinoma su značajno različito reagirali na kemoterapiju.

Primjer 6. Operacija duodenalng ulkusa. Četiri skupine bolesnika s duodenalnim ulkusom podvrgnute su operaciji različitim operacijama, koje su se razlikovale u postotku uklonjenog gastričnog tkiva: 0% (vagotomija i drenaţa, V+D), 25% (vagotomija i antrektomija, V+A), 50% (vagotomija i piloroplastija, V+P) i 75% (gastrektomija i Roux-en-Y rekonstrukcija, G+R). Bolesnici su svrstani u razrede prema jačini različitih neţeljenih posljedica operacije: nikakva, slaba, osrednja. Provjeriti postoji li povezanost izmeďu postotka uklonjenog gastričnog tkiva i jačine neţeljenih posljedica operacije. Podaci su dani u tablici: Jačina neželjenih posljedica operacije Tip operacije nikakva slaba osrednja Ukupno V+D (0%) 61 28 7 96 V+A (25%) 68 23 13 104 V+P (50%) 58 40 12 110 G+R (75%) 53 38 6 97 Ukupno 240 129 38 407 ---------------------------------------------------- 1) Postavljanje statističke hipoteze: H 0 : Dvije kategorijske varijable meďusobno su nezavisne. H 1 : Dvije kategorijske varijable nisu meďusobno nezavisne.

2) χ 2 -test nezavisnosti dviju varijabli. Yatesova korekcija nije potrebna jer se radi od kontingencijskoj tablici tipa 4 3, s velikom ukupnom frekvencijom i velikim brojem u svakoj ćeliji. Skup = 1 uzorak Broj uzoraka: 1 uzorak bolesnici kojima je operiran duodenalnog ulkusa. Varijable: tip operacije (ordinalna, zbog postotka uklonjenog gastričnog tkiva) - varijabla s četiri vrijednosti (0%: V+D, 25%: V+A, 50%: V+P, 75%: G+R), jačina neţeljenih posljedica operacije (ordinalna) - varijabla s tri vrijednosti (nikakva, slaba, osrednja). 3) Izbor testnog kriterija: kritična vrijednost za dani df i α = 0.05 df = (broj redova - 1) (broj stupaca - 1) = (4-1) (3-1) = 6 4) Izračunavanje: T = 407 ---- ukupna frekvencija A 1 = 96, A 2 = 104, A 3 = 110, A 4 = 97 --- frekvencije nezavisne varijable (tip operacije); B 1 = 240, B 2 = 129, B 3 = 38 --- frekvencije zavisne varijable (jačina neţeljenih posljedica operacije) -opaţene apsolutne frekvencije su dane u kontingencijskoj tablici zadatka -računanje očekivanih frekvencija prema uniformnoj raspodjeli: E ij = A i B j /T E 11 = 96 240/407 = 56.609337 57 E 31 = 110 240/407 = 64.864865 65 E 12 = 96 129/407 = 30.427518 30 E 32 = 110 129/407 = 34.864865 35 E 13 = 96 38/407 = 8.963145 9 E 33 = 110 38/407 = 10.27027 10 E 21 = 104 240/407 = 61.326781 61 E 41 = 97 240/407 = 57.199017 57 E 22 = 104 129/407 = 32.963145 33 E 42 = 97 129/407 = 30.744472 31 E 23 = 104 38/407 = 9.7100737 10 E 43 = 97 38/407 = 9.0565111 9

-izrada kontingencijske tablice za očekivane frekvencije: ----------------------------------------------------------------- Jačina neželjenih posljedica operacije Tip operacije nikakva slaba osrednja Ukupno V+D (0%) 57 30 9 96 V+A (25%) 61 33 10 104 V+P (50%) 65 35 10 110 G+R (75%) 57 31 9 97 Ukupno 240 129 38 407 -Pearsonov ili običan χ 2 -test: računanje χ 2 -vrijednosti po definiciji: χ 2 = Σ i (O i - E i ) 2 /E i = (61-57) 2 /57 + (28-30) 2 /30 + (7-9) 2 /9 + (68-61) 2 /61 + (23-33) 2 /33 + (13-10) 2 /10 + (58-65) 2 /65 + (40-35) 2 /35 + (12-10) 2 /10 + (53-57) 2 /57 + (38-31) 2 /31+ (6-9) 2 /9 = 10.32154 10.322 U tablici χ 2 -rasp. za df = 6 i α = 0.05 je χ 2 * = 12.592. Stoga je P > 0.05. 5) Zaključivanje: χ 2 < χ 2 * H 0 se ne moţe odbaciti pa se zadrţava, a H 1 se ne moţe zadrţati pa se odbacuje. Odgovor: Za ispitan uzorak bolesnika, dvije varijable nisu značajno zavisne (df = 6, χ 2 * = 12.592 za α = 0.06, χ 2 = 10.322, P > 0.05). Drugim riječima, jačina neţeljenih posljedica operacije ne ovisi značajno o tipu operacije (tj. o postotku uklonjenog gastričnog tkiva).

III.3.4. Primjeri zadataka o χ 2 -testu homogenosti uzorka Primjeri slijedećih zadataka odnose se na slučaj χ 2 -testa homogenosti uzorka, tj. χ 2 -testa kojim se ispituje homogenost cijelog skupa (gdje je skup shvaćen kao jedan uzorak) odnosno postoje li značajne razlike unutar skupa = razlike izmeďu originalnih uzoraka (podskupova) različitih veličina. Broj takvih uzoraka (podskupova) moţe biti dva, tri, četiri i više. Ovaj tip χ 2 -testa primijenjen je u svim zadacima radi jednostavnosti. U zadatku se ne traţi izračunavanje očekivanih vrijednosti i χ 2 -vrijednosti, jer su takvi računi komplicirani i dugo traju da bi se rješavali za vrijeme ispita. MeĎutim, uz sve zadane podatke, u zadatku se moţe traţiti: -izraďivanje kontingencijske tablice opaţenih vrijednosti -odreďivanje broja stupnjeva slobode -nalaţenje kritične vrijednosti χ 2 * i vjerojatnosti P iz priloţene tablice -statističko zaključivanje tj. statističko odlučivanje o postavljenoj hipotezi (hipoteza da nema ili ima značajnih razlika u skupu tj. izmeďu podskupova) Vjerojatnost P uvijek se određuje iz tablica za najmanji α za koji je χ 2 > χ 2 *. Ako α za statističko testiranje nije navedeno, uzima se vrijednost α = 0.05. U odgovoru zadatka se uvijek navode informacije o rješenju i konačnom statističkom testiranju.

Primjer 1. Postoperativne komplikacije. Slučajno su odabrani uzorci od po 800 bolesnika koji su operirani u gradu A i u gradu B. Bolesnici su svrstani u dva razreda koji nemaju i koji imaju postoperativne komplikacije. Ispitivalo se χ 2 -testom na razini značajnosti α = 5% postoje li značajne razlike izmeďu bolesnika iz gradova A u B, upotrebom χ 2 -testa za homogenost skupa. Sastaviti kontingencijsku tablicu za opaţene vrijednosti, kada je poznato da je broj pacijenata bez postoperativnih komplikacija u gradu A jednak 762, a u oba grada je 1522. Odrediti broj stupnjeva slobode. --------------------------- Postupak: a) podaci: -dva nezavisna uzorka u skupu: uzorak 1 uzorak bolesnika operiranih u gradu A, uzorak 2 uzorak bolesnika operiranih u gradu B χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeďu bolesnika operiranih u dva grada s obzirom na postoperativne komplikacije -veličine uzoraka: 800 (uzorak 1) i 800 (uzorak 2) veličina skupa: 1600 -varijable: grad - mjesto stanovanja (nominalna) s dvije vrijednosti (A i B); postojanje postoperativnih komplikacija (nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 2 2 Yatesova korekcija b) traţe se: -kontingencijska tablica opaţenih vrijednosti -broj stupnjeva slobode

Postoperativne komplikacije Grad DA NE Ukupno A 38 762 800 B 40 760 800 Ukupno 78 1522 1600 Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti: 1- konstruira se tablica veličine 2x2, jer je utvrďen broj razreda dviju varijabli 2- vertikalno se postavi varijabla koja je nezavisna varijabla, kontrolna varijabla ili je moguće da bude nezavisna varijabla; u ovom slučaju to je grad mjesto stanovanja 3- horizontalno se postavi varijabla koja je zavisna, nije kontrolna niti nezavisna, ili je moguće da bude zavisna varijabla; u ovom slučaj to je postojanje postoperativnih komplikacija -postavljanje ovih varijabli je stvar konvencije, a ovaj poredak ili obratan poredak daju istu χ 2 -vrijednost bez korekcije ili s korekcijom 4- upišu se brojevne vrijednosti iz zadatka u pripadne ćelije u tablici 5- izračunavaju se brojevi u prazne ćelije (označeni crveno u gornjoj tablici), postepenim računanjem iz poznatih brojeva: 800 + 800 = 1600 800-762 = 38 1600-1522 = 78 1522-762 = 760 800-760 = 40

6- provjeravaju se SVI zbrojevi, da se isprave eventualna kriva izračunavanja ili upisivanja zadanih brojeva: -horizontalni zbrojevi: 38 + 762 = 800 40 + 760 = 800 78 + 1522 = 1600 -vertikalni zbrojevi: 38 + 40 = 78 762 + 760 = 1522 800 + 800 = 1600 II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (2-1) (2-1) = 1 Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih vrijednosti je slijedeća: Postoperativne komplikacije Grad DA NE Ukupno A 38 762 800 B 40 760 800 Ukupno 78 1522 1600 Primjer 2. Postoperativne komplikacije 2. Nastavljajući se na problem u Primjeru 1, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 0.054 bez korekcije i χ 2 = 0.013 s Yatesovom korekcijom. Testirati hipotezu da nema značajne razlike u pojavljivanju postoperativnih komplikacija u gradovima A i B, za α = 5% i df = 1. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

--------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 5% = 0.05 -broj stupnjeva slobode: df = 1 -χ 2 -vrijednost: χ 2 = 0.054 bez korekcije, χ 2 = 0.013 s Yatesovom korekcijom, dakle meďusobno su bliske vrijednosti -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u pojavljivanju postoperativnih komplikacija u gradovima A i B. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u pojavljivanju postoperativnih komplikacija u gradovima A i B. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 3.84 Testiranje: χ 2 < χ 2 * tj. 0.054 < 3.84 i 0.013 < 3.84 H 0 se prihvaća, a H 1 se odbacuje, a vjerojatnost za H 0 je P > 0.05. Odgovor: Razlike u pojavljivanju postoperativnih komplikacija u gradovima A i B nisu značajne (df = 1, χ 2 * = 3.84 za α = 0.05; χ 2 = 0.054 bez korekcije, χ 2 = 0.013 s Yatesovom korekcijom, P > 0.05).

Primjer 3. Pušači i nepušači. U jednom istraţivanju o pušenju u nekoj zemlji nasumično je odabrano 1000 ispitanika, od kojih je 328 bilo pušača od kojih 125 ţena. Znajući da je bilo 515 ispitanica, sastaviti kontingencijsku tablicu za opaţene vrijednosti, za χ 2 -test homogenosti kojim se ispituje razlika izmeďu muškaraca i ţena s obzirom na učestalost pušenja. Izračunati df. --------------------------- Postupak: a) podaci: -dva nezavisna uzorka u skupu: uzorak 1 uzorak muškaraca, uzorak 2 uzorak ţena χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeďu spolova s obzirom na učestalost pušenja -veličina skupa: 1000 -varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski); pušenje (nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 2 2 Yatesova korekcija b) traţe se: -kontingencijska tablica opaţenih vrijednosti -broj stupnjeva slobode Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti (idući slajd), povodeći se istim pravilima kao u Primjeru 1.

Pušenje Spol DA NE Ukupno muškarci 203 282 485 žene 125 390 515 Ukupno 328 672 1000 -izračunavanje brojeva za prazne ćelije: 1000-515 = 485 328-125 = 203 1000-328 = 672 515-125 = 390 485-203 = 282 ili 672-390 = 282 -provjera ispravnosti tablice zbrojevima: horizontalno: 203 + 282 = 485 125 + 390 = 515 328 + 672 = 1000 vertikalno: 203 + 125 = 328 282 + 390 = 672 485 + 515 = 1000 II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (2-1) (2-1) = 1 Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih vrijednosti: Pušenje Spol DA NE Ukupno muškarci 203 282 485 žene 125 390 515 Ukupno 328 672 1000

Primjer 4. Pušači i nepušači 2. Nastavljajući se na problem u Primjeru 3, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 35.037 bez korekcije i χ 2 = 34.244 s Yatesovom korekcijom. Testirati hipotezu da nema značajne razlike u učestalosti pušenja meďu spolovima, za α = 0.1% i df = 1. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83 --------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 0.1% = 0.001 -broj stupnjeva slobode: df = 1 -χ 2 -vrijednost: χ 2 = 35.037 bez korekcije, χ 2 = 34.244 s Yatesovom korekcijom, dakle meďusobno su bliske vrijednosti -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u učestalosti pušenja meďu spolovima. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u učestalosti pušenja meďu spolovima.

b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 10.83 Testiranje: χ 2 > χ 2 * tj. 35.037 >> 3.84 i 34.244 >> 3.84 H 0 se odbacuje, a H 1 se prihvaća, a vjerojatnost za H 0 je P < 0.001. Odgovor: Razlike u učestalosti pušenja meďu spolovima su značajne (df = 1, χ 2 * = 10.83 za α = 0.001; χ 2 = 35.037 bez korekcije, χ 2 = 34.244 s Yatesovom korekcijom, P < 0.001). Primjer 5. Učinkovitost lijekova. U jednom istraţivanju o učinkovitosti dvaju lijekova A i B s obzirom na odreďenu bolest sudjelovalo je 160 osoba, od kojih su 55 osjetile a 25 nisu osjetile učinak lijeka A. Sveukupno je 100 osoba osjetilo djelovanje lijekova. Sastaviti kontingencijsku tablicu za opaţene vrijednosti, za χ 2 -test homogenosti kojim se ispituje jesu li lijekovi A i B podjednako učinkoviti odnosno neučinkoviti. Odrediti broj stupnjeva slobode. --------------------------- Postupak: a) podaci: -dva nezavisna uzorka u skupu: uzorak 1 osobe liječene lijekom A, uzorak 2 osobe liječene lijekom B χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeďu osoba liječenih lijekom A i B s obzirom na učinkovitost

-veličina skupa: 160 -varijable: terapija - lijek (nominalna) s dvije vrijednosti (A i B); postojanje učinka lijeka (nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 2 2 Yatesova korekcija b) traţe se: -kontingencijska tablica opaţenih vrijednosti -broj stupnjeva slobode Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim pravilima kao u Primjeru 1. Postojanje učinka lijeka Lijek DA NE Ukupno A 55 25 80 B 45 35 80 Ukupno 100 60 160 -izračunavanje brojeva za prazne ćelije: 55 + 25 = 80 160-80 = 80 160-100 = 60 100-55 = 45 60-25 = 35 ili 80-45 = 35 -provjera ispravnosti tablice zbrojevima: horizontalno: 55 + 25 = 80 45 + 35 = 80 100 + 60 = 160 vertikalno: 55 + 45 = 100 25 + 35 = 60 80 + 80 = 160

II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (2-1) (2-1) = 1 Odgovor: Broj stupnjeva slobode je df = 1. Kontingencijska tablica opaţenih vrijednosti: Postojanje učinka lijeka Lijek DA NE Ukupno A 55 25 80 B 45 35 80 Ukupno 100 60 160 Primjer 6. Učinkovitost lijekova 2. Nastavljajući se na problem u Primjeru 5, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 2.667 bez korekcije i χ 2 = 2.16 s Yatesovom korekcijom. Testirati hipotezu da postoji značajna razlika u učinkovitosti dvaju lijekova, za α = 1% i df = 1. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83

--------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 1% = 0.01 -broj stupnjeva slobode: df = 1 -χ 2 -vrijednost: χ 2 = 2.667 bez korekcije, χ 2 = 2.16 s Yatesovom korekcijom, dakle meďusobno bliske vrijednosti -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u učinkovitosti lijekova A i B. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u učinkovitosti lijekova A i B. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 6.64 Testiranje: χ 2 < χ 2 * tj. 2.667 < 6.64 i 2.16 < 6.64 H 0 se prihvaća, a H 1 se odbacuje, a vjerojatnost za H 0 je P > 0.01. Odgovor: Razlike u učinkovitosti dvaju lijekova nisu značajne (df = 1, χ 2 * = 6.64 za α = 0.01; χ 2 = 2.667 bez korekcije, χ 2 = 2.16 s Yatesovom korekcijom, P > 0.01).

Primjer 7. Albumin u urinu. U jednom istraţivanju je kod 33 zdrave osobe, 50 osoba sa različitim nefrološkim dijagnozama i 33 osobe sa kardiološkim bolestima dokazivan albumin u urinu. Pozitivan rezultat na albumin u urinu dobijen je kod 4 zdrave osobe, 41 pacijenta sa nefrološkim i 8 pacijenata sa kardiloškim oboljenjima. Sastaviti kontingencijsku tablicu za opaţene vrijednosti, za χ 2 -test homogenosti kojim se ispituje postoji li razlika izmeďu učestalosti pojavljivanja pozitivnih rezultata za albumin u urinu kod ovih grupa. Odrediti broj stupnjeva slobode. --------------------------- Postupak: a) podaci: -tri nezavisna uzorka u skupu: uzorak 1 zdrave osobe, uzorak 2 nefrološki bolesnici, uzorak 3 kardiološki bolesnici χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeďu tri uzorka ispitanika s obzirom na pozitivan rezultat albumina u urinu -varijable: zdravstveno stanje (nominalna) s tri vrijednosti (zdrave osobe, nefrološki bolesnici, kardiološki bolesnici); prisutnost albumina u urinu (nominalna) s dvije vrijednosti (DA i NE) kontingencijska tablica tipa 3 2 b) traţe se: -kontingencijska tablica opaţenih vrijednosti -broj stupnjeva slobode

Prisutnost albumina u urinu Zdravstveno stanje DA NE Ukupno zdrave osobe 4 29 33 nefrološki bolesnici 41 9 50 kardiološki bolesnici 8 25 33 Ukupno 53 63 116 Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim pravilima kao u Primjeru 1. -izračunavanje brojeva za prazne ćelije: 4 + 41 + 8 = 53 33-4 = 29 50-41 = 9 33-8 = 25 33 + 50 + 33 = 116 116-53 = 63 ili 29 + 9 + 25 = 63 -provjera računa: horizontalno: 4 + 29 = 33 41 +9 = 50 8 + 25 = 33 53 + 63 = 116 vertikalno: 4 + 41 + 8 = 53 29 + 9 + 25 = 63 33 + 50 + 33 = 116 II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (3-1) (2-1) = 2 Odgovor: Broj stupnjeva slobode je df = 2. Kontingencijska tablica opaţenih vrijednosti (idući slajd):

Prisutnost albumina u urinu Zdravstveno stanje DA NE Ukupno zdrave osobe 4 29 33 nefrološki bolesnici 41 9 50 kardiološki bolesnici 8 25 33 Ukupno 53 63 116 Primjer 8. Albumin u urinu 2. Nastavljajući se na problem u Primjeru 7, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 47.669. Testirati hipotezu da postoji značajna razlika izmeďu triju skupina osoba u prisutnosti albumina u urinu, za α = 0.05 i df = 2. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83 2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82 3 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.82 11.34 16.27

--------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 0.05 -broj stupnjeva slobode: df = 2 -χ 2 -vrijednost: χ 2 = 47.669 -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u prisutnosti albumina u urinu triju skupina osoba. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u prisutnosti albumina u urinu triju skupina osoba. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 5.99 Testiranje: χ 2 > χ 2 * tj. 47.669 >> 5.99 H 0 se odbacuje, a H 1 se prihvaća, a vjerojatnost za H 0 je P < 0.001. Odgovor: Razlike u prisutnosti albumina u urinu triju skupina osoba (zdrave osobe, nefrološki i kardiološki bolesnici) su značajne (df = 2, χ 2 * = 5.99 za α = 0.05, χ 2 = 47.669, P < 0.001). Kao što je za očekivati, nefrološki bolesnici najčešće imaju albumin u urinu.

Primjer 9. Alfa-1-antitripsin. Kod bolesnika oboljelih od bronhijalne astme (N=30) i grupe oboljelih od obstruktivnog bronhitisa (N=30), kao i kod zdravih osoba (N=30) odreďena je koncentracija α-1-antitripsina nefelometrijskom metodom (vrijednosti su date u g/l). Sastaviti kontingencijsku tablicu, ako je kod zdravih jedan rezultat bio iznad gornje granice referentnih vrijednosti, kod bolesnika sa astmom je bilo 8, a kod bolesnika sa bronhitisom 5 povišenih vrijednosti. χ 2 -testom se provjerava da li ima razlike u broju osoba koje imaju povišene vrijednosti u odnosu na zdrave. Odrediti broj stupnjeva slobode. --------------------------- Postupak: a) podaci: -tri nezavisna uzorka u skupu: uzorak 1 oboljeli od bronhijalne astme, uzorak 2 oboljeli od obstruktivnog bronhitisa, uzorak 3 zdrave osobe χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeďu tri uzorka ispitanika s obzirom na normalnu odnosno povišenu koncentraciju α-1-antitripsina u krvi. -varijable: zdravstveno stanje (nominalna) s tri vrijednosti (oboljeli od bronhijalne astme, oboljeli od obstruktivnog bronhitisa, zdrave osobe); prisutnost α-1-antitripsina u krvi (nominalna) s dvije vrijednosti (normalna i povišena) kontingencijska tablica tipa 3 2

b) traţe se: -kontingencijska tablica opaţenih vrijednosti -broj stupnjeva slobode Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim pravilima kao u Primjeru 1. Koncentracija α-1-antitripsina Zdravstveno stanje normalna povišena Ukupno oboljeli od bronhijalne 22 8 30 astme oboljeli od obstruktivnog 25 5 30 brohnitisa zdrave osobe 29 1 30 Ukupno 76 14 90 -izračunavanje brojeva za prazne ćelije: 30 + 30 + 30 = 90 30-8 = 22 30-5 = 25 30-1 = 29 33 + 30 + 30 = 90 8 + 5 + 1 = 14 90-14 = 76 ili 22 + 25 + 29 = 76 -provjera računa: horizontalno: 22 + 8 = 30 25 +5 = 30 29 + 1 = 30 76 + 14 = 90 vertikalno: 22 + 25 + 29 = 76 8 + 5 + 1 = 14 30 + 30 + 30 = 90

II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (3-1) (2-1) = 2 Odgovor: Broj stup. slobode df = 2. Kontingencijska tablica opaţenih vrijednosti: Koncentracija α-1-antitripsina Zdravstveno stanje normalna povišena Ukupno oboljeli od bronhijalne 22 8 30 astme oboljeli od obstruktivnog 25 5 30 brohnitisa zdrave osobe 29 1 30 Ukupno 76 14 90 Primjer 10. Alfa-1-antitripsin 2. Nastavljajući se na problem u Primjeru 9, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 6.259. Testirati hipotezu da postoji značajna razlika izmeďu triju skupina osoba u prisutnosti α-1-antitripsina u krvi, za α = 0.05 i df = 2. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82

--------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 0.05 -broj stupnjeva slobode: df = 2 -χ 2 -vrijednost: χ 2 = 6.259 -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u prisutnosti α-1-antitripsina u krvi triju skupina osoba. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u prisutnosti α-1-antitripsina u krvi triju skupina osoba. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 5.99 Testiranje: χ 2 > χ 2 * tj. 6.259 > 5.99 H 0 se odbacuje, a H 1 se prihvaća, a vjerojatnost za H 0 je P < 0.05. Odgovor: Razlike u koncentraciji α-1-antitripsina u krvi triju skupina osoba (oboljeli od bronhijalne astme, oboljeli od obstruktivnog bronhitisa, zdrave osobe) su značajne (df = 2, χ 2 * = 5.99 za α = 0.05, χ 2 = 6.259, P < 0.05). Kao što je za očekivati, plućni bolesnici imaju značajnu koncentraciju ovog enzima.

Primjer 11. Pušenje i spol. U jednom anketiranju studenata o zastupljenosti pušača dobiveni su slijedeći rezultati u tablici dolje, za koju je potrebno sastaviti kontingencijsku tablicu opaţenih vrijednosti, sa svrhom da se χ 2 -testom utvrdi postoje li značajne razlike u zastupljenosti pušača izmeďu spolovima. Legenda za tablicu: spol: 1 muški, 2 ţenski; pušenje: 1 da, 2 povremeno, 3 ne. Izračunati broj stupnjeva slobode. spol pušenje spol pušenje spol pušenje 1 3 1 3 2 1 2 3 2 3 1 1 2 1 1 3 2 1 2 3 2 3 2 1 1 1 2 3 2 1 2 1 2 3 1 2 2 2 2 3 1 1 2 2 1 1 2 1 1 3 2 1 2 1

--------------------------- Postupak: a) podaci: -dva nezavisna uzorka u skupu: uzorak 1 uzorak muških ispitanika, uzorak 2 uzorak ţenskih ispitanika χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeďu dva uzorka ispitanika tj. spolova s obzirom na status pušenja -varijable: spol (nominalna) s dvije vrijednosti (muški i ţenski); status pušenja (ordinalna) s tri vrijednosti (da, povremeno, ne) kontingenc. tablica tipa 2 3 b) traţi se: -kontingencijska tablica opaţenih vrijednosti Izračunavanje: Izrada kontingencijske tablice opaţenih vrijednosti: prvo se načine jednostavnija prebrajanja (brojevi u crnom) po spolovima, zatim brojevi povremenih pušača jer ih je malo, broj svih pušača i svih nepušača; zatim se ostatak ćelija popuni iz razlika ili zbrojeva već upisanih brojeva (brojevi u crvenom). Status pušenja Spol da povremeno ne Ukupno muški 4 1 4 9 ženski 9 2 7 18 Ukupno 13 3 11 27

II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (2-1) (3-1) = 2 Odgovor: Broj stupnjeva slobode je df = 2. Kontingencijska tablica opaţenih vrijednosti je: Status pušenja Spol da povremeno ne Ukupno muški 4 1 4 9 ženski 9 2 7 18 Ukupno 13 3 11 27 Primjer 12. Pušenje i spol 2. Nastavljajući se na problem u Primjeru 11, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 0.084, a s Yatesovom korekcijom χ 2 = 0.396. Testirati hipotezu da postoji značajna razlika izmeďu spolova s obzirom na status pušenja, za α = 0.05 i df = 2. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 2 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.60 5.99 9.21 13.82

--------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 0.05 -broj stupnjeva slobode: df = 2 -χ 2 -vrijednost: χ 2 = 0.084, s Yatesovom korekcijom χ 2 = 0.396 zbog ćelija s brojevima koji su manji od 5 -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u statusu pušenja spolova. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u statusu pušenja spolova. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 5.99 Testiranje: χ 2 < χ 2 * tj. 0.084 < 5.99 i 0.396 < 5.99 H 0 se svakako zadrţava jer se ne moţe odbaciti, a H 1 se odbacuje, a vjerojatnost za H 0 je P > 0.05. Odgovor: Razlike u statusu pušenja spolova nisu značajne (df = 2, χ 2 * = 5.99 za α = 0.05, χ 2 = 0.084, χ 2 = 0.396 s Yatesovom korekcijom, P > 0.05). Dakle, studenti muškog i ţenskog spola podjednako puše odnosno ne puše.

Primjer 13. Stavovi o liječniku. U jednoj ustanovi provedena je anketa meďu 23 djelatnika i 26 djelatnica te je ispitivan stav prema liječniku u ambulanti te ustanove. Iz dobivenih odgovora moglo se zaključiti je li stav prema liječniku u cjelini pozitivan ili negativan. Budući da je liječnik u toj ambulanti bila ţena, postavljeno je pitanje razlikuju li se muškarci od ţena u stavu prema toj liječnici. Dobiveni su slijedeći rezultati: Muškarci (N=23) Pozitivan stav 14 Negativan stav 9 Ţene (N=26) Pozitivan stav 9 Negativan stav 17 Sastaviti kontingencijsku tablicu opaţenih frekvencija, sa svrhom da bi se χ 2 -testom moglo utvrditi postoje li značajne razlike u stavovima spolova prema toj liječnici. --------------------------- Postupak: a) podaci: -dva nezavisna uzorka u skupu: uzorak 1 djelatnici muškarci, uzorak 2 djelatnici ţene χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika izmeďu dva uzorka ispitanika s obzirom stav prema liječnici u ustanovi -varijable: spol (nominalna) s dvije vrijednosti (muški zaposlenici, ţenski zaposlenici); stav prema liječnici ustanove (nominalna) s dvije vrijednosti (pozitivan stav i negativna stav) kontingencijska tablica tipa 2 2 -kontingencijska tablica opaţenih vrijednosti

Stav prema liječnici Spol pozitivan negativan Ukupno muški 14 9 23 ženski 9 17 26 Ukupno 23 26 49 Izračunavanje: Izrada kontingencijske tablice opaţenih vrijednosti kao u Primjeru 1: prvo se upišu zadani brojevi (brojevi u crnom), zatim se upišu preostali brojevi (brojevi u crvenom) koji su u ovom slučaju zbrojevi nekih zadanih brojeva. Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (2-1) (2-1) = 1 Odgovor: Broj stupnjeva slobode je df = 1 jer je tablica tipa 2 2. Kontingencijska tablica opaţenih vrijednosti je slijedeća: Stav prema liječnici Spol pozitivan negativan Ukupno muški 14 9 23 ženski 9 17 26 Ukupno 23 26 49

Primjer 14. Stavovi o liječniku 2. Nastavljajući se na problem u Primjeru 13, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 3.377, a s Yatesovom korekcijom χ 2 = 2.406. Testirati hipotezu da postoji značajna razlika izmeďu spolova s obzirom na stav prema liječnici ustanove, za α = 0.05 i df = 1. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83 --------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 0.05 -broj stupnjeva slobode: df = 1 -χ 2 -vrijednost: χ 2 = 3.377, s Yatesovom korekcijom χ 2 = 2.406 zbog tipa 2 2 -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u stavu spolova prema liječnici ustanove. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u stavu spolova prema liječnici ustanove. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele

Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 3.84 Testiranje: χ 2 < χ 2 * tj. 3.377 < 3.84 i 2.406 < 3.84 H 0 se svakako zadrţava jer se ne moţe odbaciti, a H 1 se odbacuje, a vjerojatnost za H 0 je P > 0.05. Odgovor: Razlike u stavu spolova prema liječnici ustanove nisu značajne (df = 2, χ 2 * = 3.84 za α = 0.05, χ 2 = 3.377, χ 2 = 2.406 s Yatesovom korekcijom, P > 0.05). Primjer 15. Epidemija gripe. Medicinski centar je izvršio analizu oboljenja od gripe u ustanovama gdje su neki zaposlenici bili cijepljeni 11 mjeseci prije epidemije, neki neposredno prije epidemije, a neki nisu bili uopće cijepljeni. Dobiveni su sljedeći rezultati za ukupno 911 oboljelih i 8295 koji nisu oboljeli: od 2899 necijepljenih samo 402 osobe su oboljele, a meďu cijepljenima neposredno prije epidemije samo 131 osoba je oboljelo a 2009 nije oboljelo. Sastaviti kontingencijsku tablicu opaţenih frekvencija, sa svrhom da bi se χ 2 -testom moglo utvrditi postoje li značajne razlike u zdravstvenom statusu ispitanika s obzirom na njihov status cijepljenja. Izračunati broj stupnjeva slobode. --------------------------- Postupak: a) podaci: -tri nezavisna uzorka u skupu: uzorak 1 necijepljeni, uzorak 2 cijepljeni 11 mjeseci prije epidemije, uzorak 3 cijepljeni neposredno prije epidemije

χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika meďu uzorcima s obzirom na status zdravlja za vrijeme epidemije gripe -varijable: status cijepljenja (ordinalna) s tri vrijednosti (necijepljeni, cijepljeni 11 mjeseci prije epidemije i cijepljeni neposredno prije epidemije); zdravstveni status (nominalna) s dvije vrijednosti (oboljeli od gripe i nisu oboljeli) kontingencijska tablica tipa 3 2 b) traţe se: -kontingencijska tablica opaţenih vrijednosti -broj stupnjeva slobode Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim pravilima kao u Primjeru 1. Zdravstveni status Status cijepljenja oboljeli nisu oboljeli Ukupno necijepljeni 402 2497 2899 cijepljeni 11 mjeseci prije epidemije 378 3789 4167 cijepljeni neposredni prije epidemije 131 2009 2140 Ukupno 911 8295 9206

-izračunavanje brojeva za prazne ćelije: 911 - (131 + 402) = 378 2899-402 = 2497 131 + 2009 = 2140 911 + 8295 = 9206 8295 - (2009 + 2497) = 3789 378 + 3789 = 4167 ili 9206 - (2899 + 2140) = 4167 -provjera računa: horizontalno: 402 + 2497 = 2899 378 + 3789 = 4167 131 + 2009 = 2140 911 + 8295 = 9206 vertikalno: 402 + 378 + 131 = 911 2497 + 3789 + 2009 = 8295 2899 + 4167 + 2140 = 9206 II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (3-1) (2-1) = 2 Odgovor: Broj stup. slob. df = 2. Kontingencijska tablica opaţenih vrijednosti: Zdravstveni status Status cijepljenja oboljeli nisu oboljeli Ukupno necijepljeni 402 2497 2899 cijepljeni 11 mjeseci prije epidemije 378 3789 4167 cijepljeni neposredni prije epidemije 131 2009 2140 Ukupno 911 8295 9206

Primjer 16. Epidemija gripe 2. Nastavljajući se na problem u Primjeru 15, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 88.637. Testirati hipotezu da postoji značajna razlika uzoraka s različitim statusom cijepljenja s obzirom na njihov status zdravlja tijekom epidemije gripe, za α = 0.001 i df = 2. Podaci za χ 2 -raspodjelu: df vjerojatnost α 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.01 0.001 1 0.004 0.02 0.06 0.15 0.46 1.07 1.64 2.71 3.84 6.64 10.83 --------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 0.001 -broj stupnjeva slobode: df = 2 -χ 2 -vrijednost: χ 2 = 88.637 -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u zdravstvenom statusu skupina s obzirom na status cijepljenja. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u zdravstvenom statusu skupina s obzirom na status cijepljenja. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 ; u tu svrhu treba pronaći odgovarajuću kritičnu vrijednost u tablici χ 2 -raspodjele

Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 10.83 Testiranje: χ 2 > χ 2 * tj. 88.637 >> 10.83 H 0 se svakako ne moţe zadrţati pa se odbacuje, a H 1 se zadrţava, a vjerojatnost za H 0 je P < 0.001. Odgovor: Razlike u zdravstvenom statusu triju uzoraka su značajne (df = 2, χ 2 * = 10.83 za α = 0.001, χ 2 = 88.637, P < 0.001). Vidljivo je da meďu cijepljenima ima najmanje oboljelih. Primjer 17. Stav prema doniranju organa. U istraţivanju o znanju i stanovnika jedne hrvatske ţupanije o javnozdravstvenom značaju doniranja organa dobiveni su slijedeći podaci. Anketirano je 82 osoba mlaďe (18-35 g.), 77 zrelije (36-55 g.) i 41 starije (55 i više g.) dobi. Na pitanje bi li donirali organe svojih bliţnjih nakon njihove smrti, s DA odgovorilo je 80 ispitanika, s NE 44, a s NE ZNAM 76 ispitanika. Tri najčešća odgovora su bila: NE ZNAM u mlaďoj skupini (44 osoba), DA u zreloj skupini (39 ispitanika), i DA opet u mlaďoj skupini (24 osoba). Odgovor s najmanjoj frekvencijom je bio NE ZNAM u starijoj skupini (9 osoba). Sastaviti kontingencijsku tablicu opaţenih frekvencija i izračunati broj stupnjeva slobode. --------------------------- Postupak: a) podaci: -tri nezavisna uzorka u skupu: uzorak 1 mlaďi (18-35 g.) ispitanici, uzorak 2 zreliji (36-55 g.) ispitanici, uzorak 3 stariji (55 i više g.) ispitanici

χ 2 -test homogenosti skupa - ispituje se postoji li značajna razlika meďu uzorcima s obzirom na stav o doniranju organa svojih bliţnjih nakon njihove smrti -varijable: dob (ordinalna) s tri vrijednosti (mlaďi, zreliji i stariji ispitanici); stav o doniranju organa svojih bliţnjih (nominalna) s tri vrijednosti (DA, NE i NE ZNAM) kontingencijska tablica tipa 3 3 b) traţe se: -kontingencijska tablica opaţenih vrijednosti i broj stupnjeva slobode Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti, povodeći se istim pravilima kao u Primjeru 1. 82 + 77 + 41 = 200 80 - (24 + 39) = 17 82 - (24 + 44) = 14 76 - (44 + 9) = 23 41 - (17 + 9) = 15 44 - (14 + 15) = 15 II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (3-1) (3-1) = 4 Stav o doniranju organa bližnjih Dob DA NE NE ZNAM Ukupno 18-35 g. 24 14 44 82 36-55 g. 39 15 23 77 > 55 g. 17 15 9 41 Ukupno 80 44 76 200

-provjera računa: horizontalno: 24 + 14 + 44 = 82 39 + 15 + 23 = 77 17 + 15 + 9 = 41 80 + 44 + 76 = 200 vertikalno: 24 + 39 + 17 = 80 14 + 15 + 15 = 44 44 + 23 + 9 = 76 82 + 77 + 41 = 200 Odgovor: Broj stup. slob. df = 4. Kontingencijska tablica opaţenih vrijednosti: Stav o doniranju organa bližnjih Dob DA NE NE ZNAM Ukupno 18-35 g. 24 14 44 82 36-55 g. 39 15 23 77 > 55 g. 17 15 9 41 Ukupno 80 44 76 200 Primjer 18. Stav prema doniranju organa 2. Nastavljajući se na problem u Primjeru 17, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 19.067. Testirati hipotezu da postoji značajna razlika uzoraka (dobnih skupina) s obzirom na njihov stav o doniranju organa bliţnjih. Uzeti kritičnu vrijednost χ 2 * = 9.488 za α = 0.05 i df = 4. --------------------------- Postupak:

a) podaci: -razina statističke značajnosti: α = 0.05 -broj stupnjeva slobode: df = 4 -χ 2 -vrijednost: χ 2 = 9.488 -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u stavu triju dobnih skupina o doniranju organa bliţnjih. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u stavu triju dobnih skupina o doniranju organa bliţnjih. b) traţi se: -testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 9.488 Testiranje: χ 2 > χ 2 * tj. 19.067 > 9.488 H 0 se ne moţe zadrţati pa se odbacuje, a H 1 se zadrţava, a vjerojatnost za H 0 je P < 0.05. Odgovor: Razlike u stavu triju dobnih skupina o doniranju organa bliţnjih su značajne (df = 4, χ 2 * = 10.83 za α = 0.05, χ 2 = 19.067, P < 0.05). Primjer 19. Metabolički sindrom. Ispitane su dvije skupine 100 shizofrenih bolesnika u jednoj klinici za psihijatriju, te 100 zdravih osoba (kontrolna skupina) na sistematskom pregledu. Cilj istraţivanja je bio utvrditi učestalost i uzroke metaboličkog sindroma kod oboljelih od shizofrenije. OdreĎene su

kritične vrijednosti pet sastavnica metaboličkog sindroma tj. opsega struka (abdominalna pretilost), serumskih triglicerida (hipertrigliceridemija), serumskog HDL-kolesterola (nizak HDL-kolesterol), krvnog tlaka (hipertenzija) i razine glukoze u krvi (hiperglikemija). Dobiveni su slijedeći podaci za respektivno 0, 1, 2, 3, 4 i 5 sastavnica metaboličkog sindroma: 16, 16, 22, 29, 11 i 6 shizofrenih bolesnika; 21, 22, 28, 17, 8 i 4 ispitanika iz kontrolne skupine. Sastaviti kontingencijsku tablicu opaţenih frekvencija i izračunati broj stupnjeva slobode. --------------------------- Postupak: a) podaci: -dva nezavisna uzorka u skupu: uzorak 1 shizofreni bolesnici, uzorak 2 zdrave osobe (kontrolna skupina) χ 2 -test homogenosti skupa, gdje se ispituje postoji li značajna razlika meďu uzorcima s obzirom na broj sastavnica metaboličkog sindroma -varijable: zdravstveni status (nominalna) s dvije vrijednosti (shizofreni bolesnici i zdravi ispitanici); broj sastavnica metaboličkog sindroma (diskretna) sa šest vrijednosti (0, 1, 2, 3, 4 i 5) kontingencijska tablica tipa 2 6 b) traţe se: -kontingencijska tablica opaţenih vrijednosti i broj stupnjeva slobode Izračunavanje: I) Izrada kontingencijske tablice opaţenih vrijednosti, upisujući vrijednosti u odgovarajuće ćelije (brojevi u crnom) i računanje suma (brojevi u crvenom)

Broj sastavnica metaboličkog sindroma Zdravstveni status 0 1 2 3 4 5 Ukupno shizofreni bolesnici 16 16 22 29 11 6 100 zdravi ispitanici 21 22 28 17 8 4 100 Ukupno 37 38 50 46 19 10 200 II) Računanje broja stupnjeva slobode df: df = (broj redova - 1) (broj stupaca - 1) = (2-1) (6-1) = 5 Odgovor: Broj stup. slob. df = 5. Kontingencijska tablica opaţenih vrijednosti: Broj sastavnica metaboličkog sindroma Zdravstveni status 0 1 2 3 4 5 Ukupno shizofreni bolesnici 16 16 22 29 11 6 100 zdravi ispitanici 21 22 28 17 8 4 100 Ukupno 37 38 50 46 19 10 200 Primjer 20. Metabolički sindrom 2. Nastavljajući se na problem u Primjeru 19, na osnovi izraďene kontingencijske tablice dobivena je vrijednost χ 2 = 6.347, s Yatesovom korekcijom χ 2 = 4.531. Testirati hipotezu da postoji značajna razlika uzoraka (shizofrenih bolesnika i zdravih osoba) s obzirom broj sastavnica metaboličkog sindroma. Uzeti kritičnu vrijednost χ 2 * = 11.070 za α = 0.05 i df = 5.

--------------------------- Postupak: a) podaci: -razina statističke značajnosti: α = 0.05 -broj stupnjeva slobode: df = 5 -χ 2 -vrijednost: χ 2 = 6.347, s Yatesovom korekcijom χ 2 = 4.531 -statistička hipoteza: Nul-hipoteza (H 0 ): Nema značajne razlike u broju sastavnica metaboličkog sindroma izmeďu shizofrenih bolesnika i zdravih ispitanika. slijedno tome je: Alternativna, suprotna hipoteza (H 1 ): Postoje značajne razlike u broju sastavnica metaboličkog sindroma izmeďu shizofrenih bolesnika i zdravih ispitanika. b) traţi se: testirati hipotezu H 0 i odlučiti koja će se zadrţati, H 0 ili H 1 Izračunavanje: Kritična χ 2 -vrijednost: χ 2 * = 11.070 Testiranje: χ 2 < χ 2 * tj. 6.347 < 11.070 i 4.531 < 11.070 H 0 se ne moţe odbaciti pa se prihvaća, a H 1 se odbacuje, a vjerojatnost za H 0 je P > 0.05. Odgovor: Razlike izmeďu shizofrenih bolesnika i zdravih ispitanika u broju sastavnica metaboličkog sindroma nisu značajne (df = 5, χ 2 * = 11.070 za α = 0.05, χ 2 = 6.347, s Yatesovom korekcijom χ 2 = 4.531, P > 0.05). Broj sastavnica metaboličkog sindroma je ovdje shvaćen kao kategorijska (ordinalna) varijabla.

Primjer 21. Srčani udar. Bolnički podaci za manju skupinu bolesnika koji su imali srčani udar su dani u tablici desno. Varijable: spol (M muški, F ţenski); dijagnoza prema meďunarodnoj klasifikaciji (41041, 51051 i 41091 prema mjestu oštećenja srca); dijagnostička grupa bolesnika (121 bolesnici koji su preţivjeli s kardiovaskularnim komplikacijama, 122 bolesnici koji su preţivjeli bez kardiovaskularnih komplikacija, 123 umrli). Sastaviti kontingecijsku tablicu i odrediti df za testiranje razlika spolova s obzirom na dijagnozu i dijagnostičke skupine.