Statistika, Prehrambeno-tehnološki fakultet 1 Zaključivanje o jednoj slučajnoj varijabli Numeričke karakteristike distribucije populacije nazivamo par

Слични документи
Zadatak 1 U tablici se nalaze podaci dobiveni odredivanjem bilirubina u 24 uzoraka seruma (µmol/l):

Raspodjela i prikaz podataka

Uvod u statistiku

Paper Title (use style: paper title)

Sadržaj 1 Diskretan slučajan vektor Definicija slučajnog vektora Diskretan slučajan vektor

Microsoft Word - predavanje8

JMBAG IME I PREZIME BROJ BODOVA MJERA I INTEGRAL završni ispit 6. srpnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!) 1.

JMBAG IME I PREZIME BROJ BODOVA MJERA I INTEGRAL 2. kolokvij 29. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!) 1. (

ТЕОРИЈА УЗОРАКА 2

I

IRL201_STAR_sylab_ 2018_19

I

Microsoft Word - 15ms261

35-Kolic.indd

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Hrvatski studiji Psihologija Ured za

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Hrvatski studiji Kroatologija Ured za

Microsoft Word - 6ms001

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet organizacije i informatike O

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Grafički fakultet Grafička tehnnologi

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet organizacije i informatike I

Microsoft PowerPoint - PDPL FBF ZG spec 2011.ppt [Read-Only] [Compatibility Mode]

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet kemijskog inženjerstva i teh

Metode psihologije

(Microsoft Word - MATB - kolovoz osnovna razina - rje\232enja zadataka)

07jeli.DVI

VELEUČILIŠTE VELIKA GORICA REZULTATI STUDENTSKE ANKETE PROVEDENE NA VELEUČILIŠTU VELIKA GORICA ZA ZIMSKI SEMESTAR AKADEMSKE 2013/2014 GODINE 1. Uvod E

(Microsoft Word - Dr\236avna matura - studeni osnovna razina - rje\232enja)

SVEUČILIŠTE U ZAGREBU PRIRODOSLOVNO MATEMATIČKI FAKULTET MATEMATIČKI ODSJEK Ivana Šore REKURZIVNOST REALNIH FUNKCIJA Diplomski rad Voditelj rada: doc.

Sos.indd

РЕШЕЊА 1. (2) Обележја статистичких јединица посматрања су: а) особине које су заједничке за јединице посматрања б) особине које се проучавају, а подр

Numeričke metode u fizici 1, Projektni zadataci 2018./ Za sustav običnih diferencijalnih jednadžbi, koje opisuju kretanje populacije dviju vrs

6-Lizacic.indd

(Microsoft Word - Dr\236avna matura - kolovoz ni\236a razina - rje\232enja)

Istraživanje turističkog tržišta

I

84-Knjaz.indd

48-Blazevic.indd

Primjena neodredenog integrala u inženjerstvu Matematika 2 Erna Begović Kovač, Literatura: I. Gusić, Lekcije iz Matematike 2

Postojanost boja

Vrjednovanje integriranih preddiplomskih i diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Kinezio

Toplinska i električna vodljivost metala

knjiga.dvi

atka 26 (2017./2018.) br. 102 NEKE VRSTE DOKAZA U ČAROBMATICI Jadranka Delač-Klepac, Zagreb jednoj smo priči spomenuli kako je važno znati postavljati

SVEUČILIŠTE U ZAGREBU PRIRODOSLOVNO-MATEMATIČKI FAKULTET MATEMATIČKI ODSJEK Matej Šupljika ANALIZA UKUPNIH RASHODA LOKALNIH JEDINICA U RAZDOBLJU 2002.

Microsoft Word - zadaci_21.doc

I

Smjernice za korištenje sustava online prijava Ukoliko imate pristupno korisničko ime i lozinku ili ste navedeno dobili nakon zahtjeva za otvaranje no

8 2 upiti_izvjesca.indd

Hej hej bojiš se matematike? Ma nema potrebe! Dobra priprema je pola obavljenog posla, a da bi bio izvrsno pripremljen tu uskačemo mi iz Štreberaja. D

Numerička matematika 11. predavanje dodatak Saša Singer web.math.pmf.unizg.hr/~singer PMF Matematički odsjek, Zagreb NumMat 2019, 11. p

Microsoft PowerPoint - jkoren10.ppt

No Slide Title

Fokusne grupe s novim studenticama diplomskog studija

ZADACI ZA VJEŽBU 1. Dokažite da vrijedi: (a) (A \ B) (B \ A) = (A B) (A C B C ), (b) A \ (B \ C) = (A C) (A \ B), (c) (A B) \ C = (A \ C) (B \ C). 2.

Sveučilište J.J. Strossmayera Fizika 2 FERIT Predložak za laboratorijske vježbe Određivanje relativne permitivnosti sredstva Cilj vježbe Određivanje r

Slide 1

Slide 1

JMBAG IME I PREZIME BROJ BODOVA 1. (ukupno 6 bodova) MJERA I INTEGRAL 1. kolokvij 4. svibnja (Knjige, bilježnice, dodatni papiri i kalkulatori n

Sveučilište J.J. Strossmayera Fizika 2 FERIT Predložak za laboratorijske vježbe Lom i refleksija svjetlosti Cilj vježbe Primjena zakona geometrijske o

Biz web hosting

Obrazac Metodičkih preporuka za ostvarivanje odgojno-obrazovnih ishoda predmetnih kurikuluma i međupredmetnih tema za osnovnu i srednju školu OSNOVNI

Newtonova metoda za rješavanje nelinearne jednadžbe f(x)=0

(Microsoft Word - Dr\236avna matura - svibanj osnovna razina - rje\232enja)

evaluacija09-10

JMBAG IME I PREZIME BROJ BODOVA 1. (ukupno 20 bodova) MJERA I INTEGRAL Popravni ispit 7. rujna (Knjige, bilježnice, dodatni papiri i kalkulatori

Microsoft Word - Predmet 13-Napredni finansijski menadzment novembar 2018 RJESENJE

ИЗВЕШТАЈ О РЕЗУЛТАТИМА АНКЕТЕ О ИНФЛАЦИОНИМ OЧЕКИВАЊИМА Фебруар Београд, март 2019.

PowerPoint Presentation

Slide 1

Natjecanje 2016.

Posjet poduzeću Model Pakiranja d.d je u sklopu kolegija Menadžment ljudskih potencijala organizirana terenska nastava i posjet poduzeću M

Ministarstvo poljoprivrede Portal gospodarskog ribarstva Registracija prvih kupaca Uputa za korisnike

XIII. Hrvatski simpozij o nastavi fizike Istraživački usmjerena nastava fizike na Bungee jumping primjeru temeljena na analizi video snimke Berti Erja

ПОСЛОВНИ ПЛАН -Назив пословне идеје- 1

2

1

Logičke izjave i logičke funkcije

Diferenciranje i integriranje pod znakom integrala math.e Vol math.e Hrvatski matematički elektronički časopis Diferenciranje i integriranje pod

Microsoft PowerPoint - PDPL FBF ZG SPEC uvodno 2013 I.ppt [Read-Only] [Compatibility Mode]

Microsoft Word - V03-Prelijevanje.doc

(Microsoft Word vje\236ba - LIMES FUNKCIJE.doc)

Verovatnoća - kolokvijum 17. decembar Profesor daje dva tipa ispita,,,težak ispit i,,lak ispit. Verovatnoća da student dobije težak ispit je

Istraživanje kvalitete zraka Slavonski Brod: Izvještaj 3 – usporedba podataka hitnih medicinskih intervencija za godine i

ŽUPANIJSKO NATJECANJE IZ MATEMATIKE 28. veljače razred - rješenja OVDJE SU DANI NEKI NAČINI RJEŠAVANJA ZADATAKA. UKOLIKO UČENIK IMA DRUGAČIJI

(Microsoft Word - Rje\232enja zadataka)

vjezbe-difrfv.dvi

PowerPoint Presentation

Uvod u pedagogijska istrazivanja

CVRSTOCA

Pamphlet Serbian: A Matter of Fairness, Une question d'équité

Bojenje karti iliti poučak o četiri boje Petar Mladinić, Zagreb Moj djed volio je igrati šah. Uvijek mi je znao zadati neki zanimljiv zadatak povezan

Elementarna matematika 1 - Oblici matematickog mišljenja

Универзитет у Београду Економски факултет Катедра за економску политику и развој Јавне финансије 2018/19 УПУТСТВО ЗА ПРИЈАВЉИВАЊЕ НА Е-КУРС ИЗ ПРЕДМЕТ

ИЗВЕШТАЈ О РЕЗУЛТАТИМА АНКЕТЕ О ИНФЛАЦИОНИМ OЧЕКИВАЊИМА Мај Београд, јун 2019.

Microsoft Word - Natjecaj_RAZMJENA_Finska.doc

Microsoft Word - Detaljne SMJERNICE za izradu projektnog zadatka 2016.docx

Poslovni uzlet grada Gospića

Interpretacija čuda pomoću teorije determinističkog kaosa (Jerko Kolovrat, KBF Split; Marija Todorić, PMF Zagreb) Postoje razne teme koje zaokupljaju

Microsoft Word - DIOFANTSKE JEDNADŽBE ZADACI docx

Teorija skupova - blog.sake.ba

Транскрипт:

Statistika, Prehrambeno-tehnološki fakultet 1 Zaključivanje o jednoj slučajnoj varijabli Numeričke karakteristike distribucije populacije nazivamo parametrima. Statističko zaključivanje odnosi se na donošenje zaključaka o parametrima promatrane populacije na temelju analiziranja odabranog uzorka. Prije samog odabira uzorka iz čijih će karakteristika slijediti zaključci treba voditi računa o sljedećem: dimenziji uzorka i načinu odabira elemenata populacije u uzorak, prirodi zaključka kojeg želimo donijeti, vjerodostojnosti konačnog zaključka. Dva najvažnija postupka statističkog zaključivanja su: procjena parametara, testiranje hipoteza vezanih uz parametre. Kod procjene parametara razlikujemo: procjenu vrijednosti nepoznatog parametra (procjena konkretnom vrijednošću), određivanje intervala kojem vrijednost nepoznatog parametra pripada s nekom unaprijed zadanom vjerojatnosti (procjena parametara intervalima zadane pouzdanosti). Procjena vrijednosti parametara slučajne varijable Jednostavno rečeno, procijeniti vrijednost parametra znači na temelju informacija dostupnih iz uzorka odrediti jednu vrijednost blisku vrijednosti nepoznatog parametra. Primjer 1: auti1.sta Raspolažemo podacima iz test mjerenja potrošnje goriva novog modela automobila pri brzini od 110 km/h na autocesti za 100 pokusa. Podaci se nalaze u bazi podataka auti1.sta. 1. Kolika je vjerojatnost da je potrošnja goriva tog modela u navedenim uvjetima manja od 4 l? (Rješenje: 0, 08)

Statistika, Prehrambeno-tehnološki fakultet 2 2. Kolika je očekivana potrošnja goriva u navedenim uvjetima? (Rješenje: 4.43928) 3. Kolika je standardna devijacija slučajne varijable koja opisuje potrošnju goriva u navedenim uvjetima? (Rješenje: 0.290148) Ovaj primjer ilustrira problem procjene vjerojatnosti događaja, očekivanja i standardne devijacije slučajne varijable koja opisuje potrošnju goriva tog modela automobila iz prikupljenih podataka. Da bismo točno odgovorili na ovakva i slična pitanja potrebno je poznavati točnu distribuciju slučajne varijable koja opisuje potrošnju goriva tog modela automobila. U našem slučaju dostupni su samo izmjereni podaci iz kojih lako saznajemo empirijsku distribuciju te odgovore na ova pitanja moramo potražiti na osnovu njih - moramo procijeniti tražene numeričke karakteristike. Koje matematičke funkcije ćemo iskoristiti za izračune traženih vrijednosti? Koristimo funkcije koje nazivamo procjeniteljima - kad su nam dostupni samo izmjereni podaci pomoću procjenitelja donosimo zaključke o traženim numeričkim karakteristikama i tako dobivene vrijednosti nazivamo procjenama. Kako znati koju funkciju (procjenitelja) koristiti za procjenu tražene numeričke karakteristike? Primjer 2: 1. Kako biste izvršili procjenu vjerojatnosti iz prvog dijela prethodnog primjera? 2. Smatrate li da empirijska distribucija mjerenih podataka o potrošnji goriva ovog tipa automobila ima veze sa stvarnom distribucijom potrošnje? Kada i zašto? 3. Ako bismo ponovili istraživanje i ponovno napravili izračun empirijske distribucije na osnovu novih podataka, očekujete li promijenu vrijednosti? Kako to objašnjavate? Procjena distribucije slučajne varijable Za procjenu distribucije slučajne varijable koristimo empirijsku distribuciju podataka dobivenih mjerenjem realizacija navedene slučajne varijable u međusobno nezavisnim ponavljanjima pokusa.

Statistika, Prehrambeno-tehnološki fakultet 3 Procjena očekivanja slučajne varijable Za procjenu očekivanja slučajne varijable koristimo aritmetičku sredinu podataka dobivenih mjerenjem realizacija navedene slučajne varijable u međusobno nezavisnim ponavljanjima pokusa, tj. x = 1 n n x i. i=1 Procjena varijance slučajne varijable Za procjenu varijance slučajne varijable koristimo korigiranu varijancu podataka dobivenih mjerenjem realizacija navedene slučajne varijable u međusobno nezavisnim ponavljanjima pokusa, tj. Napomena: s 2 = 1 n 1 n (x i x) 2. Budući se odabrani procjenitelj primjenjuje na uzorak, koji je slučajnog karaktera, pri ponavljanju postupka procjene na drugim realizacijama istog uzorka prirodno je da se mogu pojaviti različite vrijednosti procjena iste numeričke karakteristike. Iako želimo izvršiti procjenu neke numeričke vrijednosti jednim brojem valja priznati realnost, tj. slučajan karakter procjenitelja, i pokušati dobiti što kvalitetniju informaciju iz postupka procjene. U tu svrhu vršimo procjenu numeričke vrijednosti intervalom unaprijed izabrane pouzdanosti. Tako, npr. ako smo izabrali pouzdanost 95% kažemo da smo procijenili danu numeričku karakteristiku intervalom s pouzdanošću 95%, odnosno da je vjerojatnost pripadnosti numeričke karakteristike koju procjenjujemo dobivenom intervalu jednaka 0.95. i=1

Statistika, Prehrambeno-tehnološki fakultet 4 Procjena očekivanja intervalom zadane pouzdanosti za velike uzorke Pod pojmom veliki uzorak podrazumjevamo uzorak dimenzije barem 30 (n 30). Nivo pouzdanosti je broj γ 0, 1, npr. γ = 0.95 ili γ = 0.90. Interval nivoa pouzdanosti γ za očekivanje slučajne varijable je interval za koji tvrdimo da se očekivanje (µ) te slučajne varijable nalazi u njemu s vjerojatnošću približno γ. Računamo ga na sljedeći način: I γ = [ x z γ σ n, x + z γ σ n ], gdje je: x - aritmetička sredina uzorka; σ - standardna devijacija uzorka; n - dimenzija uzorka; z γ - broj za koji vrijedi: P { Z z γ } = γ; Z - standardna normalna slučajna varijabla. U svrhu određivanja intervala nivoa pouzdanosti γ za očekivanje slučajne varijable potrebno je odrediti z γ takav da je gdje je Z N (0, 1). Primijetimo da je P { Z z γ } = γ, γ = P { Z z γ } = P ( z γ Z z γ ) = 1 zγ e x 2 /2 dx. 2π z γ Primjer 3: auti1.sta Za podatke iz baze auti1.sta napravite procjenu očekivane potrošnje goriva 95% intervalom pouzdanosti. (Rješenje: [4.381708, 4.496852])

Statistika, Prehrambeno-tehnološki fakultet 5 Primjer 4: tajnice.sta Pretpostavimo da imate vlastito poduzeće i da želite zaposliti tajnicu. Poznato vam je da je u vašem okruženju plaća tajnica normalno distribuirana. Trenutno imate na raspolaganju podatke o 8 plaća i želite vašoj budućoj tajnici dati plaću koja će biti u intervalu oko očekivanja pouzdanosti 90%. Kolika je najmanja, a kolika najveća plaća koju možete ponuditi ako se oslonite na podatke kojima raspolažete? (Rješenje: [1688.180, 2115.570]) Primjer 5: dob-poduzetnika.sta Podaci o dobi 200 poduzetnika u Hrvatskoj dani su u bazi podataka dob poduzetnika.sta. Procijenite očekivanu dob poduzetnika u Hrvatskoj intervalom pouzdanosti 95%. (Rješenje: [41.35088, 43.85912]) Primjer 6: iq25.sta; iq60.sta Zakon o diskriminaciji prema dobi iz 1967. godine označava ilegalnim postupak diskriminacije pri zapošljavanju djelatnika starih 40 godina i više. Oni koji se ne slažu sa zakonom argumentiraju ga postojanjem ekonomskih razloga zbog kojih poslodavci nerado zapošljavaju osobe koje su blizu mirovine. Također govore da je sposobnost ljudi te dobi upitna. U bazi podataka iq25.sta nalaze se rezultati testa inteligencije za 25-godišnjake, a u bazi podataka iq60.sta rezultati testa inteligencije za 60-godišnjake. Odredite intervale pouzdanosti 95% za očekivanje za obje dobi. Dajte objašnjenje tih intervala i komentar u kontekstu problema koji je opisan. (Rješenje: iq25.sta: [61.97539, 71.69127]; iq60.sta: [41.00907, 49.60204])

Statistika, Prehrambeno-tehnološki fakultet 6 Procjena proporcije intervalom zadane pouzdanosti za velike uzorke Procjena proporcije koristi se kada želimo procijeniti vjerojatnost nekog unaprijed izabranog događaja na osnovu nezavisnih ponavljanja istog pokusa. Primjeri: odrediti vjerojatnost pobjede izabrane stranke na izborima na osnovu anketiranja adekvatno izabranog uzorka prije izbora, odrediti vjerojatnost prodaje nekog proizvoda na osnovu istraživanja tržišta anketiranjem adekvatno izabranog uzorka potencijalnih kupaca. Ovo su primjeri slučajnih pokusa koje možemo modelirati Bernoullijevom slučajnom varijablom, tj. slučajnom varijablom X zadanom sljedećom tablicom distribucije: X = ( 0 1 q p ), p [0, 1], q = 1 p. Nezavisnim ponavljanjem našeg pokusa n puta prikupljamo uzorak i tako dobivamo niz jedinica i nula (sve skupa n njih). Cilj je na osnovu zabilježenih realizacija procijeniti vjerojatnost uspjeha p. Dobar procjenitelj za p je relativna frekvencija uspjeha (tj. jedinica) u uzorku. Realizacija tog procjenitelja je konkretan realan broj. Procjena proporcije intervalom dane pouzdanosti γ za velike uzorke: Nivo pouzdanosti je broj γ 0, 1, npr. γ = 0.95 ili γ = 0.90. Interval za koji možemo tvrditi da se p nalazi u njemu s vjerojatnošću približno γ zovemo interval za p pouzdanosti γ. Računamo ga na sljedeći način:

Statistika, Prehrambeno-tehnološki fakultet 7 [ ] ˆp ˆq ˆp ˆq I γ = ˆp z γ n, ˆp + z γ, n gdje je: ˆp - relativna frekvencija jedinica (uspjeha) u uzorku; ˆq - relativna frekvencija nula (neuspjeha) u uzorku; n - dimenzija uzorka; z γ - broj za koji vrijedi: P { Z z γ } = γ; Z - standardna normalna sluč. Kažemo da je dimenzija uzorka dovoljno velika ako interval [ ] ˆp(1 ˆp) ˆp(1 ˆp) ˆp 3, ˆp + 3 n n ne sadrži ni 0 ni 1 (očito je tada z γ = 3). Primjer 7: Jedna tvornica hrane želi provesti istraživanje tržišta intervjuirajući 1000 potrošača kako bi odredili koju marku pahuljica za doručak oni preferiraju. Prikupljeni podaci su pokazali da 313 ispitanika odabire pahuljice koje proizvodi tvornica koja je provela istraživanje. Na osnovu dobivenih rezultata odredite interval za koji se može tvrditi da sadrži proporciju konzumenata pahuljica navedene tvrtke u odnosu na sve potrošače pahuljica istraživanog tržišta s pouzdanošću γ = 0.95. (Rješenje: [0.284, 0.342]) Primjer 8: vrtic.sta U nekom poduzeću zaposleno je više od 3000 ljudi. Vlasnik želi ponuditi pomoć svojim zaposlenima oko organizacije čuvanja djece. Razmišljao je o dvije opcije: otvoriti službu čuvanja djece unutar poduzeća ili ponuditi novčanu pomoć roditeljima kako bi sami organizirali čuvanje. Odabrao je uzorak od 60 roditelja, pitao ih za mišljenje i njihove odgovore kodirao na sljedeći način: 0 - radije bih novčanu pomoć za samostalnu organizaciju čuvanja djece; 1 - radije bih organizaciju prepustio poduzeću. Procijenite s pouzdanošću γ = 0.95 proporciju roditelja koji žele organizirano čuvanje djece. Podaci se nalaze u bazi podataka vrtic.sta. (Rješenje: [0.5115, 0.75535])

Statistika, Prehrambeno-tehnološki fakultet 8 Primjer 9: Neka banka je provela istraživanje koje je obuhvatilo 1252 osobe koje posjeduju kreditnu karticu. Pronašli su da je njih 180 koristilo karticu za kupovinu putem Interneta. 1. Je li uzorak dovoljno velik za konstruiranje valjanog intervala povjerenja za proporciju onih koji su koristili kartice za kupovinu putem Interneta u odnosu na sve osobe koje posjeduju kreditnu karticu? Obrazložite odgovor. (Rješenje: uzorak je dovoljno velik.) 2. Sastavite pouzdani interval za navedenu proporciju ako je γ = 0.98. Interpretirajte rezultat u kontekstu problema koji proučavate. (Rješenje: [0.1209, 0.1671]) 3. Da ste konstruirali interval za γ = 0.90, bi li on bio uži ili širi? (Rješenje: bio bi uži jer je z 0.90 < z 0.98 ) Primjer 10: grickalice.sta Tvrtka "Gric" proizvela je grickalice sa novim okusom pa je prije lansiranja novog proizvoda na tržiste odabrala slučajan uzorak od 50 ljudi koje je zamolila da probaju nove grickalice. Njihovi odgovori su kodirani na sljedeći način: 0 ne sviđa mi se; 1 sviđa mi se; 2 niti mi se sviđa niti mi se ne sviđa. Pomoću intervala pouzdanosti 80% procijenite proporciju potrošača kojima će se svidjeti ove nove grickalice. (Rješenje: [0.2355, 0.4045])

Statistika, Prehrambeno-tehnološki fakultet 9 Testiranje statističkih hipoteza Statistička hipoteza je tvrdnja o veličini parametra θ ili o obliku distribucije populacije čija se vjerodostojnost ispituje pomoću podataka dostupnih iz slučajno odabranog uzorka. Postupak kojim se donosi odluka o prihvaćanju ili neprihvaćanju tvrdnje na temelju podataka iz slučajnog uzorka naziva se testiranje statističkih hipoteza. Primjer 11: Pretpostavimo da želimo provjeriti je li očekivano vrijeme čekanja u redu studentske menze u vrijeme ručka veće od pet minuta i na osnovu toga odlučiti trebamo li pokrenuti još jednu traku ili ne. U ovom slučaju valja provesti statistički test o vrijednosti očekivanja slučajne varijable. U postupku provođenja statističkog testa potrebno je praktičnu hipotezu (tvrdnju koju želimo testirati) formulirati kao statističku hipotezu i na osnovu toga izabrati prikladan statistički test iz niza dostupnih testova. Osnovni koraci u testiranju statističkih hipoteza 1. Postaviti nultu i alternativnu hipotezu temeljenu na parametrima. Kako znati koju tvrdnju postaviti za nultu, a koju za alternativnu hipotezu? negaciju pretpostavke, koja se temelji na podacima dobivenim iz uzorka, koju želimo testirati i na osnovu koje želimo donijeti neku odluku postavljamo kao nultu hipotezu i označavamo ju sa H 0. samu pretpostavku koju želimo testirati postavljamo kao alternativnu hipotezu i označavamo ju sa H A. Nulta i alternativna hipoteza koje postavljamo na osnovu pretpostavke navedene u primjeru 1 su: H 0 : Vrijeme čekanja u redu studentske menze u vrijeme ručka je manje ili jednako 5 minuta. H A : Vrijeme čekanja u redu studentske menze u vrijeme ručka je veće od 5 minuta. Alternativnu hipotezu trebamo smatrati netočnom sve dok nam neki prikladan statistički test ne da dovoljno uvjerljive rezultate na osnovu kojih ju možemo prihvatiti, tj. na osnovu kojih možemo odbaciti nultu hipotezu (koju a priori smatramo točnom).

Statistika, Prehrambeno-tehnološki fakultet 10 2. Odabrati test statistiku (koja je u svojoj osnovi slučajna varijabla) T čija vrijednost najbolje odražava vjerodostojnost hipoteze koju želimo testirati, odrediti skup mogućih vrijednosti koje test statistika može poprimiti, te konkretnu vrijednost test statistike za koje nultu hipotezu H 0 ne prihvaćamo u korist alternativne hipoteze H A. Područje vrijednosti test statistike T za koje ne prihvaćamo nultu hipotezu H 0 nazivamo kritično područje ili područje odbacivanja testa. Test statistike koje koristimo pri testiranju hipoteza o vrijednosti različitih parametara bit će navedene kasnije. 3. Budući su statistički testovi kreirani na bazi slučajnih varijabli, potrebno je priznati mogućnost pogreške prilikom zaključivanja. Razlikujemo dvije vrste takvih pogrešaka: Pogreška prvog reda: neprihvaćanje nulte hipoteze H 0 u slučaju kad je ona zapravo istinita. Vjerojatnost pojave pogreške prvog reda nazivamo p-vrijednost. Pogreška drugog reda: prihvaćanje nulte hipoteze u slučaju kad je istinita alternativna hipoteza. Ako je u postupku odlučivanja definiran najveći iznos vjerojatnosti pogreške prvog reda koji smo spremni prihvatiti, taj broj nazivamo nivo značajnosti ili nivo signifikantnosti i označavamo ga sa α. U tom slučaju nultu hipotezu odbacujemo ako je izračunata p-vrijednost manja od nivoa značajnosti α. 4. Nakon određivanja test statistike treba izračunati njezinu vrijednost iz eksperimentalno određenih podataka i odrediti pripada li ta vrijednost u kritično područje: ako pripada, zaključujemo da je alternativna hipoteza H A potvrđena na danom nivou značajnosti α. Istovremeno ne možemo tvrditi da smo dokazali apsolutnu netočnost nulte hipoteze H 0. ako ne pripada, zaključujemo da nema dovoljno objektivnih razloga za neprihvaćanje nulte hipoteza H 0, tj. kažemo da alternativna hipoteza H A nije potvrđena na danom nivou značajnosti α.

Statistika, Prehrambeno-tehnološki fakultet 11 Testiranje hipoteze o tome je li očekivanje jednako unaprijed određenoj vrijednosti za velike uzorke U ovom postupku koristimo aritmetičku sredinu uzorka kao procjenu za očekivanje. U slučajnom uzorku uzetom iz proizvoljne populacije, karakterizirane očekivanjem µ i standardnom devijacijom σ, distribucija aritmetičke sredine uzorka kao procjenitelja za očekivanje (u oznaci X) je približno normalna s očekivanjem µ i standardnom devijacijom σ/ n. Štoviše: Z = X µ σ/ n je približno standardna normalna slučajna varijabla. Naša situacija bit će obilježena nepoznatom standardnom devijacijom σ. Stoga ćemo koristiti standardnu devijaciju slučajnog uzorka koju označavamo sa s. Neka je α nivo značajnosti testa (npr. α = 0.05 ili α = 0.01). Test koji koristimo za testiranje hipoteze o jednakosti očekivanja (µ) nekoj unaprijed zadanoj vrijednosti (µ 0 ) naziva se z-test. Ovisno o prirodi nulte i alternativne hipoteze, razlikujemo: dvostrani test - karakteriziraju ga znak jednakosti u nultoj i znak različitosti u alternativnoj hipotezi. jednostrani test - karakteriziraju ga znak jednakosti u nultoj i stroga nejednakost u alternativnoj hipotezi.

Statistika, Prehrambeno-tehnološki fakultet 12 Dvostrani test: H 0 : µ = µ 0, Test statistika: H 1 : µ µ 0. z = µ µ 0 s/ n. nultu hipotezu H 0 odbacujemo ako je: z > z α/2. s - standardna devijacija slučajnog uzorka. µ - aritmetička sredina uzorka. n - dimenzija uzorka. z α/2 - broj za koji vrijedi da je P { Z z α/2 } = α. Z - standardna normalna slučajna varijabla. Kod dvostranog testa nivoa značajnosti α potrebno je odrediti z α/2 takav da je P { Z z α/2 } = α, gdje je Z N (0, 1). Primijetimo da je α = P { Z z α/2 } = 1 P ( Z z α/2 ) = 1 1 zα/2 e x 2 /2 dx. 2π z α/2

Statistika, Prehrambeno-tehnološki fakultet 13 Jednostrani test: H 0 : µ = µ 0, Test statistika: H 1 : µ < µ 0 ili H 1 : µ > µ 0. z = ˆµ µ 0 s/ n. nultu hipotezu H 0 odbacujemo ako je: z < z α, odnosno ako je z > z α. s - standardna devijacija slučajnog uzorka. µ - aritmetička sredina uzorka. n - dimenzija uzorka. z α - broj za koji vrijedi da je P {Z z α } = α. Z - standardna normalna slučajna varijabla. Kod jednostranog testa nivoa značajnosti α potrebno je odrediti z α takav da je P {Z z α } = α, gdje je Z N (0, 1). Ukoliko zasigurno znamo da naš uzorak potječe iz normalne distribucije, analogne testove možemo provesti i na malom uzorku (n < 30). Tada je distribucija aritmetičke sredine uzorka kao procjenitelja za očekivanje Studentova s (n 1) stupnjeva slobode i pripadni test naziva se t-test. Neka je α nivo značajnosti testa (npr. α = 0.05 ili α = 0.01)

Statistika, Prehrambeno-tehnološki fakultet 14 Dvostrani test: H 0 : µ = µ 0, Test statistika: H 1 : µ µ 0. t = µ µ 0 s/ n. nultu hipotezu H 0 odbacujemo ako je: t > t α/2. s - standardna devijacija slučajnog uzorka. µ - aritmetička sredina uzorka. n - dimenzija uzorka. t α/2 - broj za koji vrijedi da je P { T t α/2 } = α. T - Studentova s (n 1) stupnjeva slobode. Jednostrani test: H 0 : µ = µ 0, Test statistika: H 1 : µ < µ 0 ili H 1 : µ > µ 0. t = ˆµ µ 0 s/ n. nultu hipotezu H 0 odbacujemo ako je: t < t α, odnosno ako je t > t α. s - standardna devijacija slučajnog uzorka. µ - aritmetička sredina uzorka. n - dimenzija uzorka. t α - broj za koji vrijedi da je P {T t α } = α. T - Studentova s (n 1) stupnjeva slobode. U uvjetima istinitosti nulte hipoteze očekujemo da je realizacija z (analogno t) slučajne varijable Z (analogno T ) blizu 0. Može se pokazati da slučajna varijabla Z (analogno T ) za koju je gornja vrijednost z (analogno t) jedna realizacija ima jediničnu normalnu distribuciju.

Statistika, Prehrambeno-tehnološki fakultet 15 Na osnovu realizacije z (analogno t) na našem uzorku možemo odrediti p-vrijednost na sljedeći način: p = P {Z z} (odnosno, p = P {Z z}) ovisno o tome suprotstavljamo li nultoj hipotezi alternativu da je stvarno očekivanje veće ili manje od hipotetske vrijednosti. Primjer 12: tv.sta Godine 1979. osnovna kablovska televizija je, u prosjeku, koštala 7.37 dolara mjesečno. Godine 1983. "Federalno udruženje kablovskih televizija" (broji više od 4000 kablovskih sustava) zaključilo je da je kablovska televizija poskupjela za samo 8% u odnosu na 1979., te da ne stoji statistički značajno više od 8 dolara mjesečno. No "Udruženje potrošača" sumnja u te izjave pa su ih odlučili provjeriti. Koristeći podatke prikupljene u bazi tv.sta provjerite govori li "Federalno udruženje kablovskih televizija" istinu. (Rješenje: H 0 : µ = 8; H A : µ > 8; na nivou značajnosti 0.05 prihvaćamo nultu hipotezu.) Primjer 13: lopta.sta Jedan se poduzetnik bavi proizvodnjom loptica za golf. U suradnji s projektantima u poduzeću napravio je preinake na jednom dijelu stroja (ubrizgavalici). Cijeli je proces dizajniran tako da proizvodi loptice prosječne mase 0.25 unci. Kako bi istražio da li nova ubrizgavalica radi zadovoljavajuće, odabire 40 loptica i bilježi njihove mase (podaci su dostupni u bazi lopta.sta). Provjerite može li poduzetnik prihvatiti hipotezu da prosječna masa loptice nije 0.25 unci. (Rješenje: H 0 : µ = 0.25; H A : µ 0.25; na nivou značajnosti 0.05 ne prihvaćamo nultu hipotezu.) Primjer 14: Kako bi odgovorili na pitanje koji faktori sprečavaju proces učenja u razredu, istraživači na Murray State University ispitali su 40 učenika koji su trebali ocjenama od 1 (uopće ne) do 7 (u velikoj mjeri) ocijeniti razinu do koje određeni faktori ometaju proces učenja. Faktor koji je dobio najveću ocjenu je: "Profesori koji inzistiraju na jednom točnom odgovoru radije nego da evaluiraju cjelokupno razmišljanje i kreativnost". Deskriptivna statistika za ocjenu razine utjecaja ovog faktora je: µ = 4.70, s = 1.62. Premašuje li očekivanje ocjene za navedeni faktor značajno ocjenu 4? Interpretirajte rezultat. (Rješenje: H 0 : µ = 4; H A : µ > 4; na nivou značajnosti 0.05 ne prihvaćamo nultu hipotezu.)

Statistika, Prehrambeno-tehnološki fakultet 16 Testiranje hipoteze o tome je li vjerojatnost događaja jednaka unaprijed određenoj vrijednosti za velike uzorke U sklopu modela Bernoullijevog pokusa modeliranog slučajnom varijablom zadanom sljedećom tablicom distribucije: ( ) 0 1 X =, q p testiramo hipoteze o vrijednosti parametra p (vjerojatnost relizacije uspjeha u jednoj izvedbi Bernoullijevog pokusa). U ovom postupku relativnu frekvenciju uspjeha (ˆp) koristimo kao procjenu za vjerojatnost (proporciju) p: ˆp = X n, gdje je X slučajna varijabla čija je realizacija broj uspjeha u n ponavljanja Bernoullijevog pokusa. Ovaj test baziran je na normalnoj aproksimaciji binomne distribucije, tj. ˆp ima približno normalnu distribuciju s očekivanjem µ i standardnom devijacijom p(1 p)/n. Uz pretpostavku da vjerojatnost p ima unaprijed zadanu vrijednost p 0, distribucija procjenitelja ˆp je N (p 0, p 0 (1 p 0 )/n). Prema tome, standardizirana test statistika Z = ima standardnu normalnu distribuciju. ˆp p 0 p0 (1 p 0 )/n Neka je α nivo značajnosti testa (npr. α = 0.05 ili α = 0.01).

Statistika, Prehrambeno-tehnološki fakultet 17 Dvostrani test: Test statistika: H 0 : p = p 0 H 1 : p p 0 z = ˆp p 0 p 0(1 p 0) n nultu hipotezu H 0 odbacujemo ako je: z > z α/2. p - relativna frekvencija uspjeha. n - dimenzija uzorka. z α/2 - broj za koji vrijedi da je P { Z z α/2 } = α. Z standardna normalna slučajna varijabla.. Jednostrani test: H 0 : p = p 0 H 1 : p < p 0 (odnosno H 1 : p > p 0 ) Test statistika: z = ˆp p 0 p 0(1 p 0) n nultu hipotezu H 0 odbacujemo ako je z < z α (odnosno z > z α ). p - relativna frekvencija uspjeha. n - dimenzija uzorka. z α - broj za koji vrijedi da je P {Z z α } = α. Z - standardna normalna slučajna varijabla. Primjer 15: perec.sta Odlučili ste prodavati nove perece u svojoj pekari. Niste sigurni sviđaju li se ili ne vašim kupcima. O tome ovisi hoćete li nastaviti prodavati te perece ili ne. U bazi podataka perec.sta nalaze se podaci dobiveni iz uzorka od 50 potrošača:

Statistika, Prehrambeno-tehnološki fakultet 18 0 - ne sviđa mi se 1 - sviđa mi se 2 - indiferentan sam 1. Sastavite interval za proporciju kupaca kojima se sviđaju novi pereci, pouzdanosti γ = 0.95. (Rješenje: [0.173, 0.427]) 2. Što ćete učiniti s dimenzijom uzorka ako želite povećati preciznost procjene? (Rješenje: treba povećati dimenziju uzorka) 3. Testirajte hipotezu da je proporcija kupaca kojima se ne sviđaju novi pereci jednaka 0.5. (Rješenje: H 0 : p = 0.5; H A : p 0.5; na nivou značajnosti 0.05 prihvaćamo nultu hipotezu.) Primjer 16: Reputacija mnogih poslova može biti snažno narušena pošiljkom proizvedene robe koja sadrži veliki postotak oštećenih proizvoda. Na primjer, proizvođač alkalnih baterija želi biti siguran da je manje od 5% baterija u pošiljci oštećeno. Pretpostavimo da je slučajnim izborom iz vrlo velike pošiljke odabrano 300 baterija od kojih je 10 oštećenih. Je li to dovoljan dokaz proizvođaču da zaključi kako je proporcija defektnih proizvoda u cijeloj pošiljci manja od 0.05 na nivou značajnosti α = 0.01? (Rješenje: H 0 : p = 0.05; H A : p < 0.05; na nivou značajnosti 0.01 prihvaćamo nultu hipotezu.)

Statistika, Prehrambeno-tehnološki fakultet 19 Testiranje hipoteze o jednakosti distribucije pretpostavljenoj teorijskoj distribuciji Kao procjenu za stvarnu distribuciju slučajne varijable koristimo empirijsku distribuciju podataka koje smo prikupili nezavisnim ponavljanjem pokusa. Želimo testirati ima li slučajna varijabla iz koje sakupljamo podatke neku pretpostavljenu distribuciju - zovemo ju teorijska distribucija. χ 2 test Neka je teorijska distribucija dana tablicom: ( ) x 1 x 2... x r p 1 p 2... p r Ovdje je x i x j za i j, p i 0 za svaki i {1,..., r} i r p i = 1. Pretpostavimo da promatramo slučajan pokus koji ima konačan skup ishoda A = {x 1, x 2,..., x r }, r 2 i da smo ga nezavisno ponovili n puta. Cilj nam je bio zabilježiti frekvencije ˆf j, odnosno relativne frekvencije ˆp j = ˆf j /n, za svaki ishod a j. Time smo dobili empirijsku distribuciju promatrane slučajne varijable. Želimo testirati jednakost empirijske distribucije ( ) x 1 x 2... x r ˆp 1 ˆp 2... ˆp r i teorijske distribucije navedene na početku poglavlja. Da bi koristili ovaj test mora biti svaki p i veći od 5, gdje je n dimenzija uzorka. Nultu i alternativnu hipotezu postavljamo na sljedeći način: H 0 : procijenjena distribucija jednaka je teorijskoj distribuciji, H A : procijenjena distribucija se razlikuje od teorijske distribucije. U uvjetima istinitosti hipoteze H 0, za velik broj nezavisnih ponavljanja slučajnog pokusa, test statistika približno ima hikvadrat distribuciju s (r 1) stupnjeva slobode. Iskoristimo programski paket Statistica: formirajmo bazu podataka koja sadrži eksperimentalno dobivene frekvencije i teorijske frekvencije izračunate na bazi teorijske distribucije i broja podataka u uzorku. Provedemo χ 2 test i odbacimo H 0 ako je dobivena p-vrijednost manja od α, gdje je α odabrani nivo značajnosti testa. i=1

Statistika, Prehrambeno-tehnološki fakultet 20 Ovaj test možemo koristiti i kod neprekidnih slučajnih varijabli tako da R(X) podijelimo na disjunktne intervale i suprotstavimo teorijske frekvencije tih intervala njihovim uzoračkim frekvencijama. Treba voditi računa o tome da je test jako osjetljiv na izbor intervala. Primjer 17: Savjetnik ekološkog kluba na jednom sveučilištu želi poštovati zahtjev da klub sačinjava 10% brucoša, 20% studenata druge godine, 40% studenata treće godine, te 30% apsolvenata. Članstvo ekološkog kluba za ovu godinu brojilo je 14 brucoša, 19 studenata druge godine, 51 studenta treće godine, te 16 apslovenata. Provjerite postoji li statistički značajna razlika trenutnog sastava kluba od traženih standarda na nivou značajnosti α = 0.1. (Rješenje: na nivou značajnosti 0.1 ne prihvaćamo nultu hipotezu.) Primjer 18: Tržišni analitičar želi istražiti imaju li potrošači neke posebne sklonosti prema jednom od okusa sokova koji su se pojavili na tržištu. Na uzorku od 100 ljudi prikupio je preferencije prema ponuđenim okusima. Frekvencije su dane u sljedećoj tablici: višnja jagoda naranča limun grejp 32 28 16 14 10 Ispitajte postoji li na nivou značajnosti α = 0.05 statistički značajna preferencija potrošača prema nekom od okusa ili je sklonost potrošača jednaka prema svim ponuđenim okusima. (Rješenje: na nivou značajnosti 0.05 ne prihvaćamo nultu hipotezu.) Primjer 19: Jedna je studija na osnovu istraživanja o razlozima povratka na posao ljudi koji su umirovljeni postavila sljedeću distribuciju: 38% se ponovo zaposli u drugom poduzeću; 32% osnuje obrt; 23% rade kao konzultanti; 7% osnuje vlastito poduzeće. Poklapaju li se sljedeći rezultati, dobiveni ponovnim istraživanjem, s prethodno postavljenom tezom ili možemo utvrditi postojanje statistički značajne razlike? 122 se ponovo zaposlilo u drugom poduzeću; 85 je osnovalo obrt; 76 su radili kao konzultanti; 17 je osnovalo vlastito poduzeće.

Statistika, Prehrambeno-tehnološki fakultet 21 (Rješenje: na nivou značajnosti 0.05 prihvaćamo nultu hipotezu.) Testiranje normalne distribuiranosti obilježja Odgovor na ovo pitanje od izuzetne je važnosti za točnost statističkih analiza obzirom da su mnogi statistički testovi kreirani uz pretpostavku normalnosti obilježja. Potrebno je nezavisnim ponavljanjem pokusa prikupiti podatke iz realizacija promatrane slučajne varijable. Za prvi uvid u moguća odstupanja od normalne distribucije možemo koristiti razne mjere deskriptivne statistike i grafičke prikaze. Nultu i alternativnu hipotezu postavljamo na sljedeći način: H 0 : H A : obilježje je normalno distribuirano. obilježje nije normalno distribuirano. Za testiranje hipoteze o normalnosti obilježja možemo koristiti razne testove, npr: Lillieforsova inačica Kolmogorov-Smirnovljevog testa; Shapiro-Wilksov W test. Primjer 20: auti1.sta Raspolažemo mjerenjima potrošnje novog modela automobila za 100 takvih automobila. Provjerite je li potrošnja normalna slučajna vrijabla. Podaci su dostupni u bazi auti1.sta. (Rješenje: na nivou značajnosti 0.05 prihvaćamo nultu hipotezu da obilježje potječe iz normalne distribucije.) Primjer 21: dob-poduz.sta Raspolažemo podacima o dobi 200 poduzetnika u nekoj zemlji. Zanima nas je li dob poduzetnika u bazi podataka dob-poduz.sta normalno distribuirana slučajna varijabla. Napravite testiranje i donesite zaključak. Prokomentirajte dobiveni rezultat s obzirom na kontekst pojave koju proučavate. (Rješenje: na nivou značajnosti 0.05 prihvaćamo nultu hipotezu da obilježje potječe iz normalne distribucije.)

Statistika, Prehrambeno-tehnološki fakultet 22 Primjer 22: mba.sta U bazi podataka mba.sta nalaze se podaci o rezultatima GMAT testa (Graduate Management Admission Test) za 100 studenata koji su prijavili na studij. Provjerite potječu li podaci iz normalne distribucije. (Rješenje: na nivou značajnosti 0.05 prihvaćamo nultu hipotezu da obilježje potječe iz normalne distribucije.)