Mobilne aplikacije - Sažetak završnih projekata

Слични документи
Sveučilište u Zagrebu Fakultet prometnih znanosti Zavod za inteligentne transportne sustave Katedra za primijenjeno računarstvo Vježba: #7 Kolegij: Ba

Microsoft Word - 6. RAZRED INFORMATIKA.doc

Slide 1

Uvod u statistiku

Stručno usavršavanje

Test ispravio: (1) (2) Ukupan broj bodova: 21. veljače od 13:00 do 14:00 Županijsko natjecanje / Osnove informatike Osnovne škole Ime i prezime

DUBINSKA ANALIZA PODATAKA

PowerPoint Presentation

Slide 1

DUBINSKA ANALIZA PODATAKA

4

Microsoft PowerPoint - LB7-2_WCCF_2012.ppt

A1_NOVA PONUDA_CJENIK pdf

Programski jezik QBasic Kriteriji ocjenjivanja programiranje(b) - QBasic razred 42

Programski jezik QBasic Kriteriji ocjenjivanja programiranje(b) - QBasic razred 42

Microsoft Word - InveoP_01.docx

PROGRAMIRANJE Program je niz naredbi razumljivih računalu koje rješavaju neki problem. Algoritam je postupak raščlanjivanja problema na jednostavnije

Postojanost boja

Microsoft Word - privitak prijedloga odluke

30. april godine Viva Com cenovnik mobilnih telefona GARANCIJA NA SVE TELEFONE 12 MESECI SAMSUNG M10 2GB/16GB Duos, crni 145 M10 3GB/32GB Duos M

Универзитет у Београду Факултет организационих наука Коначан распоред испита за предмете Мастер академских студија Испитни рок: ОКТОБАР Предмет

PuTTY CERT.hr-PUBDOC

PowerPoint Presentation

SVEUČILIŠTE U ZAGREBU FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA Seminarski rad u okviru predmeta Računalna forenzika BETTER PORTABLE GRAPHICS FORMAT Matej

Klasifikacija slika kucnih brojeva dubokim konvolucijskim modelima

23. siječnja od 13:00 do 14:00 Školsko natjecanje / Osnove informatike Srednje škole RJEŠENJA ZADATAKA S OBJAŠNJENJIMA Sponzori Medijski pokrovi

Može li učenje tablice množenja biti zabavno?

Универзитет у Београду Факултет организационих наука Распоред испита за предмете мастер академских студија Испитни рок: Јун Предмет Датум Време

Microsoft Word - Akreditacija 2013

Numeričke metode u fizici 1, Projektni zadataci 2018./ Za sustav običnih diferencijalnih jednadžbi, koje opisuju kretanje populacije dviju vrs

РАСПОРЕД ИСПИТА У ИСПИТНОМ РОКУ ЈАНУАР 1 ШКОЛСКЕ 2016/2017. ГОДИНЕ (последња измена ) Прва година: ПРВА ГОДИНА - сви сем информатике Име пр

Matematika 1 - izborna

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet organizacije i informatike I

XIII. Hrvatski simpozij o nastavi fizike Istraživački usmjerena nastava fizike na Bungee jumping primjeru temeljena na analizi video snimke Berti Erja

Microsoft Word - Akreditacija 2013

Recuva CERT.hr-PUBDOC

Microsoft Word - Akreditacija 2013

Microsoft Word - Akreditacija 2013

PowerPoint Presentation

8 2 upiti_izvjesca.indd

Državna matura iz informatike

Рачунарска интелигенција

R u z v e l t o v a 5 5, B e o g r a d, t e l : ( ) , m a i l : c o n t a c p s i t. r s, w w w. p s i t. r s

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet kemijskog inženjerstva i teh

Школа Ј. Ј. Змај Свилајнац МЕСЕЧНИ ПЛАН РАДА ЗА СЕПТЕМБАР Школска 2018 /2019. Назив предмета: Информатика и рачунарство Разред: 5. Недељни број часова

УПУТСТВО ЗА КОРИСНИКА Приступ локацији часописа Српски архив за целокупно лекарство добија се преко internet adrese: Након

Microsoft PowerPoint - LB7-2_WCCF_2010.ppt

PowerPoint Presentation

KORISNIČKE UPUTE APLIKACIJA ZA POTPIS DATOTEKA

Microsoft PowerPoint - podatkovni promet za objavu.pptx

MOODLE KAO PODRŠKA CJELOVITOJ KURIKULARNOJ REFORMI Lidija Kralj, prof. Darija Dasović Rakijašić, dipl. inf.

KATALOG ZNANJA IZ INFORMATIKE

PowerPoint Template

Lorem ipsum dolor sit amet lorem ipsum dolor

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Fakultet organizacije i informatike O

PowerPoint Presentation

(Microsoft Word - Dr\236avna matura - kolovoz ni\236a razina - rje\232enja)

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Grafički fakultet Grafička tehnnologi

(Microsoft Word - Rje\232enja zadataka)

Satnica.xlsx

SVEUČILIŠTE U ZAGREBU SVEUČILIŠNI RAČUNSKI CENTAR UVJETI KORIŠTENJA USLUGE EDUADRESAR Zagreb, kolovoz 2013.

UPUTA za uvođenje JOPPD - prva faza

NSZ-GS7

Document ID / Revision : 0419/1.1 ID Issuer Sustav (sustav izdavatelja identifikacijskih oznaka) Upute za registraciju gospodarskih subjekata

Radionice, webinari i MOOC-ovi u sklopu projekta E-škole Radionica "E-učitelj suvremena nastava uz pomoć tehnologije" Trajanje: 5 sati Polaznici radio

Microsoft Word - Lekcija 11.doc

УПУТСТВО ЗА КОРИСНИКА Приступ локацији часописа Српски архив за целокупно лекарство добија се преко internet adrese: Након

Objektno orjentirano programiranje 2P

Ponuda mobilnih uređaja ALCATEL A5 +LED DS (KAMPANJA 1+1=3)(SNIŽENJE)... 3 ALCATEL Idol 4S DS (KAMPANJA 1+1=3)(SNIŽENJE)... 4 ALCATEL 5 DS (KAMPANJA 1

PLAN I PROGRAM ZA DOPUNSKU (PRODUŽNU) NASTAVU IZ MATEMATIKE (za 1. razred)

I

No Slide Title

NIAS Projekt e-građani KORISNIČKA UPUTA za aplikaciju NIAS Verzija 1.1 Zagreb, srpanj 2014.

АНКЕТА О ИЗБОРУ СТУДИЈСКИХ ГРУПА И МОДУЛА СТУДИЈСКИ ПРОГРАМИ МАСТЕР АКАДЕМСКИХ СТУДИЈА (МАС): А) РАЧУНАРСТВО И АУТОМАТИКА (РиА) и Б) СОФТВЕРСКО ИНЖЕЊЕ

POSLOVNA INTELIGENCIJA I ANALITIKA ZA PRAVE POSLOVNE ODLUKE

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Hrvatski studiji Psihologija Ured za

Maxtv To Go/Pickbox upute

Vrjednovanje diplomskih studija od strane studenata koji su tijekom akademske godine 2015./2016. završili studij Hrvatski studiji Kroatologija Ured za

Istarska razvojna agencija

1, 2, 3, кодирај! Активности циклуса 4 Пројект «Аркадне игре» - Час 6: Програмирање падања новчића (наставак) Доминантна дисциплина Математикa Резиме

ASAS AS ASAS

Programiranje u C-u ili C++-u Pseudo-slučajni brojevi; Dinamička alokacija memorije 1 ZADACI SA ČASA Zadatak 1 Napraviti funkciju koja generišlučajan

OBRAZAC 1. Vrednovanje sveucilišnih studijskih programa preddiplomskih, diplomskih i integriranih preddiplomskih i diplomskih studija te strucnih stud

Numerička matematika 11. predavanje dodatak Saša Singer web.math.pmf.unizg.hr/~singer PMF Matematički odsjek, Zagreb NumMat 2019, 11. p

(Microsoft Word - MATB - kolovoz osnovna razina - rje\232enja zadataka)

5S prezentacija - za printati bez videa i igre (3)

eredar Sustav upravljanja prijavama odjelu komunalnog gospodarstva 1 UPUTE ZA KORIŠTENJE SUSTAVA 1. O eredar sustavu eredar je sustav upravljanja prij

Nastavna cjelina: 1. Jezik računala Kataloška tema: 1.1. Bit 1.2. Brojevi zapisani četvorkom bitova Nastavna jedinica: 1.1. Bit   1.2. Brojevi zapisan

ZADNJI DATUM AŽURIRANJA:

3 DNEVNI SEMINAR INTERNET POSLOVANJE TEME: 1. INTERNET POSLOVANJE 2. INTERNET MARKETING, INTERNET PR I ANALITIKA 3. UPRAVLJANJE SADRŽAJEM, DOMENE, HOS

Slide 1

Poštovani,

Microsoft Word - III godina - EA - Metodi vjestacke inteligencije

1. OPĆE INFORMACIJE 1.1. Naziv kolegija Programiranje 1.6. Semestar Nositelj kolegija dr.sc. Bruno Trstenjak, v. pred Bodovna vrijednost

Hej hej bojiš se matematike? Ma nema potrebe! Dobra priprema je pola obavljenog posla, a da bi bio izvrsno pripremljen tu uskačemo mi iz Štreberaja. D

Транскрипт:

Sveučilište Jurja Dobrile u Puli Fakultet informatike Diplomski studij Informatike: 1. godina Primijenjena statistika Sažetak prezentiranih završnih projekata 2018./2019. Ak.g. 2018./2019.

01-preporučitelj kulinarskih recepata Sustav preporuka kulinarskih recepata na osnovu dostupnih namirnica AUTORI: Tihana Glavaš (tglavas@unipu.hr) Ivan Matak (imatak@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Preporučitelj kulinarskih recepata Autori: Ivan Matak i Tihana Glavaš Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Poster prikazuje proces data scrapinga za recepte, njihove sastojke i količinu sa stranice finirecepti.net.hr te formulu za recommender sustav za odabir recepata na temelju dostupnih namirnica. 2. Opis problema Stranica finirecepti.net.hr sadrži preko 2000 recepata koji sadrže do 20 sastojaka i njihove količine. Naš je cilj prikupiti sve podatke o receptima, njihovim sastojcima i količinama u jednu uređenu tablicu. Problem je sličan problemu gdje postoji tablica sa filmovima te njihovim ocjenama korisnika te je napraviti recommender sustav koji će preporučiti filmove korisnicima na temelju njihovih ocjena. 4. Rezultati Rezultat data scrapinga je normalizirana tablica koja slijedno prikazuje sve recepte, njihove sastojke i količinu. Rezultat je postignut korištenjem algoritma izrađenog pomoću Web Scrapera. Za sada, kao rezultat korištenja formule, dobivamo preporuku filmova slično ćemo kasnije napraviti i za recepte - za korisnika 7 (Tomislav), te je najbolja preporuka za korisnika 7 film Matrix (3.170034). Preporuka je kombinacija ocjena korisnika 7 i ostalih korisnika. 3. Metoda Za data scraping koristimo Chrome ekstenziju Web Scraper. Web Scraper omogućuje kretnju dinamičkom web lokacijom na svim razinama te je moguće kategorizirati podatke na kategorije i potkategorije. Pravilnim označavanjem podataka, stvaramo algoritam koji prikuplja podatke sa svih stranica koje sadrže recepte. Kod algoritma za preporuku filmova, potrebno je predvidjeti ocjene filmova koje korisnik nije ocijenio na način da koristimo filmove koje je ocijenio te vrijednosti sličnosti. Za film Inception, koristimo već postojeće ocjene korisnika za druge filmove koji su slični, te ih pomnožimo sa rating-om koji smo napravili u prethodnom koraku. Za kraj, sve dijelimo sa zbrojem rating-a svih filmova. Algoritam scrapinga i normalizirane tablice Tablice i rezultati preporuke filmova korištenjem algoritma Označavanje podataka na stranici recepata Formula za preporuku filmova 5. Zaključak Interesantno! Što više korisnika imamo, preporuka će biti preciznija. Web Scraper predstavlja vrlo efektivni i besplatni alat za data scraping te omogućuje neograničeno prikupljanje podataka koji se mogu normalizirati u R sučelju. Algoritam za preporuku filmova je vrlo efektivan kada se radi o preporuci numeričkih vrijednosti, no nije efektivan za preporuku recepata koji se sastoje od kombinacija riječi i numeričkih vrijednosti, što namjeravamo riješiti u sljedećem razdoblju. Primijenjena statistika, ak. god. 2018/2019

02-model cijene najma kuca za odmor Statistički model cijena najma kuća za odmor u Istri AUTORI: Lejla Mehinović (lmehinovic@unipu.hr) Matea Smoković (masmokov@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Statistički model cijena najma kuća za odmor u Istri Autor: Lejla Mehinović i Matea Smoković Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Prikupljeni su podaci o cijenama najma kuća za odmor za dvije osobe u Istarskoj županiji u sezoni c, točnije od 29.06-06.07.2019.god. Podaci uključuju 150 unosa te 17 varijabli. Podaci su prikupljeni sa web stranice Booking.com. Podaci su obrađeni kako bi se nad njima mogla provesti statistička analiza. Cilj je odrediti veze između varijabli te koje varijable najviše utiču na cijenu najma. 2. Opis problema Pomoću podataka koje smo prikupili trebalo je doći do zaključka što trebamo odabrati kako bi najjeftinije iznajmili vilu u Istarskoj županiji u sezoni c. 3. Metoda Raspored vila po gradovima Najviše objekata nalazi se u Poreču, zatim u Umagu Za prikupljanje podataka sa Booking.com korišten je Selector gadget koji prikuplja podatke u tablicu koja je poslije uvezena u R studio. U nekim varijablama nalazilo se nekoliko nedostajućih vrijedosti koje su zamijenjene srednjom vrijednošću podataka. Za sve važnije varijable određene su minimalne, maksimalne i prosječne vrijednosti. Glavni cilj je odrediti koje varijable najviše utiču na cijenu najma, te je pomoću grafova prikazana ovisnost cijene o lokaciji, broju zvjezdica, veličini, kapacitetu, ocjeni gostiju, bazenu, besplatnom parkiralištu, kućnim ljubimcima, besplatnim internetom, dozvoljenom pušenju, uslugama prijevoza od/do zračne luke, aktivnostima, uslugama recepcije, čišćenjem te wellnessom. Kreirano je više statističkih modela linearne regresije od kojih je odabran najznačajniji. U konačnici je prikazana precijenjena te podcijenjena vila. Dijagram kojim se ilustriraju koraci u analizi podataka 4. Rezultati Najnižu cijenu imaju vile sa 3 zvjezdice 5. Zaključak Interesantno! Za najpovoljniji odmor potrebno je odabrati vilu sa 3 zvjezdice, 100 kvadrata i kapaciteta za 4 osobe. Radom sa podacima i kreiranjem modela za predikciju dolazi se do zaključka da cijena najviše ovisi o broju zvjezdica, kapacitetu, kvadraturi, prijevozu od/do zračne luke i wellnessu. Cijena ne ovisi o bazenu, čišćenju, dozvoljenom pušenju i dozvoljenim kućnim ljubimcima. Prema modelu podcijenjena vila je Moonlight koja se nalazi u Poreču, a precijenjena vila je Vanessa koja se nalazi u Rovinju. Prema modelu ne možemo u potpunosti predvidjeti cijenu najma vila u Istarskoj županiji. Za takvu analizu potrebno je obuhvatiti mnogo više podataka. Primijenjena statistika, ak. god. 2018/2019 Najnižu cijenu imaju vile za 4 osobe Najznačajniji model je model koji prikazuje odnos cijene sa wellnessom, prijevozom, bazenom te međudjelovanjem prediktora wellnessa i prijevoza. Udio varijance iznosi 28.69% što je nažalost vrlo malo. model5=lm(vile.cijena_ukupno~vile.wellness+vile.prijevoz+vile.bazen+vile.wellness:vile.prijevoz, data=vile_num) Precjenjena vila Podcjenjena vila Najnižu cijenu imaju vile od 100 kvadrata

03-model cijene mobilnih uređaja Statistički model cijena mobilnih uređaja u RH AUTORI: Vedran Tometić (vtometic@unipu.hr) Nikolina Zirdum (nzirdum@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Statistički model cijena mobilnih uređaja u RH Autor: Vedran Tometić, Nikolina Zirdum Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Analizirali smo 3 najpopularnija proizvođača mobilnih uređaja. Proizvođači: Samsung(10), iphone(10), Huawei(10) = 30 modela. Specifikacije: unutarnja memorija, veličina ekrana, glavna kamera, selfie kamera, radna memorije, baterija. 3 trgovine (neutrinomobile, tia-mobiteli, ekupi). Prikupljanje podataka: gsmarena, nabava.net. 2. Opis problema Ciljevi: min, max i prosječna cijena svakog modela, usporedba prosječne cijene sa specifikacijama, pronaći najpodcijenjeniji i najprecijenjeniji model od svakog proizvođača. Naziv modela i specifikacije preuzeli smo sa stranice gsmarena.com, dok smo cijene svih modela preuzeli sa stranica neutrinomobile.hr, tia-mobiteli.hr, ekupi.hr. Izvukli smo minimalnu, maksimalnu i prosječnu cijenu za svaki model. 3. Metoda U daljnjoj analizi podataka koristili smo prosječnu cijenu uređaja. U odabranom modelu zavisna varijabla predstavlja prosječnu cijenu, dok su nezavisne varijable (prediktori): unutarnja memorija, velicina ekrana, glavna kamera, selfie kamera, radna memorija, baterija. Samsung (model1) objašnjava 82% varijance zavisne varijable. Iphone (model6) objašnjava 89% varijance zavisne varijable. Huawei (model14) objašnjava 66% varijance zavisne varijable. 4. Rezultati Interesantno! Proizvođač Apple nije poboljšao glavnu kameru, na čak zadnjih 10 izdanih modela. Najskuplji Samsung model -> Note9, iphone model -> XS Max 256GB, Huawei model -> Mate 20Pro. Najjeftiniji Samsung model -> J4+, iphone model -> 8 64GB, Huawei model -> Y6. Za svakog proizvođača, unutar određene serije, cijena modela raste s obzirom što je model noviji. Na cijenu iphone uređaja veliku ulogu imaju unutarnja i radna memorija. Kod Huawei-a je to glavna i selfie kamera. Interesantno! Cijena Samsunga s obzirom na seriju i model. Cijena iphona s obzirom na seriju i memoriju. 5. Zaključak Ovim projektom upoznali smo sami sebe s nekim podacima koji su ustvari jako blizu nas, ali su nam bili nepoznati. Najpodcijenjeniji model: Samsung Galaxy S8, najprecijenjeniji model: Samsung Galaxy S9+. Najpodcijenjeniji model: Apple iphone XR 256GB, najprecijenjeniji model: Apple iphone X 256GB. Najpodcijenjeniji model: Huawei Honor 10, najprecijenjeniji model: Huawei Mate 20 Primijenjena statistika, ak. god. 2018/2019

04-tutorial sistem-dinamički modeli u R-u Tutorial za sistem-dinamičke modele (eng. system dynamics) u R-u AUTORI: Maja Mandarić (mmandaric@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Tutorial - Sistem-dinamički modeli u R-u Autor: Maja Mandarić Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Sistem-dinamički model je pojednostavnjeni prikaz realnog sustava koji služi za bolje razumijevanje i daljnje proučavanje tog sustava i eksperimentiranju s njim, a elementi su mu akumulacija i tokovi. Akumulacija predstavlja temelj svakog sustava, a može se mijenjati samo kroz tokove. Dva su toka, inflow odnosno ulazni podatci koji povećavaju akumulaciju te outflow odnosno izlazni podatci koji smanjuju akumulaciju. 2. Opis problema Primjer koji je uzet za objašnjene sistem-dinamičkog modela su kupci jednog poduzeća. Cilj je maksimizirati regrute i ograničiti gubite kako bi se povećala razina kupaca i podržao rast poduzeća. Kupci predstavljaju akumulaciju, regruti ulazne podatke, a gubitci izlazne podatke. Dijagram koji ilustrira sistem-dinamički model kupaca u poduzeću Interesantno! Manjim vremenskim korakom manja je vjerojatnost pojave grešaka. 3. Metoda U pozadini sistem-dinamičkih modela stoje diferencijalne jednadžbe, a najučinkovitija je Eulerova metoda koja rješava složenije sustave. U R-u se za navedeno koristi paket desolve. Za rješavanje prethodno spomenutog problema potrebno je odrediti početnu vrijednost akumulacije odnosno kupca (10000) te stvoriti jednadžbe za regrute i gubitke. Formula za regrute predstavlja umnožak akumulacije i stope djelomičnog povećanja dok formula za gubitke predstavlja umnožak akumulacije i stope djelomičnog smanjenja. Uz navedeno potrebno je postaviti i početno (2015) i završno (2030) vrijeme simulacije te vremenski korak (0,25). 4. Rezultati Na prvom grafu vidljiv je rast akumulacije koja je 2015. godine iznosila 10000 dok se za 2030. godinu predviđa 21071. Na drugom grafu vidljiv je rast regruta kojih je 2015. godine bilo 800, a za 2030. predviđa se 1685. Na istom grafu vidljiv je i rast odbitaka s početnom vrijednošću 300 u 2015. godini, a za 2030. godinu predviđa se broj od 632. 5. Zaključak Vizualizacija podataka Na samome kraju može se zaključiti da su sistem-dinamički modeli pogodni za rješavanje raznih problema te predviđanje rezultata, a neke od područja koja ih mogu koristiti su matematika, fizika, biologija, inženjerstvo, ekonomija, ekologija i dr. Eulerova metoda za rješavanje složenijih sustava Formule za rješavanje primjera Primijenjena statistika, ak. god. 2018./2019.

05-tutorial caret paket Tutorial za Caret paket sučelje za strojno učenje (pokriva preko 200 različitih modela) AUTORI: Vedrana Jašarević (vjasarev@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Tutorial Caret paket Autor: Vedrana Jašarević Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Poster prikazuje korištenje Caret paketa. Classification And REgression Training -> CARET Caret paket je skup funkcija koje pokušavaju pojednostaviti proces za stvaranje prediktivnih modela. Dijeljenje podataka, pred obrada, odabir značajki su samo neki od alata koje sadrži. 2. Opis problema Prikazala sam Caret paket na skupu podataka o cvijeću iris. Skup podataka ima 150 opservacija i 5 varijabli. Varijable su dužina lapa, širina lapa, dužina latice, širina latice i vrsta. Postoje tri vrste, a to su setosa, versicolor i virginica. 3. Metoda Prvo sam instalirala caret paket, a zatim sam podijelila skup podataka na skup za učenje (80%) i skup za testiranje (20%) pomoću funkcije createdatapartition. Nakon toga sam odabrala 4 različita algoritma, C5.0, knn (k najbližih susjeda), SVM (stroj potpornih vektora) i RF (šuma stabla) te pomoću caret funkcije train dobila sam podatke za sve algoritme na jednak način. Podatke možemo iščitati iz konfuzijske matrice, ali zbog nepreglednosti podatke sam prikazala pomoću različitih grafikona. Vizualizacija - usporedba specifičnosti i osjetljivosti Prikaz funkcije createdatapartition i funkcije train na knn algoritmu 4. Rezultati Iz konfuzijske matrice možemo vidjeti da je knn algoritam najtočniji sa 100%, algoritam C5.0 ima 94.4%, SVM algoritam 93% dok algoritam RF ima 96.7%. Iz grafikona možemo još bolje vidjeti kako knn osim u točnosti ima najveće vrijednosti i u osjetljivosti, specifičnosti te i u pozitivnoj i negativnoj prediktivnosti. Na grafikonu s osjetljivošću i specifičnošću možemo najbolje vidjeti kako SVM algoritam ima najmanje vrijednosti. Prikazala sam vizualno i konfuzijske matrice od najboljeg i najlošijeg algoritma te možemo vidjeti da je knn dobro klasificirao sve podatke, dok kod SVM-a možemo vidjeti da ima neispravno klasificiranih primjera. 5. Zaključak Iz svih navedenih primjera zaključila sam da su svi algoritmi dosta slični, ali ipak je knn algoritam najbolji u ovom slučaju. Svi ostali algoritmi međusobno imaju slične vrijednosti. Caret paket je bio koristan i olakšao usporedbu algoritama pomoću samo jedne funkcije train. Primijenjena statistika, ak. god. 2018/2019

06-tutorial shiny paket Tutorial za Shiny - paket za izradu interaktivnih web aplikacija u R-u AUTORI: Mateo Lukač (mlukac@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Tutorial Shiny paket Autor: Matteo Lukač Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Shiny je paket koji nam omogućuje stvaranje interaktivnih web aplikacija direktno iz R. Interaktivne web aplikacije omogućuju da korisnik izabere koji ga podaci zanimaju te je time omogućeno prikazivanje više podataka. Shiny aplikacije postaje dostupna na internetu putem shiny servera ili putem hosting stranice Shinyapps.io 2. Opis problema Prikaz je primjer shiny aplikacije na integriranim podacima o autima iz R. Aplikacija nam omogućuje da po parametrima koji nas zanimaju filtriramo podatke te ih vizualno pokažemo na jednom od ponuđenih grafova. 3. Metoda Shiny aplikacija se sastoji od UI dijela, funkcija servera i ShinyApp funkcije. UI dio a kontrolira razmještaj i izgled aplikacije, serverske funkcije kontroliraju sta aplikacije radi a ShinyApp funkcija stvara aplikaciju na osnovi UI i serverskih funkcija. UI dio sadrži html naredbe za obradu teksta, control widget i sidebarlayout-a. Serverske funkcije sastoje se od renderdatatable, renderimage, renderplot, renderprint, rendertable, rendertext, renderui, reactive naredbe. Serverski dio koda se izvodi svaki put kad se novi korisnik spoji na server, dok gore navede naredbe se izvodi svaki put kad se u njima sadržani widget promjeni. Reactive naredba nam omogućuje da objedinjujemo naredbe koje se koriste u više rendera kako se ne budeisti kod više puta izvodio kod svake promjene widget-a. 5. Zaključak Vizualizacija primjera shiny aplikacije Na primjeru je pokazano kako je pomoću shiny aplikacije moguće prikazati podatke tako da korisnik može filtrira podatka na one koje su njemu bitni i grafove pokazati na osnovu tih podataka. Primijenjena statistika, ak. god. 2018/2019

07-tutorial deep learning u R-u Tutorial za duboko učenje (eng. deep learning) u R-u AUTORI: Domagoj Oblak (dooblak@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Tutorial - Duboko učenje u R-u Autor: Domagoj Oblak Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Duboko učenje je specifično potpolje strojnog učenja, tzv. učenje po slojevima. Duboki model je slijed naučenih nelinearnih transformacija. Neke od primjena dubokog učenja su: računalni vid klasifikacija slika lokalizacija objekata raspoznavanje simbola raspoznavanje govora 2. Opis problema MNIST baza podataka s ručno napisanim znamenkama. Sadrži 60.000 slika za trening i 10.000 slika za testiranje. Train_images i train_labels su podaci od kojih će model učiti, a model će se testirati na testnom setu podataka test_images i test_labels. 3. Metoda Korišten je R interface to Keras, tj. Keras je API neuronskih mreža razvijen s naglaskom na omogućavanje brzog eksperimentiranja. 4. Stvarne znamenke Učenje po slojevima Primjer MNIST ručno napisanih znamenki 5. Rezultat R Primijenjena statistika, ak. god. 2018/2019

08-tutorial rudarenje teksta u R-u Tutorial za rudarenje teksta (eng. text mining) u R-u AUTORI: Andrej Međeral (amederal@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Tutorial - Rudarenje teksta u R-u Autor: Andrej Međeral Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Rudarenje teksta predstavlja proces otkrivanja zanimljivih znanja iz velike količine podataka (teksta). U procesu rudarenja teksta kategoriziramo, grupiramo, sažimamo skupove podataka radi vađenja informacija, kao što su frekvencija ponavljanja riječi i njihovi odnosi Koristeći se tekstom odabranim od strane autora, napraviti ćemo grupiranje i sažimanje podataka radi lakšeg manipuliranja. Analiza se temelji na grupiranju podataka po frekvenciji ponavljanja prilikom koje ćemo vidjeti riječi koje se najviše pojavljuju u tekstu. 2. Opis problema Cilj ovog projekta je nakon korištenja funkcija programskog jezika R, prikupljene podatke sažeti, grupirati i na kraju grafički prikazati. 3. Metoda Pomoću funkcija čitao sam red po red u dokumentu, gdje funkcija gleda svaku liniju kao zaseban element u vektoru chr. Isti je bilo potrebno prilagoditi za analizu tj. izbacivanje interpunkcijskih znakova, izbacivanje svih brojeva, izbacivanje svih riječi koje imaju jedno slovo, maknuti sve Stop riječi i staviti u pravilan format te na kraju popuniti prazna mjesta napravljena u procesu. Primjenom metoda za analizu riječi dobivene su najučestalije riječi koje se pojavljuju u odabranom tekstu prikazane grafički pomoću WordCloud-a i Plot dijagrama. Nakon toga slijedi kolika je frekvencija ponavljanja riječi između više tekstova (Corpusa) prikazana grafički pomoću Comparison WordCloud-a. Na kraju uspoređujemo tekst sa svim pozitivnim i negativnim riječima na svijetu. 4. Rezultati Prikaz koliko se puta ponavlja riječ u tekstu (Txt1). Prikaz riječi s obzirom na frekvenciju ponavljanja između više dokumenata. Zanimljivost! Riječ Trump jedna je od riječi koja ima najveću frekvenciju ponavljanja na Twiteru. Proces rudarenja teksta Prikaz riječi s obzirom na frekvenciju ponavljanja (Txt1). 5. Zaključak Prikaz riječi s obzirom na frekvenciju ponavljanja (Corpus). U ovom radu su prikupljeni, obrađeni i grafički prikazani podaci o frekvenciji ponavljanja riječi u dokumentima. Prema podacima iz prvog dokumenta možemo vidjeti da najveću frekvenciju ponavljanja ima riječ Specialized, dok u corpus-u tj. spoju više dokumenata najviše prevladava riječ Trump. Te vidimo da broj riječi u nekom tekstu ne znači da je i ujedno iz toga teksta riječ koja ima najveću frekvenciju. Primijenjena statistika, ak. god. 2018/2019 Primijenjena statistika, ak. god. 2017/2018 Prikaz koliko riječi ima u kojem dokumentu(txt1).

09-paket za hrv. ekon. podatke R paket za sakupljanje svih javno dostupnih hrvatskih (makro)ekonomskih podataka AUTORI: Tomislava Kolar (tkolar@unipu.hr) David Ravnik (dravnik@unipu.hr) DROPBOX: bit.ly/2cxpgjm

Paket za sakupljanje i vizualizaciju hrvatskih makroekonomskih podataka Autori: David Ravnik i Tomislava Kolar Mentor: doc. dr. sc. Siniša Sovilj Fakultet informatike, Sveučilište Jurja Dobrile u Puli 1. Uvod Zadatak projekta je bio kreirati R paket koji omogućuje sakupljanje i vizualizaciju hrvatskih makroekonomskih podataka. Kreiran je paket pod nazivom SiVHMP1 koji prikazuje vizualizaciju makroekonomskih proizvoda, te pomoću kojeg su svi podatci o makroekonomskim proizvodima dostupni na jednom mjestu. 2. Opis problema Državni zavod za statistiku je državna organizacija koja javno objavljuje svoje poslove. Korisnici mogu besplatno pretražiti statističke informacije, baze podataka i elektroničke publikacije. Paket SiVHMP1 skuplja podatke sa Državnog zavoda za statistiku (https://www.dzs.hr) i Hrvatske narodne banke(https://www.hnb.hr/statistika ). Podaci su klasificirani prema institucionalnim sektorima i financijskim instrumentima. Paket skuplja podatke vezane uz makroekonomske pokazatelje kao što su BDP, kamatna stopa, inflacija 3. Metoda Kako bi se kreirao vlastiti paket potrebno je instalirati neke alate: devtools koji se koristi za kompajliranje paketa, roxygen2 koji služi za kreiranje dokumentacije. Podatke o BDP-u godišnje i po kvartalima prikupili smo sa DZS-a, a možemo ih dohvatiti naredbom plotbdpgodina i plotbdpkvartal1. 4. Rezultati Tablica i pozivanje plota kroz paket Paket SiVHMP1 sadrži 53 različitih tablica sa makroekonomskim indikatorima vezani uz hrvatsku ekonomiju čije se datoteke preuzimaju iz ažuriranih izvora i prikazuju u obliku tablice. Funkcijama paketa moguće je i vizualizirati odgovarajuće tablice pozivom naredbe plotbdpgodina (godisnja vizualizacija) ili plotbdpkvartal (kvartalna vizualizacija), također je napravljena vizualizacija za 15 drugih tablica. Obe funkcije kao argument primaju stupac kojeg korisnik želi vizualizirati te naziv stupca. 5. Zaključak Paket SiVHMP1 služi za skupljanje i vizualizaciju podataka, točnije za umetanje podataka u tablice koji se preuzimaju iz ažuriranih izvora. Također paket omogućuje pretraživanje podataka, kroz uređene tablice. SiVHMP1 paket omogućuje jednostavniji pristup podacima koji su grupirani i nalaze se na jednom mjestu čime se olakšava sama analiza podataka. Help tablica BDP Primijenjena statistika, ak. god. 2018/2019

ORGANIZACIJA: Sveučilište Jurja Dobrile u Puli Fakultet informatike Diplomski studij Informatike, 1. godina Primijenjena statistika, Ak.g. 2018./2019. Voditelji: doc.dr.sc. Siniša Sovilj (ssovilj@unipu.hr) i Ingrid Hrga mag.oec. (inhrga@unipu.hr)