Uputstvo za izradu seminarskog rada 2018/19. Pronalaženje informacija Cilj seminarskog Cilj seminarskog je evaluacija automatskog prepoznavanja geopolitičkih imena u novinskom tekstu na srpskom jeziku. Od geopolitičkih imena se prepoznaju: Imena država etikta <top.dr> Imena naseljenih mesta (gradovi, sela, ) etiketa <top.gr> Imena vodenih površina (reke, mora, jezera ) etiketa <top.hyd> Imena geografskih površina (planine, vulkani, ostrva ) etiketa <top.geo> Imena regiona unutar država (uključujući i federalne države) etiketa <top.reg> Imena delova gradova etiketa <top.deogr> Imena nad-regiona (koji obuhvataju više država, ili se prostiru preko više država) etiketa <supreg> Primeri ispravno obeleženih delova teksta ovim etiketama Za države i gradove: </seg><seg>druga grupa je u <top.gr>palermu</top.gr> gde igraju <top.dr>italija</top.dr>, <top.dr>crna Gora</top.dr>, <top.dr>nemačka</top.dr> i <top.dr>rusija</top.dr>, i iz koje dve ekipe idu dalje, kao i u mađarskom <top.gr>kečkemetu</top.gr>, gde učestvuju domaćin, <top.dr>španija</top.dr>, <top.dr>francuska</top.dr>, <top.dr>rumunija</top.dr> i <top.dr>gruzija</top.dr>. Vodene površine: Kako se navodi, zemljotres je registrovan nešto pre dva sata posle ponoći u <top.hyd>jonskom moru</top.hyd> zapadno od Zakintosa, na dubini od pet kilometara. Geografske površine izjavio je danas direktor UNICEF-a u <top.dr>srbiji</top.dr> Majk Sent Lot na <top.geo>kopaonik</top.geo> biznis forumu. Regioni: Trener američkog fudbala u srednjoj školi u gradu <top.gr>parklendu</top.gr> na <top.reg>floridi</top.reg> poginuo je u oružanom napadu na školu, u pokušaju da spase svoje učenike. Delovi gradova:
Voždovačko-vinčanska, sa sedištem na <top.deogr>voždovcu</top.deogr>, i Zemunskonovobeogradska, čiji će vladika sedeti na <top.deogr>novom Beogradu</top.deoGr>, navode "Novosti". Nadregioni: Istovremeno i makedonska dijaspora održala je proteste u <top.supreg>evropi</top.supreg>, <top.gr>vašingtonu</top.gr> i <top.gr>sidneju</top.gr> u <top.dr>australiji</top.dr>, gde je zapaljena grčka zastava, kao i fotografija Zorana Zaeva, navodi Rojters. Kako treba vršiti evaluaciju Proverava se ispravnost prepoznavanja geopolitičkih imena. Što se tiče imena moguće su sledeće situacije: 1. Ime u potpunosti dobro određeno; 2. Ime je delimično dobro određeno, npr. jeste geopolitičko ime ali njegova vrsta nije dobro određena ili opseg imena nije dobar (nisu označeni svi delovi imena ili je obuhvaćeno etiketom nešto što ne pripada imenu); 3. Označeno je nešto što uopšte nije geopolitičko ime 4. Geopolitičko ime u tekstu nije uopšte označeno. 5. Geopolitičko ime u tekstu nije uopšte označeno jer je pogrešno otkucano. Slučaj 1 U slučaju 1, i takvih bi trebalo da bude najviše, ne treba ništa raditi. Takvi su svi slučajevi iz prethodno datih primera. Pod ispravno prepoznatim imenima podrazumevaju se i stara geopolitička imena (npr. danas nepostojećih država primer 1a), kao i imena država data skraćenicama (primer 1b). Primer 1a: Bio je aktivan u mnogim mirovnim, antiratnim organizacijama i pokretima u bivšoj <top.dr>jugoslaviji</top.dr> i <top.dr>srbiji</top.dr>, posebno tokom ratova devedesetih godina prošlog veka. Primer 1b: Tramp danas potpisuje novu uredbu o zabrani ulaska u <top.dr>sad</top.dr>? Ako je geopolitičko ime deo nekog drugog imena, na primer organizacije, onda je i to ispravno prepoznato ime (primer 1c) Primer 1c: Ministra Mrkonjića upoznao sam i sa aktivnostima na privatizaciji i restrukturiranju preduzeća iz oblasti saobraćaja, prvenstveno "Luke Bar" i "Železnice <top.dr>crne Gore</top.dr>".
U ovom slučaju ime države Crna Gora je prepoznati i tagirano (kao deo organizacije), dok ime grada Bar nije pa tu treba dodati etiketu s atributom EV= MISS (vidi slučaj 4) Ministra Mrkonjića upoznao sam i sa aktivnostima na privatizaciji i restrukturiranju preduzeća iz oblasti saobraćaja, prvenstveno "Luke <top.gr EV= MISS >Bar</top.gr>" i "Železnice <top.dr>crne Gore</top.dr>". Slučaj 2 U svim ostalim situacijama treba dodati ili atribut uz postojeću etiketu, ili celu etiketu. Slučaj 2 znači da je geopolitičko ime delimično tačno označeno. Primer 2a: Kako kaže, puštanjem u rad prve mini hidroelektrane "Beli kamen" na ušću <top.gr>ribnice</top.gr> u Crni <top.hyd>rzav</top.hyd>, Zlatibor je dobio prve megavate svoje "zelene energije". U ovom primeru je prepoznat samo deo geopolitičkog imena reka Crni Rzav pa treba dodati atribut EV sa vrednošću UOKo uslovno tačno, s pogrešnim opsegom. Drugo geopolitičko ime reka Ribnica je označeno kao grad pa treba dodati atribut EV sa vrednošću UOKt uslovno tačno, s pogrešno određenim tipom. U ovom slučaju Zlatibor nije prepoznat kao planina pa treba dodati celu etiketu. Rezultat: Kako kaže, puštanjem u rad prve mini hidroelektrane "Beli kamen" na ušću <top.gr EV= UOKt >Ribnice</top.gr> u Crni <top.hyd EV= UOKo >Rzav</top.hyd>, <top.geo EV= MISS >Zlatibor</top.geo> je dobio prve megavate svoje "zelene energije". Primer 2b: Policija <top.hyd>severne</top.hyd> <top.dr>irske</top.dr> saopštila je danas da je uhapsila dvojicu muškaraca, starih 17 i 37 godina, povezanih sa sinoćnjim ubistvom policajca Stefana Karola u blizini <top.gr>belfasta</top.gr>. U ovom primeru je jedno geopolitičko ime region Severna Irska u okviru UK razdvojeno na dva i oba su pogrešno etiketirana: kao reka (Severn iz UK) i država Irska. Svakom treba dodati atribut EV sa vrednošću UOKot uslovno tačno, s pogrešnim opsegom i pogrešnim tipom. Policija <top.hyd EV= UOKot >Severne</top.hyd> <top.dr EV= UOKot >Irske</top.dr> saopštila je danas da je uhapsila dvojicu muškaraca, starih 17 i 37 godina, povezanih sa sinoćnjim ubistvom policajca Stefana Karola u blizini <top.gr>belfasta</top.gr>. Slučaj 3 Slučaj 3 znači da je nešto označeno kao geopolitičko ime a ne radi se o takvom imenu. Primer 3:
Ovo je, pod jedan, za nas daleko veći uspeh, a sigurno da je osvajanje <top.hyd>kupa</top.hyd> dovelo do bržeg oporavka za razliku od rivala koji je taj Kup izgubio u finalu. Ovde je Kupa obeležena kao ime reke, što u ovom slučaju nije, pa treba dodati uz etiketu atribut EV sa vrednošću NOK Ovo je, pod jedan, za nas daleko veći uspeh, a sigurno da je osvajanje <top.hyd EV= NOK >Kupa</top.hyd> dovelo do bržeg oporavka za razliku od rivala koji je taj Kup izgubio u finalu. Slučaj 4 Slučaj 4 znači da geopolitičko ime nije uopšte označeno pa treba dodati celu etiketu: Primer 4a: Kako se navodi, zemljotres je registrovan nešto pre dva sata posle ponoći u <top.hyd>jonskom moru</top.hyd> zapadno od Zakintosa, na dubini od pet kilometara. Ime ostrva Zakintos nije prepoznato pa treba daodati celu etiketu s atributom za evaluaciju EV koji treba da dobije vrednost MISS što znači da je cela etikea propuštena. Rezultat: Kako se navodi, zemljotres je registrovan nešto pre dva sata posle ponoći u <top.hyd>jonskom moru</top.hyd> zapadno od <top.geo EV= MISS >Zakintosa</top.geo>, na dubini od pet kilometara. Treba razlikovati imena država od prideva istog oblika. Reči u pridevskoj funkciji ne treba da budu označene kao države pa u takvom slučaju NE treba dodavati atribut EV= MISS (primer 4b). Primer 4b: Nemačka kancelarka Angela Merkel pohvalila je premijera <top.dr>srbije</top.dr> Aleksandra Vučića za reforme koje je sproveo u svojoj zemlji omogućivši tako ekonomski boljitak. U ovom primeru je sve dobro obeleženo i ne treba ništa dodavati. Slučaj 5 Slučaj 5 znači da je u tekstu bila neka greška i da ime verovatno zbog toga nije prepoznato. Treba dodati odgovarajuću etiketu s atributom EV čija je vrednost ERR. Primer 5: Takođe je naveo da izgradnjom još dve mini hidroelektrane u Semegnjevu, "uz maksimalne napore zlatiborske lokalne samouprave", Cajetina postaje i ekološka opština. U ovom primeru ime sela Semegnjevo nije prepoznato, kao ni ime varošice Čajetina u ovom drugom slučaju jer nije dobro otkucano. Treba da postane:
Takođe je naveo da izgradnjom još dve mini hidroelektrane u <top.gr EV= MISS >Semegnjevu</top.err>, "uz maksimalne napore zlatiborske lokalne samouprave", <top.gr EV= ERR >Cajetina</top.gr> postaje i ekološka opština. Napomena: Za svako ime koje vam nije poznato, npr. selo Semegnjevo u prethodnom primeru, treba da proverite na internetu (ili drugde) o čemu se radi i da postupite na odgovarajući način.