PowerPoint Presentation

Слични документи
4 dan - DWeb

Р273 Пројектовање база података Примери питања за колоквијум 1. Навести најважније моделе података кроз историју рачунарства до данас. 2. Објаснити ос

Универзитет у Београду Факултет организационих наука Коначан распоред испита за предмете Мастер академских студија Испитни рок: ОКТОБАР Предмет

Универзитет у Београду Факултет организационих наука Распоред испита за предмете мастер академских студија Испитни рок: Јун Предмет Датум Време

DUBINSKA ANALIZA PODATAKA

1 NOVO U MNG CENTRU!!! OVLADAJTE TEHNOLOGIJOM IZRADE JAVA EE APLIKACIJA KORIŠ C ENJEM ORACLE ADF-A O - Otkrijte brzinu razvoja aplikacija sa ADF-om -

UNIVERZITET U NOVOM SADU TEHNIČKI FAKULTET MIHAJLO PUPIN ZRENJANIN TEHNOLOGIJE DISTRIBUIRANIH INFORMACIONIH SISTEMA - Skripta za teorijski deo (RADNA

ASAS AS ASAS

ASAS AS ASAS

ASAS AS ASAS

ASAS AS ASAS

Microsoft PowerPoint - Topic04-Serbian.ppt

Model podataka

PowerPoint Presentation

Microsoft Word - Master 2013

Microsoft Word - Master 2013

Pojačavači

Структура модула студијског програма МЕНАЏМЕТ И ОРГАНИЗАЦИЈА

Analitička obrada IS za podršku odlučivanju

ASAS AS ASAS

ASAS AS ASAS

DUBINSKA ANALIZA PODATAKA

SPO

PowerPoint Presentation

1. Šta su transakcioni sistemi i čemu služe? Pitanja za odbranu prvog domaćeg zadatka: Svakodnevno belezenje podataka o izvrsenim transakcijama online

РАСПОРЕД ИСПИТА У ИСПИТНОМ РОКУ ЈАНУАР 1 ШКОЛСКЕ 2016/2017. ГОДИНЕ (последња измена ) Прва година: ПРВА ГОДИНА - сви сем информатике Име пр

Tеорија одлучивања

PowerPoint-Präsentation

Рачунарска интелигенција

ЈЕДАН НОВИ ПРИСТУП У ПРЕВОЂЕЊУ ИЗ BPMN а У BPEL ONE NEW APPROACH IN TRANSLATING FROM BPMN TO BPEL Александар Недељковић Факултет организационих наука,

PowerPoint Presentation

Microsoft Word - vodicitm.doc

Satnica.xlsx

UNIVERZITET UKSHIN HOTI PRIZREN FAKULTET RAČUNARSKIH NAUKA PROGRAM: TIT - BOS NASTAVNI PLAN-PROGRAM SYLLABUS Nivo studija Bachelor Program TIT-Bos Aka

Slide 1

Microsoft PowerPoint - GR_MbIS_12_IDEF

Banka iz ugla klijenta, klijent iz ugla banke POZIV NA OTVORENI SPECIJALISTIČKI SEMINAR Banka iz ugla klijenta, klijent iz ugla banke Termin: 29. mart

Microsoft Word - III godina - EA - Metodi vjestacke inteligencije

ekonferencije.com stručni i naučni skupovi, seminari i konferencije

АНКЕТА О ИЗБОРУ СТУДИЈСКИХ ГРУПА И МОДУЛА СТУДИЈСКИ ПРОГРАМИ МАСТЕР АКАДЕМСКИХ СТУДИЈА (МАС): А) РАЧУНАРСТВО И АУТОМАТИКА (РиА) и Б) СОФТВЕРСКО ИНЖЕЊЕ

SINTEZA 2019 INTERNATIONAL SCIENTIFIC CONFERENCE ON INFORMATION TECHNOLOGY AND DATA RELATED RESEARCH ADVANCED COMPUTING AND CLOUD COMPUTING INTELIGENT

PowerPoint Presentation

Perspektive BI

INFORMACONI SISTEMI U TRGOVINI

Microsoft PowerPoint - IS_G_predavanja_ [Compatibility Mode]

Microsoft Word - MODULI AGENDA.docx

Menadzment - principi i koncepti STAVRIC, VASIC.1.1

Satnica.xlsx

Tema 8 – Ekspertni sistemi

08_03

ASAS AS ASAS

( )

Microsoft Word - REGIONALNA EKONOMIJA EVROPSKE UNIJE_Ispit.doc

Softversko inženjerstvo

ПА-4 Машинско учење-алгоритми машинског учења

Satnica.xlsx

Raspored ispita - juni NNV.xlsx

Technology management performance indicators in global country rankings

Baze podataka

PowerPoint Presentation

Satnica.xlsx

GODIŠNJI KALENDAR ISPITA Inženjerski menadžment (OSNOVNE AKADEMSKE STUDIJE) ŠKOLSKA 2018/2019. GODINA Rbr

Inženjering informacionih sistema

Upitni jezik SQL

METOD ZA PROCENU SISTEMA POSLOVNE INTELIGENCIJE KOJI PODRŽAVAJU DATA MINING EVALUATION METHOD OF BUSINESS INTELLIGENCE SYSTEMS WHICH SUPPORT DATA MINI

Microsoft Word - Opis Programa.docx

KAKO BRŽE DO POSLA ZA StrukovnOG inženjerA zaštite životne sredine

RA

QFD METODA – PRIMER

PowerPoint Presentation

МЕНАЏМЕНТ ЉУДСКИМ РЕСУРСИМА И ВЕШТИНЕ КОМУНИЦИРАЊА МАСТЕР АКАДЕМСКЕ СТУДИЈЕ Мастер менаџмент у систему здравствене заштите ДРУГИ СЕМЕСТАР школска 2018

Projektovanje informacionih sistema i baze podataka

FAKULTET INFORMACIONIH TEHNOLOGIJA R A S P O R E D Studijska grupa: POSLOVNA INFORMATIKA Školska godina: REDOVNI STUDIJ I godina II semesta

SRV_3_Ugradj_racun_sistemi_p [Compatibility Mode]

Slide 1

Microsoft Word - Akreditacija 2013

EKONOMSKI FAKULTET BEOGRAD

Microsoft Word - Akreditacija 2013

Modernisation of Post-Graduate Studies in Chemistry and Chemistry Related Programmes Tempus UK-Tempus-JPCR WORK PACKAGE 3 WP Type 3,3

Microsoft Word - Akreditacija 2013

SVEUČILIŠTE U ZAGREBU FAKULTET ORGANIZACIJE I INFORMATIKE V A R A Ž D I N Vedran Grbavac RUDARENJE PODATAKA KAO METODA UPRAVLJANJA ZNANJEM ZAVRŠNI RAD

PowerPoint Presentation

Predmet: Marketing

Microsoft Word - Akreditacija 2013

Slide 1

PITANJA I ZADACI ZA II KOLOKVIJUM IZ MATEMATIKE I Pitanja o nizovima Nizovi Realni niz i njegov podniz. Tačka nagomilavanja niza i granična vrednost(l

Program_digitalna_akademija_2019_F

Opsta nacela nepristrasnosti

Microsoft Word - Akreditacija 2008

FAKULTET ORGANIZACIONIH NAUKA

Kolaborativno-na-Moodle

PowerPoint Presentation

Klasifikacija slika kucnih brojeva dubokim konvolucijskim modelima

Microsoft Word - Smerovi 1996

Introduction to Programming

Rani znaci upozorenja (EWS) u cilju prevencije nastanka rizičnih plasmana POZIV NA OTVORENI SPECIJALISTIČKI SEMINAR Rani znaci upozorenja (EWS) u cilj

OBRAZAC 1. Vrednovanje sveucilišnih studijskih programa preddiplomskih, diplomskih i integriranih preddiplomskih i diplomskih studija te strucnih stud

FAKULTET ORGANIZACIONIH NAUKA

Транскрипт:

Data mining kocepti i tehnike

Udžbenik: Data Mining: Concepts and Techniques, Jiawei Han, Micheline Kamber Introduction to Data Mining, Pang-Ning Tan, Michael Steinbach, Vipin Kumar Ocjenjivanje: kolokvijumi (35% + 35%), prezentacija (5%), projekat (10%), domaći zadaci (15%)

Pregled kursa Glava 1: Uvod Glava 2: Data warehousing i OLAP Glava 3: Pre-procesiranje podataka Glava 4: Arhitektura data mining sistema Glava 5: Opisivanje koncepata, karakterizacija i poređenje Glava 6: Asocijativna analiza Glava 7: Klasifikacija i regresija Glava 8: Klasterizacija Glava 9: Rudarenje složenih tipova podataka Glava 10: Primjene i trendovi razvoja data mining-a

Glava 1. Sadržaj Motivacija: zašto data mining? Šta je data mining? Data mining: koji tipovi podataka? Data mining tehnike Šta je znanje? Klasifikacija data mining sistema Osnovni koncepti data mining-a

Motivacija Eksplozija podataka: tehnologija baza podataka proizvela je velike količine podataka We are drowning in data, but starving for knowledge! Rješenje: Data warehousing i OLAP Rudarenje korisnog znanja (pravila, ograničenja itd.) iz podataka

Razvoj tehnologije baza podataka 1960: AOP 1970: Relacioni model i SUBP 1980: napredni modeli podataka i specijalizovani SUBP 1990: data mining, data warehousing

Šta je data mining? Data mining: pronalaženje korisnog znanja u velikim bazama podataka Knowledge Discovery in Databases (KDD) Šta nije data mining? Procesiranje upita Ekspertni sistemi Sistemi za mašinsko učenje

Zašto data mining? Potencijalne primjene:... Upravljanje i analiza tržišta Upravljanje i analiza rizika Medicina Nauka Inžinjerstvo

Potencijalne primjene Upravljanje i analiza tržišta Kreiranje marketinških kampanja, analiza potrošačkih navika itd. Izvor podataka mogu da budu baze transakcija velikih supermarketa Rezultati analize Grupe klijenata koji imaju zajedničke potrošačke navike, godišnje prihode itd. Zavisnost prodaje jednih proizvoda od drugih

Data mining i KDD Data mining je najvažniji u KDD Procjena znanja Podaci za rudarenje Data Mining Data Warehouse Čisćenje i integracija podataka Selekcija i transformacija podataka Baze podataka

Knowledge discovery in databases Čišćenje podataka je eliminacija šuma, nekonzistentnosti u podacima itd. Integracija podataka je objedinjavanje podataka iz više izvora Transformacija je prevođenje podataka u formu pogodnu za primjenu data mining algoritama (npr. normalizacija, agregacija) Selekcija je generisanje podataka koji su potrebni za analizu

Preprocesiranje podataka

Knowledge discovery in databases (2) Data mining je izbor i primjena algoritama da bi se prepoznali sakriveni šabloni u podacima Procjena otkrivenih znanja na osnovu utvrđene mjere identifikuje korisne šablone Prezentacija znanja je grafičko predstavljanje otkrivenog znanja

Arhitektura data mining sistema GUI Čišćenje i integracija podataka Procjena znanja Data mining sistem Server BP ili data warehouse server selekcija Baza znanja Baze podataka Data Warehouse

Data mining: koji tipovi podataka? Relacione baze podataka Data warehouse sistemi Transakcione baze podataka Napredne baze podataka Objektno-orijentisane i objektno-relacione baze podataka Prostorne baze podataka Vremenske baze podataka Multimedijalne baze podataka WWW

Data mining tehnike (1) Opisivanje klasa/koncepata Karakterizacija ciljne klase/koncepta Poređenje ciljne klase sa suprotavljenom klasom ili klasama Asocijativna analiza godine(x, 20..29 ) && prihodi(x, 20..29K ) kupuje(x, PC ) [support = 2%, confidence = 60%]

Data mining tehnike (2) Klasifikacija i regresija Konstrukcija modela koji opisuju različite klase Prezentacija modela: drveta odlučivanja, neuronske mreže itd. Regresija: predviđa se brojna vrijednost Klasterizacija Grupisanje podataka u klase Princip: maksimizacija sličnosti unutar klastera i minimizacija sličnosti van klastera

Šta je korisno znanje? Pravilo je korisno ako je lako razumljivo, validno na novim ili testnim podacima sa određenom tačnošću, prethodno nepoznato i potencijalno upotrebljivo. Objektivne i subjektivne mjere korisnosti Kompletnost: generisati sva pravila Optimizacija: generisati samo korisna pravila

Data mining, interdisciplinarnost Baze podataka Statistika Mašinsko učenje Data Mining Vizualizacija Kompjuterske nauke Ostale discipline

Klasifikacija data mining sistema Na osnovu funkcionalnosti: Deskriptivni Prediktivni Na osnovu Tipa baze podataka Tipa znanja koji se otkriva Upotrijebljenih tehnologija Domena primjene