Data Webhouse (Document-Driven DSS) DW 1
Namena data warehouse sistema je da transformiše podatke dobijene iz postojećeg transakcionog sistema, u oblik pogodan za sprovoñenje analiza i obradu nekim od alata za poslovno odlučivanje. veliki troškovi za softver i hardver 2
Način poboljšanja performansi: - hardver za paralelno procesiranje - skladištenje velikih količina podataka i - relacioni OLAP prilagoditi Web tehnologiji. Data warehouse zasnovan na upotrebi već razvijenih Web browser-a sa komunikacionim protokolima i servisima - Webhouse 3
Webhouse Šta je Webhouse? Pristup i upiti nad podacima iz Warehouse-a putem standardnog web browser-a Zašto Warehouse na Web-u? Omogućava pristup i ažuriranje sa udaljenih lokacija Jednostavan je za krajnjeg korisnika Raspolaže uvek ažurnim podacima DW 4
Način realizacije webhouse - Gradnjom skladišta od početka; - Prilagoñavanjem i razvijanjem postojećeg data warehouse-a u webhouse 5
Osnovne karakteristike Webhouse-a: 1. dovoñenje Web-a u warehouse 2. slanje warehouse-a na Web - Prva karakteristika se ostvaruje kroz tzv. clickstream koji sadrže sirove, neobrañene podatke o ponašanju posetilaca odreñenih sajtova. - Druga se odnosi na pripremanje podataka iz data warehouse-a za prikazivanje na Web-u. 6
Dovoñenje Web-a u warehouse - praćenje akcija korisnika sajtova, - analiziranje korisničkih komunikacija u realnom vremenu, - analiziranje tehnike za prikupljanje podataka o kupcima, - dizajniranje Web-sajtova da podrže warehousing, - dizajniranje Web-enabled Data Marts (skladišta podataka organizovanih na data warehousing konceptu, orijentisanih na jedan konkretan problem) 7
Stavljanje warehouse-a na Web: dizajniranje na osnovu iskustva za tri osnovne vrste korisnika: - kupca, - posetioca i - samog vlasnika sajta, izvoñenje upita i izrada izveštaja, izgradnja javnog webhouse-a i njegovo izlaganje u javnost, sigurnosna obrada data webhouse-a i manipulacija webhouse projektima. 8
Pogodnosti koju webhouse daje u odnosu na klasični data warehouse: mogućnost interakcije i analitičkog procesa u realnom vremenu pomoću paralelnog procesiranja; prijem gotovih analiza i odgovaranje na sve transakcije u poslovanju beleženjem svih clickstream-ova; kratko vreme odgovora na postavljene upite korisnika što se postiže samom arhitekturom webhouse-a. 9
Različitim kategorijama korisnika podaci se mogu prikazivati na različite načine na osnovu već pripremljenih mustri-patterna, u čemu veliku ulogu može imati XML Samom Data webhouse-u se može pristupiti i preko tzv. Private Firewall-a (Privatni spoljni zid) ili ureñaja koji štiti webhouse od neovlašćenog pristupa podacima i metodama Hot Response Cache Server (Server Keša brzog odziva) zadovoljavaja potrebe Public Web Servera za brzim (uglavnom na odreñeni Data Webhouse Application Server (Server za način unapred pripremljenim) podacima Data Webhouse aplikacije) i Relational DBMS i OLAP Server (Server Relacionog SUBP i OLAP-a) pripremaju "vruće" podatke potrebne za Hot Response Cache Server. Web Server i Application Server čija je funkcija potpuno nezavisna od Data webhouse sistema i nalaze se van Document, webhouse-a. Image and Media Server (Server za dokumente, slike i multimediju) drži sve tzv. statičke i pomoćne podatke iz sistema Unapred pripremljeni, na osnovu iskustva odreñeni podaci nalaze se na Aplikacionom serveru 10
11
Problemi: - Sigurnost i zaštita podataka i način njihovog učitavanja i stavljanja na raspolaganje; - Prilagoñavanje interfejsa za višekorisničke varijante; - Prilagoñavanje browser-a za dinamičke analize; - Integracija sa postojećim aplikacijama koje nisu razvijene za Web okruženje. 12
WEBHOUSE MODEL i XML Dimenzionalni data webhouse ili Dimenzionalni data mart clickstream-a. Informacije o običajima i navikama posetilaca 13
WEBHOUSE MODEL i XML Model se bavi: - podacima o vremenu pristupa sajtu, - podacima o korisniku, - stranicama koje su posećene, - specijanim kontrolama (npr. da li je stranica potpuno učitana), - podacima iz cookie-ja o korisniku. Iz toga se s izvla lače: -činjenična tabela clickstream-a i - dimenzione tabele u okviru šeme zvezde. 14
Najviše vremena i napora odnose procesi - ekstarkcije-preslikavanja - transformacije - učitavanja iz nasleñenog sistema u data warehouse. XML je idealno rešenje za poslove ETL (extracting, transforming, loading) krozčitavo Web okruženje. 15
XML pomoć dizajnerima ima data webhouse-a pri: - ekstrakciji podataka iz nasleñenog sistema; - prihvatu transakcija učitavanja; - direktnom smeštanju XML-a u obliku relacije; - informacionom obezbeñivanju korisničke strane. XML može biti konačni korak u postavljanju i manipulaciji upitnim i izveštajnim alatima na računaru krajnjeg korisnika. 16
Korišćenje podataka clickstream-a - Brzo prikazivanje različitih podataka korisnicima - Unapred pripremljene podatke prikazati različitim korisnicima koji ih žele na različite načine, a da pri tome koriste različite browsere i različite operativne sisteme 17
Dimenzionalni model Data Mart clickstream-a Činjenična tabela Dimenzione tabele 18 Dimenzione tabele
Kretanje podataka u Data Webhouse sistemu 19
PREDNOSTI PRIMENE XML-a a za Data Webhouse: - Umesto da se podaci prevode iz tačke u tačku, sa XML-om mogu se uneti i izneti opšti formati pomoću opštih alata. - Dostupni su XML alati za kreiranje, ocenjivanje, smeštanje i prevoñenje XML dokumenata 20
VARIJANTE REALIZACIJE ČINJENIČNIH TABELA Kreiranje: 1. odvojenih činjeničnih tabela za svaki tip transkacije -može nepotrebno da komplikuje realizaciju, 2. velike činjenične tabele koja će sadržati sve elemente koji mogu biti dodeljeni XML zapisu. (najlakši za realizaciju, ogroman broj nepopunjenih polja), 21
VARIJANTE REALIZACIJE ČINJENIČNIH TABELA 3. hibridne činjenične tabele u kojoj se nalaze svi važni elementi svakog tipa transakcije, i spajanjem transkacija u kompozitne činjenične zapise, umesto prikaza činjenice na transkacionom nivou, 4. generičkih ime-vrednost parova koji dopuštaju maksimalnu fleksibilnost izrade i najefikasnije korišćenje masivne memorije. (Ovaj pristup zahteva mnogo istraživanja u radu, puno dokumentacije i obuke onih koji ce raditi sa podacima, kako bi znali kojiće se elementi nalaziti u kojim ime-vrednost parovima). 22
ZAKLJUČAK: AK: Bilo da se data warehouse prebacuje na Web, ili podaci s Web-a smeštaju u data warehouse, dobija se nova, napredna, moćna i jeftina tehnologija koja ima višestruku namenu; Povećava se brzina odziva višedimenzionalnih OLAP sistema rasporedom servera, paralelnim procesiranjem i keširanjem podataka; Upotrebom XML markerskog jezika olakšava se rad sa strukturama podataka koje stižu sa Web-a i smeštaju se u bazu podataka, ili se prikazuju na Web-u u različitim oblicima. 23
Poboljšanja koja se u budućnosti očekuju u Webhouse sistemima ima : - Upotreba generičkih algoritama; - Upotreba inteligentnih agenata; - Upotreba novih načina indeksiranja; - Novi načini pretraživanja podataka. 24