1 StatsModels 1. Pozadina: Scipy.stats.models originalno je napisao Jonathan Taylor. Neko vrijeme bio je dio scipy paketa, ali je uklonjen. Tijekom Go

Слични документи
Sveucilište u Zagrebu

Slide 1

Slide 1

Univerzitet u Beogradu Mašinski fakultet Konstrukcija i tehnologija proizvodnje letelica PODEŠAVANJE PROGRAMSKOG PAKETA CATIA V5 Miloš D. Petrašinović

SVEUČILIŠTE U ZAGREBU AGRONOMSKI FAKULTET Sara Matanović PROCJENA GENETSKIH PARAMETARA BINOMNE VARIJABLE KORISTEĆI GLIMMIX SAS PROCEDURU DIPLOMSKI RAD

Klasifikacija slika kucnih brojeva dubokim konvolucijskim modelima

QlikView Training

Matematika 1 - izborna

Istraživanje kvalitete zraka Slavonski Brod: Izvještaj 3 – usporedba podataka hitnih medicinskih intervencija za godine i

Microsoft PowerPoint - Ispitivanje povezanosti Regresija redovni decembar 2007 [Compatibility Mode]

zefg10

Microsoft Word - 6. RAZRED INFORMATIKA.doc

Postojanost boja

Mladen Pavičić: Grafičko računanje kvantno-mehaničkih nelinearnih jednadžbi Projekt: Kvantno računanje: paralelnost i vizualizacija ( )

Biz web hosting

ELEKTROTEHNIČKI FAKULTET, UNIVERZITET U BEOGRADU KATEDRA ZA ELEKTRONIKU UVOD U ELEKTRONIKU - 13E041UE LABORATORIJSKA VEŽBA Primena mikrokontrolera

Microsoft PowerPoint - NAD IR OS pravila 2017.pptx

kriteriji ocjenjivanja - informatika 8

UPUTE ZA OBLIKOVANJE DOKTORSKE DISERTACIJE Doktorska disertacija se piše na hrvatskom standardnom jeziku. Disertacija može biti napisana na nekom od s

Rano učenje programiranj

Instalacija R-project softvera Univerzitet u Novom Sadu April 2018 Contents 1 Uvod 2 2 Instalacija R: Instalacija

No Slide Title

DUBINSKA ANALIZA PODATAKA

Kick-off meeting VIK

Microsoft PowerPoint - Programski_Jezik_C_Organizacija_Izvornog_Programa_I_Greske [Compatibility Mode]

Kombinatorno testiranje

EUROPEAN

PROJEKT UNAPRJEĐENJE PISMENOSTI U ZDRAVSTVENOM UČILIŠTU UP Danijel Kolarid PRIMIJENJENA TRIGONOMETRI

M. Grüner i sur.: Komparacija dviju metoda... Mljekarstvo 43 (1) 49 54, Komparacija dviju metoda utvrđivanja laktoze u sirutici* Matilda Grüner,

E PROJEKTI d.o.o. Maksimirska Zagreb t: (01) f: (01) e. [IZMJENE I DOPUNE PROSTOR

Web programiranje i primjene - Osnovni pojmovi WEB tehnologije korišteni u kolegiju

Hej hej bojiš se matematike? Ma nema potrebe! Dobra priprema je pola obavljenog posla, a da bi bio izvrsno pripremljen tu uskačemo mi iz Štreberaja. D

Microsoft PowerPoint - 13 PIK (Mentor Graphic ASIC).ppt

УНИВЕРЗИТЕТ У НОВОМ САДУ

P11.3 Analiza zivotnog veka, Graf smetnji

Recuva CERT.hr-PUBDOC

Slide 1

Slide 1

BUG.HR mediakit 2018

Microsoft Word - izv_rapid_2018popunjen.doc

KATUŠIĆ ANTONIO.pdf

SEMINAR

Funkcije predavač: Nadežda Jakšić

Microsoft Word - KORISNIČKA UPUTA za pripremu računala za rad s Fina potpisnim modulom_RSV_ doc

Sveučilište u Zagrebu PMF Matematički odsjek Mreže računala Vježbe 10 Zvonimir Bujanović Luka Grubišić Vinko Petričević

IRL201_STAR_sylab_ 2018_19

CPHP_19

Slide 1

Microsoft PowerPoint - podatkovni promet za objavu.pptx

Slide 1

Microsoft Word - 15ms261

GLOBALNI IZVEDBENI PLAN I PROGRAM ZA IZVOĐENJE NASTAVE GEOGEBRE U OSNOVNOJ ŠKOLI (matematička grupa, 1 sat tjedno) 6. razred (35 sati) I. Uvod u GeoGe

M-2-Kvadratna jednadžba 2. KVADRATNE JEDNADŽBE 2.1. Kvadratna jednadžba Primjeri: 1 Matematika 2 kvadratna jednadžba kompletno riješ

PRIRODNO MATEMATIČKI FAKULTET U NIŠU DEPARTMAN ZA RAČUNARSKE NAUKE Utorak, godine PRIJEMNI ISPIT IZ INFORMATIKE 1. Koja od navedenih ekste

Sveučilište J.J. Strossmayera Fizika 2 FERIT Predložak za laboratorijske vježbe Određivanje relativne permitivnosti sredstva Cilj vježbe Određivanje r

Microsoft PowerPoint - PDPL FBF ZG SPEC uvodno 2013 I.ppt [Read-Only] [Compatibility Mode]

MAZALICA DUŠKA.pdf

Microsoft PowerPoint - Strukturni dijagrami, Gantogram - Planiranje [Compatibility Mode]

Slide 1

(Printing Maxima - Vje\236be 10.wxmx)

Slide 1

Korisničko uputstvo mobilne aplikacije Digitalni Kiosk 1

Božo Online upute

Универзитет у Нишу Електронски факултет Катедра за теоријску електротехнику Кратко упутство за коришћење програмског пакета FEMM 4.2 за израду вежби и

Elektrotehnička i prometna škola Osijek Istarska 3, Osijek tel: 031/ , fax: 031/ Projekt je sufinancira Europska uni

Funkcije predavač: Nadežda Jakšić

3 DNEVNI SEMINAR INTERNET POSLOVANJE TEME: 1. INTERNET POSLOVANJE 2. INTERNET MARKETING, INTERNET PR I ANALITIKA 3. UPRAVLJANJE SADRŽAJEM, DOMENE, HOS

Microsoft PowerPoint - vezbe 4. Merenja u telekomunikacionim mrežama

Uvod u statistiku

ПРИЛОГ 5 СЛОЖЕН ПОСЛОВНИ ПЛАН ЗА МЕРУ 3 1

MODEL ZADATKA ZA WSC MEĐUSEKTORSKU SMOTRU RADOVA ŠK.GODINA 2018/2019. ELEKTROTEHNIKA I RAČUNALSTVO Document filename prefix

Istraživačka analiza i model logističke regresije aktivnosti u LMS sustavu M. Matetic*, J. Canic* and M. Brkic Bakaric* * University of Rijeka, Depart

PowerPoint Presentation

Poslovanje preduzeća u Crnoj Gori u godini

PROGRAMIRANJE Program je niz naredbi razumljivih računalu koje rješavaju neki problem. Algoritam je postupak raščlanjivanja problema na jednostavnije

časopis br. 15,16,17. MONTENEGRIN SPORT ACADEMY, Sport Mont Dr Pavle Rubin Fakultet sporta i fi zičkog vaspitanja Novi Sad EFEKTI TRENINGA NA MERENE S

Državna matura iz informatike

Računarski praktikum I - Vježbe 09 - this, static

Daljinski upravljiva utičnica

I grupa 1. Napisati program koji izračunava i ispisuje zbir 4 najveća od pet brojeva unetih sa standardnog ulaza. ulaz izlaz Analiza: 1.

COMARC/A Format

Slide 1

Sveučilište J.J. Strossmayera Fizika 2 FERIT Predložak za laboratorijske vježbe Cilj vježbe Određivanje specifičnog naboja elektrona Odrediti specifič

1. OPĆE INFORMACIJE 1.1. Naziv kolegija Programiranje 1.6. Semestar Nositelj kolegija dr.sc. Bruno Trstenjak, v. pred Bodovna vrijednost

Kriteriji ocjenjivanja 6razred

PONUDA OGLASNIH PAKETA ZA AGENCIJE ZA NEKRETNINE U SRBIJI I CRNOJ GORI

QUALITY AUSTRIA CENTER DRAVSKA 11, BEOGRAD /

РЕПУБЛИКА СРБИЈА МИНИСТАРСТВО ПРИВРЕДЕ ДИРЕКЦИЈА ЗА МЕРЕ И ДРАГОЦЕНЕ МЕТАЛЕ Београд, Мике Аласа 14, ПП: 34, ПАК: телефон: (011)

R u z v e l t o v a 5 5, B e o g r a d, t e l : ( ) , m a i l : c o n t a c p s i t. r s, w w w. p s i t. r s

Program_digitalna_akademija_2019_F

SPR , IV godina, VHDL – Ispitna pitanja

Test iz Linearne algebre i Linearne algebre A qetvrti tok, U zavisnosti od realnog parametra λ rexiti sistem jednaqina x + y + z = λ x +

Транскрипт:

1 StatsModels 1. Pozadina: Scipy.stats.models originalno je napisao Jonathan Taylor. Neko vrijeme bio je dio scipy paketa, ali je uklonjen. Tijekom Google Summer of Code 2009. godine stats.models podvrgnut je brojnim testiranjima, proširenjima i ispravkama, nakon čega je prihvaden kao novi paket unutar Python-a. Od tada pa do danas stats.models se mijenjao, postojedi modeli su unaprijeđeni i dodane su nove statističke metode. 2. StatsModels? Python modul koji pruža klase i funkcije za procjenu različitih statističkih modela. Isto tako, možemo ga koristiti za provođenje statističkih ispitivanja, kao i za statistička istraživanja podataka. Opsežan popis statističkih rezultata stavlja se na raspolaganje svakom procjenitelju, nakon čega se ti rezultati uspoređuju sa postojedim da bi se osigurali da su ispravni. 3. Glavne značajke: Važno je napomenuti da je StatsModels pravi Python-ov paket i da koristi cython-ovu ekstenziju koja mu omoguduje brži rad. Cython je optimizirajudi statički kompajler za Python programski jezik i omoguduje korištenje C-ekstenzija unutar Python-a. 1

2 Sadržaj StatsModels-a: regression: Generalized least squares (including weighted least squares and least squares with autoregressive errors), ordinary least squares. glm: Generalized linear models with support for all of the one-parameter exponential family distributions. discrete: regression with discrete dependent variables, including Logit, Probit, MNLogit, Poisson, based on maximum likelihood estimators rlm: Robust linear models with support for several M-estimators. tsa: models for time series analysis o univariate time series analysis: AR, ARIMA o vector autoregressive models, VAR and structural VAR o descriptive statistics and process models for time series analysis nonparametric : (Univariate) kernel density estimators datasets: Datasets to be distributed and used for examples and in testing. stats: a wide range of statistical tests o diagnostics and specification tests o goodness-of-fit and normality tests o functions for multiple testing o various additional statistical tests iolib: Tools for reading Stata.dta files into numpy arrays. (not yet ported to Python 3) iolob: printing table output to ascii, latex, and html miscellaneous models 4. Sandbox: StatsModels sadrži sandbox mapu, koja uključuje dio izvornog stats.models kôda koji još nije ponovno pisan i testiran. Sandbox također sadrži modele i funkcije koje se trenutno razvijaju. Ovaj kod je u raznim fazama razvoja, nije dovoljno ispitan ili s API-jem koji je još uvijek u toku. Dio koda u poodmakloj fazi obuhvada između ostalog mješovite (ponovljena mjerenja) modele, GARCH modele,procjenitelje opde 2

3 metode momenata (GMM), kernel regresija i kernel procjena gustode, te razne ekstenzije za scipy.stats.distributions. 5. Početak: Napokon, došlo je vrijeme za primjer koji de nam pomodi da lakše shvatimo srž StatsModels paketa. Počevši od sirovih podataka, pokazat demo korake potrebne za procjenu statističkih modela i crtanje grafičkih podataka. Za početak, koristit demo samo osnovne statsmodels funkcije i njihove pandas i patsy ovisnosti. Pandas - pruža bogate strukture podataka i alate za analizu podataka Patsy - Python biblioteka za opisivanje statističkih modela i gradnju matrica Što se tiče podataka koje demo koristiti u ovom primjeru, poslužit de nam zbirka povijesnih podataka koji se koriste u prilog Andre-Michel Guerryevog eseja Moralna statistika Francuske iz 1883. Podatci su u CSV formatu i nalaze se online u Rdatasets repozitoriju. 3

4 Podatke možemo učitavati i na druge načine, pomodi iolib funkcija za input i output ili preko pandas.io metode. Naravno, možemo i brisati neželjene redove pomodu DataFrame metode iz pandas-a. 4

5 Stvarna motivacija i model Želimo znati da li su stope pismenosti u 86 francuskih odjela povezane s okladama na Royal lutriju po stanovniku u 1820. Moramo kontrolirati razinu bogatstva u svakom odjelu, a također želimo uključiti niz lažnih varijabli na desnoj strani naše regresijske jednadžbe za kontrolu nepromatranih heterogenosti zbog regionalnih učinaka.model se procjenjuje pomodu obične regresije najmanjih kvadrata (OLS). Da bi nam stala vedina modela koje pokriva statsmodels, moramo stvoriti dvije matrice, egzogenu i endogenu: Matrica endogene varijable(i) (dependent, response, regressand) Matrica egzogene varijable(i) (independent, predictor, regressor) 5

6 6. Podešavanje modela i sažetak Podešavanje modela u statsmodels obično uključuje tri jednostavna koraka: Koristi klasu model za opis modela Podesi model pomodu klasa metode Pregledaj rezultate pomodu skradene metode 6

7 Res objekt ima mnogo korisnih svojstava. Na primjer, možemo izdvojiti procjene parametara i r-kvadratnu vrijednost. 7. Literatura: [internet] raspoloživo na: i. http://statsmodels.sourceforge.net/ ii. http://statsmodels.sourceforge.net/stable/ 7