Osječki matematički list 1(1), 85 94 85 Primjena karakterističnih funkcija u statistici Slobodan Jelić Sažetak. U ovom radu odred ene su funkcije distribucije aritmetičke sredine slučajnog uzorka duljine n iz standardne normalne i jedinične uniformne distribucije primjenom karakterističnih funkcija. Na primjeru geometrijske sredine uzorka iz jedinične uniformne distribucije ilustrirana je primjena teorijskih rezultata o karakterističnim funkcijama (teorem jedinstvenosti). Navedeni su i specijalni primjeri odred ivanja distribucija nekih statistika koje se često primjenjuju. Ključne riječi: karakteristična funkcija, slučajna varijabla, funkcija gustoće, funkcija distribucije, slučajan uzorak, statistika, uzoračka aritmetička sredina, uzoračka varijanca, geometrijska sredina, gama funkcija, gama distribucija, χ - distribucija Application of characteristic functions in statistics Abstract. In this paper cumulative distribution functions of arithmetic mean of random sample from standard normal and standard uniform distributions are calculated by using characteristic functions. An application of basic theoretical results of characteristic functions is illustrated in example of geometric mean of random sample from standard uniform distribution. Some special examples of calculating frequently used statistics are also presented. Key words: characteristic function, random variable, probability density function, cumulative distribution function, random sample, statistic, arithmetic mean of sample, variance of sample, geometric mean, Gamma function, Gamma distribution, χ - distribution 1. Uvod Karakteristične funkcije slučajnih varijabli i slučajnih vektora su iznimno bitna komponenta analitičkog aparata teorije vjerojatnosti. Jedan od fundamentalnih rezultata na ovom području jest teorem koji daje 1 1 korespondenciju izmed u karakteristične funkcije slučajne varijable i njoj pripadne funkcije distribucije (teorem o jedinstvenosti). To ćemo posebno koristiti u slučajevima kada treba odrediti funkciju distribucije sume nezavisnih slučajnih varijabli. Za početak, navodimo definiciju karakteristične funkcije (vidi [], strana 1). Odjel za matematiku, Sveučilišta J.J. Strossmayera u Osijeku, sjelic@mathos.hr
86 Slobodan Jelić Definicija 1. Neka je F X funkcija distribucije slučajne varijable X. Funkciju ϕ X : R C definiranu izrazom ϕ X (t) = e itx df X (x) = cos(tx)df X (x)+i sin(tx)df X (x), t R, (1) zovemo karakteristična funkcija slučajne varijable X. Prema definiciji 1 vidimo da je karakteristična funkcija slučajne varijable X s funkcijom distribucije F X jednaka matematičkom očekivanju kompleksne slučajne varijable e itx. ϕ X (t) = e itx df X (x) =E[e itx ], t R. () Ukoliko je X diskretna slučajna varijabla sa slikom R(X) ={x 1,x,...} (vidi [1], strana 89) i distribucijom P {X = x k } = p k za k =1,,..., prema definiciji 1 slijedi da je ϕ X (t) = e itxk p k, t R. x k R(X) Ukoliko je X neprekidna slučajna varijabla s funkcijom gustoće f X (vidi [], strana 4), tada prema definiciji 1 slijedi da je ϕ X (t) = e itx f X (x)dx, t R. (3) Kao što je već najavljeno, karakteristične funkcije su naročito korisne prilikom odred ivanja funkcije distribucije sume nezavisnih slučajnih varijabli. Činjenica da je karakteristična funkcija sume n nezavisnih slučajnih varijabli jednaka produktu karakterističnih funkcija tih slučajnih varijabli iskazana je sljedećim teoremom. Teorem 1. Neka su X 1,X,...,X n nezavisne slučajne varijable i S n = n X k. Tada vrijedi n ϕ Sn (t) = ϕ Xk (t), t R. Koristeći pretpostavku o nezavisnosti slučajnih varijabli X k,zak =1,...,n,te relaciju () vidimo da je ϕ Sn (t) =ϕ n Xk(t) =E[eit n Xk ]=E[e n itxk ] n n n = E[ e itxk ]= E[e itxk ]= ϕ Xk (t). Veza izmed u karakteristične funkcije slučajne varijable i njezine afine transformacije pokazat će se takod er korisnom u narednim primjenama, a navedena je u sljedećem teoremu.
Primjena karakterističnih funkcija u statistici 87 Teorem. Ako je X slučajna varijabla i α, β R, tada vrijedi ϕ αx+β (t) =e iβt ϕ X (αt), t R. Koristeći relaciju () i linearnost matematičkog očekivanja dobivamo da je ϕ αx+β (t) =E[e it(αx+β) ]=E[e itβ e iαtx ]=e itβ E[e i(αt)x ]=e itβ ϕ X (αt). Sljedeći teorem daje 1 1 korespondenciju izmed u skupa svih karakterističnih funkcija i skupa svih funkcija distribucija slučajnih varijabli. Ako dvije slučajne varijable X i Y imaju istu karakterističnu funkciju, onda one imaju istu funkciju distribucije. Teorem 3 [Teorem jedinstvenosti]. Neka su F X i F Y funkcije distribucije na R i neka one imaju istu karakterističnu funkciju, tj. t R vrijedi e itx df X (x) = Tada je F X = F Y. Za dokaz vidi [6], strana 446. e itx df Y (x).. Primjena karakterističnih funkcija.1. Aritmetička sredina slučajnog uzorka Definicija. Neka je (Ω, F, P) vjerojatnosni prostor i neka je X slučajna varijabla na Ω kojoj pripada funkcija distribucije F.Kažemo da slučajne varijable čine slučajan uzorak duljine n iz populacije s funkcijom distribucije F ako su X 1,...,X n nezavisne i jednako distribuirane slučajne varijable sa istom funkcijom distribucije F. Neka je X = (X 1,...,X n ) slučajan uzorak iz funkcije distribucije F i g : R n R Borelova funkcija. Slučajnu varijablu T = g(x) nazivamo statistika. Definicija 3. Za slučajnu varijablu X kažemo da ima standardnu uniformnu distribuciju ipišemo X U(, 1) ako je njezina funkcija gustoće definirana na sljedeći način f X (x) = { 1, x [, 1]. (1) Propozicija 1. Karakteristična funkcija statistike X = 1 n tj. karakteristična funkcija aritmetičke sredine slučajnog uzorka X je: X k
88 Slobodan Jelić a) b) [ ] n ϕ X (t) =n n e it n 1, t R \{} it ako X ima standardnu uniformnu distribuciju, tj. funkcija gustoće od X definirana je u (1). ϕ X (t) =e iµt σ t n, t R ako X potječe iz normalne distribucije s parametrima µ i σ. Kako su sve slučajne varijable jednako distribuirane i pripadne karakteristične funkcije su jednake. Neka je ϕ Xk = ϕ za k =1,...,n. Uvedemo li oznaku X = 1 n S n, gdje je S n = n X k, prema teoremu 1 vidimo da je ϕ Sn (t) =[ϕ(t)] n Uzmemo li da je α = 1 n i β = prema teoremu slijedi da je [ ( )] n t ϕ X (t) =ϕ 1 = ϕ. () n Sn n a) Treba odrediti karakterističnu funkciju ϕ slučajne varijable X k U(, 1) za k =1,...,n. Funkcija gustoće slučajne varijable X k zadana je u (1). Prema (1) je ϕ(t) = = 1 t t cos(tx)dx + i cos udu + i t t sin(tx)dx = u = tx du = tdx sin udu = 1 t sin t i t cos t + i t = i t (1 (cos t + i sin t)) = i t (1 eit )= 1 it (1 eit ) = eit 1. (3) it Iz relacija () i (3) slijedi da je karakteristična funkcija statistike X [ ] n ϕ X (t) =n n e it n 1. (4) it b) Karakteristična funkcija slučajne varijable Y sa standardnom normalnom distribucijom dana je izrazom Dokaz vidi u [6] (str. 451). ϕ(t) =e t, t R. (5)
Primjena karakterističnih funkcija u statistici 89 Slučajnu varijablu Y N(, 1) dobivamo standardizacijom slučajne varijable X N(µ, σ ), odnosno Y = X µ. σ Odatle vidimo da se X može prikazati kao Koristeći teorem dobivamo da je X = σy + µ. ϕ X (t) =e iµt ϕ Y (σt) =e iµt σ t, t R. (6) Iz relacija () i (6) možemo odrediti karakterističnu funkciju statistike X gdje je X k N(µ, σ )zak =1,,...n: ϕ X (t) = [e iµ t n σ t n ] n = e iµt σ t n, t R. (7) Prema tvrdnji teorema 3 zaključujemo da je X N(µ, σ n )... Geometrijska sredina slučajnog uzorka U sljedećem primjeru odred ena je funkcija gustoće geometrijske sredine slučajnog uzorka pomoću prethodno navedenih svojstava karakterističnih funkcija. Teorem 4. Neka je (Ω, F,P) vjerojatnosni prostor i neka je X =(X 1,...,X n ) slučajan uzorak iz standardne uniformne distribucije s funkcijom gustoće zadanom u (1). Funkcija distribucije geometrijske sredine uzorka, tj. slučajne varijable Z = n n dana je izrazom gdje je nepotpuna gama funkcija. X k, z, ] Γ(n, n ln z) F Z (z) = Γ(n), z, 1 1, z [1, + Γ(n, n ln z) = n ln z t n 1 e t dt
9 Slobodan Jelić ( n ) 1 ( n Z = X k ln Z = 1 n ) n ln X k = 1 n ln X k. (8) Neka je g : R, + monotono rastuća bijekcija zadana s g(t) =e t i Y =lnz. Vidimo da je Z = g(y ). Tada je prema [6] (str. 363, Teorem 11.8) f Z (z) = { fy (ln z) 1 z, z, +. (9) Odredimo najprije karakterističnu funkciju slučajne varijable Y k =lnx k gdje je X k U(, 1). ϕ Yk (t) = cos (t ln x)dx + i Metodom parcijalne integracije dobivamo da je sin (t ln x)dx što daje Odavde slijedi da je cos (t ln x)dx =1+t sin (t ln x)dx = t sin (t ln x)dx cos (t ln x)dx, cos (t ln x)dx = 1 1+t sin (t ln x)dx = t 1+t. ϕ Yk (t) = 1 1+t i t 1+t = 1 1+it, a iz relacije () dobivamo da je ϕ Y (t) = ( 1+i t n) n, t R. (1) Korištenjem teorema odredit ćemo karakterističnu funkciju slučajne varijable Y. ( ϕ Y (t) =ϕ Y ( t) = 1 i n) t n, t R. (11)
Primjena karakterističnih funkcija u statistici 91 Iz teorema 3 vidimo da slučajna varijabla Y ima gama-distribuciju s parametrima n i 1 n (vidi [6], str. 453), tj. { n n f Y (x) = Γ(n) xn 1 e nx, x, +. (1) Sada ćemo odrediti funkciju gustoće slučajne varijable Y. Neka je h : R R monotono padajuća bijekcija zadana s h(t) = t. Tada je Y = h( Y ) i prema [6] (str. 363, Teorem 11.8) { f f Y (y) = Y (h 1 (y)) [h 1 (y)], y,, odnosno { n n f Y (y) = Γ(n) ( y)n 1 e ny, y,. (13) Funkciju gustoće slučajne varijable Z odredit ćemo koristeći se relacijama (9) i (13). f Z (z) = { n n Γ(n) ( z ln z)n 1, z, 1. (14) Po definiciji, funkcija distribucije F Z slučajne varijable Z s funkcijom gustoće f Z (vidi []) dane u (14) jednaka je F Z (z) =P (Z z) = z f Z (t)dt. U našem slučaju, očito je F Z (z) =zaz if Z (z) =1zaz 1.Nadalje, za z, 1 imamo da je F Z (z) = nn Γ(n) z ( t ln t) n 1 dt. (15) Nakon supstitucije u = n ln t, relacija (15) dobiva sljedeći oblik F Z (z) = 1 u n 1 e u du, z, 1. Γ(n) n ln z Odavde vidimo da je funkcija distribucije slučajne varijable Z zadana izrazom, z, ] Γ(n, n ln z) F Z (z) = Γ(n), z, 1 1, z [1, +. (16)
9 Slobodan Jelić Definicija 4. Neka su X i N(, 1) nezavisne slučajne varijable. Tada je Y n = j=1 slučajna varijabla s hi-kvadrat distribucijom s n stupnjeva slobode, tj. Y n χ (n). Može se pokazati da hi-kvadrat distribucija n stupnjeva slobode predstavlja specijalni slučaj gama distribucije s parametrima n i, tj. Y n Γ( n, ) (vidi [6], str. 65). Zbog toga je funkcija gustoće od Y n zadana sljedećim izrazom { 1 f Yn (x) = x n Γ( n ) n 1 e x, x > (17), x Slučajna varijabla iz definicije 17 ima veoma značajnu primjenu u statistici prilikom provod enja χ -testa (vidi [5]). Sljedećim teoremom dano je važno svojstvo slučajnih varijabli s funkcijom gustoće (17). Teorem 5. Neka su Y n i Y m nezavisne slučajne varijable koje imaju hi-kvadrat distribuciju s n odnosno m stupnjeva slobode. Tada su slučajne varijable Y n+m i Y n + Y m jednako distribuirane i imaju hi-kvadrat distribuciju s n + m stupnjeva slobode, tj. Y n+m χ (n + m). Odredimo karakterističnu funkciju slučajne varijable Y n. Prema definiciji 1 + 1 ϕ Yn (t) = Γ( n ) x n n 1 e x (1 it) dx. Nakon supstitucije u = x (1 it), gornji izraz dobiva sljedeći oblik X j ϕ Yn (t) = što nakon sred ivanja daje 1 Γ( n )(1 it)n + u n 1 e u du, Iz teorema 1 vidimo da je ϕ Yn (t) = 1. (18) (1 it) n 1 1 ϕ Yn+Y m (t) =ϕ Yn (t)ϕ Ym (t) = (1 it) n (1 it) m 1 = = ϕ (1 it) n+m Yn+m (t). (19) Sada, prema teoremu 3 slijedi da su slučajne varijable Y n+m i Y n + Y m jednako distribuirane i imaju hi-kvadrat distribuciju s n + m stupnjeva slobode, tj. Y n+m χ (n + m).
Primjena karakterističnih funkcija u statistici 93 Teorem 6. Neka je X =(X 1,...,X n ) slučajan uzorak iz normalne distribucije s parametrima µ i σ i n. Tada statistika ns n σ ima χ (n 1) distribuciju. Statistika S n je uzoračka varijanca definirana s S n = 1 n (X j X). Za dokaz vidi [6], str. 38, Teorem 11.11. Propozicija. Neka je X N(µ, σ ). Tada je X N( µ, σ ). j=1 F X (x) =P( X x) =P(X x) =1 P(X < x) = 1 σ π = 1 σ π + + x Nakon supstitucije t = u dobivamo F X (x) = 1 σ π odakle vidimo da je X N( µ, σ ). e (t µ) σ dt 1 σ π e (t µ) σ dt x x e (u ( µ)) σ du, e (t µ) σ dt Teorem 7. Neka su X = (X 1,...,X n ) i Y = (Y 1,...,Y m ) dva nezavisna slučajna uzorka takva da je X i,y j N(µ, σ ). Neka je Tada vrijedi: X n = 1 n S n = 1 n X i ; i=1 i=1 Y m = 1 m m Y j, j=1 (X i X n ) ; Sm = 1 m (Y j Y m ). m j=1 (1) X = X n Y m nm N(, 1), σ n + m
94 Slobodan Jelić () Y n+m = ns n + ms m σ χ (n + m ). (1) Na osnovu primjera zaključujemo da je X n N(µ, σ n ); Y m N(µ, σ ). () m Prema propoziciji Y m N( µ, σ ). Iz relacije (7) izvodimo karakteristične m funkcije od X n i Y m. ϕ X n (t) =e iµt σ t n ; ϕ Y m (t) =e iµt σ t m (1) Zbog nezavisnosti slučajnih uzoraka i teorema 1, slučajna varijabla X n Y m ima karakterističnu funkciju oblika ϕ Xn Y m (t) =ϕ Xn (t)ϕ Y m (t) =e σ t m+n mn. () Sada iz teorema dobivamo da je ( ) mn ϕ X (t) =ϕ X n Y m σ (m + n) t = e t. (3) Iz teorema 3 slijedi da je X N(, 1). () Slijedi direktno iz teorema 5 i 6. Literatura [1] N. Elezović, Vjerojatnost i statistika, Diskretna vjerojatnost, Element, Zagreb, 7. [] N. Elezović, Vjerojatnost i statistika, Slučajne varijable, Element, Zagreb, 7. [3] N. Elezović, D. Petrizio, Funkcije kompleksne varijable: zbirka zadataka, Element, Zagreb, 1994. [4] G.R. Grimmett, D.R. Stirzaker, Probability and Random Processes, Oxford University Press, Oxford, 1. [5] Ž. Pauše, Uvod u matematičku statistiku, Školska knjiga, Zagreb, 1993. [6] N. Sarapa, Teorija vjerojatnosti, Školska knjiga, Zagreb,.