# Deseti cas # Kovarijacija. Korelacija. # Dvodimenzione apsolutno neprekidne slucajne velicine. # Importance sampling - uzorkovanje po znacajnosti. # Kovarijacija: # Neka su X i Y slucajne velicine definisane na istom prostoru verovatnoca. # Kovarijacijom slucajnih velicina X i Y zovemo # cov(X, Y) = E(X*Y) - E(X)E(Y). # Korelacija: # Neka su X i Y slucajne velicine definisane na istom prostoru verovatnoca. # Koeficijentom korelacije slucajnih velicina X i Y zovemo # cor(X, Y) = [E(X*Y) - E(X)E(Y)] / [sqrt(D(X))*sqrt(D(Y)). # Osobine: # -1 <= cor(X, Y) <= 1 # cor(X, Y) = cov(X, Y) / [sqrt(D(X))*sqrt(D(Y)) # cov(X, X) = D(X) # Ako je cor(X, Y) = 1, tada sa porastom X, linearno raste Y. # Ako je cor(X, Y) = -1, tada sa porastom X, linearno opada Y. # cor(X, Y) - pokazuje linearnu zavisnost te dve slucajne velicine. # Ako su X i Y nezavisne slucajne velicine => cor(X, Y) = 0. # Ako je cor(X, Y) = 0 IZ TOGA NE SLEDI nezavisnost X i Y!!! # 1) # Neka je X ~ Unif[-1,1]. Ispitati kovarijacije i # koeficijente korelacije sa sledecim slucajnim velicinama: # a) Y = X + 1 # b) Z = -X^2 - X # a) x = sort( runif(1000, -1, 1) ) y = x + 1 # kovarijacija: cov(x, y) #korelacija: cor(x, y) plot(x, y) # b) x = sort( runif(1000, -1, 1) ) z = -x^2 - x # kovarijacija: cov(x, z) #korelacija: cor(x, z) plot(x, z) # 2) # X i Y su obe Unif[0, 1]. Odrediti: # a) P{max(X, Y) < 1/2 | 0 < X+Y < 1 } # b) P{X^2 + Y^2 < 1/4 | 0 < X + Y < 1} drugi_zadatak <- function(a = TRUE, b = FALSE) { if(a) { x = runif(1) y = runif(1) if( x + y < 1) { if(max(x, y) < 1/2) return(cbind(1, 1)) return(cbind(0, 1)) } return(cbind(0, 0)) } if(b) { x = runif(1) y = runif(1) if( x + y < 1) { if(x^2 + y^2 < 1/4) return(cbind(1, 1)) return(cbind(0, 1)) } return(cbind(0, 0)) } } rez = rowMeans(replicate(10000, drugi_zadatak(a = TRUE), simplify = TRUE)) rez[1]/rez[2] rez = rowMeans(replicate(10000, drugi_zadatak(a = FALSE, b = TRUE), simplify = TRUE)) rez[1]/rez[2] # Teorijski rezultat. pi/8 # 3) # Ako je X ~ Exp(1). # Naci uslovnu gustinu # f_X(x | 1 < x < 10) # 4) # X~EXp(a), dok je # Y = a/b *X, b > 0. # Naci zakon raspodele slucajne velicine Y, # kao i vektora (X, Y). # Za y >= 0 # F_Y(y) = P{Y <= y} = P{Y <= b*y/a} # = F_X(b*y/a) = 1 - exp(-b*y/a * a) # = 1 - exp(-b*y), y >= 0 # Za y < 0. F_Y(y) = 0 # Pa vazi da je Y ~ Exp(b). # U opstem slucaju nije moguce iz dve jednodimenzione raspodele # naci dvodimenzione. Ali ovde je to moguce. # F(x, y) = P{X<=x, Y<=y} = P{X<= min(x, b/a*y)}, # za x>=0 i y>=0, inace je nula. # 5) # Slucajna velicina X ~ Exp(a), # dok Y ~ Unif[0, b]. # I nezavisne su. # Naci gustinu za Z = |X-Y| # resenje: # Iz nezavisnosti imamo: # f(x, y) = f(x)*f(y) # Ovakav zadatak je komplikovan... # 5*) # Slucajna velicina X ~ Exp(``), # dok Y ~ Exp(1). # I nezavisne su. # Naci gustinu za Z = |X-Y|. # Resenje: # Iz nezavisnosti imamo: # f(x, y) = f(x)*f(y) = exp{-(x+y)}. # F_Z(t) = P{Z <= t} = P{|X-Y| <= t} = P{X-t <= Y <= X+t} # = \integral_{0}^{t} \integral_{0}^{x+z} f(x, y) dy dx + # + \integral_{t}^{+besk} \integral_{x-t}^{x+t} f(x, y) dy dx. # = 1- exp(-t), t>=0 i nula inace. # => Z ~ Exp(1) #################################################################################### ##################### Importance sampling - uzorkovanje po znacajnosti ############# #################################################################################### # # Jedna od metoda smanjenja disperzije slucajne velicine. # Ima ogromnu primenu bas u Monte Karlo metodama. # Osnovna ideja: # Neke vrednosti slucajne velicine se imaju vecu znacajnost nego drugi # (tj imaju vecu verovatnocu) za funkciju ili parametar koji ocenjujemo. # Ako ove znacajnije vrednosti se budu pojavljivale cesce, disperzija # ocene ce se smanjiti. S toga ova metoda se bazira na odabiru odgovarajuce raspodele # koja maksimizuje odabir tih znacajnih vrednosti. # Od znacaja je sledeca teorema: # Neka je X diskretna slucajna velicina. # Neka je g(x) funkcija iz R u R, a Y druga diskretna slucajna velicina # i vazi da P(X= x) > 0 => P(Y = x) > 0. # Tada # E(g(X)) = E(p_x(Y)/p_y(Y) * g(Y)), # gde je p_x(x) = P(X = x), a p_y(x) = P(Y = x). # Slicna teoram vazi za apsolutno neprekidne slucajne velicine. # 6) # Neka je slucajna velicina X in Normalne(0, 1) raspodele. # A funkcija g(x) = 10 * exp(-5*(x-3)^4). # Oceniti srednju vrednost. # Monte Karlo n = 10000 x = rnorm(n) g_x = 10*exp(-5*(x-3)^4) monte_karlo = mean(g_x) monte_karlo odstupanje_mk_metoda = sqrt(1/n * var(g_x)) odstupanje_mk_metoda # uzorkovanje po znacenju y = 3 + rnorm(n) g_y = 10*exp(-5*(y-3)^4) g_novo = g_y*dnorm(y, 0, 1)/dnorm(y, 3, 1) UZ = mean(g_novo) UZ odstupanje_uz_metoda = sqrt(1/n * var(g_novo)) odstupanje_uz_metoda # Razlika: UZ - monte_karlo odstupanje_uz_metoda - odstupanje_mk_metoda