\[ X_{(1)}=min(X_1,..., X_n)\] \[X_{(n)}=max(X_1,..., X_n).\]
\[F_n(x)=\frac{1}{n} \sum\limits_{k=1}^n I\{X_k \leq x\}\]
x<-rpois(20, lambda = 3)
table(x)
## x
## 0 1 2 3 4 5 7
## 2 4 7 3 1 2 1
Fn<-ecdf(x)
plot(Fn, main="Empirijska funkcija raspodjele")
#### Teorema [Glivenko-Kanteli]:
\[P\{\lim\limits_{N\to \infty} \sup\limits_{x \in \mathbb{R}}|F_N(x)-F(x)|=0\}=1\]
x<-runif(1000)
Fn<-ecdf(x)
plot(Fn, main="Empirijska funkcija raspodjele")
curve(punif(x), from = -1, to= 2, add = T, col="blue")
\[ \overline{X}_n=\frac{1}{n}\sum\limits_{i=1}^{n}X_i \]
\[\frac{1}{n}\sum\limits_{i=1}^{n}(X_i-\overline{X}_n)^2 \]
\[\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{X}_n)^2 \]
\[ k=[\log_2(N)]+1 \]
\[ d=\frac{R}{k} \]
cijene<-c(1.22, 1.37, 1.27, 1.20, 1.42, 1.41, 1.22, 1.24,
1.28, 1.42, 1.48, 1.32, 1.40, 1.26, 1.39, 1.45,
1.44, 1.49, 1.47, 1.47, 1.24, 1.34, 1.27, 1.35,
1.34, 1.45, 1.49, 1.45, 1.23, 1.20, 1.42, 1.34,
1.43, 1.21, 1.49, 1.36, 1.24, 1.20, 1.45,
1.23, 1.25, 1.24, 1.35, 1.23, 1.39, 1.38,
1.46, 1.48, 1.26, 1.36, 1.22, 1.46, 1.39,
1.22, 1.29, 1.47, 1.24, 1.35, 1.21, 1.21)
mean(cijene)
## [1] 1.340167
median(cijene)
## [1] 1.35
range(cijene)
## [1] 1.20 1.49
# Napomena: Naći ove statistike bez korišćenja ugrađenih funkcija
# Pravimo histogram:
n<-length(cijene)
k<-floor(log(n, base=2) ) +1
d<-diff(range(cijene))/k
k
## [1] 6
d
## [1] 0.04833333
# Sortiramo vektor:
cijene<-sort(cijene)
# Pravimo podjelu na intervale:
podjela<-cijene[1]+0:k * d
podjela
## [1] 1.200000 1.248333 1.296667 1.345000 1.393333 1.441667 1.490000
hist(cijene, breaks = podjela)
# Hoćemo da uporedimo histogram koji se dobija ako ne zadamo sami podjele:
par(mfrow=c(1,2))
hist(cijene, breaks=podjela)
hist(cijene)
obim<-c(33.1, 33.7, 33.7, 33.8, 33.4,
33.9, 33.6, 33.4, 34.1, 34.2,
34.5, 34.2, 34.6, 34.9, 34.8,
34.0, 34.5, 34.2, 34.2, 34.7,
34.7, 34.6, 34.3, 34.3, 34.2,
35.1, 36.0, 35.8, 35.2, 35.6,
36.1, 35.1, 35.3, 35.2)
n<-length(obim)
k<-floor(log(n,2))+1
d<-diff(range(obim))/k
podjela<-sort(obim)[1]+0:k*d
hist(obim, breaks = podjela)
# Stablo- lišće dijagram
stem(obim)
##
## The decimal point is at the |
##
## 33 | 144
## 33 | 67789
## 34 | 012222233
## 34 | 55667789
## 35 | 11223
## 35 | 68
## 36 | 01
rezultati<-c(28, 27, 26, 25, 24, 23, 21, 21, 20, 19, 19, 18, 18, 18, 17, 17, 17, 17,
16, 16, 16, 15.5, 15, 15, 15, 15, 14, 13, 13, 13, 13, 12, 12, 11, 11,
11, 11, 11, 10, 10, 10, 9, 9, 8, 7, 6, 5, 4, 0, 0, 25, 23, 21, 21, 21,
21, 20, 19.5, 19, 19, 18, 18, 17, 17, 17, 17, 16, 15, 15, 15, 14, 14,
14, 13.5, 13, 13, 12, 12, 10, 10, 9, 9, 9, 9, 8, 7, 7, 7, 7, 5, 5, 5,
5, 4, 3, 2)
# Uzoracka sredina
mean(rezultati)
## [1] 13.77604
# Uzoracka disperzija
var(rezultati)
## [1] 38.12563
# Standardno odstupanje
sd(rezultati)
## [1] 6.174596
# Medijana
median(rezultati)
## [1] 14
# Stablo-lišće
stem(rezultati)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 0 | 002344
## 0 | 5555567777788999999
## 1 | 0000011111222233333344444
## 1 | 55555556666677777777888889999
## 2 | 000111111334
## 2 | 55678
# Kvantili
quantile(rezultati)
## 0% 25% 50% 75% 100%
## 0 9 14 18 28
# pokazuje koje vrijednosti statistika poretka imamo na 0%, 25%, 50% (medijana)
# 75% i 100%.
k<-floor(log(length(rezultati) , 2)) +1
d<-diff(range(rezultati))/k
podjela<-sort(rezultati)[1]+0:k*d
hist(rezultati, breaks=podjela)
```