\(\color{lightseagreen}{\it\text{други део }}\)
У наставку ће бити приказана употреба пакета за цртање неких врста графика.
Тачкасти график приказује податке као тачке у равни. У наставку ће бити наведни примери цртања овог типа графика, као и начин промене неких од његових компоненти. У примерима ће бити коришћена база података midwest
, која се налази у оквиру пакета ggplot2
(опис базе података се добија позивом ?midwest
).
На празан график ggplot
додајемо тачкасти функцијом geom_point
.
library(ggplot2)
ggplot(midwest, aes(x=area, y=poptotal)) +
geom_point()
Примећујемо да су тачке концентрисане у доњем делу графика, па ћемо променити границе оса.
ggplot(midwest, aes(x=area, y=poptotal)) +
geom_point()+
xlim(c(0, 0.1)) +
ylim(c(0, 500000))
## Warning: Removed 15 rows containing missing values (geom_point).
Вредности изван опсега који смо одабрали су избирисане (добили смо упозорење), а да би то избегли, можемо применити метод зумирања и функцију coord_cartesian()
.
ggplot(midwest, aes(x=area, y=poptotal)) +
geom_point()+
coord_cartesian(xlim=c(0,0.1), ylim=c(0, 500000))
Боја тачака на графику се може мењати, на пример, у зависности од државе на коју се податак односи. Слично, величина тачака се може мењати у односу на вредност неке друге променљиве из базе. Такође, може се мењати и облик тачкица употербом естетског параметра shape
.
ggplot(midwest, aes(x=area, y=poptotal)) +
geom_point(mapping = aes(col=state, size=popdensity))+
coord_cartesian(xlim=c(0,0.1), ylim=c(0, 500000))
Графику и осама се могу додати називи помоћу функције labs()
. Друга опција је да се називи мењају појединачно функцијама ggtitle()
, xlab()
и ylab()
.
ggplot(midwest, aes(x=area, y=poptotal)) +
geom_point(mapping = aes(col=state))+
coord_cartesian(xlim=c(0,0.1), ylim=c(0, 500000))+
labs(title="Povrsina Vs Broj stanovnika", subtitle="Iz baze midwest ", y="Broj stanovnika", x="Povrsina", caption="Midwest Demographics")
У оквиру ggplot
- а могу се користити и неке статистичке функције, па тако можемо доцртати линију која описује тренд у подацима помоћу функције geom_smooth
, која прави одређену апроксимацију података.
Подазумевани метод функције geom_smooth
за одређивање праве која најбоље описује податке је метод loess
која даје нелинеарну оцену тренда, а у наредном примеру ћемо додавањем аргумента method = "lm"
доцртати оцену тренда добијену коришћењем линеарне регресије. На графику се може уочити и трака поверења.
ggplot(midwest, aes(x=popwhite, y=popdensity)) +
geom_point(mapping = aes(col=state))+
coord_cartesian(xlim=c(0,200000), ylim=c(0, 7500))+
geom_smooth(method = "lm")