\(\color{lightseagreen}{\it\text{други део }}\)


\(\color{lightseagreen}{\text{Примери графика}}\)

У наставку ће бити приказана употреба пакета за цртање неких врста графика.


\(\color{lightseagreen}{\text{1. Тачкасти график}}\)

Тачкасти график приказује податке као тачке у равни. У наставку ће бити наведни примери цртања овог типа графика, као и начин промене неких од његових компоненти. У примерима ће бити коришћена база података midwest, која се налази у оквиру пакета ggplot2 (опис базе података се добија позивом ?midwest).

На празан график ggplot додајемо тачкасти функцијом geom_point.

library(ggplot2)
ggplot(midwest, aes(x=area, y=poptotal)) + 
  geom_point()

Примећујемо да су тачке концентрисане у доњем делу графика, па ћемо променити границе оса.

ggplot(midwest, aes(x=area, y=poptotal)) + 
  geom_point()+
  xlim(c(0, 0.1)) +
  ylim(c(0, 500000))
## Warning: Removed 15 rows containing missing values (geom_point).

Вредности изван опсега који смо одабрали су избирисане (добили смо упозорење), а да би то избегли, можемо применити метод зумирања и функцију coord_cartesian().

ggplot(midwest, aes(x=area, y=poptotal)) + 
  geom_point()+
  coord_cartesian(xlim=c(0,0.1), ylim=c(0, 500000))

Боја тачака на графику се може мењати, на пример, у зависности од државе на коју се податак односи. Слично, величина тачака се може мењати у односу на вредност неке друге променљиве из базе. Такође, може се мењати и облик тачкица употербом естетског параметра shape.

ggplot(midwest, aes(x=area, y=poptotal)) + 
  geom_point(mapping = aes(col=state, size=popdensity))+
  coord_cartesian(xlim=c(0,0.1), ylim=c(0, 500000))

Графику и осама се могу додати називи помоћу функције labs(). Друга опција је да се називи мењају појединачно функцијама ggtitle(), xlab() и ylab().

ggplot(midwest, aes(x=area, y=poptotal)) + 
  geom_point(mapping = aes(col=state))+
  coord_cartesian(xlim=c(0,0.1), ylim=c(0, 500000))+ 
  labs(title="Povrsina Vs Broj stanovnika", subtitle="Iz baze midwest ", y="Broj stanovnika", x="Povrsina", caption="Midwest Demographics")

У оквиру ggplot- а могу се користити и неке статистичке функције, па тако можемо доцртати линију која описује тренд у подацима помоћу функције geom_smooth, која прави одређену апроксимацију података.

Подазумевани метод функције geom_smooth за одређивање праве која најбоље описује податке је метод loess која даје нелинеарну оцену тренда, а у наредном примеру ћемо додавањем аргумента method = "lm" доцртати оцену тренда добијену коришћењем линеарне регресије. На графику се може уочити и трака поверења.

ggplot(midwest, aes(x=popwhite, y=popdensity)) + 
  geom_point(mapping = aes(col=state))+
  coord_cartesian(xlim=c(0,200000), ylim=c(0, 7500))+ 
  geom_smooth(method = "lm")