(R) 시각화 함수 ggplot

*ggplot()함수는 data, 좌표시스템, geoms집합(데이터 점에 대한 시각적표현)을 사용한다.

*ggplot 막대 그래프


library(ggplot2)
ggplot(simpledat_long, aes(x=Aval, y=value, fill=Bval))+geom_bar(stat="identity", position="dodge")




X축은 Aval, Y축은 value, 그리고 그 사이에 채워지는 값은 Bval이 된다.

만약 이 그래프를 선으로 바꾸려면 geom_line()을 사용하면 된다.


*ggplot 선 그래프


ggplot(simpledat_long,aes(x=Aval,y=value,colour=Bval,group=Bval))+geom_line()

fill 대신 colour을 사용해 '채우기' 색깔이 아닌 '선' 색깔에 대입하였다.





*몇 가지 용어와 이론

  • 데이터는 우리가 시각화하고 싶은 대상이다. 데이터는 '변수'로 구성되어 있으며, 변수는 데이터프레임에서 열로 저장한다.
  • '도형(geom)'은 데이터를 표현하기 위해 그리는 도형 객체들로, 막대와 선, 점 등이있다.
  • 에스테틱 속성(aesthetics)은 도형의 시각적인 속성으로, x위치나 y위치, 선 색상, 점 모양 등이다.
  • 데이터 값을 에스테틱에 '대입(map)'한다.
  • '척도(scale)'는 데이터의 공간의 값들을 에스테틱 공간의 값들로 대입하는 과정을 제어한다. 연속적인 y척도는 숫자가 큰 값을 수직 공간 상 더 높은 위치에 대입해준다.
  • '가이드(guide)'는 독자가 시각적인 속성들을 데이터 공간으로 어떻게 대입해야 하는지 알려주는 역할을 한다. 가장 흔하게 사용하는 가이드로는 눈금표시와 축 라벨이있다.




예)

dat<-data.frame(xval=1:4,yval=c(3,5,6,9),group=c("A","B","A","B"))

p<-ggplot(dat,aes(x=xval,y=yval))
p+geom_point(aes(colour=group))





->geom_point(aes(colour=group))

점의 색깔을 group열에 따라 분리시킨 것이다.

이렇게 한닥 ggplot(...)안에서 우리가 앞에서 정의한 '기본 설정된' 에스테틱 대입이 바뀌지 않는다. 그저 이 특정한 도형, geom_point()에 대한 에스테틱 대입만 추가될 뿐이다. 만약 다른 도형을 추가한다면, 이 대입은 거기엔 적용되지 않는다.

만약 geom_point(colour="blue")만 했다면???




'척도(scale)'도 수정이 가능하다.
>p+geom_point()+scale_x_continuous(limits=c(0,8))

---> X축의 범위를 0~8로 변환한다.



댓글

이 블로그의 인기 게시물

(18장) WebSocekt과 STOMP를 사용하여 메시징하기

(네트워크)폴링방식 vs 롱 폴링방식

(ElasticSearch) 결과에서 순서 정렬